Условный экстремум. Метод множителей Лагранжа.

Условный экстремум

Определение (Уравнения связи)
Итак, пусть на открытом множестве G, которое входит в \mathbb{R}^{n} заданы функции y_{i} = f_{i}(x), i = 1,2,\dots,m, x = (x_{1},x_{2},\dots, x_{m}) \in G. Обозначим через E множество точек из G, в которых все функции f_{i}(x), i = 1,2,3\dots,m, обращаются в нуль:

 E = \left\{x: f_{i}(x) = 0, i = 1,2,\dots,m, x \in G\right\}.

Уравнения f_{i}(x) будем называть уравнениями связи.

Определение (Точка условного экстремума)
Пусть на G задана функция y = f_{0}(x). Точка x^{(0)} будет называться точкой условного экстремума функции f_{0}(x) относительно уравнений связи f_{i}(x), i = 1,2,3\dots,m, если она является точкой обычного экстремума этой функции, рассматриваемой только на множестве Е.

Иначе говоря, при поиске условного экстремума мы сравниваем значение функции f_{0}(x) в точке x^{(0)} не со всеми значениями этой функции в достаточно малой окрестности x^{(0)}, а только со значениями в точках, которые одновременно принадлежат как достаточно малой окрестности x^{(0)}, так и множеству E.

Пример №1

Исследовать на наличие экстремума функцию f(x, y) = x^{2} + y^{2} при уравнении связи x + y - 1 = 0.

Решение показать

Пример №2

Найти точки условного экстремума функции (если они есть)  f(x,y) = y_{2} - x_{2} при уравнении связи  y = 2x .

Решение показать

Однако, не всегда возможно преобразовать уравнение связи к явному виду (представить одну из переменных, как функцию от остальных переменных). Далее пойдет речь о том, как справиться с этой неприятной ситуацией.

Метод множителей Лагранжа

Предполагается, что все функции f_{1}, \dots, f_{m} являются непрерывно дифференцируемыми (гладкими) на открытом множестве  G \subset \mathbb{R}^{n}, n > m.

Теорема (Необходимое условие локального экстремума)
Пусть точка x^{(0)} — точка условного экстремум функции  f_{0} при выполнении уравнений связи  f_{1}, \dots , f_{m} . Тогда в этой точке градиенты  \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} линейно зависимы, т. е. существуют такие, не все равные нулю, числа  \lambda_{0}, \lambda_{1}, \dots , \lambda_{m} , что

 \lambda_{0}\nabla f_{0} + \lambda_{1}\nabla f_{1} + \dots + \lambda_{m}\nabla f_{m} = 0 \quad \left( 1 \right)

Перед доказательством теоремы, напомним, что означает символ  \nabla .

Определение (оператор Гамильтона)
Оператор Гамильтона (часто используют сокращение << набла >>) — векторный дифференциальный оператор, компонентами которого являются частные производные по координатам.
Для трехмерного евклидового пространства, в прямоугольной системе координат оператор Гамильтона определяется так:

 \nabla = \frac{\partial}{\partial x} \vec i + \frac{\partial}{\partial y} \vec j + \frac{\partial}{\partial z} \vec k.

Также, нам понадобится свойство этого оператора. Если подействовать им на функцию, то получим вектор градиент.

Доказательство показать
Следствие
Если в точке x^{(0)} условного экстремума функции f_{0} относительно уравнений связи. Тогда в этой точке градиенты \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} линейно независимы, то есть ранг матрицы Якоби

\left( \frac{ \partial f_{j} }{ \partial x } \right), j = 1, 2, \dots , m, i = 1, 2, \dots , n,

равен m, то существуют такие \lambda_{1}, \lambda_{2}, \dots , \lambda_{m}, что в этой точке

 \nabla f_{0} + \sum\limits_{j = 1}^{m}{\lambda_{j} \nabla f_{j}} = 0 \quad \left( 2 \right)

то есть \nabla f_{0} является линейной комбинацией градиентов \nabla f_{1}, \nabla f_{2}, \dots , \nabla f_{m}.

Доказательство следствия показать

В координатной форме это условие имеет вид: для любого i = 1, 2, \dots , n в точке x_{(0)}

 \frac{\partial f_{0}}{\partial x_{i}} + \sum\limits_{j = 1}^{m}{\lambda_{j} \frac{\partial f_{j}}{\partial x_{i}}} = 0. \quad \left( 3 \right)
Определение
Функция

 F \left( x \right) = f_{0}\left( x \right) + \sum\limits_{j = 1}^{m}{\lambda_{j} f_{j}\left( x \right)}, \quad \left( 4 \right)

где числа \lambda_{1}, \lambda_{2}, \dots , \lambda_{m} удовлетворяют условию \left( 3 \right), называется функцией Лагранжа рассматриваемой задачи, а сами числа \lambda_{1}, \lambda_{2}, \dots , \lambda_{m} множителями Лагранжа.

Условие  \left( 3 \right) означает, что если  x^{(0)} является точкой условного экстремума функции  f_{0} относительно уравнений связи y_{i} = f_{i}(x), i = 1, 2, \dots , m, то она является стационарной точкой для функции Лагранжа, т. е.

 \frac{ \partial F \left( x^{(0)} \right)}{ \partial x_{i}} = 0, i = 1, 2, \dots , n.

Теперь уже можно поговорить о том, как на практике использовать эти теоремы для нахождения точек условного экстремума. Прежде всего, мы можем заметить, что у функции вида \left( 4 \right) при произвольных числах \lambda_{1}, \lambda_{2}, \dots , \lambda_{m}, каждая точка её условного экстремума является и точкой условного экстремума исходной функции  f_{0}, и наоборот. Мы выбираем такие значения \lambda_{1}, \lambda_{2}, \dots , \lambda_{m}, чтобы выполнялись условия \left( 3 \right),, т. е. чтобы данная точка условного экстремума оказалась и стационарной точкой функции \left( 4 \right) .
Для отыскания точек условного экстремума следует рассмотреть систему из  n + m уравнений, составленной из частных производных функции Лагранжа по каждой переменной  x_{i}, i = 1, 2, \dots , n и уравнений связи f_{i}(x), i = 1, 2, 3\dots, m (однако, уравнения связи можно рассматривать как частные производные функции Лагранжа по переменным \lambda_{1}, \lambda_{2}, \dots , \lambda_{m}) относительно неизвестных  x^{0}_{1}, \dots , x^{0}_{n}, \lambda_{1}, \dots , \lambda_{m} и решить её (если это возможно), найдя  x^{0}_{1}, \dots , x^{0}_{n} и по возможности исключив \lambda_{1}, \dots , \lambda_{m}. Сформулированная теорема утверждает, что все точки условного экстремума будут находится среди найденных таким образом точек  \left(x^{0}_{1}, \dots , x^{0}_{n} \right).

Пример №1

Найдем локальные экстремумы функции  f \left(x, y \right) = xy на окружности  \left( \Gamma \right) :

 \phi \left(x, y \right) = x^2 + y^2 - 1 = 0.
Пример показать

Литература

Тесты

Условный экстремум. Метод множителей Лагранжа.

Этот тест поможет вам освоить материал этой статьи.


Таблица лучших: Условный экстремум. Метод множителей Лагранжа.

максимум из 22 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

M1611. Построение прямого угла на пересекающихся окружностях

Задача из журнала «Квант» М1611 ( 1997, выпуск №5)

Задача:

Две окружности пересекаются в точках $A$ и $B$. Через точку $A$ проведена прямая, вторично пересекающая первую окружность в точке $C$, а вторую — в точке $D$. Пусть $M$ и $N$
— середины дуг $BC$ и $BD$, не содержащих точку $A$, а $K$ — середина отрезка $CD$. Докажите, что угол $MKN$ прямой.
(Можно считать, что точки $C$ и $D$ лежат по разные стороны от точки $A$)

Решение:

Пусть $N_{1}$ — точка, симметричная точке $N$ относительно $K$ (см. рисунок).

"Квант" M1611

Тогда $\bigtriangleup KCN_{1} = \bigtriangleup KDN$, поэтому $CN_{1} = ND$ и $\angle N_{1}CK = \angle NDK = \pi — \angle ABN$. Заметим ещё, что $\angle MCK = \pi — \angle ABM$. Складывая полученные равенства, находим, что $\angle N_{1}CM = \angle MBN$. Кроме того, из условия следует, что $CM = MB$ и $BN = ND$ (т.е. $BN = CN_{1}$). Значит, $\bigtriangleup MCN_{1} = \bigtriangleup MBN$, откуда $MN_{1} = MN$. Отрезок $MK$ — медиана в равнобедренном треугольнике $MNN_{1}$, поэтому $\angle MKN = 90^{\circ}$.

Замечание:

Задача имеет много других решений. Например, можно воспользоваться подобием треугольников $MEK$ и $KFN $, где $E $ и $F$ — середины отрезков $BC$ и $BD$ соответственно. Эти треугольники имеют две пары взаимно перпендикулярных сторон
($EK$ и $FN$, $ME$ и $KF$), следовательно, перпендикулярны и их третьи стороны.

Кроме того, соображения, использующие композицию поворотов, позволяют отказаться от дополнительного условия в задаче (о том, что точки $C$ и $D$ лежат по разные стороны от $A$), которое было задано лишь затем, чтобы избежать разбора различных случаев. Действительно, рассмотрим композицию поворотов $R^{\beta}_{M} \circ R^{\alpha}_{N}$ — на углы $\alpha = \angle DNB$ и $\beta = \angle BCM$ вокруг точек $N$ и $M$ соответственно (углы предполагаются ориентированными). Заметим, что $\alpha + \beta = 180^{\circ}$, поэтому $R^{\beta}_{M} \circ R^{\alpha}_{N} = Z_{x}$ — центральная симметрия относительно некоторой точки $X$. Но
$Z_{x}(D) = \left(R^{\beta}_{M} \circ R^{\alpha}_{N} \right) = R^{\beta}_{M}(B) = C$,
поэтому $X$ — середина отрезка $CD$, т. е. точка $K$. Если $N_{1} = Z_{K}(N)$, то $N_{1} = \left(R^{\beta}_{M} \circ R^{\alpha}_{N} \right) \left( N \right)$, т. е. $\bigtriangleup NMN_{1}$ — равнобедренный и $\angle MKN = 90^{\circ}$.

Д. Терешин