Условный экстремум. Метод множителей Лагранжа.

Условный экстремум

Определение (Уравнения связи)
Итак, пусть на открытом множестве [latex]G[/latex], которое входит в [latex]\mathbb{R}^{n}[/latex] заданы функции [latex]y_{i} = f_{i}(x), i = 1,2,\dots,m, x = (x_{1},x_{2},\dots, x_{m}) \in G[/latex]. Обозначим через [latex]E[/latex] множество точек из [latex]G[/latex], в которых все функции [latex]f_{i}(x), i = 1,2,3\dots,m[/latex], обращаются в нуль:

[latex] E = \left\{x: f_{i}(x) = 0, i = 1,2,\dots,m, x \in G\right\}. [/latex]

Уравнения [latex]f_{i}(x)[/latex] будем называть уравнениями связи.

Определение (Точка условного экстремума)
Пусть на [latex]G[/latex] задана функция [latex]y = f_{0}(x)[/latex]. Точка [latex]x^{(0)}[/latex] будет называться точкой условного экстремума функции [latex]f_{0}(x)[/latex] относительно уравнений связи [latex]f_{i}(x), i = 1,2,3\dots,m[/latex], если она является точкой обычного экстремума этой функции, рассматриваемой только на множестве Е.

Иначе говоря, при поиске условного экстремума мы сравниваем значение функции [latex]f_{0}(x)[/latex] в точке [latex]x^{(0)}[/latex] не со всеми значениями этой функции в достаточно малой окрестности [latex]x^{(0)}[/latex], а только со значениями в точках, которые одновременно принадлежат как достаточно малой окрестности [latex]x^{(0)}[/latex], так и множеству [latex]E[/latex].

Пример №1

Исследовать на наличие экстремума функцию [latex]f(x, y) = x^{2} + y^{2}[/latex] при уравнении связи [latex]x + y — 1 = 0[/latex].

Спойлер

Представим [latex]y[/latex] как функцию от [latex]x[/latex]. Из уравнения связи вытекает [latex]y = 1 — x[/latex], откуда [latex]f(x, 1 — x) = 2x^{2} — 2x + 1[/latex]. Таким образом, при выполнении уравнения связи мы получаем функцию от одной переменной. Найти её экстремум не составляет труда: приравнивая к нулю её производную («Необходимое условие экстремума»), получаем [latex]2x — 1 = 0[/latex], откуда [latex] x = \frac{1}{2}[/latex]. В этой точке рассматриваемая функция имеет минимум, так как она является многочленом второй степени с положительным коэффициентом при старшем члене. Из уравнения связи находим [latex] y = \frac{1}{2}[/latex].

[свернуть]

Пример №2

Найти точки условного экстремума функции (если они есть) [latex] f(x,y) = y_{2} — x_{2} [/latex] при уравнении связи [latex] y = 2x [/latex].

Спойлер

Имеем [latex] f(x, 2x) = 3x^{2} [/latex], т.е. при выполнении уравнений связи данная функция является функцией одного переменного и достигает минимума при [latex]x = 0[/latex].
Значению [latex] x = 0 [/latex] согласно уравнению связи соответствует значение [latex] y = 0 [/latex], а поэтому функция [latex] f(x,y) = y_{2} — x_{2} [/latex] имеет в точке [latex](0, 0)[/latex] условный минимум относительно уравнения связи [latex] y = 2x [/latex].

[свернуть]

Однако, не всегда возможно преобразовать уравнение связи к явному виду (представить одну из переменных, как функцию от остальных переменных). Далее пойдет речь о том, как справиться с этой неприятной ситуацией.

Метод множителей Лагранжа

Предполагается, что все функции [latex]f_{1}, \dots, f_{m}[/latex] являются непрерывно дифференцируемыми (гладкими) на открытом множестве [latex] G \subset \mathbb{R}^{n}, n > m[/latex].

Теорема (Необходимое условие локального экстремума)
Пусть точка [latex]x^{(0)}[/latex] — точка условного экстремум функции [latex] f_{0} [/latex] при выполнении уравнений связи [latex] f_{1}, \dots , f_{m} [/latex]. Тогда в этой точке градиенты [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно зависимы, т. е. существуют такие, не все равные нулю, числа [latex] \lambda_{0}, \lambda_{1}, \dots , \lambda_{m} [/latex], что

[latex] \lambda_{0}\nabla f_{0} + \lambda_{1}\nabla f_{1} + \dots + \lambda_{m}\nabla f_{m} = 0 \quad \left( 1 \right) [/latex]

Перед доказательством теоремы, напомним, что означает символ [latex] \nabla [/latex].

Определение (оператор Гамильтона)
Оператор Гамильтона (часто используют сокращение << набла >>) — векторный дифференциальный оператор, компонентами которого являются частные производные по координатам.
Для трехмерного евклидового пространства, в прямоугольной системе координат оператор Гамильтона определяется так:

[latex] \nabla = \frac{\partial}{\partial x} \vec i + \frac{\partial}{\partial y} \vec j + \frac{\partial}{\partial z} \vec k.[/latex]

Также, нам понадобится свойство этого оператора. Если подействовать им на функцию, то получим вектор градиент.

Спойлер

Докажем утверждение, равносильное теореме: если в точке [latex] x^{(0)} = \left(x_{1}^{(0)}, \dots , x_{n}^{(0)}\right) [/latex] удовлетворяющей уравнениям связи

[latex] f_{k}(x^{(0)}) = 0, k = 1, 2, \dots , m, [/latex]

градиенты [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно независимы, то [latex] x^{(0)} [/latex] не является точкой локального экстремума.

Итак, пусть [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно независимы и, следовательно, ранг матрицы Якоби

[latex] \left( \frac{ \partial f_{j} }{ \partial x_{i} } \right), j = 0, 1, \dots , m, i = 1, 2, \dots , n, [/latex]

равен [latex] m + 1 [/latex]. Тогда в этой матрице существует минор порядка [latex] m + 1 [/latex], не равный нулю. Для определенности будем считать, что он образован первыми [latex] m + 1 [/latex] столбцами, т. е.

[latex] \LARGE \left.\begin{matrix} \frac{ \partial \left( f_{0}, f_{1}, \dots , f_{m} \right) }{ \partial \left( x_{1}, x_{2}, \dots , x_{m+1} \right)} & \end{matrix}\right|_{x = x^{(0)}} \neq 0. [/latex]

Множество [latex] G [/latex] — открыто, а потому существует такое [latex] \delta_{0} > 0 [/latex], что при всех [latex]\delta, 0 < \delta < \delta_{0}[/latex], куб

[latex] Q^{n}_{ \delta} =\left\{ x : \left| x_{i} — x_{i}^{(0)} \right| < \delta, i = 1, 2, \dots ,n \right\} [/latex]

лежит в [latex] G [/latex], и, следовательно, на нем определены все функции [latex] f_{0}, f_{1}, \dots , f_{m}[/latex].

Зафиксируем

[latex] x_{m + 2} = x_{m + 2}^{(0)}, [/latex][latex] \dots, [/latex][latex] x_{n} = x_{n}^{(0)} [/latex]

и введём следующие обозначения:

[latex] x^{\star} = \left(x_{1}, \dots , x_{m+1} \right),[/latex]
[latex]Q^{m + 1}_{ \delta} =\left\{ x^{\star} \colon \left| x_{i} — x_{i}^{(0)} \right| < \delta, i = 1, 2, \dots , m + 1 \right\}.[/latex]

Очевидно, функции [latex]f_{j} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right), j = 1, 2, \dots , m,[/latex] определены и непрерывно дифференцируемы всюду в [latex]Q_{ \delta }^{m + 1}.[/latex] Рассмотрим отображение [latex]\Phi: Q_{ \delta} ^ {m + 1} \rightarrow \mathbb{R}^{m+1}, [/latex] задаваемое формулами

[latex] y_{1} = f_{1} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right),[/latex]
[latex]y_{2} = f_{2} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right),[/latex]
[latex]\dots \dots \dots \dots \dots \dots \dots \dots \dots [/latex]
[latex] y_{m + 1} = f_{m} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right).[/latex]

Для точки [latex]x^{\star(0)} = \left(x_{1}^{(0)}, \dots , x_{m + 1}^{(0)}\right)[/latex] имеем

[latex] \LARGE \left.\begin{matrix} \frac{ \partial \left(y_{1}, \dots , y_{m + 1} \right) }{ \partial \left( x_{1}, x_{2}, \dots , x_{m+1} \right)} & \end{matrix}\right|_{x^{\star} = x^{\star(0)}} = \left.\begin{matrix} \frac{ \partial \left( f_{0}, f_{1}, \dots , f_{m} \right) }{ \partial \left( x_{1}, x_{2}, \dots , x_{m+1} \right)} & \end{matrix}\right|_{x = x^{(0)}} \neq 0. [/latex]

Поскольку точка [latex]x^{(0)}[/latex] является точкой условного экстремума, она удовлетворяет всем уравнениям связи. Таким образом, для точки [latex]x^{(0)}[/latex] имеем [latex] \Phi \left(x^{ \star (0)} \right) = \left(f_{0} \left(x^{(0)} \right), 0, \dots , 0 \right).[/latex] Поэтому (по теорему о локальной обратимости непрерывно дифференцируемого отображения в точке, в которой его якобиан не равен нулю) существует такое [latex] \varepsilon > 0, [/latex] что на окрестности

[latex] V = \left\{ y = \left(y_{1}, \dots , y_{m+1} \right) \colon \left|y_{1} — f_{0}\left(x^{(0)}\right) \right| < \varepsilon, \left|y_{j} \right| < \varepsilon, j = 2, 3, \dots , m + 1 \right\} [/latex]

Курсовая 2
( см. рисунок , [latex] m = 1, n = 2 [/latex]) определено обратное к [latex] \Phi [/latex] отображение, и, следовательно, в любую точку этой окрестности отображается какая-то точка из [latex] Q_{\delta}^{m + 1}.[/latex]
В частности, так как при любом [latex] \eta, 0 < \eta < \varepsilon, [/latex] имеет место включение [latex] \left(f\left( x^{\left(0 \right)}\right) \pm \eta, 0, \dots , 0 \right) \in V, [/latex] то в кубе [latex] Q^{ m + 1 }_{ \delta } [/latex] найдутся точки [latex] x’^{ \star} = \left(x’_{1}, \dots , x’_{m + 1} \right) [/latex] и [latex] x»^{ \star} = \left(x»_{1}, \dots , x»_{m + 1} \right), [/latex] отображающиеся при отображении [latex] \Phi [/latex] в указанные точки окрестности [latex] V: [/latex]

[latex] \Phi\left(x’^{\star} \right) = \left(f\left( x^{\left(0 \right)}\right) \pm \eta, 0, \dots , 0 \right), \Phi\left(x»^{\star} \right) = \left(f\left( x^{\left(0 \right)}\right) \pm \eta, 0, \dots , 0 \right).[/latex]

Если положим для краткости [latex] x’^{ \star} = \left(x’_{1}, \dots , x’_{m + 1}, x^{\left(0 \right)}_{m+2}, \dots , x^{\left(0 \right)}_{n} \right) [/latex] и [latex] x»^{ \star} = \left(x»_{1}, \dots , x»_{m + 1}, x^{\left(0 \right)}_{m+2}, \dots , x^{\left(0 \right)}_{n} \right), [/latex] то в координатной записи получим

[latex] f_{0}\left(x’\right) = f_{0}\left(x^{\left(0\right)}\right) + \eta > f_{0}\left(x^{\left(0\right)}\right),[/latex]
[latex] f_{k}\left(x’\right) = 0, k = 1, 2, \dots , m, x’ \in Q^{n}_{\delta} [/latex]

и

[latex] f_{0}\left(x»\right) = f_{0}\left(x^{\left(0\right)}\right) — \eta < f_{0}\left(x^{\left(0\right)}\right),[/latex]
[latex]f_{k}\left(x»\right) = 0, k = 1, 2, \dots , m, x’ \in Q^{n}_{\delta}. [/latex]

Поскольку число [latex] \delta, 0 < \delta < \delta_{0}, [/latex] может быть сколь угодно мало, то указанные точки [latex] x’ [/latex] и [latex] x» [/latex] могут быть выбраны сколь угодно близко от точки [latex] x^{\left(0\right)}, [/latex] и, таким образом, сколь угодно близко от точки [latex] x^{\left(0\right)} [/latex] имеются точки, удовлетворяющие уравнениям связи, в которых функция [latex] f_{0} [/latex] принимает значения, как большие, так и меньшие значения [latex] f_{0}\left(x^{\left(0\right)}\right). [/latex] Что и означает, что точка [latex] x^{\left(0\right)} [/latex] не является точкой условного экстремума. Это противоречие и доказывает теорему.

[свернуть]
Следствие
Если в точке [latex]x^{(0)}[/latex] условного экстремума функции [latex]f_{0}[/latex] относительно уравнений связи. Тогда в этой точке градиенты [latex]\nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m}[/latex] линейно независимы, то есть ранг матрицы Якоби

[latex]\left( \frac{ \partial f_{j} }{ \partial x } \right), j = 1, 2, \dots , m, i = 1, 2, \dots , n, [/latex]

равен [latex]m[/latex], то существуют такие [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex], что в этой точке

[latex] \nabla f_{0} + \sum\limits_{j = 1}^{m}{\lambda_{j} \nabla f_{j}} = 0 \quad \left( 2 \right)[/latex]

то есть [latex]\nabla f_{0}[/latex] является линейной комбинацией градиентов [latex]\nabla f_{1}, \nabla f_{2}, \dots , \nabla f_{m}[/latex].

Спойлер

Если векторы [latex]\nabla f_{1}, \nabla f_{2}, \dots , \nabla f_{m}[/latex] линейно независимы, то в равенстве [latex] \left( 1 \right) [/latex] имеем [latex] \lambda_{0} \neq 0, [/latex] так как если [latex] \lambda_{0} = 0 [/latex] указанные векторы в силу [latex] \left( 1 \right) [/latex] оказались бы линейно зависимыми. Разделив обе части [latex] \left( 1 \right) [/latex] на [latex] \lambda_{0} [/latex] получим равенство вида [latex] \left( 2 \right). [/latex]

[свернуть]

В координатной форме это условие имеет вид: для любого [latex]i = 1, 2, \dots , n [/latex] в точке [latex]x_{(0)}[/latex]

[latex] \frac{\partial f_{0}}{\partial x_{i}} + \sum\limits_{j = 1}^{m}{\lambda_{j} \frac{\partial f_{j}}{\partial x_{i}}} = 0. \quad \left( 3 \right) [/latex]
Определение
Функция

[latex] F \left( x \right) = f_{0}\left( x \right) + \sum\limits_{j = 1}^{m}{\lambda_{j} f_{j}\left( x \right)}, \quad \left( 4 \right)[/latex]

где числа [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex] удовлетворяют условию [latex]\left( 3 \right), [/latex] называется функцией Лагранжа рассматриваемой задачи, а сами числа [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex] — множителями Лагранжа.

Условие [latex] \left( 3 \right) [/latex] означает, что если [latex] x^{(0)} [/latex] является точкой условного экстремума функции [latex] f_{0} [/latex] относительно уравнений связи [latex]y_{i} = f_{i}(x), i = 1, 2, \dots , m,[/latex] то она является стационарной точкой для функции Лагранжа, т. е.

[latex] \frac{ \partial F \left( x^{(0)} \right)}{ \partial x_{i}} = 0, i = 1, 2, \dots , n. [/latex]

Теперь уже можно поговорить о том, как на практике использовать эти теоремы для нахождения точек условного экстремума. Прежде всего, мы можем заметить, что у функции вида [latex]\left( 4 \right)[/latex] при произвольных числах [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m},[/latex] каждая точка её условного экстремума является и точкой условного экстремума исходной функции [latex] f_{0}, [/latex] и наоборот. Мы выбираем такие значения [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m},[/latex] чтобы выполнялись условия [latex]\left( 3 \right),[/latex], т. е. чтобы данная точка условного экстремума оказалась и стационарной точкой функции [latex]\left( 4 \right) [/latex].
Для отыскания точек условного экстремума следует рассмотреть систему из [latex] n + m [/latex] уравнений, составленной из частных производных функции Лагранжа по каждой переменной [latex] x_{i}, i = 1, 2, \dots , n [/latex] и уравнений связи [latex]f_{i}(x), i = 1, 2, 3\dots, m[/latex] (однако, уравнения связи можно рассматривать как частные производные функции Лагранжа по переменным [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex]) относительно неизвестных [latex] x^{0}_{1}, \dots , x^{0}_{n}, \lambda_{1}, \dots , \lambda_{m}[/latex] и решить её (если это возможно), найдя [latex] x^{0}_{1}, \dots , x^{0}_{n}[/latex] и по возможности исключив [latex]\lambda_{1}, \dots , \lambda_{m}[/latex]. Сформулированная теорема утверждает, что все точки условного экстремума будут находится среди найденных таким образом точек [latex] \left(x^{0}_{1}, \dots , x^{0}_{n} \right)[/latex].

Пример №1

Найдем локальные экстремумы функции [latex] f \left(x, y \right) = xy [/latex] на окружности [latex] \left( \Gamma \right) [/latex]:

[latex] \phi \left(x, y \right) = x^2 + y^2 — 1 = 0. [/latex]
Спойлер

Функции [latex] f [/latex] и [latex] \phi [/latex] дважды непрерывно дифференцируемы на всей плоскости. Кроме того, ранг матрицы

[latex] \begin{Vmatrix} \frac{ \partial \phi}{ \partial x} & \frac{ \partial \phi}{ \partial y} \end{Vmatrix} = \begin{Vmatrix} 2x & 2y \end{Vmatrix} [/latex]

равен единице (т. е. равно количеству связей) на всей плоскости [latex] Oxy [/latex] за исключением точки [latex] \left(0, 0 \right).[/latex] Но последняя не лежит на окружности [latex] \phi \left(x, y \right) = x^2 + y^2 — 1 = 0. [/latex] Следовательно, точки, в которых возможен локальный экстремум, находятся только среди стационарных точек.
Приравнивая к нулю частные производные функции Лагранжа задачи

[latex] F \left(x, y \right) = xy — \lambda \left(x^2 + y^2 — 1 \right),[/latex]

по переменным [latex] x, y, \lambda [/latex], получим систему уравнений:

[latex] \begin{cases} y — 2\lambda x = 0 \\ y — 2\lambda x = 0 \\ x^2 + y^2 — 1 = 0 \end{cases} [/latex]

Решив её, получим четыре пары стационарных точек [latex] x = \pm \frac{1}{\sqrt{2}}, [/latex] [latex] y = \pm \frac{1}{\sqrt{2}}, [/latex] соответствующих всевозможным распределениям [latex] «+» [/latex] и [latex] «-» [/latex]. Паре [latex] x_{1} = y_{1} = \frac{ 1}{ \sqrt{2}} [/latex]
соответствуют [latex] \lambda_{1} = \frac{1}{2} [/latex] и лагранжева функция

[latex] F \left(x, y \right) = xy — \frac{\left(x^2 + y^2 — 1 \right)}{2}. [/latex]

Второй дифференциал от [latex]F[/latex] в точке [latex] \left(x_{1}, y_{1} \right) [/latex] имеет вид

[latex] \partial_{2} F = — \partial x^2 + 2 \partial x \partial y — \partial y^2 = -\left( \partial x — \partial y \right)^2. [/latex]

Тогда, в силу уравнения связи

[latex] 2x\partial x + 2y \partial y = 0, [/latex]

откуда [latex] \partial y = — \partial x, [/latex] и окончательно

[latex] \partial^2 F = -(2 \partial x)^2 = -4 \partial x^2, [/latex]

где [latex] \partial x [/latex] — независимый дифференциал. Следовательно, в точке [latex] \left(x_{1}, y_{1} \right) [/latex] имеет место локальный относительный максимум задачи, равный [latex] f \left( \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right) = \frac{1}{2}. [/latex] Легко заключить, используя симметрические свойства [latex] f ,[/latex] что в точке [latex] \left( -\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}} \right) [/latex] имеет место другой локальный относительный максимум, равный [latex] \frac{1}{2} [/latex].
Так как окружность [latex] \Gamma [/latex] есть ограниченное замкнутое множество и непрерывная на [latex] \Gamma [/latex] функция [latex] f [/latex] должна достигать на [latex] \Gamma [/latex] своего максимума, и так как максимум на [latex] \Gamma [/latex] необходимо есть максимум на [latex] \Gamma, [/latex] то

[latex] \max_{\Gamma} F = f \left( \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right) = f \left( -\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}} \right) = \frac{1}{2} [/latex]

и, аналогично,

[latex] \min_{\Gamma} F = f \left( \frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}} \right) = f \left( -\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right) = -\frac{1}{2}. [/latex]

[свернуть]

Литература

Тесты

Условный экстремум. Метод множителей Лагранжа.

Этот тест поможет вам освоить материал этой статьи.


Таблица лучших: Условный экстремум. Метод множителей Лагранжа.

максимум из 22 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Переклад