Условный экстремум
- Определение (Уравнения связи)
- Итак, пусть на открытом множестве [latex]G[/latex], которое входит в [latex]\mathbb{R}^{n}[/latex] заданы функции [latex]y_{i} = f_{i}(x), i = 1,2,\dots,m, x = (x_{1},x_{2},\dots, x_{m}) \in G[/latex]. Обозначим через [latex]E[/latex] множество точек из [latex]G[/latex], в которых все функции [latex]f_{i}(x), i = 1,2,3\dots,m[/latex], обращаются в нуль:
[latex] E = \left\{x: f_{i}(x) = 0, i = 1,2,\dots,m, x \in G\right\}. [/latex]
Уравнения [latex]f_{i}(x)[/latex] будем называть уравнениями связи.
- Определение (Точка условного экстремума)
- Пусть на [latex]G[/latex] задана функция [latex]y = f_{0}(x)[/latex]. Точка [latex]x^{(0)}[/latex] будет называться точкой условного экстремума функции [latex]f_{0}(x)[/latex] относительно уравнений связи [latex]f_{i}(x), i = 1,2,3\dots,m[/latex], если она является точкой обычного экстремума этой функции, рассматриваемой только на множестве Е.
Иначе говоря, при поиске условного экстремума мы сравниваем значение функции [latex]f_{0}(x)[/latex] в точке [latex]x^{(0)}[/latex] не со всеми значениями этой функции в достаточно малой окрестности [latex]x^{(0)}[/latex], а только со значениями в точках, которые одновременно принадлежат как достаточно малой окрестности [latex]x^{(0)}[/latex], так и множеству [latex]E[/latex].
Пример №1
Исследовать на наличие экстремума функцию [latex]f(x, y) = x^{2} + y^{2}[/latex] при уравнении связи [latex]x + y — 1 = 0[/latex].
Представим [latex]y[/latex] как функцию от [latex]x[/latex]. Из уравнения связи вытекает [latex]y = 1 — x[/latex], откуда [latex]f(x, 1 — x) = 2x^{2} — 2x + 1[/latex]. Таким образом, при выполнении уравнения связи мы получаем функцию от одной переменной. Найти её экстремум не составляет труда: приравнивая к нулю её производную («Необходимое условие экстремума»), получаем [latex]2x — 1 = 0[/latex], откуда [latex] x = \frac{1}{2}[/latex]. В этой точке рассматриваемая функция имеет минимум, так как она является многочленом второй степени с положительным коэффициентом при старшем члене. Из уравнения связи находим [latex] y = \frac{1}{2}[/latex].
Пример №2
Найти точки условного экстремума функции (если они есть) [latex] f(x,y) = y_{2} — x_{2} [/latex] при уравнении связи [latex] y = 2x [/latex].
Имеем [latex] f(x, 2x) = 3x^{2} [/latex], т.е. при выполнении уравнений связи данная функция является функцией одного переменного и достигает минимума при [latex]x = 0[/latex].
Значению [latex] x = 0 [/latex] согласно уравнению связи соответствует значение [latex] y = 0 [/latex], а поэтому функция [latex] f(x,y) = y_{2} — x_{2} [/latex] имеет в точке [latex](0, 0)[/latex] условный минимум относительно уравнения связи [latex] y = 2x [/latex].
Однако, не всегда возможно преобразовать уравнение связи к явному виду (представить одну из переменных, как функцию от остальных переменных). Далее пойдет речь о том, как справиться с этой неприятной ситуацией.
Метод множителей Лагранжа
Предполагается, что все функции [latex]f_{1}, \dots, f_{m}[/latex] являются непрерывно дифференцируемыми (гладкими) на открытом множестве [latex] G \subset \mathbb{R}^{n}, n > m[/latex].
- Теорема (Необходимое условие локального экстремума)
- Пусть точка [latex]x^{(0)}[/latex] — точка условного экстремум функции [latex] f_{0} [/latex] при выполнении уравнений связи [latex] f_{1}, \dots , f_{m} [/latex]. Тогда в этой точке градиенты [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно зависимы, т. е. существуют такие, не все равные нулю, числа [latex] \lambda_{0}, \lambda_{1}, \dots , \lambda_{m} [/latex], что
[latex] \lambda_{0}\nabla f_{0} + \lambda_{1}\nabla f_{1} + \dots + \lambda_{m}\nabla f_{m} = 0 \quad \left( 1 \right) [/latex]
Перед доказательством теоремы, напомним, что означает символ [latex] \nabla [/latex].
- Определение (оператор Гамильтона)
- Оператор Гамильтона (часто используют сокращение << набла >>) — векторный дифференциальный оператор, компонентами которого являются частные производные по координатам.
Для трехмерного евклидового пространства, в прямоугольной системе координат оператор Гамильтона определяется так:[latex] \nabla = \frac{\partial}{\partial x} \vec i + \frac{\partial}{\partial y} \vec j + \frac{\partial}{\partial z} \vec k.[/latex]
Также, нам понадобится свойство этого оператора. Если подействовать им на функцию, то получим вектор градиент.
градиенты [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно независимы, то [latex] x^{(0)} [/latex] не является точкой локального экстремума.
Итак, пусть [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно независимы и, следовательно, ранг матрицы Якоби
равен [latex] m + 1 [/latex]. Тогда в этой матрице существует минор порядка [latex] m + 1 [/latex], не равный нулю. Для определенности будем считать, что он образован первыми [latex] m + 1 [/latex] столбцами, т. е.
Множество [latex] G [/latex] — открыто, а потому существует такое [latex] \delta_{0} > 0 [/latex], что при всех [latex]\delta, 0 < \delta < \delta_{0}[/latex], куб
лежит в [latex] G [/latex], и, следовательно, на нем определены все функции [latex] f_{0}, f_{1}, \dots , f_{m}[/latex].
Зафиксируем
и введём следующие обозначения:
[latex]Q^{m + 1}_{ \delta} =\left\{ x^{\star} \colon \left| x_{i} — x_{i}^{(0)} \right| < \delta, i = 1, 2, \dots , m + 1 \right\}.[/latex]
Очевидно, функции [latex]f_{j} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right), j = 1, 2, \dots , m,[/latex] определены и непрерывно дифференцируемы всюду в [latex]Q_{ \delta }^{m + 1}.[/latex] Рассмотрим отображение [latex]\Phi: Q_{ \delta} ^ {m + 1} \rightarrow \mathbb{R}^{m+1}, [/latex] задаваемое формулами
[latex]y_{2} = f_{2} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right),[/latex]
[latex]\dots \dots \dots \dots \dots \dots \dots \dots \dots [/latex]
[latex] y_{m + 1} = f_{m} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right).[/latex]
Для точки [latex]x^{\star(0)} = \left(x_{1}^{(0)}, \dots , x_{m + 1}^{(0)}\right)[/latex] имеем
Поскольку точка [latex]x^{(0)}[/latex] является точкой условного экстремума, она удовлетворяет всем уравнениям связи. Таким образом, для точки [latex]x^{(0)}[/latex] имеем [latex] \Phi \left(x^{ \star (0)} \right) = \left(f_{0} \left(x^{(0)} \right), 0, \dots , 0 \right).[/latex] Поэтому (по теорему о локальной обратимости непрерывно дифференцируемого отображения в точке, в которой его якобиан не равен нулю) существует такое [latex] \varepsilon > 0, [/latex] что на окрестности
( см. рисунок , [latex] m = 1, n = 2 [/latex]) определено обратное к [latex] \Phi [/latex] отображение, и, следовательно, в любую точку этой окрестности отображается какая-то точка из [latex] Q_{\delta}^{m + 1}.[/latex]
В частности, так как при любом [latex] \eta, 0 < \eta < \varepsilon, [/latex] имеет место включение [latex] \left(f\left( x^{\left(0 \right)}\right) \pm \eta, 0, \dots , 0 \right) \in V, [/latex] то в кубе [latex] Q^{ m + 1 }_{ \delta } [/latex] найдутся точки [latex] x’^{ \star} = \left(x’_{1}, \dots , x’_{m + 1} \right) [/latex] и [latex] x»^{ \star} = \left(x»_{1}, \dots , x»_{m + 1} \right), [/latex] отображающиеся при отображении [latex] \Phi [/latex] в указанные точки окрестности [latex] V: [/latex]
Если положим для краткости [latex] x’^{ \star} = \left(x’_{1}, \dots , x’_{m + 1}, x^{\left(0 \right)}_{m+2}, \dots , x^{\left(0 \right)}_{n} \right) [/latex] и [latex] x»^{ \star} = \left(x»_{1}, \dots , x»_{m + 1}, x^{\left(0 \right)}_{m+2}, \dots , x^{\left(0 \right)}_{n} \right), [/latex] то в координатной записи получим
[latex] f_{k}\left(x’\right) = 0, k = 1, 2, \dots , m, x’ \in Q^{n}_{\delta} [/latex]
и
[latex]f_{k}\left(x»\right) = 0, k = 1, 2, \dots , m, x’ \in Q^{n}_{\delta}. [/latex]
Поскольку число [latex] \delta, 0 < \delta < \delta_{0}, [/latex] может быть сколь угодно мало, то указанные точки [latex] x’ [/latex] и [latex] x» [/latex] могут быть выбраны сколь угодно близко от точки [latex] x^{\left(0\right)}, [/latex] и, таким образом, сколь угодно близко от точки [latex] x^{\left(0\right)} [/latex] имеются точки, удовлетворяющие уравнениям связи, в которых функция [latex] f_{0} [/latex] принимает значения, как большие, так и меньшие значения [latex] f_{0}\left(x^{\left(0\right)}\right). [/latex] Что и означает, что точка [latex] x^{\left(0\right)} [/latex] не является точкой условного экстремума. Это противоречие и доказывает теорему.
- Следствие
- Если в точке [latex]x^{(0)}[/latex] условного экстремума функции [latex]f_{0}[/latex] относительно уравнений связи. Тогда в этой точке градиенты [latex]\nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m}[/latex] линейно независимы, то есть ранг матрицы Якоби
[latex]\left( \frac{ \partial f_{j} }{ \partial x } \right), j = 1, 2, \dots , m, i = 1, 2, \dots , n, [/latex]
равен [latex]m[/latex], то существуют такие [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex], что в этой точке
[latex] \nabla f_{0} + \sum\limits_{j = 1}^{m}{\lambda_{j} \nabla f_{j}} = 0 \quad \left( 2 \right)[/latex]то есть [latex]\nabla f_{0}[/latex] является линейной комбинацией градиентов [latex]\nabla f_{1}, \nabla f_{2}, \dots , \nabla f_{m}[/latex].
В координатной форме это условие имеет вид: для любого [latex]i = 1, 2, \dots , n [/latex] в точке [latex]x_{(0)}[/latex]
- Определение
- Функция
[latex] F \left( x \right) = f_{0}\left( x \right) + \sum\limits_{j = 1}^{m}{\lambda_{j} f_{j}\left( x \right)}, \quad \left( 4 \right)[/latex]
где числа [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex] удовлетворяют условию [latex]\left( 3 \right), [/latex] называется функцией Лагранжа рассматриваемой задачи, а сами числа [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex] — множителями Лагранжа.
Условие [latex] \left( 3 \right) [/latex] означает, что если [latex] x^{(0)} [/latex] является точкой условного экстремума функции [latex] f_{0} [/latex] относительно уравнений связи [latex]y_{i} = f_{i}(x), i = 1, 2, \dots , m,[/latex] то она является стационарной точкой для функции Лагранжа, т. е.
Теперь уже можно поговорить о том, как на практике использовать эти теоремы для нахождения точек условного экстремума. Прежде всего, мы можем заметить, что у функции вида [latex]\left( 4 \right)[/latex] при произвольных числах [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m},[/latex] каждая точка её условного экстремума является и точкой условного экстремума исходной функции [latex] f_{0}, [/latex] и наоборот. Мы выбираем такие значения [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m},[/latex] чтобы выполнялись условия [latex]\left( 3 \right),[/latex], т. е. чтобы данная точка условного экстремума оказалась и стационарной точкой функции [latex]\left( 4 \right) [/latex].
Для отыскания точек условного экстремума следует рассмотреть систему из [latex] n + m [/latex] уравнений, составленной из частных производных функции Лагранжа по каждой переменной [latex] x_{i}, i = 1, 2, \dots , n [/latex] и уравнений связи [latex]f_{i}(x), i = 1, 2, 3\dots, m[/latex] (однако, уравнения связи можно рассматривать как частные производные функции Лагранжа по переменным [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex]) относительно неизвестных [latex] x^{0}_{1}, \dots , x^{0}_{n}, \lambda_{1}, \dots , \lambda_{m}[/latex] и решить её (если это возможно), найдя [latex] x^{0}_{1}, \dots , x^{0}_{n}[/latex] и по возможности исключив [latex]\lambda_{1}, \dots , \lambda_{m}[/latex]. Сформулированная теорема утверждает, что все точки условного экстремума будут находится среди найденных таким образом точек [latex] \left(x^{0}_{1}, \dots , x^{0}_{n} \right)[/latex].
Пример №1
Функции [latex] f [/latex] и [latex] \phi [/latex] дважды непрерывно дифференцируемы на всей плоскости. Кроме того, ранг матрицы
равен единице (т. е. равно количеству связей) на всей плоскости [latex] Oxy [/latex] за исключением точки [latex] \left(0, 0 \right).[/latex] Но последняя не лежит на окружности [latex] \phi \left(x, y \right) = x^2 + y^2 — 1 = 0. [/latex] Следовательно, точки, в которых возможен локальный экстремум, находятся только среди стационарных точек.
Приравнивая к нулю частные производные функции Лагранжа задачи
по переменным [latex] x, y, \lambda [/latex], получим систему уравнений:
Решив её, получим четыре пары стационарных точек [latex] x = \pm \frac{1}{\sqrt{2}}, [/latex] [latex] y = \pm \frac{1}{\sqrt{2}}, [/latex] соответствующих всевозможным распределениям [latex] «+» [/latex] и [latex] «-» [/latex]. Паре [latex] x_{1} = y_{1} = \frac{ 1}{ \sqrt{2}} [/latex]
соответствуют [latex] \lambda_{1} = \frac{1}{2} [/latex] и лагранжева функция
Второй дифференциал от [latex]F[/latex] в точке [latex] \left(x_{1}, y_{1} \right) [/latex] имеет вид
Тогда, в силу уравнения связи
откуда [latex] \partial y = — \partial x, [/latex] и окончательно
где [latex] \partial x [/latex] — независимый дифференциал. Следовательно, в точке [latex] \left(x_{1}, y_{1} \right) [/latex] имеет место локальный относительный максимум задачи, равный [latex] f \left( \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right) = \frac{1}{2}. [/latex] Легко заключить, используя симметрические свойства [latex] f ,[/latex] что в точке [latex] \left( -\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}} \right) [/latex] имеет место другой локальный относительный максимум, равный [latex] \frac{1}{2} [/latex].
Так как окружность [latex] \Gamma [/latex] есть ограниченное замкнутое множество и непрерывная на [latex] \Gamma [/latex] функция [latex] f [/latex] должна достигать на [latex] \Gamma [/latex] своего максимума, и так как максимум на [latex] \Gamma [/latex] необходимо есть максимум на [latex] \Gamma, [/latex] то
и, аналогично,
Литература
- Конспект лекций по мат.анализу Лысенко З.М.
- Л. Д. Кудрявцев. Курс математического анализа, том 2, страницы 371 — 376.
- С. М. Никольский. Курс математического анализа, том 1, издание третье, страницы 285 — 292.
- Б. П. Демидович. Сборник задач и упражнений по математическому анализу, примеры: 3654, 3656, 3657.1, 3658.
Тесты
Условный экстремум. Метод множителей Лагранжа.
Этот тест поможет вам освоить материал этой статьи.
Таблица лучших: Условный экстремум. Метод множителей Лагранжа.
Место | Имя | Записано | Баллы | Результат |
---|---|---|---|---|
Таблица загружается |