Дифференциальное исчисление функций многих переменных — важный раздел анализа, имеющий немало приложений в физике, инженерии и прикладной математике. Существенное количество практических задач формулируется в терминах функций от двух переменных — явном выражении поверхностей в пространстве [latex]\mathbb{R}^{3}[/latex]. В классических курсах анализа их изучают с более общих позиций, рассматривая достаточные критерии экстремума функций вида [latex]f: \mathbb{R}^{n} \rightarrow \mathbb{R}[/latex] (также называемых скалярными полями), в терминах которых ведётся дальнейшее изложение.
Определение
- локальный минимум, если [latex]\exists U(x_{0}) \subset \mathbb{E}: \forall f(x) \le f(x_{0})[/latex].
- локальный максимум, если [latex]\exists U(x_{0}) \subset \mathbb{E}: \forall f(x) \ge f(x_{0})[/latex].
Заменой неравенств на строгие получаем условия соответственно строгого локального минимума и максимума.
Определение
Якобианом векторного поля [latex]f: \mathbb{R}^{m} \rightarrow \mathbb{R}^{n}, \forall x \in \mathbb{R}^{m} f(x) = (f_{1}(x),…,f_{m}(x))[/latex], дифференцируемого в точке [latex]x[/latex] и непрерывного в некоторой её окрестности [latex]U(x) \in \mathbb{R}^{m}[/latex]называют линейный оператор [latex]\mathbf{J}[/latex], описывающий наилучшее линейное приближение функции в некоторой окрестности точки [latex]x[/latex] и имеющий матрицу вида:
— так называемую матрицу Якоби (матрица касательного отображения). Для скалярного поля матрица Якоби имеет вид:
Определение
Гессианом скалярного поля [latex]f: \mathbb{R}^{m} \rightarrow \mathbb{R}[/latex], дважды дифференцируемого по всем аргументам в точке [latex]x=(x^{1},…,x^{m}) \in \mathbb{R}^{m}[/latex], называют симметрическую квадратичную форму [latex]H(x)=\sum _{ i=1 }^{ m }{ \sum _{ j=1 }^{ m }{ h_{ij}x_{i}x_{j} } } [/latex], описывающую наилучшее квадратичное приближение функции в некоторой окрестности точки [latex]x[/latex] и имеющую матрицу вида:
— так называемую матрицу Гессе, определитель которой обычно подразумевается под Гессианом. Матрица Гессе также описывает локальную кривизну скалярного поля.
Утверждение
Поведение функция [latex]f: \mathbb{R}^{m} \rightarrow \mathbb{R}^{n}[/latex], дважды дифференцируемой в точке [latex]x=(x^{1},…,x^{m}) \in \mathbb{R}^{m}[/latex] и непрерывной в некоторой окрестности [latex]U(x) \subset \mathbb{R}[/latex] этой точки, характеризуется формулой:
Достаточное условие экстремума в терминах частных производных
Для того, чтобы функция [latex]f: U(x_{0}) \rightarrow \mathbb{R}[/latex], дважды дифференцируемая по всем аргументам в точке [latex]x_{0}=(x_{0}^{1},…,x_{0}^{m}) \in \mathbb{R}^{m}[/latex], в ней имела экстремум достаточно, чтобы её Гессиан был знакоопределён, причем, положительная определённость влечёт наличие в точке строгого локального минимума, отрицательная определённость — строгого локального максимума.
Воспользуемся разложением в ряд Тейлора, обозначив вектор сдвига как [latex]\mathbf{h}=(h_{1},…,h_{m})[/latex]. Тогда
Отсюда следует, что знак выражения в левой части, позволяющий судить о наличии или отсутствии экстремума в точке [latex]\mathbf{x}[/latex], определяется знаком выражения в квадратных скобках. Посмотрим на неё внимательнее: пусть [latex]\mathbf{h} != 0[/latex], тогда вектор [latex]{ e }=\left( \frac { h_{ 1 } }{ \left\| { h } \right\| } ,\frac { h_{ 2 } }{ \left\| { h } \right\| } ,…,\frac { h_{ m } }{ \left\| { h } \right\|} \right) [/latex] имеет единичную норму [latex]\left\| { e } \right\| = 1[/latex], каким бы он ни был. Форма [latex]\sum _{i=1}^{m}{\sum_{j=1}^{m}{\frac {\partial f^{2}} {\partial x_{i} \partial x_{j}} \frac{h_{i} } { \left\| \mathbf{h} \right\| } \frac{ h_{j}} {\left\| \mathbf{h} \right\|}}}[/latex] непрерывна на [latex]\mathbb{R}^{m}[/latex] как однородный многочлен второй степени от координат [latex]\mathbf{h}[/latex] в силу непрерывности вторых производных [latex]f[/latex] в окрестности [latex]\mathbf{x}[/latex]. Квадратичная форма непрерывна и на единичной сфере [latex]S(0;1)=\left\{ x \in \mathbb{R}^{m}| \left\| { x } \right\| \le 1 \right\} [/latex]. Приниципиальный интерес этот факт представляет по той причине, что единичная сфера — компакт, а свойства скалярных функций, непрерывных на компакте, хорошо известны и сыграют важную роль. В частности, непрерывная на компакте функция достигает на нём своих точных верхней и нижней граней [latex]m[/latex] и [latex]M[/latex].
Если форма положительно определена, то [latex]0 0[/latex], что [latex]\forall y: \left\| y \right\| < \delta \quad \underline { o } (1)=\alpha (y) < m \Rightarrow \underline { o } (1) < m 0[/latex].
Доказательство для случая отрицательно определённой квадратичной формы симметрично приведенному.
Докажем далее, что значения разных знаков, принимаемые формой в окрестности данной точки, являются достаточным условием отсутствия в ней экстремума функции. Сохраняя обозначения предыдущего пункта, назовём [latex]\mathbf{e_{m}}[/latex] и [latex]\mathbf{e_{M}}[/latex] точки единичной сфера, в которых форма достигает значений [latex]m[/latex] и [latex]M[/latex] соответственно, причем пусть [latex]m < 0 < M[/latex].
Вновь выпишем разложение в ряд Тейлора функции [latex]f[/latex], взяв за вектор сдвига вектор [latex]t\mathbf{e_{m}}[/latex], где число [latex]t[/latex] подобрано таким образом, чтобы [latex]\mathbf{x}+t\mathbf{e_{m}} \in U(x)[/latex]:
Аналогично рассуждениям предыдущего пункта, рассмотрим случай [latex]\text{sign}(\underline {o}(1))=1[/latex]: [latex]\lim _{ \left\| t \right\| \rightarrow 0}{ \alpha (t\mathbf{e_{m}}) } = 0 \Rightarrow \exists \delta > 0: \forall t m[/latex]. Тогда значение в квадратных скобках, как и выражение в левой части, неположительно. В ходе аналогичных рассуждений получим двойственную ситуацию для [latex]\mathbf{e_{M}}[/latex]. Следовательно, в любой окрестности [latex]U(\mathbf{x})[/latex] точки [latex]\mathbf{x}[/latex] функция [latex]f[/latex] принимает значения, как большие, так и меньше [latex]f(\mathbf{x})[/latex], следовательно, в точке [latex]\mathbf{x}[/latex] экстремума быть не может по определению.
Замечание 1
Условие не является необходимым, так как ничего не говорит о случае, когда квадратичная форма полуопределена, т.е. является и неположительна или неотрицательна, т.е. содержит критические точки, не являющиеся экстремальными, строго больше или меньше нуля на всех векторах окрестности.
Исследуем на экстремум функцию [latex]f(x,y)=x^{4}+y^{4}-2x^{2}[/latex]. Отыщем критические точки согласно необходимому условию:
Решаяя систему, получаем точки: [latex](-1,0),(0,0),(1,0)[/latex]. Поскольку смешанные производные существуют и непрерывны и
матрица Гессе имеет вид
Используя критерий Сильвестра, убедитесь, что в указанных трёх точках квадратичная форма полуопределена. Несмотря на то, что достаточный критерий экстремума в терминах квадратичного приближения неприменим, из записи функции в виде [latex]f(x,y)=(x^{2}-1)^{2}+y^{4}-1[/latex] очевидно, что в точках [latex](\pm 1, 0)[/latex] функция (симметричная и монотонно возрастающая по обеим переменным) имеет строгий локальный минимум, а в точке [latex](0, 0)[/latex] не имеет экстремума вовсе.
Нижеприведенное изображение наглядно демонстрирует правильность выводов. Нормалями к поверхности обозначены стационарные точки.
Замечание 2
Функция может принимать экстремальные значения в граничных точках области определения. Вышеприведенное достаточное условие для их выявления использовать не рекомендуется, следует обратиться к аппарату теории условного экстремума.
Пример (Демидович, №3629)
Исследовать на локальный экстремум функцию
Вычислим первые частные производные. Решением нижеприведенной системы
находим стационарные точки
Отметим, что в точках, лежащих на границе эллипса [latex]1=\frac{x^2}{a^2}+\frac{y^2}{b^2}[/latex] частные производные не существуют, следовательно, их следует отдельно проверить на экстремум, что выходит за рамки аппарата данной статьи.
Для проверки достаточных условий выпишем вторые производные
- Точка [latex] (0,0) [/latex] не является точкой условного экстремума
$$ \mathbf{ H }_{ z }(0,0)=\begin{Vmatrix} 0 & 1 \\ 1 & 0 \end{Vmatrix},\quad \Delta_{1}=0,\quad \Delta_{2}=-1 $$
-
Заметим, что функция [latex]z(x,y)[/latex] чётна, а также [latex]z \left( \frac { -a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } \right) = z \left( \frac { a }{ \sqrt { 3 } } ,\frac { -b }{ \sqrt { 3 } } \right)[/latex].
Точки [latex] (\pm \frac { a }{ \sqrt { 3 } }, \pm \frac { b }{ \sqrt { 3 } }) [/latex] являются точками условного экстремума
$$ { H }_{ z }(\frac { a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } )=\begin{Vmatrix} -\frac { 4b }{ \sqrt { 3 } a } & -\frac { 2 }{ \sqrt { 3 } } \\ -\frac { 2 }{ \sqrt { 3 } } & -\frac { 4a }{ \sqrt{3}b} \end{Vmatrix},\quad \Delta _{ 1 }=-\frac { 4b }{ \sqrt { 3 } a } 0 $$ $$ { H }_{ z }(\frac { -a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } )=\left( \begin{array}{cc} \frac { 4b }{ \sqrt { 3 } a } & -\frac { 2 }{ \sqrt { 3 } } \\ -\frac { 2 }{ \sqrt { 3 } } & \frac { 4a }{ \sqrt { 3 } b } \end{array} \right) ,\Delta _{ 1 }=\frac { 4b }{ \sqrt { 3 } a } >0, \quad \Delta _{ 1 }=\frac { 16 }{ 3 } — \frac{4}{3} = 4 > 0 $$Соответственно, [latex]\left(\pm \frac {a}{ \sqrt { 3 } } , \pm \frac { b }{ \sqrt { 3 } } \right)[/latex] — точки минимума, [latex]\left(\pm \frac {a}{ \sqrt { 3 } } , \mp \frac { b }{ \sqrt { 3 } } \right)[/latex] — точки максимума.
Источники:
- Зорич В.А., Математический анализ, ФАЗИС, 1997, стр. 454-461
- Демидович Б.П., Сборник заданий и упражнений по математическому анализу, издание 13, исправленное, Издательство Московского Университета, Издательство ЧеРо, 1997
- Лысенко З.М., Конспект лекций по математическому анализу, 2014-2015 гг., семестр 2
Закрепление материала.
Таблица лучших: Достаточные условия экстремума функции многих переменных
Место | Имя | Записано | Баллы | Результат |
---|---|---|---|---|
Таблица загружается |