М1818. Доказать неравенство с тремя параметрами

Задача из журнала «Квант» (2002 год, 3 выпуск)

Условие

Докажите неравенство $$\sqrt{\cfrac{a}{b+c}}+\sqrt{\cfrac{b}{c+a}}+\sqrt{\cfrac{c}{a+b}}>2,$$где $a>0, b>0, c>0$.

С.Нестеров

Решение

Рассмотрим функцию $$f(x,y,z)=\sqrt{\cfrac{x}{y+z}}+\sqrt{\cfrac{y}{z+x}}+\sqrt{\cfrac{z}{x+y}},$$ где $x>0, y>0, z>0$. Считая, без ограничения общности, $x\leqslant y \leqslant z$, докажем вначале неравенство $$f(x,y,z)\leqslant f(x,\cfrac{y+z}{2}, \cfrac{y+z}{2}). \tag{1}$$ Обозначив $\cfrac{z+y}{2}=\alpha, \cfrac{z-y}{2}=t$, перепишем $(1)$ в виде $$\phi (t)\geqslant \phi (0),\tag{2}$$ где $$\phi (t)=\sqrt{\cfrac{\alpha + t}{\alpha + x — t}}+\sqrt{\cfrac{\alpha — t}{\alpha + x + t}}.$$

Здесь $0\leqslant t \leqslant \alpha, \alpha \geqslant x$.

Докажем $(2)$. Имеем $$\phi^{\prime}(t)=(x+2a)\left (\cfrac{1}{(\alpha + t)^{\frac{1}{2} }(x+\alpha-t)^{\frac{3}{2}}} — \cfrac{1}{(\alpha — t)^{\frac{1}{2}}(x+\alpha +t)^{\frac{3}{2}}}\right ).$$ Очевидно, знак $\phi^{\prime}(t)$ совпадает со знаком функции $$\psi (t)=(\alpha — t)(x + \alpha + t)^{3}-(\alpha + t)(x+\alpha -t)^{3},$$ и любой нуль функции $\phi^{\prime} (t)$ также является нулем функции $\psi (t)$. Исследуем $\psi (t)$. Имеем: $\psi (t)$ — отличный от константы нечетный многочлен, степень которого не выше $3$. Следовательно, $\psi (t)$ имеет на положительной полуоси не более одного корня.

Получили: $\phi (t)$ может иметь внутри отрезка $[0,\alpha]$ не более одного экстремума. Но и этот экстремум не может быть минимумом, поскольку $\psi (\alpha)<0$.

Итак, $\phi (t) \geqslant min\{ \phi (0), \phi(\alpha)\} $. Но, поскольку $\alpha \geqslant x$, имеем $$\phi(0)=2\sqrt{\cfrac{\alpha}{\alpha + x}}\leqslant \sqrt{\cfrac{2\alpha}{x}}=\phi (\alpha).$$ Неравенство $(1)$ доказано.

(Выше мы ограничились необходимой нам информацией о производной; легко получить и полную информацию о ней. Именно, $\psi (t)$ — многочлен третьей степени; $\psi (t) = 0$, при $t = 0$ и при $$t^{2}=\cfrac{(x+\alpha)^{2}(2\alpha — x)}{3x+2\alpha}.$$ При этом $t^{2}<\alpha^{2}$ при $x>0, \alpha>0$. Значит исследуемая функция при любом $x, x < 0 < \alpha$, имеет экстремум на интервале $(0;\alpha)$.)

Вследствие $(1)$ для решения задачи достаточно доказать, что $$f_{1}(x)=\sqrt{\cfrac{x}{2\alpha}}+2\sqrt{\cfrac{\alpha}{x+\alpha}}> 2 \tag{3}$$ при $0<x\leqslant \alpha$.

Исследуем $f_{1}(x)$ на отрезке $[0;\alpha]$. Во внутренних точках этого отрезка знак $f^{\prime}_1(x)$ совпадает со знаком многочлена $P(x)=(x+\alpha)^{3}-8\alpha^{2}x$. Кроме того, любой нуль функции $f^{\prime}_{1}(x)$ является также нулем многочлена $P(x)$. Заметим что $P(\alpha)=0;$ помимо этого, $P(x)$ имеет корень на отрицательной полуоси. Следовательно, если $P(x_0)=0$ при $0<x_0<\alpha$, то при переходе через $x_0$ многочлен $P(x)$ меняет знак с $«+»$ на $«-»$. Поэтому $x_0$ — точка максимума функции $f_1(x)$.

Получили: $$f_{1}(x)>min\{f_{1}(0),f_{1}(\alpha)\}$$ при $0<x<\alpha$. Но $$f_{1}(\alpha)=\cfrac{3}{\sqrt{2}}>2=f_{1}(0).$$ Неравенство $(3)$ доказано.

(Легко видеть, что $P(x)=0$ при $x=\alpha$ и при $x=\alpha(-2\pm \sqrt{5})$. Значит исследуемая функция имеет экстремум на интервале $(0;\alpha)$.)

А.Ковальджи, С.Нестеров, В.Сендеров

14.3 Условный экстремум

Определение. Пусть $f $– действительная функция, заданная на открытом множестве $E ⊂ R^n,$ $M-p$-мерное многообразие, содержащееся в $E$. В точке $x_0 ∈ M$ функция $f$ имеет условный максимум на многообразии $M,$ если существует такая окрестность $U ⊂ E$ точки $x_0,$ что для всех $x ∈ U ∩ M$ выполняется неравенство $f(x)≤f(x_0).$ Условный максимум называется строгим, если окрестность можно выбрать настолько малой, что для всех $x ∈ U ∩M,$ $x \ne x_0,$ будет выполнено строгое неравенство $f(x)< f(x_0).$ Аналогично определяется понятие условного минимума.

Пример. Пусть $f(x, y) = xy.$ В начале координат эта функция не имеет обычного экстремума, поскольку в любой окрестности начала координат она принимает как положительные, так и отрицательные значения. Возьмем теперь многообразие $M_1 : y = x.$ На этом многообразии $f(x, y) = x^2$ и в точке $(0, 0)$ функция f имеет условный минимум на многообразии $M_1.$ Если взять $M_2 : y = −x,$ то на нем $f(x, y) = −x^2,$ и теперь функция $f$ имеет условный максимум в точке $(0, 0).$ Итак, функция f в начале координат не имеет экстремума, а на многообразиях $M_1$ и $M_2$ имеет условные минимум и максимум, соответственно.

 

Теорема (необходимое условие экстремума на многообразии). Пусть $f$– действительная функция, заданная на открытом множестве $E ⊂ R^n,$ содержащем многообразие $M$. Пусть в точке $x_0 ∈ M$ функция $f$ имеет условный экстремум и дифференцируема в этой точке. Тогда производная $f'{}(x_0)$ обращается в нуль на касательном пространстве $T_{x0}(M),$ т. е.$f'{} (x_0)·h = 0$ для любого $h ∈ T_{x0}(M).$

Пусть $h$ – касательный вектор, т. е. $h ∈ T_{x0}(M).$ Тогда существует такая функция $γ : R \to M,$ $γ(0) = x_0,$ что $γ'{}(0) = h.$ Рассмотрим функцию $g(t) = f(γ(t)) (t ∈ R).$ Если $f$ в точке $x_0$ имеет условный максимум, то при $t = 0$ функция $g$ имеет обычный локальный максимум. Функция $g$ дифференцируема в точке $t = 0$ и, по теореме о производной сложной функции,

$g'{}(0)= f'{}(γ(0))·γ'{} (0) = f'{}(x_0)·h$

С другой стороны, по теореме Ферма, $g'{}(0)=0.$ Итак, $f'{}(x_0)·h=0.$

Геометрический смысл теоремы. Предположим, что функция $f$ класса $C^1$ и рассмотрим множество

$H = ${$x:f(x)= f(x_0)$}

Это множество называется множеством уровня функции $f.$ Предположим, что $f'{}(x)\ne 0$ для всех $x ∈ H.$ Тогда получим, что $H – (n − 1)$- мерное многообразие, т. е. гиперповерхность. Касательное пространство к многообразию $H$ определяется как совокупность всех векторов $h,$ для которых выполнено равенство $f'{}(x_0)·h = 0.$ Доказанная теорема утверждает, что $p$-мерное подпространство $T_{x0}(M)$ содержится в $(n−1)$-мерной гиперплоскости $T_{x0}(H).$ Другими словами, касательная гиперплоскость к $H$ в точке $x_0$ содержит касательную $p$-плоскость к $M$ в этой точке.

Заметим, что доказанная теорема дает лишь необходимое условие экстремума. Можно показать, что достаточным оно не является.

Метод множителей Лагранжа. Пусть $M – p$-мерное многообразие, точка $x_0 ∈ M$ и в окрестности $U$ этой точки $M$ определено уравнением $ϕ(x) = 0,$ где $ϕ = (ϕ^1, …, ϕ ^{n−p} ),$ $rank$ $ϕ'{}(x) = n − p$ для любого $x ∈ U.$

Теорема. Пусть $f$ – действительная функция в некоторой окрестности многообразия $M,$ дифференцируемая в точке $x_0 ∈ M$ и имеющая в этой точке условный экстремум. Тогда существуют такие действительные числа $λ_1,…, λ_{n−p},$ что для функции

$F(x) = f(x) + λ_1ϕ^1(x) + … + λ_{n−p}ϕ^{n−p}(x)$

полная производная $F'{}(x_0) = 0.$

В силу предыдущей теоремы, $f'{}(x_0)·h = 0$ для любого $h ∈ T_{x0} (M).$ Это равносильно тому, что $grad$ $f(x_0)·h = 0$ для любого $h ∈ T_{x0} (M), $т. е. $grad$ $f(x_0)$ ортогонален к любому касательному вектору. Значит, этот градиент является нормальным вектором к многообразию $M$ в точке $x_0.$ Как известно, векторы $grad$ $ϕ^i (x_0) (i = 1, …, n − p)$ образуют базис в пространстве нормальных векторов. Значит, существуют числа $α_1, …, α_{n−p}$ такие, что

$grad$ $(f(x_0)) = α^1$ $grad$ $( ϕ^1 (x_0) + … + α_{n−p})$ $grad$ $(ϕ^{n−p} (x_0)).$

Обозначим $λ_i = −α_i, i = 1, …, n−p.$ Тогда видим, что для $F$ ее градиент $grad$ $F(x_0) = 0,$ а это равносильно тому, что $F'{}(x_0) = 0,$ и тем самым теорема доказана.

Числа $λ_1, …, λ_{n−p}$ называются множителями Лагранжа. Они определяются однозначно, так как являются координатами разложения вектора $grad$ $ f(x_0)$ по базису из векторов $grad$ $ϕ^i (x_0) (i = 1, …, n − p),$ взятых с противоположным знаком. Условие $rank $ $ϕ'{}(x) = n − p$ обеспечивает линейную независимость векторов $grad$ $ϕ^i (x_0) (i = 1, …, n − p).$

В качестве примера, иллюстрирующего метод множителей Лагранжа, рассмотрим следующую задачу. Найти расстояние от точки до гиперплоскости в пространстве $R^n.$
Решение

Гиперплоскость $H$ определяется уравнением

$ a_1x ^1 + … + a_nx^n = b,$

или в векторной форме $ax = b,$ где $a \ne 0,$ ибо, в противном случае, не получим гиперплоскость.

Пример. Пусть $x_0 ∈ R^n.$ Покажем, что расстояние от заданной точки $x_0$ до $H$ равно $d(x_0, H) = \frac{|ax_0−b|}{|a|}.$ Расстояние от $x_0$ до произвольной точки $x ∈ H$ выражается следующим образом:
Решение

$\sqrt{(x^1 − x^1_0 )^2 + … + (x^n − x^n_0 )^2}.$

Поэтому для нахождения минимума этих расстояний достаточно рассмотреть подкоренное выражение и найти его минимум.

Обозначим $f(x) = (x^1 − x^1_0 )^2 + … + (x^n − x^n_0 )^2 .$ Составим функцию Лагранжа

$ F(x) = f(x) + λ(ax − b) = f(x) + λ(a_1x^1 + … + a_nx ^n − b).$

Находим все частные производные функции $F$ и приравниваем их к нулю. Получаем

$ \left \{\begin{matrix} 2(x^1 − x^1_0 ) + λa_1 = 0,\\ ………………… \\ 2(x^n − x^n_0 ) + λa_n = 0, \\a_1x^1 + … + a_nx^n = b \end{matrix}\right.$

Последнее уравнение этой системы означает, что точка x лежит на гиперплоскости $H.$ Умножим $i$-е уравнение этой системы на $a_i (i = 1, …, n)$ и сложим первые $n$ уравнений. Тогда получим

$ 2 \sum_{i=1}^n (a_ix^i − a_ix^i_0 ) + λ\sum^n_{i=1} a^2_i = 0,$

или, учитывая последнее уравнение системы,

$ 2(b − ax_0) + λ|a|^2 = 0.$

Отсюда находим

$ λ = \frac{2(ax_0 − b)} {|a|^2}.$

Подставим найденное значение $λ$ в первые $n$ уравнений системы и получим

$2(x^i − x^i_0 ) = −a_i\frac{ 2(ax_0 − b) }{|a|^2} (i = 1, …, n).$

Каждое из этих равенств возведем в квадрат и сложим полученные равенства. Получим

$ f(x) = \frac{(ax_0 − b)^2} {|a|^2} ,$

а это и есть квадрат искомого расстояния.

Пример. Найти точки условного экстремума функции (если они есть) $f(x,y) = y_{2} — x_{2}$ при уравнении связи $y = 2x.$
Решение

Имеем $f(x, 2x) = 3x^{2},$ т.е. при выполнении уравнений связи данная функция является функцией одного переменного и достигает минимума при $x = 0.$
Значению $x = 0$ согласно уравнению связи соответствует значение $y = 0,$ а поэтому функция $f(x,y) = y_{2} — x_{2}$ имеет в точке $(0, 0)$ условный минимум относительно уравнения связи $y = 2x.$

Литература

Условный экстремум

Проверьте, насколько хорошо вы усвоили эту тему и закрепите свои знания по ней, пройдя тест.

Достаточные условия экстремума

Экстремумы функций одной переменной

Определение:

Функция [latex]f:\mathbb{E} \subset \mathbb{R}\rightarrow \mathbb{R}[/latex], имеет во внутренней точке [latex]x_{0}[/latex]:

  • Локальный минимум, если [latex]\exists U(x_{0}):\forall x\in \dot {U}(x_{0}) f(x)\ge f(x_{ 0 })[/latex]
  • Строгий локальный минимум, если [latex]\exists U(x_{0}):\forall x\in \dot {U}(x_{0}) f(x) > f(x_{ 0 })[/latex]
  • Локальный максимум если [latex]\exists U(x_{0}):\forall x\in \dot {U}(x_{0}) f(x)\le f(x_{ 0 })[/latex]
  • Строгий локальный максимум, если [latex]\exists U(x_{0}):\forall x\in \dot {U}(x_{0}) f(x) < f(x_{ 0 })[/latex]

Поиск локальных и абсолютных экстремумов — важная практическая задача, породившая широкий спектр методов оптимизации. Изучение свойств и условий существования локального экстремума функций в одномерном случае создает прочный фундамент, упрощающий изучение аналогичного материала в анализе функций многих переменных.


Достаточные условия экстремума в терминах первой производной

Читать далее «Достаточные условия экстремума»

Достаточные условия экстремума функции двух переменных

Дифференциальное исчисление функций многих переменных — важный раздел анализа, имеющий немало приложений в физике, инженерии и прикладной математике. Существенное количество практических задач формулируется в терминах функций от двух переменных — явном выражении поверхностей в пространстве [latex]\mathbb{R}^{3}[/latex]. В классических курсах анализа их изучают с более общих позиций, рассматривая достаточные критерии экстремума функций вида [latex]f: \mathbb{R}^{n} \rightarrow \mathbb{R}[/latex] (также называемых скалярными полями), в терминах которых ведётся дальнейшее изложение.


Определение

Говорят, что функция [latex]f: \mathbb{E} \subset \mathbb{R}^{m} \rightarrow \mathbb{R}[/latex] имеет во внутренней точке [latex]x_{0}[/latex]

  • локальный минимум, если [latex]\exists U(x_{0}) \subset \mathbb{E}: \forall f(x) \le f(x_{0})[/latex].
  • локальный максимум, если [latex]\exists U(x_{0}) \subset \mathbb{E}: \forall f(x) \ge f(x_{0})[/latex].

Заменой неравенств на строгие получаем условия соответственно строгого локального минимума и максимума.


Определение

Якобианом векторного поля [latex]f: \mathbb{R}^{m} \rightarrow \mathbb{R}^{n}, \forall x \in \mathbb{R}^{m} f(x) = (f_{1}(x),…,f_{m}(x))[/latex], дифференцируемого в точке [latex]x[/latex] и непрерывного в некоторой её окрестности [latex]U(x) \in \mathbb{R}^{m}[/latex]называют линейный оператор [latex]\mathbf{J}[/latex], описывающий наилучшее линейное приближение функции в некоторой окрестности точки [latex]x[/latex] и имеющий матрицу вида:

$$ { J }_{ f }(x)=\begin{Vmatrix} \frac { \partial f_{ 1 } }{ \partial x_{ 1 } } (x) & \frac { \partial f_{ 1 } }{ \partial x_{ 2 } } (x) & … & \frac { \partial f_{ 1 } }{ \partial x_{ m } } (x) \\ \frac { \partial f_{ 2 } }{ \partial x_{ 1 } } (x) & \frac { \partial f_{ 2 } }{ \partial x_{ 2 } } (x) & … & \frac { \partial f_{2} }{ \partial x_{ m } } (x) \\ … & … & … & … \\ \frac { \partial f_{m} }{ \partial x_{ 1 } } (x) & \frac { \partial f_{m} }{ \partial x_{ 2 } } (x) & … & \frac { \partial f_{m} }{ \partial x_{ m }} (x) \end{Vmatrix} $$

— так называемую матрицу Якоби (матрица касательного отображения). Для скалярного поля матрица Якоби имеет вид:

$$ { J }_{ f }(x)=\begin{Vmatrix} \frac { \partial f }{ \partial x_{ 1 } } (x) & \frac { \partial f }{ \partial x_{ 2 } } (x) & … & \frac { \partial f }{ \partial x_{ m } } (x) \end{Vmatrix} $$

Определение

Гессианом скалярного поля [latex]f: \mathbb{R}^{m} \rightarrow \mathbb{R}[/latex], дважды дифференцируемого по всем аргументам в точке [latex]x=(x^{1},…,x^{m}) \in \mathbb{R}^{m}[/latex], называют симметрическую квадратичную форму [latex]H(x)=\sum _{ i=1 }^{ m }{ \sum _{ j=1 }^{ m }{ h_{ij}x_{i}x_{j} } } [/latex], описывающую наилучшее квадратичное приближение функции в некоторой окрестности точки [latex]x[/latex] и имеющую матрицу вида:

$$ \mathbf{H}_{f}(x) = \begin{Vmatrix} \frac { \partial ^{ 2 }f }{ \partial x_{ 1 }^{ 2 } } (x) & \frac { \partial ^{ 2 }f }{ \partial x_{ 1 }\partial x_{ 2 } } (x) & … & \frac { \partial ^{ 2 }f }{ \partial x_{ 1 }\partial x_{ m } } (x) \\ \frac { \partial ^{ 2 }f }{ \partial x_{ 2 }\partial x_{ 1 } } (x) & \frac { \partial ^{ 2 }f }{ \partial x_{ 2 }^{ 2 } } (x) & … & \frac { \partial ^{ 2 }f }{ \partial x_{ 2 }\partial x_{ m } } (x) \\ … & … & … & … \\ \frac { \partial ^{ 2 }f }{ \partial x_{ m }\partial x_{ 1 } } (x) & \frac { \partial ^{ 2 }f }{ \partial x_{ m }\partial x_{ 2 } } (x) & … & \frac { \partial ^{ 2 }f }{ \partial x_{ m }^{ 2 } } (x) \end{Vmatrix} $$

— так называемую матрицу Гессе, определитель которой обычно подразумевается под Гессианом. Матрица Гессе также описывает локальную кривизну скалярного поля.


Утверждение

Поведение функция [latex]f: \mathbb{R}^{m} \rightarrow \mathbb{R}^{n}[/latex], дважды дифференцируемой в точке [latex]x=(x^{1},…,x^{m}) \in \mathbb{R}^{m}[/latex] и непрерывной в некоторой окрестности [latex]U(x) \subset \mathbb{R}[/latex] этой точки, характеризуется формулой:

$$ f(\mathbf{x}+\mathbf{\Delta x}) \approx f(x) + \mathbf{J(x)\Delta x} + \frac{1}{2} \mathbf{\Delta x^{T} H(x) \Delta x} $$

Достаточное условие экстремума в терминах частных производных

Для того, чтобы функция [latex]f: U(x_{0}) \rightarrow \mathbb{R}[/latex], дважды дифференцируемая по всем аргументам в точке [latex]x_{0}=(x_{0}^{1},…,x_{0}^{m}) \in \mathbb{R}^{m}[/latex], в ней имела экстремум достаточно, чтобы её Гессиан был знакоопределён, причем, положительная определённость влечёт наличие в точке строгого локального минимума, отрицательная определённость — строгого локального максимума.

Спойлер

Воспользуемся разложением в ряд Тейлора, обозначив вектор сдвига как [latex]\mathbf{h}=(h_{1},…,h_{m})[/latex]. Тогда

$$ f(\mathbf{x}+\mathbf{h}) = f(\mathbf{x}) + \frac{1}{2!} \mathbf{h^{T} H(x) h} + \underline{o}((\left\| \mathbf{h} \right\|)^{2}),\left\| h \right\| =\sqrt { \sum _{ i=1 }^{ n }{ h_{ i }^{ 2 } } } \\ f(\mathbf{x}+\mathbf{h}) = f(\mathbf{x}) + \sum _{i=1}^{m}{\sum_{j=1}^{m}{\frac {\partial f^{2}} {\partial x_{i} \partial x_{j}}h_{i}h_{j}}} + \underline{o}((\left\| \mathbf{h} \right\|)^{2}) \\ f(\mathbf{x}+\mathbf{h}) — f(\mathbf{x}) = \frac {1}{2!} \left\| \mathbf{h} \right\|^{2}\left[\sum _{i=1}^{m}{\sum_{j=1}^{m}{\frac {\partial f^{2}} {\partial x_{i} \partial x_{j}} \frac{h_{i} } { \left\| \mathbf{h} \right\| } \frac{ h_{j}} {\left\| \mathbf{h} \right\|}}} + \underline{o}(1) \right] $$

Отсюда следует, что знак выражения в левой части, позволяющий судить о наличии или отсутствии экстремума в точке [latex]\mathbf{x}[/latex], определяется знаком выражения в квадратных скобках. Посмотрим на неё внимательнее: пусть [latex]\mathbf{h} != 0[/latex], тогда вектор [latex]{ e }=\left( \frac { h_{ 1 } }{ \left\| { h } \right\| } ,\frac { h_{ 2 } }{ \left\| { h } \right\| } ,…,\frac { h_{ m } }{ \left\| { h } \right\|} \right) [/latex] имеет единичную норму [latex]\left\| { e } \right\| = 1[/latex], каким бы он ни был. Форма [latex]\sum _{i=1}^{m}{\sum_{j=1}^{m}{\frac {\partial f^{2}} {\partial x_{i} \partial x_{j}} \frac{h_{i} } { \left\| \mathbf{h} \right\| } \frac{ h_{j}} {\left\| \mathbf{h} \right\|}}}[/latex] непрерывна на [latex]\mathbb{R}^{m}[/latex] как однородный многочлен второй степени от координат [latex]\mathbf{h}[/latex] в силу непрерывности вторых производных [latex]f[/latex] в окрестности [latex]\mathbf{x}[/latex]. Квадратичная форма непрерывна и на единичной сфере [latex]S(0;1)=\left\{ x \in \mathbb{R}^{m}| \left\| { x } \right\| \le 1 \right\} [/latex]. Приниципиальный интерес этот факт представляет по той причине, что единичная сфера — компакт, а свойства скалярных функций, непрерывных на компакте, хорошо известны и сыграют важную роль. В частности, непрерывная на компакте функция достигает на нём своих точных верхней и нижней граней [latex]m[/latex] и [latex]M[/latex].
Если форма положительно определена, то [latex]0 0[/latex], что [latex]\forall y: \left\| y \right\| < \delta \quad \underline { o } (1)=\alpha (y) < m \Rightarrow \underline { o } (1) < m 0[/latex].
Доказательство для случая отрицательно определённой квадратичной формы симметрично приведенному.
Докажем далее, что значения разных знаков, принимаемые формой в окрестности данной точки, являются достаточным условием отсутствия в ней экстремума функции. Сохраняя обозначения предыдущего пункта, назовём [latex]\mathbf{e_{m}}[/latex] и [latex]\mathbf{e_{M}}[/latex] точки единичной сфера, в которых форма достигает значений [latex]m[/latex] и [latex]M[/latex] соответственно, причем пусть [latex]m < 0 < M[/latex].
Вновь выпишем разложение в ряд Тейлора функции [latex]f[/latex], взяв за вектор сдвига вектор [latex]t\mathbf{e_{m}}[/latex], где число [latex]t[/latex] подобрано таким образом, чтобы [latex]\mathbf{x}+t\mathbf{e_{m}} \in U(x)[/latex]:

$$ f({ x }+{ h })-f({ x })=\frac { 1 }{ 2! } \left\| { te_{ m } } \right\| ^{ 2 }\left[ m+\underline { o } (1) \right] =\frac { 1 }{ 2! } (\left| t \right| \left\| { e_{ m } } \right\| )^{ 2 }\left[ m+\underline { o } (1) \right] =\frac { 1 }{ 2! } t^{ 2 }\left[ m+\underline { o } (1) \right] $$

Аналогично рассуждениям предыдущего пункта, рассмотрим случай [latex]\text{sign}(\underline {o}(1))=1[/latex]: [latex]\lim _{ \left\| t \right\| \rightarrow 0}{ \alpha (t\mathbf{e_{m}}) } = 0 \Rightarrow \exists \delta > 0: \forall t m[/latex]. Тогда значение в квадратных скобках, как и выражение в левой части, неположительно. В ходе аналогичных рассуждений получим двойственную ситуацию для [latex]\mathbf{e_{M}}[/latex]. Следовательно, в любой окрестности [latex]U(\mathbf{x})[/latex] точки [latex]\mathbf{x}[/latex] функция [latex]f[/latex] принимает значения, как большие, так и меньше [latex]f(\mathbf{x})[/latex], следовательно, в точке [latex]\mathbf{x}[/latex] экстремума быть не может по определению.

[свернуть]

Замечание 1

Условие не является необходимым, так как ничего не говорит о случае, когда квадратичная форма полуопределена, т.е. является и неположительна или неотрицательна, т.е. содержит критические точки, не являющиеся экстремальными, строго больше или меньше нуля на всех векторах окрестности.

Спойлер

Исследуем на экстремум функцию [latex]f(x,y)=x^{4}+y^{4}-2x^{2}[/latex]. Отыщем критические точки согласно необходимому условию:

$$ \begin{cases} \frac { \partial f }{ \partial x } (x,y)=4x^{ 3 }-4x=0, \\ \frac { \partial f }{ \partial x } (x,y)=4y^{ 3 }=0; \end{cases} $$

Решаяя систему, получаем точки: [latex](-1,0),(0,0),(1,0)[/latex]. Поскольку смешанные производные существуют и непрерывны и

$$ \frac { \partial f^{ 2 } }{ \partial x^{ 2 } } (x,y)=12x^{ 2 }-4, \frac { \partial f^{ 2 } }{ \partial y\partial x } (x,y)=0, \frac { \partial f^{ 2 } }{ \partial y^{ 2 } } (x,y)=12y^{ 2 } $$

матрица Гессе имеет вид

$$ { H }_{ f }(x,y)=\begin{Vmatrix} 12x^{ 2 }-4 & 0 \\ 0 & 12y^{ 2 } \end{Vmatrix} $$

Используя критерий Сильвестра, убедитесь, что в указанных трёх точках квадратичная форма полуопределена. Несмотря на то, что достаточный критерий экстремума в терминах квадратичного приближения неприменим, из записи функции в виде [latex]f(x,y)=(x^{2}-1)^{2}+y^{4}-1[/latex] очевидно, что в точках [latex](\pm 1, 0)[/latex] функция (симметричная и монотонно возрастающая по обеим переменным) имеет строгий локальный минимум, а в точке [latex](0, 0)[/latex] не имеет экстремума вовсе.
Нижеприведенное изображение наглядно демонстрирует правильность выводов. Нормалями к поверхности обозначены стационарные точки.
Example_Top_View

[свернуть]

Замечание 2

Функция может принимать экстремальные значения в граничных точках области определения. Вышеприведенное достаточное условие для их выявления использовать не рекомендуется, следует обратиться к аппарату теории условного экстремума.


Пример (Демидович, №3629)

Исследовать на локальный экстремум функцию

$$ z = x y \sqrt{1-\frac{x^2}{a^2}-\frac{y^2}{b^2}} \quad (a > 0, \quad b > 0) $$

Спойлер

Вычислим первые частные производные. Решением нижеприведенной системы

$$ z^{ ‘ }_{ x }=\frac { y\left( 1-\frac { 2x^{ 2 } }{ a^{ 2 } } -\frac { y^{ 2 } }{ b^{ 2 } } \right) }{ \sqrt { 1-\frac { x^{ 2 } }{ a^{ 2 } } -\frac { y^{ 2 } }{ b^{ 2 } } } }, \quad z^{ ‘ }_{ y }=\frac { y\left( 1-\frac { x^{ 2 } }{ a^{ 2 } } -\frac { 2y^{ 2 } }{ b^{ 2 } } \right) }{ \sqrt { 1-\frac { x^{ 2 } }{ a^{ 2 } } -\frac { y^{ 2 } }{ b^{ 2 } } } } $$

находим стационарные точки

$$(0,0),\quad \left( \frac { a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } \right) ,\quad \left( -\frac { a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } \right) ,\quad \left( \frac { a }{ \sqrt { 3 } } ,-\frac { b }{ \sqrt { 3 } } \right) ,\quad \left( -\frac { a }{ \sqrt { 3 } } ,-\frac { b }{ \sqrt { 3 } } \right) $$

Отметим, что в точках, лежащих на границе эллипса [latex]1=\frac{x^2}{a^2}+\frac{y^2}{b^2}[/latex] частные производные не существуют, следовательно, их следует отдельно проверить на экстремум, что выходит за рамки аппарата данной статьи.

Для проверки достаточных условий выпишем вторые производные

$$ z^{ » }_{ x^{ 2 } }=\frac { -\frac { xy }{ a^{ 2 } } \left( 1-\frac { 2x^{ 2 } }{ a^{ 2 } } -\frac { 3y^{ 2 } }{ b^{ 2 } } \right)}{ \left(1-\frac { 2x^{ 2 } }{ a^{ 2 } } -\frac { 3y^{ 2 } }{ b^{ 2 } } \right)^{\frac{3}{2}} }, \quad z^{ » }_{ y^{ 2 } }=\frac { -\frac { xy }{ b^{ 2 } } \left( 1-\frac { 3x^{ 2 } }{ a^{ 2 } } -\frac { 2y^{ 2 } }{ b^{ 2 } } \right) }{ \left( 1-\frac { 2x^{ 2 } }{ a^{ 2 } } -\frac { 3y^{ 2 } }{ b^{ 2 } } \right) ^{ \frac { 3 }{ 2 } } }, \\ z^{ » }_{ xy }=\frac { 1+\frac { 2x^{ 4 } }{ a^{ 4 } } +\frac { 3x^{ 2 }y^{ 2 } }{ a^{ 2 }b^{ 2 } } +\frac { 2y^{ 4 } }{ b^{ 4 } } -\frac { 3x^{ 2 } }{ a^{ 2 } } -\frac { 3y^{ 2 } }{ b^{ 2 } } }{ \left( 1-\frac { 2x^{ 2 } }{ a^{ 2 } } -\frac { 3y^{ 2 } }{ b^{ 2 } } \right) ^{ \frac { 3 }{ 2 } } } $$
  1. Точка [latex] (0,0) [/latex] не является точкой условного экстремума
    $$ \mathbf{ H }_{ z }(0,0)=\begin{Vmatrix} 0 & 1 \\ 1 & 0 \end{Vmatrix},\quad \Delta_{1}=0,\quad \Delta_{2}=-1 $$
  2. Заметим, что функция [latex]z(x,y)[/latex] чётна, а также [latex]z \left( \frac { -a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } \right) = z \left( \frac { a }{ \sqrt { 3 } } ,\frac { -b }{ \sqrt { 3 } } \right)[/latex].

    Точки [latex] (\pm \frac { a }{ \sqrt { 3 } }, \pm \frac { b }{ \sqrt { 3 } }) [/latex] являются точками условного экстремума

    $$ { H }_{ z }(\frac { a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } )=\begin{Vmatrix} -\frac { 4b }{ \sqrt { 3 } a } & -\frac { 2 }{ \sqrt { 3 } } \\ -\frac { 2 }{ \sqrt { 3 } } & -\frac { 4a }{ \sqrt{3}b} \end{Vmatrix},\quad \Delta _{ 1 }=-\frac { 4b }{ \sqrt { 3 } a } 0 $$ $$ { H }_{ z }(\frac { -a }{ \sqrt { 3 } } ,\frac { b }{ \sqrt { 3 } } )=\left( \begin{array}{cc} \frac { 4b }{ \sqrt { 3 } a } & -\frac { 2 }{ \sqrt { 3 } } \\ -\frac { 2 }{ \sqrt { 3 } } & \frac { 4a }{ \sqrt { 3 } b } \end{array} \right) ,\Delta _{ 1 }=\frac { 4b }{ \sqrt { 3 } a } >0, \quad \Delta _{ 1 }=\frac { 16 }{ 3 } — \frac{4}{3} = 4 > 0 $$

    Соответственно, [latex]\left(\pm \frac {a}{ \sqrt { 3 } } , \pm \frac { b }{ \sqrt { 3 } } \right)[/latex] — точки минимума, [latex]\left(\pm \frac {a}{ \sqrt { 3 } } , \mp \frac { b }{ \sqrt { 3 } } \right)[/latex] — точки максимума.

  3. Пример: [latex]a = b = 2[/latex]
    Elliptic_Surface_a_b_2

[свернуть]

Источники:

Закрепление материала.

Таблица лучших: Достаточные условия экстремума функции многих переменных

максимум из 23 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

Теорема Ферма о корне производной

Формулировка

Если функция имеет локальный экстремум в точке [latex]x_{0}[/latex] и дифференцируема в этой точке, то [latex]f'(x_{0})=0[/latex]

Доказательство

Пусть, например, функция имеет локальный минимум в точке [latex]x_{0}.[/latex] Тогда, по определению локального минимума для всех [latex]x\in(x_{0}-\delta , x_{0}+\delta )[/latex] выполняется неравенство [latex]f(x)-f(x_{0})\geq 0.[/latex]
Если [latex]x\in(x_{0}-\delta ,x_{0}) ,[/latex] то [latex]x-x_{0}< 0,[/latex] тогда из условия [latex]f(x)-f(x_{0})\geq 0[/latex] следует, что
[latex]\frac{f(x)-f(x_{0})}{x-x_{0}}\leq 0,[/latex]
а если [latex]x\in (x_{0},x_{0}+\delta ),[/latex] то выполняется неравенство
[latex]\frac{f(x)-f(x_{0})}{x-x_{0}}\geq 0.[/latex]
Так как функция f предел при [latex]x\rightarrow x_{0}[/latex] в левой части неравенства [latex]\frac{f(x)-f(x_{0})}{x-x_{0}}\leq 0[/latex], равный [latex]f_{-}^{‘}(x_{0})=f'(x_{0}).[/latex] По свойствам пределов из [latex]\frac{f(x)-f(x_{0})}{x-x_{0}}\leq 0[/latex] следует, что
[latex]f'(x_{0})\leq 0.[/latex]
Аналогично, переходя к пределу в неравенстве [latex]\frac{f(x)-f(x_{0})}{x-x_{0}}\geq 0[/latex] получаем
[latex]f'(x_{0})\geq 0.[/latex]
Из неравенств [latex]f'(x_{0})\leq 0[/latex] и [latex]f'(x_{0})\geq 0[/latex] следует, что [latex]f'(x_{0})=0.[/latex]

Пример

Функция [latex]f(x)=x^{2}[/latex] имеет на отрезке [-1,1] точку минимума [latex]x_{0}=0.[/latex] Производная функция существует при всех x: [latex]f'(x)=2x.[/latex] В точке минимума производная действительно оказывается равной 0. [latex]f'(x_{0})=f'(0)=0,[/latex] так что утверждение теоремы Ферма выполнено.

ferma

Литература

  • Конспект лекций Лысенко З.М.
  • Тер-Крикоров А.М., Шабунин М.И., Курс математического анализа, физмат-лит, 1988. стр.164-165
  • Демидович Б.П., Сборник задач и упражнений по математическому анализу, М., Наука, 1981. стр.134-140
  • www.pm298.ru
  • www.bymath.net