Loading [MathJax]/jax/element/mml/optable/Latin1Supplement.js

12.8.2 Локальные экстремумы функций многих переменных

Определение. Пусть f – действительная функция на открытом множестве ERn. Говорят, что f имеет локальный максимум в точке x0E, если существует такая окрестность U точки x0, что для всех xU выполняется неравенство f(x)f(x0).

Локальный максимум называется строгим, если окрестность U можно выбрать так, чтобы для всех xU, отличных от x0, было f(x)<f(x0).

Определение
Пусть f – действительная функция на открытом множестве ERn. Говорят, что f имеет локальный минимум в точке x0E, если существует такая окрестность U точки x0, что для всех xU выполняется неравенство f(x)f(x0).

Локальный минимум называется строгим, если окрестность U можно выбрать так, чтобы для всех xU, отличных от x0, было f(x)>f(x0).

Локальный экстремум объединяет понятия локального минимума и локального максимума.

Теорема (необходимое условие экстремума дифференцируемой функции)
Пусть f – действительная функция на открытом множестве ERn. Если в точке x0E функция f имеет локальный экстремум и дифференцируема в этой точке,то df(x0)=0. Равенство нулю дифференциала равносильно тому, что все частные производные равны нулю, т.е. fxi(x0)=0.

В одномерном случае это – теорема Ферма. Обозначим ϕ(t)=f(x0+th), где h – произвольный вектор. Функция ϕ определена при достаточно малых по модулю значениях t. Кроме того, по теореме о производной сложной функции, она дифференцируема, и ϕ(t)=df(x0+th)h.
Пусть f имеет локальный максимум в точкеx 0. Значит, функция ϕ при t=0 имеет локальный максимум и, по теореме Ферма, ϕ(0)=0.
Итак, мы получили, что df(x0)=0, т.е. дифференциал функции f в точке x0 равен нулю на любом векторе h.

Определение
Точки, в которых дифференциал равен нулю, т.е. такие, в которых все частные производные равны нулю, называются стационарными. Критическими точками функции f называются такие точки, в которых f не дифференцируема, либо ее градиент равен нулю. Если точка стационарная, то из этого еще не следует, что в этой точке функция имеет экстремум.

Пример 1.
Пусть f(x,y)=x3+y3. Тогда fx=3x2,fy=3y2, так что (0,0) – стационарная точка, но в этой точке у функции нет экстремума. Действительно, f(0,0)=0, но легко видеть, что в любой окрестности точки (0,0) функция принимает как положительные, так и отрицательные значения.

Пример 2.
У функции f(x,y)=x2y2 начало координат – стационарная точка, но ясно, что экстремума в этой точке нет.

Теорема (достаточное условие экстремума).
Пусть функция f дважды непрерывно-дифференцируема на открытом множестве ERn. Пусть x0E – стационарная точка и Qx0(h)ni=1nj=12fxixj(x0)hihj. Тогда

  1. если Qx0знакоопределенная квадратичная форма, то функция f в точке x0 имеет локальный экстремум, а именно, минимум, если форма положительноопределенная, и максимум, если форма отрицательноопределенная;
  2. если квадратичная форма Qx0 неопределенная, то функция f в точке x0 не имеет экстремума.

Воспользуемся разложением по формуле Тейлора (12.7 стр. 292). Учитывая, что частные производные первого порядка в точке x0 равны нулю, получим f(x0+h)f(x0)=12ni=1nj=12fxixj(x0+θh)hihj, где 0<θ<1. Обозначим aij=2fxixj(x0). В силу теоремы Шварца (12.6 стр. 289-290), aij=aji. Обозначим αij(h)=2fxixj(x0+θh)2fxixj(x0). По предположению, все частные производные второго порядка непрерывны и поэтому limh0αij(h)=0.(1) Получаем f(x0+h)f(x0)=12[Qx0(h)+ni=1nj=1αij(h)hihj]. Обозначим ϵ(h)=1|h|2ni=1nj=1αij(h)hihj. Тогда |ϵ(h)|ni=1nj=1|αij(h)| и, в силу соотношения (1), имеем ϵ(h)0 при h0. Окончательно получаем f(x0+h)f(x0)=12[Qx0(h)+ϵ(h)|h|2].(2) Предположим, что Qx0 – положительноопределенная форма. Согласно лемме о положительноопределённой квадратичной форме (12.8.1 стр. 295, Лемма 1), существует такое положительное число λ, что Qx0(h)λ|h|2 при любом h. Поэтому f(x0+h)f(x0)12|h|2(λ+ϵ(h)). Так как λ>0, а ϵ(h)0 при h0, то правая часть будет положительной при любом векторе h достаточно малой длины.
Итак, мы пришли к тому, что в некоторой окрестности точки x0 выполнено неравенство f(x)>f(x0), если только xx0 (мы положили x=x0+h\right).  Это означает, что в точке x0 функция имеет строгий локальный минимум, и тем самым доказана первая часть нашей теоремы.
Предположим теперь, что Qx0 – неопределенная форма. Тогда найдутся векторы h1, h2, такие, что Qx0(h1)=λ1>0, Qx0(h2)=λ2<0. В соотношении (2) h=th1 t>0. Тогда получим f(x0+th1)f(x0)=12[t2λ1+t2|h1|2ϵ(th1)]=12t2[λ1+|h1|2ϵ(th1)]. При достаточно малых t>0 правая часть положительна. Это означает, что в любой окрестности точки x0 функция f принимает значения f(x), большие, чем f(x0).
Аналогично получим, что в любой окрестности точки x0 функция f принимает значения, меньшие, чем f(x0). Это, вместе с предыдущим, означает, что в точке x0 функция f не имеет экстремума.

Рассмотрим частный случай этой теоремы для функции f(x,y) двух переменных, определенной в некоторой окрестности точки (x0,y0) и имеющей в этой окрестности непрерывные частные производные первого и второго порядков. Предположим, что (x0,y0) – стационарная точка, и обозначим a11=2fx2(x0,y0),a12=2fxy(x0,y0),a22=2fy2(x0,y0). Тогда предыдущая теорема примет следующий вид.

Теорема
Пусть Δ=a11a22a212. Тогда:

  1. если Δ>0, то функция f имеет в точке (x0,y0) локальный экстремум, а именно, минимум, если a11>0, и максимум, если a11<0;
  2. если Δ<0, то экстремума в точке (x0,y0) нет. Как и в одномерном случае, при Δ=0 экстремум может быть, а может и не быть.

Примеры решения задач

Алгоритм нахождения экстремума функции многих переменных:

  1. Находим стационарные точки;
  2. Находим дифференциал 2-ого порядка во всех стационарных точках
  3. Пользуясь достаточным условием экстремума функции многих переменных, рассматриваем дифференциал 2-ого порядка в каждой стационарной точке
  1. Исследовать функцию на экстремум f(x,y)=x3+8y3+18x30y.
    Решение

    Найдем частные производные 1-го порядка: fx=3x26y; fy=24y26x. Составим и решим систему: {fx=0fy=0{3x26y=024y26x=0{x22y=04y2x=0 Из 2-го уравнения выразим x=4y2 — подставим в 1-ое уравнение: (4y2)22y=0 16y42y=0 8y4y=0 y(8y31)=0 В результате получены 2 стационарные точки:
    1) y=0x=0,M1=(0,0);
    2) 8y31=0y3=18y=12x=1,M2=(12,1)
    Проверим выполнение достаточного условия экстремума:
    2fx2=6x;2fxy=6;2fy2=48y
    1) Для точки M1=(0,0):
    A1=2fx2(0,0)=0;B1=2fxy(0,0)=6;C1=2fy2(0,0)=0;
    A1B1C21=36<0 , значит, в точке M1 нет экстремума.
    2) Для точки M2:
    A2=2fx2(1,12)=6;B2=2fxy(1,12)=6;C2=2fy2(1,12)=24;
    A2B2C22=108>0, значит, в точке M2 существует экстремум, и поскольку A2>0, то это минимум.
    Ответ: Точка M2(1,12) является точкой минимума функции f.

  2. Исследовать функцию на экстремум f=y2+2xy4x2y3.
    Решение

    Найдём стационарные точки: fx=2y4; fy=2y+2x2.
    Составим и решим систему: {fx=0fy=0{2y4=02y+2x2=0{y=2y+x=1x=1
    M0(1,2) – стационарная точка.
    Проверим выполнение достаточного условия экстремума: A=2fx2(1,2)=0;B=2fxy(1,2)=2;C=2fy2(1,2)=2;
    ABC2=4<0 , значит, в точке M0 нет экстремума.
    Ответ: экстремумы отсутствуют.

Пройдите этот тест, чтобы проверить свои знания по только что прочитанной теме «Локальные экстремумы функций многих переменных».


Таблица лучших: Локальные экстремумы функций многих переменных

максимум из 4 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

Литература:
См. Также:

Необходимые и достаточные условия существования экстремумов. Примеры.

 Экстремумом функции называется максимальное (минимальное) значение функции на заданном множестве. Точка, в которой достигается экстремум называется точкой экстремума.
Точка x0 называется точкой локального максимума функции f(x), если выполняется условие: Uδ(x0):xUδ(x0)f(x0)f(x).
Аналогично точка x0 называется точкой локального минимума функции f(x) , если выполняется условие: Uδ(x0):xUδ(x0)f(x0)f(x).

Точки, в которых производная равна нулю, называются стационарными точками.
Точки, в которых функция непрерывна, а её производная либо равна нулю, либо не существует, называются критическими точками.

Теорема (необходимое условие экстремума)

Если точка x0 — точка экстремума функции f(x), то она критическая.

Доказательство

По условию точка x0 — точка экстремума функции f(x) по теореме Ферма производная f(x0)=0 точка x0 является критической.

Пример:

Найти экстремум функции f(x)=x3 6x2+9x4.
Найдем производную этой функции:f=3x212x+9 критические точки задаются уравнением 3x212x+9=0. Корни этого уравнения x1=3 и x2=1.

Svg.4.ex

Как видно по рисунку функция имеет максимум в точке 1, а минимум в точке 3.
Подставим эти значения чтобы убедиться в исходную функцию: f(3)=27 54+274=4 и f(1)=16+94=0 в точке  x1=3 функция имеет минимум, равный -4, а в точке x2=1 функция имеет максимум, равный 0.

Замечания:

Не всякая критическая точка является точкой экстремума.

Пример:

Рассмотрим функцию f(x)=x3. Построим график этой функции:

Svg.4.ex

Производная данной функции в точке x0=0 f(0)=0 x0 по определению является критической точкой, однако в этой точке функция не имеет экстремума.

 

Теорема (первое достаточное условие экстремума в терминах первой производной)

Пусть функция f(x) определена и дифференцируема в некоторой окрестности точки x0, кроме, быть может, самой точки x0 и непрерывна в этой точке. Тогда:

  1. Если производная f меняет знак с «-» на «+» при переходе через точку x0: x (x0δ;x0)f(x)< 0 и x (x0;x0+δ)f(x)> 0, то x0 — точка строго минимума функции f(x).
  2. Если производная f меняет знак с «+» на «-» при переходе через точку x0: x (x0δ;x0)f(x)> 0 и  x (x0;x0+δ)f(x)< 0, то x0 — точка строго максимума функции f(x).

Доказательство

Пусть, например, f меняет знак с «-» на «+». Рассмотрим точку x0 на сегменте [x;x0]. Воспользуемся теоремой о конечных приращениях Лагранжа: f(x)f(x0) =f(ξ)(xx0), ξ(x;x0). Поскольку при переходе через точку x0 функция меняет знак с «-» на «+», то f(ξ)<0 и x<x0, то xx0<0 f(x)f(x0)>0.
Аналогично рассмотрим сегмент [x0;x], получим
f(x)f(x0)>0 f(x0)<f(x)   x0 — точка строгого минимума функции.

Замечания:

Если x0 — точка строго экстремума, то из этого не следует, что производная f(x) меняет знак при переходе через точку x0.

Теорема (второе достаточное условие строгого экстремума в терминах второй производной)

Пусть дана функция f(x), она определена в некоторой окрестности точки x0, ее первая производная f(x0)=0 и пусть \exists {f}»(x_{0}), тогда:

  1. Если {f}»(x_{0})>0, то точка x_{0} — точка строгого минимума;
  2. Если {f}»(x_{0})<0, то точка x_{0} — точка строгого максимума.

Доказательство

Докажем теорему для первого случая, когда {f}»(x_{0})>0. По скольку {f}»(x_{0}) непрерывна, то на достаточно малом интервале (x_{0}-\delta ;x_{0}+\delta), т.к {f}»(x_{0})>0, то {f}'(x_{0}) возрастает в этом интервале. {f}'(x_{0})=0, значит {f}'(x_{0})<0 на интервале (x_{0}-\delta ;x_{0}) и  {f}'(x_{0})>0 на интервале (x_{0} ;x_{0}+\delta).
Таким образом функция f(x) убывает на интервале (x_{0}-\delta ;x_{0}) и возрастает на интервале (x_{0} ;x_{0}+\delta) \Rightarrow по первому достаточному условию экстремума функция в точке x_{0} имеет минимум.
Аналогично доказывается второй случай теоремы.

Замечания:

Если {f}'(x)=0 и {f}»(x)=0, то функция f(x) может и не иметь экстремум в точке x_{0}.

Теорема (третье достаточное условие строгого экстремума в терминах производных порядка больше двух)

Пусть функция f(x) определена в некоторой окрестности точки x_{0} , и в этой точке существуют производные до n-го порядка пусть \exists f^{(n)}(x_{0}), n> 2 и {f}'(x_{0})={f}»(x_{0})=…=f^{(n-1)}(x_{0})=0, f^{(n)}(x_{0})\neq 0. Тогда:

  1. Если n=2k (т.е n — четное), то x_{0} — точка экстремума:
    • если f^{(n)}(x_{0})<0, то x_{0} — точка локального максимума;
    • если f^{(n)}(x_{0})>0, то x_{0} — точка локального минимума;
  2. Если n=2k+1 (т.е n — нечетное), то x_{0} — не является точкой экстремума.

Доказательство

Воспользуемся формулой Тейлора в окрестности точки x_{0} с остатком в форме Пеано: f(x)=f(x_{0})+ \frac{{f}'(x_{0})}{1!}(x-x_{0})+… + \frac{f^{(n-1)}(x_{0})}{(n-1)!}(x-x_{0})^{n-1}+ \frac{f^{(n)}(x_{0})}{n!}(x-x_{0})^{n}+ o((x-x_{0})^{n}), x\rightarrow x_{0}.
По скольку все производные до (n-1) порядка включительно равны нулю получим: f(x)-f(x_{0})=\frac{f^{n}(x_{0})}{n!}(x-x_{0})^{n}+o((x-x_{0})^{n}), x\rightarrow x_{0}. Запишем полученное выражение в виде: f(x)-f(x_{0})=\frac{f(n)(x_{0})}{n!}(x-x_{0})\left [ 1+\frac{o((x-x_{0})^{n})}{(x-x_{0})^{n}} \right ]. Выражение [1+\frac{o((x-x_{0})^{n})}{(x-x_{0})^{n})}]>1. Пусть n=2k \Rightarrow (x-x_{0}) ^{n}> 0, \text{sign}(f(x)-f(x_{0}))= \text{sign} (\frac{f^{(n)}(x_{0})}{n!}(x-x_{0})^{n}). Отсюда следует, что сохранение или изменение знака приращения функции во время перехода через точку x_{0} зависит от четности n. Последний факт и доказывает теорему.

Список литературы:

Экстремум функции

Тест для проверки знаний по теме «Экстремум функции».

Таблица лучших: Экстремум функции

максимум из 4 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных