Processing math: 100%

14.3 Условный экстремум

Определение. Пусть f– действительная функция, заданная на открытом множестве ERn, Mp-мерное многообразие, содержащееся в E. В точке x0M функция f имеет условный максимум на многообразии M, если существует такая окрестность UE точки x0, что для всех xUM выполняется неравенство f(x)f(x0). Условный максимум называется строгим, если окрестность можно выбрать настолько малой, что для всех xUM, xx0, будет выполнено строгое неравенство f(x)<f(x0). Аналогично определяется понятие условного минимума.

Пример. Пусть f(x,y)=xy. В начале координат эта функция не имеет обычного экстремума, поскольку в любой окрестности начала координат она принимает как положительные, так и отрицательные значения. Возьмем теперь многообразие M1:y=x. На этом многообразии f(x,y)=x2 и в точке (0,0) функция f имеет условный минимум на многообразии M1. Если взять M2:y=x, то на нем f(x,y)=x2, и теперь функция f имеет условный максимум в точке (0,0). Итак, функция f в начале координат не имеет экстремума, а на многообразиях M1 и M2 имеет условные минимум и максимум, соответственно.

 

Теорема (необходимое условие экстремума на многообразии). Пусть f– действительная функция, заданная на открытом множестве ERn, содержащем многообразие M. Пусть в точке x0M функция f имеет условный экстремум и дифференцируема в этой точке. Тогда производная f(x0) обращается в нуль на касательном пространстве Tx0(M), т. е.f(x0)·h=0 для любого hTx0(M).

Пусть h – касательный вектор, т. е. hTx0(M). Тогда существует такая функция γ:RM, γ(0)=x0, что γ(0)=h. Рассмотрим функцию g(t)=f(γ(t))(tR). Если f в точке x0 имеет условный максимум, то при t=0 функция g имеет обычный локальный максимум. Функция g дифференцируема в точке t=0 и, по теореме о производной сложной функции,

g(0)=f(γ(0))·γ(0)=f(x0)·h

С другой стороны, по теореме Ферма, g(0)=0. Итак, f(x0)·h=0.

Геометрический смысл теоремы. Предположим, что функция f класса C1 и рассмотрим множество

H={x:f(x)=f(x0)}

Это множество называется множеством уровня функции f. Предположим, что f(x)0 для всех xH. Тогда получим, что H(n1)- мерное многообразие, т. е. гиперповерхность. Касательное пространство к многообразию H определяется как совокупность всех векторов h, для которых выполнено равенство f(x0)·h=0. Доказанная теорема утверждает, что p-мерное подпространство Tx0(M) содержится в (n1)-мерной гиперплоскости Tx0(H). Другими словами, касательная гиперплоскость к H в точке x0 содержит касательную p-плоскость к M в этой точке.

Заметим, что доказанная теорема дает лишь необходимое условие экстремума. Можно показать, что достаточным оно не является.

Метод множителей Лагранжа. Пусть Mp-мерное многообразие, точка x0M и в окрестности U этой точки M определено уравнением ϕ(x)=0, где ϕ=(ϕ1,,ϕnp), rank ϕ(x)=np для любого xU.

Теорема. Пусть f – действительная функция в некоторой окрестности многообразия M, дифференцируемая в точке x0M и имеющая в этой точке условный экстремум. Тогда существуют такие действительные числа λ1,,λnp, что для функции

F(x)=f(x)+λ1ϕ1(x)++λnpϕnp(x)

полная производная F(x0)=0.

В силу предыдущей теоремы, f(x0)·h=0 для любого hTx0(M). Это равносильно тому, что grad f(x0)·h=0 для любого hTx0(M),т. е. grad f(x0) ортогонален к любому касательному вектору. Значит, этот градиент является нормальным вектором к многообразию M в точке x0. Как известно, векторы grad ϕi(x0)(i=1,,np) образуют базис в пространстве нормальных векторов. Значит, существуют числа α1,,αnp такие, что

grad (f(x0))=α1 grad (ϕ1(x0)++αnp) grad (ϕnp(x0)).

Обозначим λi=αi,i=1,,np. Тогда видим, что для F ее градиент grad F(x0)=0, а это равносильно тому, что F(x0)=0, и тем самым теорема доказана.

Числа λ1,,λnp называются множителями Лагранжа. Они определяются однозначно, так как являются координатами разложения вектора grad f(x0) по базису из векторов grad ϕi(x0)(i=1,,np), взятых с противоположным знаком. Условие rank ϕ(x)=np обеспечивает линейную независимость векторов grad ϕi(x0)(i=1,,np).

В качестве примера, иллюстрирующего метод множителей Лагранжа, рассмотрим следующую задачу. Найти расстояние от точки до гиперплоскости в пространстве Rn.
Решение

Гиперплоскость H определяется уравнением

a1x1++anxn=b,

или в векторной форме ax=b, где a0, ибо, в противном случае, не получим гиперплоскость.

Пример. Пусть x0Rn. Покажем, что расстояние от заданной точки x0 до H равно d(x0,H)=|ax0b||a|. Расстояние от x0 до произвольной точки xH выражается следующим образом:
Решение

(x1x10)2++(xnxn0)2.

Поэтому для нахождения минимума этих расстояний достаточно рассмотреть подкоренное выражение и найти его минимум.

Обозначим f(x)=(x1x10)2++(xnxn0)2. Составим функцию Лагранжа

F(x)=f(x)+λ(axb)=f(x)+λ(a1x1++anxnb).

Находим все частные производные функции F и приравниваем их к нулю. Получаем

{2(x1x10)+λa1=0,2(xnxn0)+λan=0,a1x1++anxn=b

Последнее уравнение этой системы означает, что точка x лежит на гиперплоскости H. Умножим i-е уравнение этой системы на ai(i=1,,n) и сложим первые n уравнений. Тогда получим

2ni=1(aixiaixi0)+λni=1a2i=0,

или, учитывая последнее уравнение системы,

2(bax0)+λ|a|2=0.

Отсюда находим

λ=2(ax0b)|a|2.

Подставим найденное значение λ в первые n уравнений системы и получим

2(xixi0)=ai2(ax0b)|a|2(i=1,,n).

Каждое из этих равенств возведем в квадрат и сложим полученные равенства. Получим

f(x)=(ax0b)2|a|2,

а это и есть квадрат искомого расстояния.

Пример. Найти точки условного экстремума функции (если они есть) f(x,y)=y2x2 при уравнении связи y=2x.
Решение

Имеем f(x,2x)=3x2, т.е. при выполнении уравнений связи данная функция является функцией одного переменного и достигает минимума при x=0.
Значению x=0 согласно уравнению связи соответствует значение y=0, а поэтому функция f(x,y)=y2x2 имеет в точке (0,0) условный минимум относительно уравнения связи y=2x.

Литература

Условный экстремум

Проверьте, насколько хорошо вы усвоили эту тему и закрепите свои знания по ней, пройдя тест.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *