Условный экстремум. Метод множителей Лагранжа.

Условный экстремум

Определение (Уравнения связи)
Итак, пусть на открытом множестве [latex]G[/latex], которое входит в [latex]\mathbb{R}^{n}[/latex] заданы функции [latex]y_{i} = f_{i}(x), i = 1,2,\dots,m, x = (x_{1},x_{2},\dots, x_{m}) \in G[/latex]. Обозначим через [latex]E[/latex] множество точек из [latex]G[/latex], в которых все функции [latex]f_{i}(x), i = 1,2,3\dots,m[/latex], обращаются в нуль:

[latex] E = \left\{x: f_{i}(x) = 0, i = 1,2,\dots,m, x \in G\right\}. [/latex]

Уравнения [latex]f_{i}(x)[/latex] будем называть уравнениями связи.

Определение (Точка условного экстремума)
Пусть на [latex]G[/latex] задана функция [latex]y = f_{0}(x)[/latex]. Точка [latex]x^{(0)}[/latex] будет называться точкой условного экстремума функции [latex]f_{0}(x)[/latex] относительно уравнений связи [latex]f_{i}(x), i = 1,2,3\dots,m[/latex], если она является точкой обычного экстремума этой функции, рассматриваемой только на множестве Е.

Иначе говоря, при поиске условного экстремума мы сравниваем значение функции [latex]f_{0}(x)[/latex] в точке [latex]x^{(0)}[/latex] не со всеми значениями этой функции в достаточно малой окрестности [latex]x^{(0)}[/latex], а только со значениями в точках, которые одновременно принадлежат как достаточно малой окрестности [latex]x^{(0)}[/latex], так и множеству [latex]E[/latex].

Пример №1

Исследовать на наличие экстремума функцию [latex]f(x, y) = x^{2} + y^{2}[/latex] при уравнении связи [latex]x + y — 1 = 0[/latex].

Спойлер

Представим [latex]y[/latex] как функцию от [latex]x[/latex]. Из уравнения связи вытекает [latex]y = 1 — x[/latex], откуда [latex]f(x, 1 — x) = 2x^{2} — 2x + 1[/latex]. Таким образом, при выполнении уравнения связи мы получаем функцию от одной переменной. Найти её экстремум не составляет труда: приравнивая к нулю её производную («Необходимое условие экстремума»), получаем [latex]2x — 1 = 0[/latex], откуда [latex] x = \frac{1}{2}[/latex]. В этой точке рассматриваемая функция имеет минимум, так как она является многочленом второй степени с положительным коэффициентом при старшем члене. Из уравнения связи находим [latex] y = \frac{1}{2}[/latex].

[свернуть]

Пример №2

Найти точки условного экстремума функции (если они есть) [latex] f(x,y) = y_{2} — x_{2} [/latex] при уравнении связи [latex] y = 2x [/latex].

Спойлер

Имеем [latex] f(x, 2x) = 3x^{2} [/latex], т.е. при выполнении уравнений связи данная функция является функцией одного переменного и достигает минимума при [latex]x = 0[/latex].
Значению [latex] x = 0 [/latex] согласно уравнению связи соответствует значение [latex] y = 0 [/latex], а поэтому функция [latex] f(x,y) = y_{2} — x_{2} [/latex] имеет в точке [latex](0, 0)[/latex] условный минимум относительно уравнения связи [latex] y = 2x [/latex].

[свернуть]

Однако, не всегда возможно преобразовать уравнение связи к явному виду (представить одну из переменных, как функцию от остальных переменных). Далее пойдет речь о том, как справиться с этой неприятной ситуацией.

Метод множителей Лагранжа

Предполагается, что все функции [latex]f_{1}, \dots, f_{m}[/latex] являются непрерывно дифференцируемыми (гладкими) на открытом множестве [latex] G \subset \mathbb{R}^{n}, n > m[/latex].

Теорема (Необходимое условие локального экстремума)
Пусть точка [latex]x^{(0)}[/latex] — точка условного экстремум функции [latex] f_{0} [/latex] при выполнении уравнений связи [latex] f_{1}, \dots , f_{m} [/latex]. Тогда в этой точке градиенты [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно зависимы, т. е. существуют такие, не все равные нулю, числа [latex] \lambda_{0}, \lambda_{1}, \dots , \lambda_{m} [/latex], что

[latex] \lambda_{0}\nabla f_{0} + \lambda_{1}\nabla f_{1} + \dots + \lambda_{m}\nabla f_{m} = 0 \quad \left( 1 \right) [/latex]

Перед доказательством теоремы, напомним, что означает символ [latex] \nabla [/latex].

Определение (оператор Гамильтона)
Оператор Гамильтона (часто используют сокращение << набла >>) — векторный дифференциальный оператор, компонентами которого являются частные производные по координатам.
Для трехмерного евклидового пространства, в прямоугольной системе координат оператор Гамильтона определяется так:

[latex] \nabla = \frac{\partial}{\partial x} \vec i + \frac{\partial}{\partial y} \vec j + \frac{\partial}{\partial z} \vec k.[/latex]

Также, нам понадобится свойство этого оператора. Если подействовать им на функцию, то получим вектор градиент.

Спойлер

Докажем утверждение, равносильное теореме: если в точке [latex] x^{(0)} = \left(x_{1}^{(0)}, \dots , x_{n}^{(0)}\right) [/latex] удовлетворяющей уравнениям связи

[latex] f_{k}(x^{(0)}) = 0, k = 1, 2, \dots , m, [/latex]

градиенты [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно независимы, то [latex] x^{(0)} [/latex] не является точкой локального экстремума.

Итак, пусть [latex] \nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m} [/latex] линейно независимы и, следовательно, ранг матрицы Якоби

[latex] \left( \frac{ \partial f_{j} }{ \partial x_{i} } \right), j = 0, 1, \dots , m, i = 1, 2, \dots , n, [/latex]

равен [latex] m + 1 [/latex]. Тогда в этой матрице существует минор порядка [latex] m + 1 [/latex], не равный нулю. Для определенности будем считать, что он образован первыми [latex] m + 1 [/latex] столбцами, т. е.

[latex] \LARGE \left.\begin{matrix} \frac{ \partial \left( f_{0}, f_{1}, \dots , f_{m} \right) }{ \partial \left( x_{1}, x_{2}, \dots , x_{m+1} \right)} & \end{matrix}\right|_{x = x^{(0)}} \neq 0. [/latex]

Множество [latex] G [/latex] — открыто, а потому существует такое [latex] \delta_{0} > 0 [/latex], что при всех [latex]\delta, 0 < \delta < \delta_{0}[/latex], куб

[latex] Q^{n}_{ \delta} =\left\{ x : \left| x_{i} — x_{i}^{(0)} \right| < \delta, i = 1, 2, \dots ,n \right\} [/latex]

лежит в [latex] G [/latex], и, следовательно, на нем определены все функции [latex] f_{0}, f_{1}, \dots , f_{m}[/latex].

Зафиксируем

[latex] x_{m + 2} = x_{m + 2}^{(0)}, [/latex][latex] \dots, [/latex][latex] x_{n} = x_{n}^{(0)} [/latex]

и введём следующие обозначения:

[latex] x^{\star} = \left(x_{1}, \dots , x_{m+1} \right),[/latex]
[latex]Q^{m + 1}_{ \delta} =\left\{ x^{\star} \colon \left| x_{i} — x_{i}^{(0)} \right| < \delta, i = 1, 2, \dots , m + 1 \right\}.[/latex]

Очевидно, функции [latex]f_{j} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right), j = 1, 2, \dots , m,[/latex] определены и непрерывно дифференцируемы всюду в [latex]Q_{ \delta }^{m + 1}.[/latex] Рассмотрим отображение [latex]\Phi: Q_{ \delta} ^ {m + 1} \rightarrow \mathbb{R}^{m+1}, [/latex] задаваемое формулами

[latex] y_{1} = f_{1} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right),[/latex]
[latex]y_{2} = f_{2} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right),[/latex]
[latex]\dots \dots \dots \dots \dots \dots \dots \dots \dots [/latex]
[latex] y_{m + 1} = f_{m} \left(x_{1}, \dots x_{m + 1}, x_{m + 2}^{(0)}, \dots , x_{n}^{(0)} \right).[/latex]

Для точки [latex]x^{\star(0)} = \left(x_{1}^{(0)}, \dots , x_{m + 1}^{(0)}\right)[/latex] имеем

[latex] \LARGE \left.\begin{matrix} \frac{ \partial \left(y_{1}, \dots , y_{m + 1} \right) }{ \partial \left( x_{1}, x_{2}, \dots , x_{m+1} \right)} & \end{matrix}\right|_{x^{\star} = x^{\star(0)}} = \left.\begin{matrix} \frac{ \partial \left( f_{0}, f_{1}, \dots , f_{m} \right) }{ \partial \left( x_{1}, x_{2}, \dots , x_{m+1} \right)} & \end{matrix}\right|_{x = x^{(0)}} \neq 0. [/latex]

Поскольку точка [latex]x^{(0)}[/latex] является точкой условного экстремума, она удовлетворяет всем уравнениям связи. Таким образом, для точки [latex]x^{(0)}[/latex] имеем [latex] \Phi \left(x^{ \star (0)} \right) = \left(f_{0} \left(x^{(0)} \right), 0, \dots , 0 \right).[/latex] Поэтому (по теорему о локальной обратимости непрерывно дифференцируемого отображения в точке, в которой его якобиан не равен нулю) существует такое [latex] \varepsilon > 0, [/latex] что на окрестности

[latex] V = \left\{ y = \left(y_{1}, \dots , y_{m+1} \right) \colon \left|y_{1} — f_{0}\left(x^{(0)}\right) \right| < \varepsilon, \left|y_{j} \right| < \varepsilon, j = 2, 3, \dots , m + 1 \right\} [/latex]

Курсовая 2
( см. рисунок , [latex] m = 1, n = 2 [/latex]) определено обратное к [latex] \Phi [/latex] отображение, и, следовательно, в любую точку этой окрестности отображается какая-то точка из [latex] Q_{\delta}^{m + 1}.[/latex]
В частности, так как при любом [latex] \eta, 0 < \eta < \varepsilon, [/latex] имеет место включение [latex] \left(f\left( x^{\left(0 \right)}\right) \pm \eta, 0, \dots , 0 \right) \in V, [/latex] то в кубе [latex] Q^{ m + 1 }_{ \delta } [/latex] найдутся точки [latex] x’^{ \star} = \left(x’_{1}, \dots , x’_{m + 1} \right) [/latex] и [latex] x»^{ \star} = \left(x»_{1}, \dots , x»_{m + 1} \right), [/latex] отображающиеся при отображении [latex] \Phi [/latex] в указанные точки окрестности [latex] V: [/latex]

[latex] \Phi\left(x’^{\star} \right) = \left(f\left( x^{\left(0 \right)}\right) \pm \eta, 0, \dots , 0 \right), \Phi\left(x»^{\star} \right) = \left(f\left( x^{\left(0 \right)}\right) \pm \eta, 0, \dots , 0 \right).[/latex]

Если положим для краткости [latex] x’^{ \star} = \left(x’_{1}, \dots , x’_{m + 1}, x^{\left(0 \right)}_{m+2}, \dots , x^{\left(0 \right)}_{n} \right) [/latex] и [latex] x»^{ \star} = \left(x»_{1}, \dots , x»_{m + 1}, x^{\left(0 \right)}_{m+2}, \dots , x^{\left(0 \right)}_{n} \right), [/latex] то в координатной записи получим

[latex] f_{0}\left(x’\right) = f_{0}\left(x^{\left(0\right)}\right) + \eta > f_{0}\left(x^{\left(0\right)}\right),[/latex]
[latex] f_{k}\left(x’\right) = 0, k = 1, 2, \dots , m, x’ \in Q^{n}_{\delta} [/latex]

и

[latex] f_{0}\left(x»\right) = f_{0}\left(x^{\left(0\right)}\right) — \eta < f_{0}\left(x^{\left(0\right)}\right),[/latex]
[latex]f_{k}\left(x»\right) = 0, k = 1, 2, \dots , m, x’ \in Q^{n}_{\delta}. [/latex]

Поскольку число [latex] \delta, 0 < \delta < \delta_{0}, [/latex] может быть сколь угодно мало, то указанные точки [latex] x’ [/latex] и [latex] x» [/latex] могут быть выбраны сколь угодно близко от точки [latex] x^{\left(0\right)}, [/latex] и, таким образом, сколь угодно близко от точки [latex] x^{\left(0\right)} [/latex] имеются точки, удовлетворяющие уравнениям связи, в которых функция [latex] f_{0} [/latex] принимает значения, как большие, так и меньшие значения [latex] f_{0}\left(x^{\left(0\right)}\right). [/latex] Что и означает, что точка [latex] x^{\left(0\right)} [/latex] не является точкой условного экстремума. Это противоречие и доказывает теорему.

[свернуть]
Следствие
Если в точке [latex]x^{(0)}[/latex] условного экстремума функции [latex]f_{0}[/latex] относительно уравнений связи. Тогда в этой точке градиенты [latex]\nabla f_{0}, \nabla f_{1}, \dots , \nabla f_{m}[/latex] линейно независимы, то есть ранг матрицы Якоби

[latex]\left( \frac{ \partial f_{j} }{ \partial x } \right), j = 1, 2, \dots , m, i = 1, 2, \dots , n, [/latex]

равен [latex]m[/latex], то существуют такие [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex], что в этой точке

[latex] \nabla f_{0} + \sum\limits_{j = 1}^{m}{\lambda_{j} \nabla f_{j}} = 0 \quad \left( 2 \right)[/latex]

то есть [latex]\nabla f_{0}[/latex] является линейной комбинацией градиентов [latex]\nabla f_{1}, \nabla f_{2}, \dots , \nabla f_{m}[/latex].

Спойлер

Если векторы [latex]\nabla f_{1}, \nabla f_{2}, \dots , \nabla f_{m}[/latex] линейно независимы, то в равенстве [latex] \left( 1 \right) [/latex] имеем [latex] \lambda_{0} \neq 0, [/latex] так как если [latex] \lambda_{0} = 0 [/latex] указанные векторы в силу [latex] \left( 1 \right) [/latex] оказались бы линейно зависимыми. Разделив обе части [latex] \left( 1 \right) [/latex] на [latex] \lambda_{0} [/latex] получим равенство вида [latex] \left( 2 \right). [/latex]

[свернуть]

В координатной форме это условие имеет вид: для любого [latex]i = 1, 2, \dots , n [/latex] в точке [latex]x_{(0)}[/latex]

[latex] \frac{\partial f_{0}}{\partial x_{i}} + \sum\limits_{j = 1}^{m}{\lambda_{j} \frac{\partial f_{j}}{\partial x_{i}}} = 0. \quad \left( 3 \right) [/latex]
Определение
Функция

[latex] F \left( x \right) = f_{0}\left( x \right) + \sum\limits_{j = 1}^{m}{\lambda_{j} f_{j}\left( x \right)}, \quad \left( 4 \right)[/latex]

где числа [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex] удовлетворяют условию [latex]\left( 3 \right), [/latex] называется функцией Лагранжа рассматриваемой задачи, а сами числа [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex] — множителями Лагранжа.

Условие [latex] \left( 3 \right) [/latex] означает, что если [latex] x^{(0)} [/latex] является точкой условного экстремума функции [latex] f_{0} [/latex] относительно уравнений связи [latex]y_{i} = f_{i}(x), i = 1, 2, \dots , m,[/latex] то она является стационарной точкой для функции Лагранжа, т. е.

[latex] \frac{ \partial F \left( x^{(0)} \right)}{ \partial x_{i}} = 0, i = 1, 2, \dots , n. [/latex]

Теперь уже можно поговорить о том, как на практике использовать эти теоремы для нахождения точек условного экстремума. Прежде всего, мы можем заметить, что у функции вида [latex]\left( 4 \right)[/latex] при произвольных числах [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m},[/latex] каждая точка её условного экстремума является и точкой условного экстремума исходной функции [latex] f_{0}, [/latex] и наоборот. Мы выбираем такие значения [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m},[/latex] чтобы выполнялись условия [latex]\left( 3 \right),[/latex], т. е. чтобы данная точка условного экстремума оказалась и стационарной точкой функции [latex]\left( 4 \right) [/latex].
Для отыскания точек условного экстремума следует рассмотреть систему из [latex] n + m [/latex] уравнений, составленной из частных производных функции Лагранжа по каждой переменной [latex] x_{i}, i = 1, 2, \dots , n [/latex] и уравнений связи [latex]f_{i}(x), i = 1, 2, 3\dots, m[/latex] (однако, уравнения связи можно рассматривать как частные производные функции Лагранжа по переменным [latex]\lambda_{1}, \lambda_{2}, \dots , \lambda_{m}[/latex]) относительно неизвестных [latex] x^{0}_{1}, \dots , x^{0}_{n}, \lambda_{1}, \dots , \lambda_{m}[/latex] и решить её (если это возможно), найдя [latex] x^{0}_{1}, \dots , x^{0}_{n}[/latex] и по возможности исключив [latex]\lambda_{1}, \dots , \lambda_{m}[/latex]. Сформулированная теорема утверждает, что все точки условного экстремума будут находится среди найденных таким образом точек [latex] \left(x^{0}_{1}, \dots , x^{0}_{n} \right)[/latex].

Пример №1

Найдем локальные экстремумы функции [latex] f \left(x, y \right) = xy [/latex] на окружности [latex] \left( \Gamma \right) [/latex]:

[latex] \phi \left(x, y \right) = x^2 + y^2 — 1 = 0. [/latex]
Спойлер

Функции [latex] f [/latex] и [latex] \phi [/latex] дважды непрерывно дифференцируемы на всей плоскости. Кроме того, ранг матрицы

[latex] \begin{Vmatrix} \frac{ \partial \phi}{ \partial x} & \frac{ \partial \phi}{ \partial y} \end{Vmatrix} = \begin{Vmatrix} 2x & 2y \end{Vmatrix} [/latex]

равен единице (т. е. равно количеству связей) на всей плоскости [latex] Oxy [/latex] за исключением точки [latex] \left(0, 0 \right).[/latex] Но последняя не лежит на окружности [latex] \phi \left(x, y \right) = x^2 + y^2 — 1 = 0. [/latex] Следовательно, точки, в которых возможен локальный экстремум, находятся только среди стационарных точек.
Приравнивая к нулю частные производные функции Лагранжа задачи

[latex] F \left(x, y \right) = xy — \lambda \left(x^2 + y^2 — 1 \right),[/latex]

по переменным [latex] x, y, \lambda [/latex], получим систему уравнений:

[latex] \begin{cases} y — 2\lambda x = 0 \\ y — 2\lambda x = 0 \\ x^2 + y^2 — 1 = 0 \end{cases} [/latex]

Решив её, получим четыре пары стационарных точек [latex] x = \pm \frac{1}{\sqrt{2}}, [/latex] [latex] y = \pm \frac{1}{\sqrt{2}}, [/latex] соответствующих всевозможным распределениям [latex] «+» [/latex] и [latex] «-» [/latex]. Паре [latex] x_{1} = y_{1} = \frac{ 1}{ \sqrt{2}} [/latex]
соответствуют [latex] \lambda_{1} = \frac{1}{2} [/latex] и лагранжева функция

[latex] F \left(x, y \right) = xy — \frac{\left(x^2 + y^2 — 1 \right)}{2}. [/latex]

Второй дифференциал от [latex]F[/latex] в точке [latex] \left(x_{1}, y_{1} \right) [/latex] имеет вид

[latex] \partial_{2} F = — \partial x^2 + 2 \partial x \partial y — \partial y^2 = -\left( \partial x — \partial y \right)^2. [/latex]

Тогда, в силу уравнения связи

[latex] 2x\partial x + 2y \partial y = 0, [/latex]

откуда [latex] \partial y = — \partial x, [/latex] и окончательно

[latex] \partial^2 F = -(2 \partial x)^2 = -4 \partial x^2, [/latex]

где [latex] \partial x [/latex] — независимый дифференциал. Следовательно, в точке [latex] \left(x_{1}, y_{1} \right) [/latex] имеет место локальный относительный максимум задачи, равный [latex] f \left( \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right) = \frac{1}{2}. [/latex] Легко заключить, используя симметрические свойства [latex] f ,[/latex] что в точке [latex] \left( -\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}} \right) [/latex] имеет место другой локальный относительный максимум, равный [latex] \frac{1}{2} [/latex].
Так как окружность [latex] \Gamma [/latex] есть ограниченное замкнутое множество и непрерывная на [latex] \Gamma [/latex] функция [latex] f [/latex] должна достигать на [latex] \Gamma [/latex] своего максимума, и так как максимум на [latex] \Gamma [/latex] необходимо есть максимум на [latex] \Gamma, [/latex] то

[latex] \max_{\Gamma} F = f \left( \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right) = f \left( -\frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}} \right) = \frac{1}{2} [/latex]

и, аналогично,

[latex] \min_{\Gamma} F = f \left( \frac{1}{\sqrt{2}}, -\frac{1}{\sqrt{2}} \right) = f \left( -\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right) = -\frac{1}{2}. [/latex]

[свернуть]

Литература

Тесты

Условный экстремум. Метод множителей Лагранжа.

Этот тест поможет вам освоить материал этой статьи.


Таблица лучших: Условный экстремум. Метод множителей Лагранжа.

максимум из 22 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

Частные производные высших порядков

Частные производные высших порядков определяются при помощи индукции. Если говорить неформально, то каждая частная производная порядка больше чем 1 определяется, как производная от производной предыдущего порядка.
 

Определение

Частная производная (по независимым переменным) от частной производной порядка $m-1$ называется частной производной порядка $m(m=1,2,…)$.
Частная производная, полученная  с помощью дифференцирования по разным переменным, называется смешанной частной производной.
Частные производные высших порядков сохраняют все те же свойства, что и обычные частные производные.

Пример

Пусть дана функция $f(x,y,z)$.
Частной производной первого порядка по $x$ будет $\frac { df }{ dx } $.
Частной производной второго порядка по $x$ будет $\frac { { d }^{ 2 }f }{ d{ x }^{ 2 } } $
Смешанной производной третьего порядка будет $\frac { { d }^{ 3 }f }{ d{ x }^{ 2 }dy }$

Геометрический смысл частной производной

Спойлер

Пусть нам дана функция [latex]z(x,y)[/latex], которая имеет частную производную в точке ${ M }_{ 0 }({ x }_{ 0 },{ y }_{ 0 })$. Пусть на рисунке изображена поверхность графика функции $z$. Проведем плоскость $y={y}_{0}$. Плоскость пересечет поверхность по линии [latex]T{ P }_{ 0 }[/latex]. Проведем касательную ${ P }_{ 0 }A$ к линии ${ P }_{ 0 }T$. Прямая ${ P }_{ 0 }A$ образует угол $\alpha$ с осью $Ox$. Тангенс угла наклона к оси $Ox$ касательной к графику функции $f(x,{ y }_{ 0 })$ в точке ${ x }_{ 0 }$ и есть частная производная по $x$ функции $z$ в точке ${ M }_{ 0 }({ x }_{ 0 },{ y }_{ 0 })$.
$$
{\rm \tg}\alpha =\frac { dz({ x }_{ 0 },{ y }_{ 0 }) }{ dx } ={ f }_{ x }^{ \prime }({ M }_{ 0 })
$$

4

[свернуть]

Использованная литература

Частные производные высших порядков

Тест на понимание темы «Частные производные высших порядков»

Таблица лучших: Частные производные высших порядков

максимум из 3 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

Критерий сходимости несобственных интегралов

Теорема

Пусть [latex]f(x)[/latex] не изменяет знак на полуинтервале [latex]\left[ a ,b \right)[/latex] и для любого [latex]\xi[/latex] из данного полуинтервала [latex]f(x)[/latex] интегрируема по Риману на отрезке[latex]\left[ a ,\xi \right][/latex]. Тогда для сходимости несобственного интеграла [latex]\int _{a}^{b}{f(x)dx}[/latex] необходимо и достаточно, чтобы функция [latex]\Phi (\xi )=\int _{ a }^{ \xi }{ f(x)dx }[/latex] была ограничена на [latex]\left[ a ,b \right)[/latex].

Спойлер

firsttopic

[latex]\Phi(t)[/latex] — площадь заштрихованной фигуры.

[свернуть]

Доказательство

Докажем вначале теорему для [latex]f(x)[/latex] неотрицательной. Покажем, что функция [latex]\Phi (\xi )[/latex] возрастает. Действительно, для любых [latex]{\xi}_{1}[/latex], [latex]{\xi}_{2}[/latex] из [latex]\left[ a ,b \right)[/latex], [latex]{\xi}_{1}<{\xi}_{2}[/latex]
$$ \Phi({ \xi }_{ 1 })-\Phi({ \xi }_{ 2 })=\overset { { \xi }_{ 1 } }{ \underset { a }{\int} } f(x)dx-\overset{ { \xi }_{ 2 } }{ \underset { a }{\int} } f(x)dx=\overset { { \xi }_{ 2 } }{ \underset { { \xi }_{ 1 } }{ \int } } f(x)dx \ge 0 ,$$ так как [latex]f(x)[/latex] неотрицательна.

Из определения сходимости несобственного интеграла, интеграл [latex]\int _{ a }^{ b }{ f(x)dx }[/latex] сходится тогда, когда существует конечный предел $$ \underset { \xi \rightarrow b-0 }{ \lim } \overset { \xi }{ \underset { a }{ \int } } f(x)dx=\underset { \xi \rightarrow b-0 }{ \lim }\Phi (\xi ) ,$$ а данный предел существует как предел монотонной и ограниченной функции [latex]\Phi (\xi )[/latex].

В случае если [latex]f(x)[/latex] — неположительная, то рассмотрим функцию [latex]g(x) = -f(x)[/latex] — неотрицательную. Из сходимости g(x) следует сходимость f(x), а для g(x) теорема уже доказана.

Спойлер

Изучим на сходимость следующий интеграл:[latex] \overset { 0 } { \underset { -1 }{ \int }} \frac {dx}{ \sqrt{ -x } } [/latex].
Особая точка — [latex]x_0 = 0[/latex]. Функция [latex]\Phi (\xi)=\int_{-1}^{\xi}{\frac{dx}{\sqrt{-x}}}[/latex] должна быть ограничена сверху. Найдем неопределенный интеграл
$$ \int \frac {dx}{ \sqrt{ -x } } = 2 \sqrt{-x} + С .$$
Из этого следует, что
$$ \overset { \xi } { \underset { -1 }{ \int }} \frac {dx}{ \sqrt{ -x } } = 2 \sqrt{-\xi} + 2 = 2(\sqrt{-\xi} + 1) .$$
Так как [latex]\xi \in \left [-1;0\right ][/latex], то функция [latex]\Phi (\xi)[/latex] ограничена сверху числом [latex]4[/latex], а значит интеграл сходится.

[свернуть]

Список Литературы

Критерий сходимости несобственных интегралов

Тест по теме: Критерий сходимости несобственных интегралов

После прочтения статьи, для закрепления материала, рекомендуется пройти тест по данной теме


Таблица лучших: Критерий сходимости несобственных интегралов

максимум из 30 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

Равномерная сходимость последовательностей и рядов

Функциональные последовательности

Если каждому натуральному числу [latex]n[/latex] ставится в соответствие по некоторому закону функция [latex]f_n(x)[/latex], определенная на множестве [latex]E[/latex], то говорят, что на множестве [latex]E[/latex] задана функциональная последовательность [latex]\left \{f_n (x)\right \}[/latex]. Множество [latex]E[/latex] называется областью определения последовательности [latex]\left \{f_n (x)\right \}[/latex].

Если для некоторого [latex]x_0 \in E[/latex] числовая последовательность [latex]\left \{f_n (x_0) \right \}[/latex] сходится, то говорят, что последовательность функций [latex]\left \{f_n (x) \right \}[/latex] сходится в точке [latex]x_0[/latex]. Последовательность функций, сходящуюся в каждой точке [latex]x \in E[/latex], называют сходящейся на множестве [latex]E[/latex].

Если [latex]\underset {n \to \infty}{\lim} f_n(x) = f(x)[/latex] для всех [latex]x \in E[/latex], то говорят, что последовательность [latex]\left \{f_n (x) \right \}[/latex] на множестве [latex]E[/latex] сходится к функции [latex]f(x)[/latex]. Эту функцию называют предельной функцией последовательности.

Равномерная сходимость функциональных последовательностей

Пусть задана последовательность функций [latex]\left \{ f_n(x) \right \}[/latex] и предельная функция [latex]f(x)[/latex]. Говорят, что последовательность функций равномерно сходится на множестве [latex]E[/latex] к функции [latex]f(x)[/latex] если
$$\forall \varepsilon >0 \quad \exists n_{ \varepsilon }\in \mathbb{N}: \forall n \ge n_\varepsilon \ \forall x \in E \Rightarrow \left|f_n(x)-f(x) \right| < \varepsilon .$$
Последовательность [latex]\left \{ f_n(x) \right \}[/latex] называется равномерно сходящейся на [latex]E[/latex], если существует функция [latex]f(x)[/latex], к которой она равномерно сходится.

Спойлер

Рассмотрим последовательность [latex]\left \{f_n(x) \right \}[/latex], [latex]f_n(x) = \frac{1}{n}x^n[/latex] на отрезке [latex]\left [ 0;1 \right ][/latex]. Она равномерно сходится на этом отрезке.

thirdtopic

Действительно, так как [latex]0 < \frac{1}{n}x^n < \frac{1}{n}[/latex] и [latex]\underset{n \to \infty}{\lim} \frac{1}{n} = 0[/latex], то для любой точности [latex]\varepsilon > 0[/latex] мы можем выбрать номер [latex] n_\varepsilon = \left \lceil \frac{1}{\varepsilon } \right \rceil + 1[/latex], начиная с которого все последующие члены ряда будут меньше [latex]\varepsilon[/latex], [latex]\left | f_n(x) \right | < \varepsilon[/latex]. Значит последовательность сходится равномерно к нулю на [latex]\left [ 0;1 \right ][/latex].

[свернуть]

Функциональные ряды

Аналогично вводим понятие функциональных рядов. Пусть каждому натуральному числу [latex]n[/latex] ставится в соответствие по некоторому закону функция [latex]u_n(x)[/latex], определенная на множестве [latex]E[/latex]. Формально говоря нам дана функциональная последовательность [latex]\left \{ u_n(x) \right \}[/latex].

Выражение вида [latex]u_{ 1 }(x)+u_2(x) +\dots +u_n(x) +\dots =\overset{\infty}{\underset{n=1}{\sum}}u_n(x)[/latex] называется функциональным рядом. Если для некоторого [latex]x_0 \in E[/latex] числовой ряд [latex]\sum_{n=1}^{\infty} u_n(x_0)[/latex] сходится, то говорят, что функциональный ряд [latex]\sum_{n=1}^{\infty} u_n(x)[/latex] сходится в точке [latex]x_0[/latex]. Функциональный ряд, сходящийся в каждой точке [latex]x \in E[/latex], называют сходящимся на множестве [latex]E[/latex].

Сумма [latex]n[/latex] первых членов ряда [latex]S_n(x) = \overset{n}{\underset{k=1}{\sum}}u_k(x)[/latex] называется его частичной суммой. Заметим, что частичная сумма сама является функцией. Мы получаем функциональную последовательность [latex]\left \{ S_n(x) \right \}[/latex].

Спойлер

Изучим сходимость ряда
$$x^2 + \frac{x^2}{1+x^2} + \dots + \frac{x^2}{(1+x^2)^n} + \dots,$$
Где [latex]x[/latex] — действительное число. Этот ряд сходится при всех [latex]x[/latex]. При [latex]x \neq 0[/latex] мы имеем бесконечно убывающую геометрическую прогрессию со знаменателем [latex]q = \frac{1}{1+x^2}[/latex], [latex] 0 < q < 1[/latex]. Таким образом:
$$x^2 + \frac{x^2}{1+x^2} + \dots + \frac{x^2}{(1+x^2)^n} + \dots = \frac{x^2}{1-\frac{1}{1+x^2}} = 1 + x^2 .$$
При [latex]x = 0[/latex] каждый член ряда равен нулю и тогда сумма всего ряда равна нулю.

[свернуть]

Равномерная сходимость функциональных рядов

Пусть задан функциональный ряд [latex]\overset{\infty}{\underset{n=1}{\sum}}u_n(x)[/latex], члены которого являются функциями, определенными на множестве [latex]E[/latex]. Функциональный ряд называется равномерно сходящимся на множестве [latex]E[/latex], если последовательность его частичных сумм равномерно сходящаяся на множестве [latex]E[/latex]. Согласно определению равномерной сходимости последовательности функции, существует такая функция [latex]S(x)[/latex], что
$$\forall \varepsilon >0 \quad \exists n_{ \varepsilon }\in \mathbb{N}: \forall n \ge n_\varepsilon \ \forall x \in E \Rightarrow \left|S_n(x)-S(x) \right| < \varepsilon .$$
Обозначим [latex]S_n(x)-S(x)=r_n(x)[/latex] — [latex]n[/latex]-ый остаток ряда, получаем [latex]r_n(x) = \overset{\infty}{\underset{k=n+1}{\sum}}u_k(x)[/latex]. Тогда условие сходимости ряда примет вид: $$\forall \varepsilon >0 \quad \exists n_{ \varepsilon }\in \mathbb{N}: \forall n \ge n_\varepsilon \ \forall x \in E \Rightarrow \left|r_n(x)\right| < \varepsilon .$$
Это означает, что какое бы мы маленькое [latex]\varepsilon[/latex] не взяли, начиная с некоторого номера [latex]n[/latex], [latex]n[/latex]-ый остаток ряда будет меньше этого [latex]\varepsilon[/latex].

Необходимое условие равномерной сходимости функционального ряда

Теорема

Если функциональный ряд [latex]\overset{\infty}{\underset{n=1}{\sum}}u_n(x)[/latex] равномерно сходится на множестве [latex]E[/latex], то последовательность его членов [latex]\left \{ u_n(x) \right \}[/latex] равномерно стремится к нулю на множестве [latex]E[/latex].

Доказательство

Обозначим частичные суммы ряда как [latex]S_n(x)[/latex], а сумму ряда (предельную функцию последовательности частичных сумм) как [latex]S(x)[/latex]. Согласно определению равномерной сходимости ряда
$$\forall \varepsilon >0 \quad \exists n_{ \varepsilon }\in \mathbb{N}: \forall n \ge n_\varepsilon \ \forall x \in E \Rightarrow \left|S_n(x)-S(x) \right| < \frac{\varepsilon}{2} ,$$
поэтому для [latex]\forall n \ge n_\varepsilon[/latex] справедливо также неравенство
$$\left| u_{ n+1 }(x) \right| =\left| S_{ n+1 }(x)-S_{ n }(x) \right| =\left| \left[ S_{n+1}(x)-S(x) \right] + \left[S(x) — S_n(x) \right] \right| < \frac{\varepsilon}{2} + \frac{\varepsilon}{2} = \varepsilon .$$
А это и означает равномерную сходимость к нулю последовательности [latex]\left \{ u_n(x) \right \}[/latex].

Список Литературы

Равномерная сходимость последовательностей и рядов

После прочтения статьи, для закрепления материала, рекомендуется пройти тест по данной теме


Таблица лучших: Равномерная сходимость последовательностей и рядов

максимум из 60 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных

Дифференцируемость композиции дифференцируемых функций

В данной статье, используя термин «сложная функция», мы будем понимать композицию нескольких функций.

Теорема

Пусть функции [latex]{ \varphi }_{ i }(x)={ \varphi }_{ i }({ x }_{ 1 },{ x }_{ 1 },{ x }_{ 1 },…,{ x }_{ n })\quad i=\overline { 1,m }[/latex] дифференцируемы в точке [latex]{ x }^{ \circ }=({ x }_{ 1 }^{ \circ },{ x }_{ 2 }^{ \circ },…,{ x }_{ n }^{ \circ })[/latex] . Пусть функция [latex]f({ y }_{ 1 },{ y }_{ 2 },{ y }_{ 3 },…{ ,y }_{ m })[/latex] дифференцируема в точке [latex]{ y }^{ \circ }=({ \varphi }_{ 1 }({ x }^{ \circ }),{ \varphi }_{ 2 }({ x }^{ \circ }),…,{ \varphi }_{ m }({ x }^{ \circ }))[/latex].

Тогда сложная функция [latex]T(x)=f({ \varphi }_{ 1 }(x),{ \varphi }_{ 2 }(x),…,{ \varphi }_{ m }(x))[/latex] дифференцируема в точке [latex]{ x }^{ \circ }[/latex] , причем при [latex]{ x\rightarrow x }^{ \circ }[/latex]
$$
T(x)-T({ x }^{ \circ })=\sum _{ i=1 }^{ n }{ { A }_{ i }({ x }_{ i }-{ x }_{ i }^{ \circ })+o(p(x,{ x }^{ \circ }))} 
$$
$$
{A }_{ i }=\frac { \partial T }{ \partial { x }_{ i } } ({ x }^{ \circ  })=\sum _{ j=1 }^{ m }{ \frac { \partial f }{ \partial { y }_{ j } }  } ({ y }^{ \circ  })\frac { \partial { \varphi  }_{ i } }{ \partial { x }_{ i } } ({ x }^{ \circ  }),\quad i=\overline { 1,n } \quad \quad \quad \quad (1)
$$

Спойлер

Функция [latex]f(y)[/latex] дифференцируема в точке [latex]{ y }^{ \circ }[/latex], а значит, по теореме о существовании частных производных найдутся функции [latex]{ { f }_{ j }( }y), j=\overline { 1,m }[/latex] непрерывные в точке [latex]{ y }^{ \circ }[/latex] и такие, что $$f(y)-f({ y }^{ \circ  })=\sum _{ j=1 }^{ m }{ { f }_{ j }(y)({ y }_{ j }-{ y }_{ j }^{ \circ  }), } \quad \quad { f }_{ j }({ y }^{ \circ  })=\frac { \partial f }{ \partial { y }_{ j } } ({ y }^{ \circ  }) \quad \quad\quad \quad(2)$$Раз функция дифференцируема в точке, то она непрерывна в этой точке. Используя это и теорему о непрерывности сложной функции, получим что функции: $${ \psi  }_{ j }(x)={ f }_{ j }({ \varphi  }_{ 1 }(x),{ \varphi  }_{ 2 }(x),…{ \varphi  }_{ m }(x)),\quad \quad j=\overline { 1,m }\quad \quad\quad \quad(3) $$

непрерывны в точке [latex]{ x }^{ \circ }[/latex] (т.к функции [latex]{\varphi}_{ i }(x)[/latex] непрерывны, и по теореме указанной выше, их композиция также даст непрерывную функцию) , при этом
$$
{ \psi  }_{ j }({ x }^{ \circ  })={ f }_{ j }({ y }^{ \circ  })=\frac { \partial f }{ \partial { y }_{ j } } ({ y }^{ \circ  })\quad \quad\quad \quad(4)
$$

Подставив в [latex](2)[/latex] [latex]{ y }_{ 1 }={ \varphi }_{ 1 }(x),…,{ y }_{ m }={ \varphi }_{ m }(x)[/latex] и воспользовавшись [latex](3)[/latex] получим:

$$T(x)-T({ x }^{ \circ  })=\sum _{ j=1 }^{ m }{ { \psi  }_{ j }(x)({ \varphi  }_{ j }(x)- } ({ \varphi  }_{ j }({ x }^{ \circ  }))\quad \quad\quad \quad(5)$$

Но функции [latex]{ \varphi }_{ j }(x)[/latex] дифференцируемы в точке [latex]{ x }^{ \circ }[/latex] (по условию), поэтому найдутся такие непрерывные в точке [latex]{ x }^{ \circ }[/latex] функции [latex]{ \varphi }_{ ij }(x)[/latex],  что $${ \varphi  }_{ j }(x)-{ \varphi  }_{ j }({ x }^{ \circ  })=\sum _{ i=1 }^{ n }{ { \varphi  }_{ ij }(x) } ({ x }_{ i }-{ x }_{ i }^{ \circ  }),\quad \quad { \varphi  }_{ ij }({ x }^{ \circ  })=\frac { \partial { \varphi  }_{ j } }{ \partial { x }_{ i } } ({ x }^{ \circ  })\quad \quad\quad \quad(6)$$

$${ i=\overline { 1,n }  }\quad { j=\overline { 1,m }  }$$

Подставляя выражения [latex](6)[/latex] и [latex](5)[/latex] получаем

$$T(x)-T({ x }^{ \circ  })=\sum _{ i=1 }^{ n }{ { T }_{ i }(x)({ x }_{ i }-{ x }_{ i }^{ \circ  }) } \quad \quad { T }_{ i }(x)=\sum _{ j=1 }^{ m }{ { \varphi  }_{ ij } } (x){ \psi  }_{ j }(x)\quad \quad\quad \quad(7)$$

Так как функции [latex]{ \psi }_{ j }(x)[/latex] и [latex]{ \varphi }_{ ij }(x)[/latex] непрерывны в точке  [latex]{ x }^{ \circ }[/latex], то и [latex]{ T }_{ i }(x)[/latex] непрерывны в этой точке (как композиции непрерывных). А это означает, что сложная функция  [latex]{ T }(x)[/latex] дифференцируема в  [latex]{ x }^{ \circ }[/latex].

Дифференцируемая функция [latex]{ T }(x)[/latex] может быть записан в виде [latex](1)[/latex] с коэффициентами [latex]{ A }_{ i }[/latex], равными в силу [latex](6)[/latex] и [latex](4)[/latex]

$${ A }_{ i }={ T }_{ i }({ x }^{ \circ  })=\sum _{ j=1 }^{ m }{ { \varphi  }_{ ij } } ({ x }^{ \circ  }){ \psi  }_{ j }({ x }^{ \circ  })=\sum _{ j=1 }^{ m }{ \frac { \partial f }{ d{ y }_{ j } } ({ y }^{ \circ  })\frac { \partial { \varphi  }_{ j } }{ d{ x }_{ i } } ({ x }^{ \circ  })=\frac { \partial T }{ \partial { x }_{ i } }  } ({ x }^{ \circ  })$$

[свернуть]
Спойлер

  •  Формула ${ A }_{ i }=\frac { \partial T }{ \partial { x }_{ i } } ({ x }^{ \circ })=\sum\limits _{ j=1 }\limits^{ m }{ \frac { \partial f }{ \partial { y }_{ j } }  } ({ y }^{ \circ })\frac { \partial { \varphi }_{ i } }{ \partial { x }_{ i } } ({ x }^{ \circ }),\quad i=\overline { 1,n }$  дает правило нахождения частных производных сложной функции, аналогичное соответствующему правилу для функций одной переменной.

[свернуть]
Спойлер

Пусть дана функция $f(x,y)=\sin x + \tan (x^ 2+y^ 2)$.
Ее можно представить как композицию функций: $z(u,v)=u+v\quad u(x,y)=\sin x \quad v(x,y)=\tan (x^ 2+y^ 2)$
Тогда дифференциал функции $f$ имеет вид:
$$
df=\frac { dz }{ dx } +\frac { dz }{ dy } =\frac { dz }{ du } \frac { du }{ dx } +\frac { dz }{ dv } \frac { dv }{ dx } +\frac { dz }{ du } \frac { du }{ dy } +\frac { dz }{ dv } \frac { dv }{ dy }
$$
Вычислим частные производные:
$$
\frac { dz }{ du } =1; \quad \frac { du }{ dx } =-\cos x;
$$
$$
\frac { dz }{ dv } =1; \quad \frac { dv }{ dx } =\frac { 2x }{ \cos ^{ 2 }{ ({ x }^{ 2 }+{ y }^{ 2 }) } } ;
$$
$$
\frac { du }{ dy } = 0; \quad \frac { dv }{ dy } =\frac { 2y }{ \cos ^{ 2 }{ ({ x }^{ 2 } } +y };
$$
Получаем, что:
$$
df=-\cos x +\frac { 2x }{ \cos ^{ 2 }{ ({ x }^{ 2 }+{ y }^{ 2 }) } } +\frac { 2y }{ \cos ^{ 2 }{ ({ x }^{ 2 } } + y^{ 2 }) }.
$$

[свернуть]

 

Дифференцируемость композиции дифференцируемых функций

Тест, на понимание темы «Дифференцируемость композиции дифференцируемых функций»

Таблица лучших: Дифференцируемость композиции дифференцируемых функций

максимум из 3 баллов
Место Имя Записано Баллы Результат
Таблица загружается
Нет данных