Теорема об умножении определителей

Теорема. Определитель произведения нескольких квадратных матриц порядка $n$ равен произведению определителей этих матриц: $$\textrm{det}(A \cdot B)=\textrm{det}(A) \cdot \textrm{det}(B)$$ или полная формула: $$\textrm{det}\left (\prod_{i=1}^{k}A_i\right )= \prod_{i=1}^{k}\textrm{det} A_i, A_i\in\left(P\right), i=1, \ldots, k.$$

Рассмотрим случай $k=2$. Допустим заданы две матрицы $A=\left \| a_{ij} \right \|\in M_n\left ( P \right )$ и $B=\left \| b_{ij} \right \|\in M_n\left ( P \right )$. Воспользуемся вспомогательной блочной матрицей $C=\begin{Vmatrix}A & 0\\-E & B\end{Vmatrix}$ размера $2n\times 2n$, определитель которой имеет вид: $$\Delta = \begin{vmatrix}
a_{11}&a_{12} &\cdots & a_{1n} &0 & 0 & \cdots & 0\\
a_{21}&a_{22} &\cdots & a_{2n} &0 & 0 & \cdots & 0 \\
\cdot & \cdot & \cdot & \cdot & \cdot &\cdot & \cdot & \cdot\\
a_{n1}&a_{n2} &\cdots & a_{nn} &0 & 0 & \cdots & 0\\
-1& 0 & \cdots & 0 & b_{11} & b_{12} & \cdots & b_{1n}\\
0 & -1 & \cdots & 0 & b_{21} & b_{22} & \cdots & b_{2n} \\
\cdot & \cdot & \cdot & \cdot & \cdot &\cdot & \cdot & \cdot\\
0 & 0 & \cdots & -1 & b_{n1} & b_{n2} & \cdots & b_{nn}
\end{vmatrix}$$
Вычислим $\Delta$ используя теорему Лапласа. Замечаем, что отличным от нуля будет только $\textrm{det}(A)$. Следовательно, $\Delta=\textrm{det}(A) \cdot \textrm{det}(B)$. Теперь с помощью элементарных преобразований изменим $\Delta$ так, что в итоге получим определитель вида $\begin{vmatrix}A & C\\ -E & O\end{vmatrix}$. Где $C$ является произведением матриц $A$ и $B$. Первый столбец умножим на $b_{11}$ и прибавим к $\left ( n+1 \right)$-му столбцу, второй на элемент $b_{21}$ и вновь прибавим к $\left ( n+1 \right )$-му столбцу. Так же обнулим остальные элементы матрицы $B$. Записав подробнее полученный определитель имеем: $$\Delta = \begin{vmatrix}
a_{11}&a_{12} &\cdots & a_{1n} & c_{11} & c_{12} & \cdots & c_{1n}\\
a_{21}&a_{22} &\cdots & a_{2n} & c_{21} & c_{22} & \cdots & c_{2n}\\
\cdot & \cdot & \cdot & \cdot & \cdot &\cdot & \cdot & \cdot\\
a_{n1}&a_{n2} &\cdots & a_{nn} & c_{n1} & c_{n2} & \cdots & c_{nn} \\
-1& 0 & \cdots & 0 & 0 & 0 & \cdots & 0\\
0 & -1 & \cdots & 0 & 0 & 0 & \cdots & 0\\
\cdot & \cdot & \cdot & \cdot & \cdot &\cdot & \cdot & \cdot\\
0 & 0 & \cdots & -1 & 0 & 0 & \cdots & 0
\end{vmatrix}$$ Снова вычислим определитель $\Delta$, разложением по последним $n$ столбцам. В этом случае отличным от нуля минором $n-$го порядка будет определитель матрицы $C$. Поэтому $\Delta= \textrm{det}C\cdot\textrm{det}\left (-E\right )=\textrm{det}C\cdot\left ( -1 \right )^{n}\cdot\left (-1\right )^{S_1+S_2},$ где $$S_1=\sum_{k=n+1}^{2n}k, \textrm{ a } S_2=\sum_{k=1}^{n}k.$$ В результате получаем $\Delta=\textrm {det}C\cdot\left ( -1 \right )^{2n\left ( n^{2}+n \right )}=\textrm {det}C.$ Теперь, подставляя имеем доказательство теоремы: $$\Delta=\textrm {det}C=\textrm{det}(A \cdot B)=\textrm{det}(A) \cdot \textrm{det}(B).$$

Замечание Теорема остается верной для любого из возможных правил умножения матрицы на матрицу:

  1. строка на строку;
  2. строка на столбец;
  3. столбец на строку;
  4. столбец на столбец.

Теорема об умножении определителей является следствием формулы Бине-Коши. Это теорема об определителе произведения прямоугольных матриц, в случае если это произведение дает квадратную матрицу. Справедлива для матриц с элементами любого коммутативного кольца.

Теорема. Пусть даны две матрицы $A$ и $B$ размеров $\left ( m\times n \right )$ и $\left ( n\times m \right )$ соответственно. Определитель матрицы равен нулю, если $m > n$, и равен сумме произведений всех соответствующих миноров $m \leqslant n$. Миноры матриц $A$ и $B$ одинакового порядка, равного наименьшему из чисел n и m, называются соответствующими друг другу, если они стоят в столбцах матрицы $A$ и строках матрицы $B$ с одинаковыми номерами: $$\textrm{det}AB=\sum_{\gamma_1<\gamma_2<\cdots<\gamma_m }A_{\gamma_1<\gamma_2<\cdots<\gamma_m }B_{\gamma_1<\gamma_2<\cdots<\gamma_m },$$
где $A_{\gamma_1<\gamma_2<\cdots<\gamma_m }$ — минор матрицы $A$, составленный из столбцов с номерами $\gamma_1<\gamma_2<\cdots<\gamma_m$, и $B_{\gamma_1<\gamma_2<\cdots<\gamma_m }$ — минор матрицы $B$, составленный из строк с номерами $\gamma_1<\gamma_2<\cdots<\gamma_m$.

Аналогично доказательству теоремы об умножении определителей, используя теорему Лапласа в общей формулировке.

Примеры решения задач

Рассмотрим примеры решения задач связанных с рассмотренной теоремой. Читателю рекомендовано попытаться решить задачи самостоятельно, а затем сверить свое решение с приведенным ниже.

  1. Найти определитель произведения матриц: $$A=\begin{Vmatrix}3 & 4\\ 1 & -8\end{Vmatrix},
    B=\begin{Vmatrix}2 & 9\\ -1 & 5\end{Vmatrix}$$

    Решение

    Находим определители данных матриц второго порядка: $\begin{vmatrix}3 & -4\\ 1 & -6\end{vmatrix}=-18+4=-14
    $ и $\begin{vmatrix}2 & 7\\ 1 & 5\end{vmatrix}=10-7=3$. По теореме об определителе произведения матриц получаем: $$\textrm{det}(A \cdot B)=\textrm{det}\left (A \right ) \cdot \textrm{det}\left ( B \right )=\left ( -14\right )\cdot\left ( 3 \right )=-42.$$ Вычислим этот же определитель, находя произведение матриц: $$A\cdot B=\begin{vmatrix}3 & -4\\ 1 & -6\end{vmatrix}\cdot\begin{vmatrix}2 & 7\\ 1 & 5\end{vmatrix}=\begin{vmatrix}2 & 1\\ -4 & -23\end{vmatrix}$$ Следовательно, $\textrm{det}\left (A\cdot B\right )=-46+4=-42$. Результаты совпадают.

  2. Найти определитель матрицы пятого порядка: $$M=\begin{Vmatrix}
    1 & 2 & u & v & w\\
    3 & 4 & x & y & z\\
    0 & 0 & 3 & 2 & 1\\
    0 & 0 & 2 & 5 & 3\\
    0 & 0 & 3 & 4 & 2
    \end{Vmatrix}$$

    Решение

    Разобьём данную матрицу на 4 блока, $M=\begin{Vmatrix}A & B\\ O & C\end{Vmatrix}$ где $A=\begin{Vmatrix}1 & 2\\ 3 & 4\end{Vmatrix}$,
    $B=\begin{Vmatrix}u & v & w\\ x & y & z\end{Vmatrix}$, $O=\begin{Vmatrix}0 & 0 \\ 0 & 0\\ 0 & 0\end{Vmatrix}$, $C=\begin{Vmatrix}3 & 2 & 1\\ 2 & 5 & 3 \\3 & 4 & 2\end{Vmatrix}$.
    Представим блочную матрицу как произведение (в справедливости этого представления можно убедиться, найдя произведение по правилам умножения блочных матриц). $$D=\begin{Vmatrix}
    A & B\\
    C & D
    \end{Vmatrix} = \begin{Vmatrix}
    E_2 & O^T\\
    O & C
    \end{Vmatrix} \cdot \begin{Vmatrix}
    E_2 & B\\
    O & E_3
    \end{Vmatrix} \cdot \begin{Vmatrix}
    A & O^T\\
    O & E_3
    \end{Vmatrix} ,$$ где $E_2,E_3$ — единичные матрицы соответствующих порядков.
    $\begin{vmatrix}
    A & O^T\\
    O & E_3
    \end{vmatrix} = \textrm{det}A =\left | A \right |$, $\begin{vmatrix}
    E_2 & O^T\\
    O & C
    \end{vmatrix} = \textrm{det}C =\left | C \right|$.
    Матрица $\begin{Vmatrix}
    E_2 & B\\
    O & E_3
    \end{Vmatrix}$ — треугольная с единицами на главной диагонали, следовательно ее определитель равен $1$ По теореме об определителе произведения получаем:
    $$\begin{vmatrix}
    A & B\\
    O & C
    \end{vmatrix}= \begin{vmatrix}
    E_2 & O^T\\
    O & C
    \end{vmatrix}\ \cdot \begin{vmatrix}
    E_2 & B\\
    O & E_3
    \end{vmatrix}\ \cdot\begin{vmatrix}
    A & O^T\\
    O & E_3
    \end{vmatrix}=\left | C \right |\cdot 1\cdot\left | A \right |=\left | A \right |\cdot\left | C \right |$$ Найдем $\textrm{det}A$ и $\textrm{det}C$. $\begin{vmatrix}1 & 2\\ 3 & 4\end{vmatrix}=-2$ $\begin{vmatrix}3 & 2 & 1\\ 2 & 5 & 3 \\3 & 4 & 2\end{vmatrix}=-15-8-36+30+18=-3$. Подставляя, получаем, $\textrm{det}M=-2\cdot -3=-6$

  3. Смотрите также:

    1. Белозеров Г.С. Конспект лекций по линейной алгебре.
    2. В.А. Ильин, Э.Г. Позняк. Линейная алгебра; 5-е изд., стереотипное. ФИЗМАТЛИТ. — 2002. С. 38-39
    3. А.И. Кострикин. Введение в алгебру. Основы алгебры С.138-139
    4. Курош А.Г. Курс высшей алгебры М.: Наука, 1968, С.93-95
    5. Фаддеев Д. К. Лекции по алгебре: Учебное пособие для вузов.— M.: Наука. Главная редакция физико-математической литературы, 1984.— 416 с. C. 130-134

    Теорема об умножении определителей

    Тест на знание темы «Теорема об умножении определителей».

Теорема о «чужих дополнениях»

Теорема. Сумма произведений элементов некоторой строки (столбца) матрицы определителя на алгебраическое дополнения соответствующих элементов другой строки (столбца) (чужие алгебраические дополнения) равны $0$.

Разложение по строке: $$a_{i1}A_{j1}+a_{i2}A_{j2}+\ldots+a_{in}A_{kn}=\sum_{k=1}^{n} a_{ij}A_{kj}=0$$

Разложение по столбцу: $$a_{1j}A_{1j}+a_{2i}A_{2j}+\ldots+a_{nj}A_{nk}=\sum_{k=1}^{n} a_{ij}A_{ik}=0$$

Пусть $\Delta$ – определитель порядка $n$. Тогда $$\sum_{j=1}^{n} a_{i j} A_{k j}=\left\{\begin{array}{l} \Delta, & если & k = i \\0, &если & k \neq i \end{array}\right.$$

Рассмотрим определитель матрицы $A=\left\|a_{i j}\right\| \in M_{n}(P)$. Прибавим $k$-ю строку к $i$-й, отчего определитель матрицы не изменится в соответствии со свойством определитель не изменится, если к какой-либо его строке (столбцу) прибавить (как матрицу) другую его строку (столбец), умноженную (-ого) на произвольный элемент поля. Отсюда, в частности, следует, что определитель, содержащий равные строки (столбцы), равен нулю. Теперь распишем по теореме о разложении определителя по строке (столбцу) определитель новой матрицы, разлагая его по $i$-й строке. Получим $$\Delta=\sum_{i=1}^{n}\left(a_{i j}+a_{k j}\right) A_{i j}=\sum_{j=1}^{n} a_{i j} A_{i j}+\sum_{j=1}^{n} a_{k j} A_{i j}=$$ $$=\Delta+\sum a_{k j} A_{i j} \Rightarrow \sum_{j=1}^{n} a_{k j} A_{i j}=0 $$

Примеры

  1. Вычислим определитель матрицы $$A=\left(\begin{array}{ll}3 & 5 & 7 & 2\\7 & 6 & 3 & 7\\5 & 4 & 3 & 5\\-5 & -6 & -5 & -4\end{array}\right)$$
  2. Нахождение определителя матрицы $А$

    В этой матрице нет строк (столбцов) содержащих ноль, а значит, выберем любую строку (столбец), например, 3-ю строку. $$\operatorname{det}A = \left|\begin{array}{cccc}3 & 5 & 7 & 2 \\7 & 6 & 3 & 7 \\5 & 4 & 3 & 5\\-5 & -6 & -5 & -4\end{array}\right|= 5 \cdot\left|\begin{array}{ccc}5 & 7 & 2 \\6 & 3 & 7 \\-6 & -5 & -4\end{array}\right| \cdot(-1)^{3+1}+$$ $$+4 \cdot\left|\begin{array}{ccc}3 & 7 & 2 \\7 & 3 & 7\\-5 & -5 & -4\end{array}\right| \cdot(-1)^{3+2}+ 3\cdot\left|\begin{array}{ccc}3 & 5 & 2 \\7 & 6 & 7 \\-5 & -6 &-4\end{array}\right| \cdot(-1)^{3+3}+$$ $$+5\cdot\left|\begin{array}{ccc}3 & 5 & 7 \\7 & 6 & 3\\-5 & -6 & -5\end{array}\right| \cdot(-1)^{3+4}$$

    Применяя правило Саррюса решим миноры 3-го порядка. Получим, что

    $$\operatorname{det}A = 5\cdot(-35) -4\cdot(-20)+3\cdot(-5)-5\cdot(-20) =$$ $$=-175+80-15+100 = -10 \Rightarrow \operatorname{det}A = -10 $$

    [свернуть]
  3. Вычислим определитель матрицы $$B=\left(\begin{array}{ll}3 & 1 & 1 & 0\\0 & 1 & 5 & 4\\-1 & -4 & 0 & 2\\-1 & 0 & 2 & 2\end{array}\right)$$
    Нахождение определителя матрицы $B$

    $$\operatorname{det}B = \left|\begin{array}{cccc}3 & 1 & 1 & 0 \\0 & 1 & 5 & 4 \\-1 & -4 & 0 & 2\\-1 & 0 & 2 & 2\end{array}\right|= 3 \cdot\left|\begin{array}{ccc}1 & 5 & 4 \\-4 & 0 & 2 \\0 & 2 & 2\end{array}\right| \cdot(-1)^{1+1}+$$ $$+\left|\begin{array}{ccc}0 & 5 & 4 \\-1 & 0 & 2\\-1 & 2 & 2\end{array}\right| \cdot(-1)^{1+2}+ \left|\begin{array}{ccc}0 & 1 & 4\\-1 & -4 & 2\\-1 & 0 &2\end{array}\right| \cdot(-1)^{1+3}$$ $$\operatorname{det}A = 3\cdot4-(-8)-16 = 4\Rightarrow \operatorname{det}A = 4 $$

    [свернуть]

Литература

  1. Конспект лекций по линейной алгебре. Белозёров Г.С. Глава IV. Матрицы и определители.
  2. Конспект лекций по линейной алгебре. Марков В.Т МГУ 2013 год (стр. 29)
  3. Конспект лекций по линейной алгебре. Факультет математики НИУ ВШЭ

Теорема о «чужих дополнениях»

Тест на теорму о «чужих дополнениях»

M689. Задача о равнобедренных трапециях и прямоугольнике

Условие

Докажите, что из одинаковых плиток, имеющих форму равнобедренных трапеций с основаниями $3$ см, $1$ см и высотой $1$ см, нельзя составить прямоугольник.

Рис. 1
Рис. 2

Решение

Предположим, что прямоугольник удалось составить из $n$ трапеций. Отметим точки, в которые попадают вершины трапеций, в том числе — четыре вершины прямоугольника. У каждой трапеции два острых угла (по $45^\circ$) и два тупых (по $135^\circ$), так что у всех $n$ трапеций вместе одинаковое число острых и тупых углов — по $2n$ .

рис. 3

рис. 4

рис. 5

С другой стороны, ясно, что в каждой из отмеченных точек расположена не меньше острых углов, чем тупых (если там есть один тупой угол, то есть по крайней мере один острый, а если — два тупых, то и два острых); при этом в вершинах прямоугольника могут оказаться острые углы трапеции. Таким образом, острых углов больше, чем тупых (по крайней мере, на 8).

Полученное противоречие доказывает невозможность составления прямоугольника из трапеций.

С. Рукшин

14.3 Условный экстремум

Определение. Пусть $f $– действительная функция, заданная на открытом множестве $E ⊂ R^n,$ $M-p$-мерное многообразие, содержащееся в $E$. В точке $x_0 ∈ M$ функция $f$ имеет условный максимум на многообразии $M,$ если существует такая окрестность $U ⊂ E$ точки $x_0,$ что для всех $x ∈ U ∩ M$ выполняется неравенство $f(x)≤f(x_0).$ Условный максимум называется строгим, если окрестность можно выбрать настолько малой, что для всех $x ∈ U ∩M,$ $x \ne x_0,$ будет выполнено строгое неравенство $f(x)< f(x_0).$ Аналогично определяется понятие условного минимума.

Пример. Пусть $f(x, y) = xy.$ В начале координат эта функция не имеет обычного экстремума, поскольку в любой окрестности начала координат она принимает как положительные, так и отрицательные значения. Возьмем теперь многообразие $M_1 : y = x.$ На этом многообразии $f(x, y) = x^2$ и в точке $(0, 0)$ функция f имеет условный минимум на многообразии $M_1.$ Если взять $M_2 : y = −x,$ то на нем $f(x, y) = −x^2,$ и теперь функция $f$ имеет условный максимум в точке $(0, 0).$ Итак, функция f в начале координат не имеет экстремума, а на многообразиях $M_1$ и $M_2$ имеет условные минимум и максимум, соответственно.

 

Теорема (необходимое условие экстремума на многообразии). Пусть $f$– действительная функция, заданная на открытом множестве $E ⊂ R^n,$ содержащем многообразие $M$. Пусть в точке $x_0 ∈ M$ функция $f$ имеет условный экстремум и дифференцируема в этой точке. Тогда производная $f'{}(x_0)$ обращается в нуль на касательном пространстве $T_{x0}(M),$ т. е.$f'{} (x_0)·h = 0$ для любого $h ∈ T_{x0}(M).$

Пусть $h$ – касательный вектор, т. е. $h ∈ T_{x0}(M).$ Тогда существует такая функция $γ : R \to M,$ $γ(0) = x_0,$ что $γ'{}(0) = h.$ Рассмотрим функцию $g(t) = f(γ(t)) (t ∈ R).$ Если $f$ в точке $x_0$ имеет условный максимум, то при $t = 0$ функция $g$ имеет обычный локальный максимум. Функция $g$ дифференцируема в точке $t = 0$ и, по теореме о производной сложной функции,

$g'{}(0)= f'{}(γ(0))·γ'{} (0) = f'{}(x_0)·h$

С другой стороны, по теореме Ферма, $g'{}(0)=0.$ Итак, $f'{}(x_0)·h=0.$

Геометрический смысл теоремы. Предположим, что функция $f$ класса $C^1$ и рассмотрим множество

$H = ${$x:f(x)= f(x_0)$}

Это множество называется множеством уровня функции $f.$ Предположим, что $f'{}(x)\ne 0$ для всех $x ∈ H.$ Тогда получим, что $H – (n − 1)$- мерное многообразие, т. е. гиперповерхность. Касательное пространство к многообразию $H$ определяется как совокупность всех векторов $h,$ для которых выполнено равенство $f'{}(x_0)·h = 0.$ Доказанная теорема утверждает, что $p$-мерное подпространство $T_{x0}(M)$ содержится в $(n−1)$-мерной гиперплоскости $T_{x0}(H).$ Другими словами, касательная гиперплоскость к $H$ в точке $x_0$ содержит касательную $p$-плоскость к $M$ в этой точке.

Заметим, что доказанная теорема дает лишь необходимое условие экстремума. Можно показать, что достаточным оно не является.

Метод множителей Лагранжа. Пусть $M – p$-мерное многообразие, точка $x_0 ∈ M$ и в окрестности $U$ этой точки $M$ определено уравнением $ϕ(x) = 0,$ где $ϕ = (ϕ^1, …, ϕ ^{n−p} ),$ $rank$ $ϕ'{}(x) = n − p$ для любого $x ∈ U.$

Теорема. Пусть $f$ – действительная функция в некоторой окрестности многообразия $M,$ дифференцируемая в точке $x_0 ∈ M$ и имеющая в этой точке условный экстремум. Тогда существуют такие действительные числа $λ_1,…, λ_{n−p},$ что для функции

$F(x) = f(x) + λ_1ϕ^1(x) + … + λ_{n−p}ϕ^{n−p}(x)$

полная производная $F'{}(x_0) = 0.$

В силу предыдущей теоремы, $f'{}(x_0)·h = 0$ для любого $h ∈ T_{x0} (M).$ Это равносильно тому, что $grad$ $f(x_0)·h = 0$ для любого $h ∈ T_{x0} (M), $т. е. $grad$ $f(x_0)$ ортогонален к любому касательному вектору. Значит, этот градиент является нормальным вектором к многообразию $M$ в точке $x_0.$ Как известно, векторы $grad$ $ϕ^i (x_0) (i = 1, …, n − p)$ образуют базис в пространстве нормальных векторов. Значит, существуют числа $α_1, …, α_{n−p}$ такие, что

$grad$ $(f(x_0)) = α^1$ $grad$ $( ϕ^1 (x_0) + … + α_{n−p})$ $grad$ $(ϕ^{n−p} (x_0)).$

Обозначим $λ_i = −α_i, i = 1, …, n−p.$ Тогда видим, что для $F$ ее градиент $grad$ $F(x_0) = 0,$ а это равносильно тому, что $F'{}(x_0) = 0,$ и тем самым теорема доказана.

Числа $λ_1, …, λ_{n−p}$ называются множителями Лагранжа. Они определяются однозначно, так как являются координатами разложения вектора $grad$ $ f(x_0)$ по базису из векторов $grad$ $ϕ^i (x_0) (i = 1, …, n − p),$ взятых с противоположным знаком. Условие $rank $ $ϕ'{}(x) = n − p$ обеспечивает линейную независимость векторов $grad$ $ϕ^i (x_0) (i = 1, …, n − p).$

В качестве примера, иллюстрирующего метод множителей Лагранжа, рассмотрим следующую задачу. Найти расстояние от точки до гиперплоскости в пространстве $R^n.$
Решение

Гиперплоскость $H$ определяется уравнением

$ a_1x ^1 + … + a_nx^n = b,$

или в векторной форме $ax = b,$ где $a \ne 0,$ ибо, в противном случае, не получим гиперплоскость.

Пример. Пусть $x_0 ∈ R^n.$ Покажем, что расстояние от заданной точки $x_0$ до $H$ равно $d(x_0, H) = \frac{|ax_0−b|}{|a|}.$ Расстояние от $x_0$ до произвольной точки $x ∈ H$ выражается следующим образом:
Решение

$\sqrt{(x^1 − x^1_0 )^2 + … + (x^n − x^n_0 )^2}.$

Поэтому для нахождения минимума этих расстояний достаточно рассмотреть подкоренное выражение и найти его минимум.

Обозначим $f(x) = (x^1 − x^1_0 )^2 + … + (x^n − x^n_0 )^2 .$ Составим функцию Лагранжа

$ F(x) = f(x) + λ(ax − b) = f(x) + λ(a_1x^1 + … + a_nx ^n − b).$

Находим все частные производные функции $F$ и приравниваем их к нулю. Получаем

$ \left \{\begin{matrix} 2(x^1 − x^1_0 ) + λa_1 = 0,\\ ………………… \\ 2(x^n − x^n_0 ) + λa_n = 0, \\a_1x^1 + … + a_nx^n = b \end{matrix}\right.$

Последнее уравнение этой системы означает, что точка x лежит на гиперплоскости $H.$ Умножим $i$-е уравнение этой системы на $a_i (i = 1, …, n)$ и сложим первые $n$ уравнений. Тогда получим

$ 2 \sum_{i=1}^n (a_ix^i − a_ix^i_0 ) + λ\sum^n_{i=1} a^2_i = 0,$

или, учитывая последнее уравнение системы,

$ 2(b − ax_0) + λ|a|^2 = 0.$

Отсюда находим

$ λ = \frac{2(ax_0 − b)} {|a|^2}.$

Подставим найденное значение $λ$ в первые $n$ уравнений системы и получим

$2(x^i − x^i_0 ) = −a_i\frac{ 2(ax_0 − b) }{|a|^2} (i = 1, …, n).$

Каждое из этих равенств возведем в квадрат и сложим полученные равенства. Получим

$ f(x) = \frac{(ax_0 − b)^2} {|a|^2} ,$

а это и есть квадрат искомого расстояния.

Пример. Найти точки условного экстремума функции (если они есть) $f(x,y) = y_{2} — x_{2}$ при уравнении связи $y = 2x.$
Решение

Имеем $f(x, 2x) = 3x^{2},$ т.е. при выполнении уравнений связи данная функция является функцией одного переменного и достигает минимума при $x = 0.$
Значению $x = 0$ согласно уравнению связи соответствует значение $y = 0,$ а поэтому функция $f(x,y) = y_{2} — x_{2}$ имеет в точке $(0, 0)$ условный минимум относительно уравнения связи $y = 2x.$

Литература

Условный экстремум

Проверьте, насколько хорошо вы усвоили эту тему и закрепите свои знания по ней, пройдя тест.

7.6 Теоремы о среднем

Теорема 1 (первая теорема о среднем значении). Пусть функции $f$ и $g$ интегрируемы на $[a,b].$ Причем функция $g$ не меняет знак на $[a,b].$ Пусть $m=\displaystyle\inf_{x \in [a,b]}f(x), M = \displaystyle\sup _{x \in [a,b]}f(x).$ Тогда найдется такое число $\mu \in [m, M]$, что $$\int^b_a f(x)g(x)dx= \mu \int^b_a g(x)dx.$$

Геометрический смысл первой теоремы о среднем

Можем считать, что $a < b,$ т. к. если поменять местами $a$ и $b,$ то знаки обеих частей равенства поменяются на противоположные. Пусть $g(x) \ge 0.$ Неравенство $m \le f(x) \le M$ умножим на $g(x)$ и проинтегрируем от $a$ до $b.$ В силу монотонности и линейности интеграла получим $$m \int^b_a g(x)dx \le \int^b_a f(x)g(x)dx \le M \int^b_a g(x)dx.$$ Если $\int^b_a g(x)dx=0,$ то из этого неравенства видно, что утверждение теоремы справедливо при любом $\mu.$ Если же $\int^b_a g(x)dx>0,$ то положим $$\mu = \frac{\int^b_a f(x)g(x)dx}{\int^b_a g(x)dx}.$$ Тогда из полученного выше неравенства следует, что $m \le \mu \le M,$ и теорема доказана.

Случай $g(x) \le 0$ рассматривается аналогично.

Следствие. Если в условиях теоремы 1 функция $f$ непрерывна на $[a,b],$ то найдется такая точка $\xi \in [a,b],$ что $$\int^b_a f(x)g(x)dx = f( \xi )\int^b_a g(x)dx.$$ Действительно, в этом случае, по теореме Больцано — Коши о промежуточном значении, число $\mu$ является значением функции $f$ в некоторой точке $\xi \in [a,b].$

Лемма. Пусть функция $g$ интегрируема на отрезке $[a,b].$ Тогда функция $G(x)\equiv \int^x_a g(t)dt (a \le x \le b)$ равномерно непрерывна на $[a,b].$

Пусть $ x^{\prime}, x^{\prime\prime} \in [a,b], x^{\prime} < x^{\prime\prime}.$ Тогда $$G(x^{\prime\prime}) — G(x^{\prime}) = \int^{x^{\prime\prime}}_a g(t)dt — \int^{x^{\prime}}_a g(t)dt =$$ $$= \int^{x^{\prime}}_a g(t)dt + \int^{x^{\prime\prime}}_{x^{\prime}} g(t)dt — \int^{x^{\prime}}_a g(t)dt = \int^{x^{\prime\prime}}_{x^{\prime}} g(t)dt.$$ Поскольку $g$ интегрируема, то она ограничена, т. е. существует такое $M$, что $|g(t)| \le M$ для всех $t \in [a,b]$. Поэтому получаем $$|G(x^{\prime\prime}) — G(x^{\prime})| \le \int^{x^{\prime\prime}}_{x^{\prime}} |g(t)|dt \le M(x^{\prime\prime} — x^{\prime}).$$ Отсюда следует, что функция $G$ равномерно непрерывна на $[a,b].$

Теорема 2 (вторая теорeма о среднем значении). Пусть функции $f$ и $g$ интегрируемы на $[a,b],$ причем функция $f$ монотонна на $[a,b].$ Тогда существует точка $\xi \in [a,b],$ такая, что$$ \int^b_a f(x)g(x)dx = f(a) \int^{\xi}_a g(x)dx + f(b) \int^b_{\xi} g(x)dx. \qquad \qquad (7.3)$$

Геометрический смысл второй теоремы о среднем

Сначала предположим, что $f$ убывает на $[a,b]$ и неотрицательна. Возьмем произвольное разбиение $a = x_0 < x_1 < \cdots < x_n = b$ отрезка $[a,b].$ Тогда, по свойству аддитивности интеграла, $$I \equiv \int^b_a f(x)g(x)dx = \sum_{i=0}^{n-1} \int ^{x_{i+1}}_{x_i} f(x)g(x)dx =$$ $$ = \sum_{i=0}^{n-1} f(x_i) \int ^{x_{i+1}}_{x_i} g(x)dx +$$ $$+ \sum_{i=0}^{n-1} \int^{x_{i+1}}_{x_i} [f(x) — f(x_i)]g(x)dx \equiv I’ + \rho.$$ Для оценки суммы $\rho$ воспользуемся тем, что интегрируемая функция $g$ ограничена, т.е. существует такое $M,$ что $|g(x)| \le M, x \in [a,b].$ Тогда получим $$| \rho | \le \sum^{n-1}_{i=0} \int^{x_i+1}_{x_i} |f(x) — f(x_i)||g(x)|dx \le M \sum^{n-1}_{i=0} \omega_i \Delta x_i, $$ где $\omega_i$ — колебания функции $f$ на $[x_i,x_{i+1}]$. Правая часть стремится к нулю при стремлении к нулю диаметра разбиения в силу критерия интегрируемости Римана. Следовательно, сумма $I^{\prime}$ стремится к интегралу $I$. Оценим $I^{\prime}$. Для этого обозначим $G(x) = \int^x_a g(t)dt.$ Получим $$I^{\prime} = \sum^{n-1}_{i=0} f(x_i)[G(x_{i+1}) — G(x_i)] = \sum^{n-1}_{i=0} f(x_i)G(x_{i+1}) -$$ $$- \sum^{n-1}_{i=0} f(x_i)G(x_i) = \sum^{n}_{i=1} f(x_{i-1})G(x_i) — \sum^{n-1}_{i=1} f(x_i)G(x_i) =$$ $$=f(x_{n-1})G(x_n) + \sum^{n-1}_{i=1} [f(x_{i-1}) — f(x_i)]G(x_i).$$ Мы воспользовались равенством $G(x_0) = G(a) = 0.$

Обозначим через $L$ и $U$ соответственно нижнюю и верхнюю грани функции $G$ на $[a,b].$ Поскольку, в силу леммы, функция $G$ непрерывна на $[a,b],$ то они существуют в силу первой теоремы Вейерштрасса. Учитывая также, что функция $f,$ по предположению, неотрицательна и монотонно убывающая, т.е. $f(x_{i-1} — f(x_i) \ge 0,$ получаем следующее неравенство: $$L \left[ f(x_{n-1}) + \sum^{n-1}_{i=1} [f(x_{i-1}) — f(x_i)] \right] \le $$ $$ \le I’ \le U \left[ f(x_{n-1}) + \sum^{n-1}_{i=1} [f(x_{i-1}) — f(x_i)] \right].$$ При этом мы использовали неравенство $L \le G(x_i) \le U.$ Поскольку, как легко видеть, сумма в квадратных скобках равна $f(x_0) = f(a),$ то полученное неравенство принимает вид $Lf(a) \le I^{\prime} \le Uf(a).$ Но поскольку $I^{\prime} \to I$ при $d(\Pi) \to 0,$ то отсюда получаем $Lf(a) \le I \le Uf(a).$ Разделив это неравенство на $f(a) > 0,$ получим $L \le \frac{I}{f(a)} \le U.$ Но поскольку функция $G$ непрерывна на $[a,b]$ в силу леммы, то найдется точка $\xi \in [a,b],$ такая, что $G(\xi) = \frac{I}{f(a)}.$ Отсюда следует, что $I = f(a)G(\xi),$ а учитывая определение функции $G,$ получаем равенство $$\int^b_a f(x)g(x)dx = f(a) \int^{\xi}_a g(x)dx \quad (\xi \in [a,b]). \qquad \qquad (7.4)$$

Итак, равенство $(7.4)$ доказано нами в предположении, что функция $f$ убывает и неотрицательна. Рассмотрим теперь случай, когда $f$ убывает на $[a,b].$ Положим $\overline{f}(x) = f(x) -f(b).$ Тогда $\overline{f}$ убывает и неотрицательна. По доказанному, найдется точка $\overline{\xi},$ такая, что $$\int^b_a \overline{f}(x)g(x)dx = \overline{f}(a) \int^{\overline{\xi}}_a g(x)dx \quad (\overline{\xi} \in [a,b]).$$ Учитывая, что $\overline{f}(x) = f(x) — f(b),$ отсюда получаем $$\int^b_a [f(x) — f(b)]g(x)dx = [f(a) — f(b)] \int^{\overline{\xi}}_a g(x)dx,$$ или, тоже самое, $$\int^b_a f(x)g(x)dx = f(a) \int^{\overline{\xi}}_a g(x)dx + f(b) \int^b_a g(x)dx -$$ $$-f(b)\int^{\overline{\xi}}_a g(x)dx = f(a) \int^{\overline{\xi}}_a g(x)dx + f(b) \int^b_{\overline{\xi}} g(x)dx.$$ Этим доказано равенство $(7.3).$

В случае когда функция $f$ возрастает и неотрицательна на $[a,b],$ аналогично тому, как было доказано равенство $(7.4),$ можно показать что существует такая точка $\xi,$ что $$\int^b_a f(x)g(x)dx = f(b)\int^b_{\xi} g(x)dx. \qquad \qquad \qquad (7.5)$$ Далее, из $(7.5)$ легко можно получить $(7.3)$ точно так же, как и $(7.3)$ было получено из $(7.4).$

Замечание.

Формулы $(7.3) -(7.5)$ называются формулами Бонне. В этих равенствах точки $\xi,$ вообще говоря, разные. В самом деле, мы можем изменить функцию $f$ в точках $a$ и $b,$ сохранив при этом монотонность функции $f$. При этом левая часть $(7.3)$ не изменится, а изменение множителей $f(a)$ и $f(b)$ перед интегралами справа в $(7.3),$ очевидно, повлечет изменение значения $\xi$ справа в $(7.3).$

Вторую теорему о среднем иногда записывают в следующем виде: $$\int^b_a f(x)g(x)dx = f(a+0) \int^{\xi’}_a g(x)dx + f(b — 0) \int^b_{\xi’} g(x)dx.$$ В этом равенстве точка $\xi’,$ вообще говоря, не совпадает со значением $\xi$ в равенстве $(7.3).$

Примеры применения теорем о среднем

1.Найти $$ \lim_{n \to \infty} \int^{1}_{0} \frac{x^n}{1+x} dx.$$

Оценим $$0 \le \int^{1}_{0} \frac{x^n}{1+x}dx \le \int^{1}_{0} x^n dx = \frac{1}{n+1}.$$ Отсюда получаем $$ \lim_{n \to \infty} \int^{1}_{0} \frac{x^n}{1+x} dx = 0.$$

2.Найти $$ \lim_{n \to \infty} \int ^{\frac{\Pi}{2}}_{0} \sin^n xdx.$$

Зафиксируем $ \xi > 0.$ Тогда получим $$ \int^{\frac{\Pi}{2}}_{0} \sin^n xdx = \int^{\frac{\Pi}{2} — \frac{\xi}{2}}_{0} \sin^n xdx + \int^{\frac{\Pi}{2}}_{\frac{\Pi}{2} — \frac{\xi}{2}} \sin^n xdx \le$$ $$\le \left( \sin \left(\frac{\Pi}{2} — \frac{\xi}{2} \right) \right)^n \frac{\Pi}{2} + \frac{\xi}{2}.$$ Поскольку $ \sin \left( \frac{\Pi}{2} — \frac{\xi}{2} \right) < 1 ,$ то первое слагаемое справа стермится к нулю при $n \to \infty .$ Поэтому найдется такое $N,$ что для всех $n \ge N$ справедливо неравенство $$ \left( \sin \left( \frac{\Pi}{2} — \frac{\xi}{2} \right) \right)^n \frac{\Pi}{2} < \frac{\xi}{2}.$$ Итак, для заданного $\xi > 0$ мы нашли номер $N,$ начиная с которого $$\int^{\frac{\Pi}{2}_{0}} \sin^n xdx < \xi .$$ Это означает, что $$\lim_{n \to \infty} \int^{\frac{\Pi}{2}}_{0} \sin^n xdx = 0.$$

3. Оценить сверху $$I \equiv \int^{1}_{0} \frac{\sin x }{1 + x^2} dx.$$

Первый способ. Применяя первую теорему о среднем, получаем $$I = \frac{1}{1 + \xi^2} \int^{1}_{0} \sin x dx = \frac{1}{1 + \xi^2}(-\cos x) |^1_0 =$$ $$=\frac{1}{1 + \xi^2}(1 — \cos 1) \le 1 -\cos 1.$$

Второй способ. В силу первой теоремы о среднем имеем $$I = \sin \eta \int^1_0 \frac{dx}{1 + x^2} = \sin \eta \quad \text{arctg} x |^1_0 = \frac{\Pi}{4} \sin \eta \le \frac{\Pi}{4} \sin 1.$$

4. Оценить интеграл $$I \equiv \int^B_A \frac{\sin x}{x}dx, \quad 0 < A < B < +\infty .$$

Первый способ. Применим вторую теорему о среднем. Для этого обозначим $f(x) = \frac{1}{x}$ и $g(x) = \sin x.$ Функция $f$ монотонна на $[A,B],$ так что во второй формуле Бонне получаем $$I = \frac{1}{A} \int^{\xi}_{A} \sin xdx = \frac{1}{A} (-\cos x) \bigg|^{\xi}_{A} = \frac{1}{A}(\cos A — \cos \xi ).$$ Отсюда следует, что $|I| \le \frac{2}{A}$.

Второй способ. Применяя первую теорему о среднем, получим $$I = \sin \xi \int^B_A \frac{dx}{x} = \sin \xi ln \frac{B}{A}.$$ Отсюда следует, что $|I| \le ln \frac{B}{A}$.

5. Показать, что если $f \in R[a,b],$ где $R$ — класс интегрируемых на отрезке, $m = \displaystyle\inf_{[a,b]} f(x),$ $M = \displaystyle\sup_{[a,b]} f(x),$ то при условии непрерывности $f$ на $[a,b]$ найдется точка $\xi \in [a,b],$ такая что $\int^b_a f(x)dx = f(\xi )(b-a).$

Решение

Воспользуемся первой теоремой о среднем, тогда можем представить $$\int^b_a f(x)dx = \int^b_a f(x)g(x)dx,$$ где $g(x) =1,$ Тогда $$\int^b_a f(x)g(x)dx = f(\xi)\int^b_a 1dx = f(\xi)(b — a),$$

6. Найти среднее значение функции $y = x^2 -5x + 7$ на отрезке $[2,13].$

Решение

Воспользуемся выше упомянутой формулой и подставим в нее известные значения: $$ f(\xi) = \frac{\int^{13}_2 (x^2 — 5x + 7)dx}{13 — 2} = \frac{1}{11}\int^{13}_2 (x^2 -5x +7)dx =$$ Вычислим интеграл: $$ = \frac{1}{11} \left(\frac{x^3}{3} — 5\frac{x^2}{2} + 7x\right) \bigg|^{13}_2 = $$ Используем формулу Ньютона — Лейбница и найдем значение полученного выражения: $$ = \frac{1}{11}\left( \frac{13^3}{3} — 5\frac{13^2}{2} + 7 \cdot 13 — \left( \frac{2^3}{3} — 5\frac{2^2}{2} + 7\cdot 2 \right) \right) = $$ Упростим выражение и вычислим его результат: $$ = \frac{1}{11} \left( \frac{2197}{3} -\frac{845}{2} + 91 — \frac{8}{3} + 10 — 14 \right) = $$ $$ = \frac{1}{11} \left( \frac{2189}{3} — \frac{845}{2} + 87 \right) = \frac{1}{11} \cdot \frac{4378 — 2535 +522}{6} = \frac{2365}{66}$$ Получили среднее значение функции $y = x^2 -5x +7$ на отрезке $[2, 13]$ равным $\frac{2365}{66}$.

Смотрите также

Теоремы о среднем

Пройдите этот тест чтобы проверить свои знания по теме «теоремы о среднем».