13.4 Производная сложной функции

Пусть $g$ — отображение открытого множества $E \subset \mathbb{R}^{n}$ в открытое множество $N \subset \mathbb{R}^{m},$ а $f: N \longmapsto \mathbb{R}^{p}.$ Тогда можно рассматривать сложную функцию $F: E \longmapsto \mathbb{R}^{p},$ $F(x) = f(g(x))$   $(x\in E).$ Ее называют композицией $F=f\circ g.$

Теорема. Пусть отображение $g$ дифференцируемо в точке $x_{0}\in E,$ а отображение $f$ дифференцируемо в соответствующей точке $y_{0}=g(x_{0})\in N.$ Тогда композиция $F=f\circ g$ дифференцируема в точке $x_{0}$ и справедливо равенство
$$F'(x_{0})=f'(y_{0})g'(x_{0}). \tag {13.1}$$

Обозначим $A=f'(y_{0}),$ $B=g'(x_{0}).$ При достаточно малой длине вектора $k$ вектор $y_{0}+k\in N$ и справедливо равенство
$$f(y_{0}+k)-f(y_{0})=A(k)+\alpha(k)|k|,$$
где
$$\lim_{k \to 0}\alpha (k)=0 \qquad (\alpha (0)=0). \tag {13.2}$$
(Заметим, что $N$ — открытое множество, и поэтому $y_{0}+k\in N$ при достаточно малых по длине векторах $k.$) Если вектор $h$ достаточно мал, то $x_{0}+h\in E.$ Положим $k\equiv k(h)=g(x_{0}+h)-g(x_{0}).$ Тогда $f(y_{0}+k)= f(g(x_{0}+h))=F(x_{0}+h)$ и получаем
$$F(x_{0}+h)-F(x_{0})=A(k(h))+\alpha (k(h))|k(h)|, \tag {13.3}$$
где
$$k(h)=B(h)+\beta (h)|h|$$
по свойству дифференцируемости отображения $g,$ и $\displaystyle\lim_{h \to 0} \beta (h)=0$. Подставив это в равенство $(13.3),$ получаем
$$F(x_{0}+h)-F(x_{0})=A(B(h))+r(h),$$
где
$$r(h)=A(\beta(h)|h|)+\alpha (k(h))|k(h)|.$$
По определению производной, нужно доказать, что $$\lim_{h \to 0}\frac{|r(h)|}{|h|}=0,$$
и тем самым теорема будет доказана.
Пусть $r_{1}(h)=A(\beta (h)|h|).$ Тогда в силу линейности отображения $А,$
$$\frac{|r_{1}(h)|}{|h|}=| A(\beta (h))| \leqslant \begin{Vmatrix}A\end{Vmatrix}\cdot| \beta (h)|.$$
Но правая часть стремится к нулю при $h\to 0$, и поэтому получаем, что
$$\lim_{h \to 0}\frac{|r_{1}(h)|}{|h|}=0.$$
Теперь положим $r_{2}(h)= \alpha (k(h))|k(h)|.$ Воспользуемся неравенством
$$|k(h)|\leqslant |B(h)|+|h|\cdot|\beta(h)|\leqslant [\begin{Vmatrix}B\end{Vmatrix}+|\beta (h)|]\cdot | h |,$$
откуда
$$\frac{|r_{2}(h)|}{|h|}\leqslant (\begin{Vmatrix}B\end{Vmatrix}+| \beta (h)|)| \alpha (k(h))|.$$
Первый множитель справа ограничен при достаточно малых $h,$ а второй множитель справа стремится к нулю при $h\to 0$ в силу $(13.2).$
Таким образом, $\frac{|r_{}(h)|}{|h|}\leqslant \frac{|r_{1}(h)|}{|h|}+\frac{|r_{2}(h) |}{|h|}$ стремится к нулю при $h\to 0,$ и теорема доказана.

Замечание. В правой части равенства $(13.1)$ мы имеем композицию линейных отображений $f{}'(y_{0})$ и $g{}'(x_{0}).$ Поэтому доказанную теорему можно сформулировать так: производная композиции равна композиции производных.

Цепное правило.
Пусть $z=f(y^{1},\ldots,y^{m})$ – действительная функция. Если положить $y^{i}=g_{i}(x)  (i=1,\ldots,m),$ то получим $z=f(g_{1}(x),\ldots,g_{m}(x)),$ и тогда, согласно правилу дифференцирования сложной функции,
$$\frac{\mathrm{dz} }{\mathrm{d} x}=\frac{\partial f}{\partial y^{1}}\frac{\mathrm{dg_{1}} }{\mathrm{d} x}+\ldots+\frac{\partial f}{\partial y^{m}}\frac{\mathrm{dg_{m}} }{\mathrm{d} x}$$
Положим теперь $y^{i}=g_{i}(x^{1},\ldots,x^{n}) (i=1,\ldots,m)$ и получим сложную функцию $z=f(g_{1}(x^{1},\ldots,x^{n}),\ldots,g_{m}(x^{1},\ldots,x^{n})).$ Если воспользоваться упомянутым только что правилом дифференцирования сложной функции, то получим
$$\frac{\partial z}{\partial x^{i}}=\frac{\partial f}{\partial y^{1}}\frac{\partial g_{1}}{\partial x^{i}}+\ldots+\frac{\partial f}{\partial y^{m}}\frac{\partial g_{m}}{\partial x^{i}} \qquad (i=1,\ldots,n).$$
Это равенство называется цепным правилом.

Цепное правило можно вывести также из только что доказанной теоремы. Действительно, положим в теореме $p = 1,$ т. е. рассмотрим случай, когда $f$ – действительная функция. Тогда $F:E \longmapsto \mathbb{R}$ – действительная функция. Из соотношения $(13.1)$ видно, что матрица производной $F'(x_{0})$ равна произведению матриц $f{}'(y_{0})$ и $g{}'(x_{0}).$ В векторной форме это можно записать так:
$$( \frac{\partial F}{\partial x^{1}}(x_{0}),\ldots,\frac{\partial F}{\partial x^{n}}(x_{0}))=$$
$$=\left ( \frac{\partial f}{\partial y^{1}}(y_{0}),\ldots,\frac{\partial f}{\partial y^{m}}(y_{0}) \right )\cdot\begin{pmatrix}
\frac{\partial g_{1}}{\partial x^{1}}(x_{0})& \ldots& \frac{\partial g_{1}}{\partial x^{n}}(x_{0}) \\
\ldots& \ldots& \ldots \\
\frac{\partial g_{m}}{\partial x^{1}}(x_{0})& \ldots& \frac{\partial g_{m}}{\partial x^{n}}(x_{0}) \\
\end{pmatrix} .$$
В частности,
$$ \frac{\partial F }{\partial x^{i}}=\frac{\partial f}{\partial y^{1}}\frac{\partial g_{1}}{\partial x^{i}}+\ldots +\frac{\partial f}{\partial y^{m}}\frac{\partial g_{m}}{\partial x^{i}} \qquad \qquad (i=1,\ldots,n),$$
и тем самым снова получаем цепное правило.

Примеры решения задач

Рассмотрим примеры задач, в которых фигурируют производные сложных функций. Читателю с целью самопроверки предлагается решить данные примеры самому, а затем сверить свое решение с приведенным.

  1. Найти производную сложной функции $u=\frac{x}{y}-\frac{y}{x},$ где $x=\sin(t),$ $y=\cos(t)$
    Решение

    $\frac{\partial u}{\partial x}=\left (\frac{x}{y}-\frac{y}{x} \right )’= \frac{1}{y}(x)’-y\left ( \frac{1}{x} \right )’=\frac{1}{y}+\frac{y}{x^{2}}$
    $\frac{\partial u}{\partial y}=\left (\frac{x}{y}-\frac{y}{x} \right )’= x\left ( \frac{1}{y} \right )’-\frac{1}{x}(y)’=-\frac{x}{y^{2}}-\frac{1}{x}$
    $\frac{\mathrm{d} x}{\mathrm{d} t}={(\sin(t))}’=\cos(t)\qquad$ $\frac{\mathrm{d} y}{\mathrm{d} t}={(\cos(t))}’=-\sin(t)$
    $\frac{\mathrm{d} u}{\mathrm{d} t}=\frac{\partial u}{\partial x}\frac{\mathrm{d} x}{\mathrm{d} t}+\frac{\partial u}{\partial y}\frac{\mathrm{d} y}{\mathrm{d} t}=\left ( \frac{1}{y}+\frac{y}{x^{2}} \right )\cos(t)+\left ( -\frac{x}{y}-\frac{1}{x} \right )(-\sin(t))$

  2. Найти полную производную сложной функции $u=x+y^{2}+z^{3},$ где $y=\sin(x),$ $z=\cos(x)$
    Решение

    $\frac{\mathrm{d} u}{\mathrm{d} x}=\frac{\partial u}{\partial x}+\frac{\partial u}{\partial y}\frac{\mathrm{d} y}{\mathrm{d} x}+\frac{\partial u}{\partial z}\frac{\mathrm{d} z}{\mathrm{d} x}=\\=1+2y\cos(x)+3z^{2}(-\sin(x))=1+2\sin(x)\cos(x)-3\cos^{2}(x)\sin(x)$

  3. Найти полный дифференциал сложной функции $u=\ln^{2}(x^{2}+y^{2}-z^{2})$
    Решение

    Вначале находим частные производные:
    $\frac{\partial u}{\partial x}=2\ln(x^{2}+y^{2}-z^{2})\frac{1}{x^{2}+y^{2}-z^{2}} 2x$
    $\frac{\partial u}{\partial y}=2\ln(x^{2}+y^{2}-z^{2})\frac{1}{x^{2}+y^{2}-z^{2}} 2y$
    $\frac{\partial u}{\partial z}=2\ln(x^{2}+y^{2}-z^{2})\frac{1}{x^{2}+y^{2}-z^{2}} (-2z)$
    Для функции $n$-переменных $y=f(x_{1},x_{2},\ldots ,x_{n})$ полный дифференциал определяется выражением : $dy=\frac{\partial y}{\partial x_{1}}dx_{1}+\frac{\partial y}{\partial x_{2}}dx_{2}+\ldots +\frac{\partial y}{\partial x_{n}}dx_{n}$. Согласно этой формуле, получаем :
    $du=4\ln(x^{2}+y^{2}-z^{2})\frac{1}{x^{2}+y^{2}-z^{2}}(xdx+ydy-zdz)$

  4. Вычислить приближенно $(1,02)^{3,01}$
    Решение

    Рассмотрим функцию $z=z^{y}.$ При $x_{0}=1$ и $y_{0}=3$ имеем $z_{0}=1^{3}=1,$
    $\Delta x=1,02-1=0,02 \qquad \Delta y=3,01-3=0,01.$
    Находим полный дифференциал функции $z=x^{y}$ в любой точке:
    $dz=yx^{y-1}\Delta x+^{y}\ln(x)\Delta y$
    Вычисляем его значения в точке $M(1,3)$ при данных приращениях $\Delta x= 0,02$ и $\Delta y= 0,01$
    $dz=3\cdot 1^{2}\cdot 0,02+1^{3}\cdot \ln(1)\cdot 0,02=0,06$
    Тогда $z=(1,02)^{3,01}\approx z_{0}+dz=$1+0,06=1,06

  5. Найти частные производные второго порядка функции $z=e^{x^{2}y^{2}}$
    Решение

    Вначале найдем частные производные первого порядка:
    $\frac{\partial z}{\partial x}=e^{x^{2}y^{2}}2xy^{2},\qquad \frac{\partial z}{\partial y}=e^{x^{2}y^{2}}2x^{2}y$
    Продифференцировав их еще раз, получим:
    $\frac{\partial^2 z}{\partial x^2}=e^{x^{2}y^{2}}4x^{2}y^{4}+e^{x^{2}y^{2}}2y^{2}$
    $\frac{\partial^2 z}{\partial y^2}=e^{x^{2}y^{2}}4x^{4}y^{2}+e^{x^{2}y^{2}}2x^{2}$
    $\frac{\partial^2 z}{\partial x \partial y}=e^{x^{2}y^{2}}4x^{3}y^{3}+e^{x^{2}y^{2}}4xy$
    $\frac{\partial^2 z}{\partial y \partial x}=e^{x^{2}y^{2}}4x^{3}y^{3}+e^{x^{2}y^{2}}4xy$
    Сравнивая последние два выражения, видим, что $\frac{\partial^2 z}{\partial x \partial y}=\frac{\partial^2 z}{\partial y \partial x}$

  6. Найти полный дифференциал второго порядка функции $z=x^{3}+y^{3}+x^{2}y^{2}$
    Решение

    Вначале находим частные производные до второго порядка:
    $\frac{\partial z}{\partial x}=3x^{2}+2xy^{2},\qquad \frac{\partial z}{\partial y}=3y^{2}+2x^{2}y$
    $\frac{\partial^2 z}{\partial x^2}=6x+2y^{2},\qquad \frac{\partial^2 z}{\partial y^2}=6y+2x^{2},\qquad \frac{\partial^2 z}{\partial x \partial y}=4xy$
    Полный дифференциал второго порядка $d^{2}z$ функции $z=f(x,y)$ выражается формулой:
    $d^{2}z=\frac{\partial^2 z}{\partial x^2}dx^{2}+2\frac{\partial^2 z}{\partial x \partial y}dxdy+\frac{\partial^2 z}{\partial y^2}dy^{2}$
    Следовательно,
    $d^{2}z=(6x+2y^{2})dx^{2}+8xydxdy+(6y+2x^{2})dy^{2}$

Литература

  1. Лысенко З.М. Конспект лекций по математическому анализу.
  2. В. И. Коляда, А. А. Кореновский «Курс лекций по математическому анализу». — Одесса: Астропринт, 2009, ч.1, раздел 13.4 «Производная сложной функции» (стр. 311 — 313).
  3. А. П. Рябушко «Сборник индивидуальных заданий по высшей математике». — Минск: «Вышэйшая школа», 1991, ч.2, разделы 10.2,10.3 «Полный дифференциал. Дифференцирование сложных и неявных функций», «Частные производные высших порядков. Касательная плоскость и нормаль к поверхности» (стр. 212 — 216).
  4. И. И. Ляшко, А.К. Боярчук, Я.Г.Гай, Г.П.Головач «Математический анализ: введение в анализ, производная, интеграл». «М.Едиториал», 2001, глава 2(4), «Производные и дифференциал высших порядков» (стр. 137).

Производная сложной функции

Пройдите этот тест, чтобы проверить свои знания по только что прочитанной теме.

М704. О квадрате, вокруг которого описан параллелограмм

Задача из журнала «Квант» (1981 год, 9 выпуск)

Условие

Вокруг квадрата описан параллелограмм (вершины квадрата лежат на разных сторонах параллелограмма). Докажите, что перпендикуляры, опущенные из вершин параллелограмма на стороны квадрата, образуют новый квадрат $(рис. 1).$

Решение

Пусть вокруг черного квадрата $(см. рис. 1)$ описан голубой параллелограмм $ABCD$ и через все его вершины проведены красные прямые, перепендикулярные сторонам квадрата. Достаточно доказать, что при повороте на $90^{\circ}$ вокруг центра $O$ черного квадрата красные прямые переходят друг в друга.

                                              $ Рис. 1.$

Пусть $H = R_{0}^{90^{\circ}}(A).$ Поскольку стороны повернутого параллелограмма перпендикулярны сторонам исходного, $(HE)\perp (AB)$ и $(HF)\perp (BC).$ Поэтому $H$ — точка пересечения высот треугольника $EBF$ и, следовательно, $H$ лежит на красной прямой, проведенной через вершину $B.$ Таким образом, красная прямая, проведенная через точку $A,$ переходит при повороте $R_{0}^{90^{\circ}}$ в красную прямую, проведенную через точку $B.$ Отсюда немедленно следует утверждение задачи.

Теорема о том, что три высоты треугольника пересекаются в одной точке (мы надеемся, известная нашим читателям), не доказывается в школьном учебнике. Поэтому мы приведем еще одно решение задачи $M704,$ хотя и не столь изящное, но тоже простое.

Это решение годится и для более общего случая, когда роль квадрата играет черный параллелограмм $(рис. 2):$ мы докажем, что красные прямые (соответственно параллельные сторонам черного параллелограмма) образуют параллелограмм, гомотетичный черному параллелограмму.

                                $ Рис. 2.$

Для доказательства достаточно проверить, что красная точка $K$ (см. рисунок 3 — фрагмент рисунка 2) лежит на диагонали параллелограмма $EG.$ Из подобия заштрихованных треугольников следует, что $\frac{x}{a} = \frac{b}{v}$ и $\frac{a}{y} = \frac{u}{b}$ (обозначения см. на рисунке 3). Перемножив эти равенства, получим $\frac{x}{y} = \frac{u}{v},$ а это и значит, что точка $K$ лежит на $EG.$

                                      $ Рис. 3.$

Полученный результат напоминает теорему Паппа, которую $Д.~ Гильберт$ и $С.~ Кон-Фоссен$ в своей замечательной (переизданной недавно по-русски) книге «Наглядная геометрия» формулируют так $(с. 126—127):$ если вершины замкнутой шестизвенной ломаной лежат попеременно на двух прямых и две пары ее противоположных звеньев параллельны, то и третья пара звеньев параллельна (на рисунке 3 — как раз такая ломаная $AKBEFGA$).

На этом возможности обобщений не исчерпаны. Если «сфотографировать» конфигурацию рисунка 3 (то есть спроектировать ее из некоторой точки $S,$ не лежащей в плоскости рисунка, на непараллельную плоскость), мы получим конфигурацию Паскаля: три пары параллельных на рисунке 3 прямых будут пересекаться на «фотографии» в трех точках одной прямой — нам удобно обозначить их $A_{1},$ $F_{1}$, $B_{1}$ $(рис. 4)$ — и наша теорема о точках $E,$ $K,$ $G$ превратиться в такую теорему: если каждая тройка точек $A,$ $B,$ $F$ и $A_{1},$ $B_{1},$ $F_{1}$ лежит на прямой, то точки $(AB_{1})\cap (A_{1}B),$ $(BF_{1})\cap (B_{1}F)$ и $(AF_{1})\cap (A_{1}F)$ также лежат на прямой.                                                $Рис. 4.$

Н.Васильев