Определение. Определенная на интервале I функция f называется выпуклой (выпуклой вниз) на I, если для любых x′,x′′∈I и любого числа λ(0<λ<1) выполняется неравенство
f(λx′+(1−λ)x′′)⩽λf(x′)+(1−λ)f(x′′).
С геометрической точки зрения смысл выпуклости состоит в том, что все точки дуги графика функции y=f(x) расположены не выше хорды, соединяющей концы этой дуги. Действительно, отрезок, соединяющий точки (x′,f(x′)) и (x′′,f(x′′)), имеет вид
l(x)=f(x′)+f(x′′)−f(x′)x′′−x′(x−x′).
При 0<λ<1 точка x=λx′+(1−λ)x′′ принадлежит интервалу с концами x′ и x′′. При этом неравенство, определяющее понятие выпуклости, принимает такой вид: f(x)⩽l(x).
Обозначим x=λx′+(1−λ)x′′. Тогда λ=x′′−xx′′−x′,1−λ=x−x′x′′−x′. Поэтому определение выпуклости можно переписать в таком виде: функция f называется выпуклой на интервале I, если для любых точек x′,x′′∈I, таких, что x′<x′′, и для любого x∈[x′,x′′]справедливо неравенство
f(x)⩽f(x′)x′′−xx′′−x′+f(x′′)x−x′x′′−x′.
Если в определении выпуклости нестрогое неравенство заменить строгим, то получим определение строгой выпуклости вниз. С геометрической точки зрения строгая выпуклость означает, что, кроме выпуклости, график функции не содержит линейных отрезков.
Пример 1. Функция f(x)=x, очевидно, выпукла вниз на всей числовой прямой.
Пример 2. Пусть f(x)=x2. Выберем произвольные x′<x′′. Тогда для 0<λ<1 имеем
(λx′+(1−λ)x′′)2=λ2x′2+2λ(1−λ)x′x′′+(1−λ)2x′′2=
=λx′2+(1−λ)x′′2+x′2(λ2−λ)+x′′2[(1−λ)2−(1−λ)]+2λ(1−λ)x′x′′=
=λx′2+(1−λ)x′′2−[λ(1−λ)x′2+λ(1−λ)x′′2−2λ(1−λ)x′x′′]=
=λx′2+(1−λ)x′′2−λ(1−λ)(x′−x′′)2<λx′2+(1−λ)x′′2
Это означает, что функция f(x)=x2 строго выпукла вниз на (−∞,+∞).
Определение. Заданная на интервале I функция f называется вогнутой (выпуклой вверх) на этом интервале, если для любых x′,x′′∈I и для любого λ(0<λ<1) справедливо неравенство
f(λx′+(1—λ)x′′)⩾λf(x′)+(1—λ)f(x′′).
Ясно, что если f выпукла вниз, то функция − f выпукла вверх. Поэтому достаточно изучить свойства лишь выпуклых вниз (т. е. выпуклых) функций.
Теорема 1. Пусть функция f выпукла на интервале I. Тогда f непрерывна на I и в каждой точке имеет конечные левую и правую производные.
Зафиксируем точку x0∈I. Из существования конечных односторонних производных f′−(x0) и f′+(x0) следует непрерывность f в точке x0.
Докажем, что существует f′+(x0). Пусть 0<h1<h2 таковы, что x0+h2∈I. Тогда, в силу выпуклости f,
f(x0+h1)⩽f(x0)h2−h1h2+f(x0+h2)h1h2,
откуда
f(x0+h1)−f(x0)h1⩽f(x0+h2)−f(x0)h2 Это неравенство означает, что функция φ(h)=f(x0+h)−f(x0)h убывает при убывании h к нулю справа. Покажем, что φ ограничена снизу. Пусть δ>0 такое, что x0−δ∈I. Тогда, в силу выпуклости f, для любого h>0 f(x0)⩽f(x0−δ)hh+δ+f(x0+h)δh+δ, откуда
f(x0)−f(x0−δ)δ⩽f(x0+h)−f(x0)h=φ(h), т. е. для любого h>0 справедливо неравенство φ(h)⩾f(x0)−f(x0−δ)δ, т. е. φ(h) ограничена снизу.
Итак, функция φ(h) при убывающем h, стремящемся к нулю справа, убывает и ограничена снизу. Следовательно, существует f′+(x0)=lim
Аналогично можно показать, что существует f’_{-} (x_0).
Замечание. Из выпуклости функции не следует ее дифференцируемость. Например, функция f(x) = |x| выпукла, но не дифференцируема в нуле. Теорема 1 утверждает, что у выпуклой функции существуют лишь односторонние производные. Анализируя доказательство теоремы 1, легко установить, что для выпуклой вниз функции f в каждой точке x_0 справедливо неравенство f’_{+} (x_0) \geqslant f’_{-} (x_0). Можно доказать, что выпуклая функция дифференцируема всюду, за исключением, быть может, не более чем счетного множества точек.
Теорема 2. Пусть функция f выпукла вниз на интервале (a, b), где −\infty < a < b < +\infty. Тогда f ограничена снизу.
Предположим противное. Тогда найдется последовательность точек x_n \in (a, b), таких, что f (x_n) <−n. Так как \{x_n\} ограниченная последовательность, то можем выделить сходящуюся подпоследовательность \{x_{n_k}\}. Пусть x_0 = \lim_{k \to \infty} x_{n_k}. Точка x_0 \in [a, b] (она не обязана принадлежать (a, b)). Тогда либо слева от x_0, либо справа от x_0 найдется бесконечно много элементов нашей подпоследовательности \{x_{n_k}\}, из которой можно выделить монотонную подпоследовательность. Обозначим ее через \{y_k\}_{k \geqslant 0}. Рассмотрим случай, когда \{y_k\} возрастает. Пусть f (y_k) = −m_k \to −\infty при k \to \infty. Обозначим z_0 = \frac{1}{2} (y_0 + x_0) \in (a, b). Тогда, начиная с некоторого номера N, будем иметь z_0 \in [y_0, y_n] при n \geqslant N.
В силу выпуклости f, для n \geqslant N получаем f(z_0) \leqslant f (y_0) \frac{y_n- z_0}{y_n- y_0} + f (y_n) \frac{z_0- y_0}{y_n- y_0}. Поскольку правая часть этого неравенства стремится к −\infty при n \to \infty, то получаем противоречие с тем, что значение f (z_0) конечно.
Замечание. Выпуклая вниз на ограниченном интервале функция не обязана быть ограниченной сверху. Например, функция f(x) = \frac{1}{x} выпукла вниз на (0, 1) и неограничена сверху на этом интервале.
Также выпуклая вниз на неограниченном интервале функция не обязана быть ограниченной снизу. Например, функция f(x) = \ln \frac{1}{x} выпукла вниз на (0, +\infty) и неограничена снизу.
Теорема 3 (критерий выпуклости дифференцируемой функции). Пусть функция f дифференцируема на интервале I. Для того чтобы f была выпуклой вниз на I, необходимо и достаточно, чтобы ее производная f’ была возрастающей на I.
Необходимость. Пусть x_1 < x < x_2 . Тогда, как было показано при доказательстве теоремы 1, выпуклость функции f равносильна такому неравенству: \frac{f(x)- f(x_1)}{x — x_1} \leqslant \frac{f(x_2)- f(x)}{x_2 -x} \quad \quad (5.5)Устремляя x \to x_1 + 0,получаем f’ (x_1) = f’_{+} (x_1) = \lim_{x \to x_1 + 0} \frac{f(x)- f(x_1)}{x- x_1} \leqslant \frac{f(x_2) — f(x_1)}{x_2- x_1}. С другой стороны, если устремим x \to x_2 − 0, то получим f’ (x_2) = f’_{-} (x_2) = \lim_{x \to x_2- 0} \frac{f (x_2)- f (x)}{x_2- x} \geqslant \frac{f (x_2) — f (x_1)}{x_2 — x_1}. Из двух последних неравенств следует, что f’ (x_1) \leqslant f’ (x_2).
Достаточность. Пусть x_1 < x < x_2. Так как выпуклость f равносильна (5.5), то достаточно показать, что справедливо неравенство (5.5).
По теореме Лагранжа, \frac{f (x)- f (x_1)}{x- x_1} = f'(\xi_1), \frac{f (x_2) — f (x)}{x_2- x} = f'(\xi_2),
где x1 < \xi_1 < x < \xi_2 < x_2, т. е. \xi_1 < \xi_2. Отсюда следует (5.5).\quad \square
Замечание. При доказательстве достаточности мы получили, что \xi_1 < \xi_2. Если производная f’ строго возрастает на I, то f’ (\xi_1) < f’ (\xi_2), откуда следует
\frac{f (x)- f (x_1)}{x- x_1} < \frac{f (x_2) — f (x)}{x_2- x}.Это означает, что функция f выпукла строго. Справедливо также и обратное, т. е. из строгой выпуклости дифференцируемой функции следует, что ее производная f’ строго возрастает. Действительно, в силу доказанной теоремы 3, из строгой выпуклости f, в силу теоремы Лагранжа, следует неравенство f’ (x_1) \leqslant f’ (\xi_1) = \frac{f (x)- f (x_1)}{x- x_1} < \frac{f (x_2) — f (x)}{x_2- x} = f’ (\xi_2) \leqslant f'(x_2), где x_1 < x < x_2 – произвольные точки из I, а точки \xi_1 \in (x_1, x), \xi_2 \in (x, x_2). Отсюда следует, что f’ (x_1) < f’ (x_2).
Теорема 4 (критерий выпуклости дважды дифференцируемой функции). Пусть функция f дважды дифференцируема на интервале I. Для того чтобы f была выпуклой вниз на I, необходимо и достаточно, чтобы было выполнено неравенство f^{\prime\prime} (x) \geqslant 0 (x \in I).
Эта теорема мгновенно вытекает из теоремы 3 и критерия монотонности дифференцируемой функции, примененного к f’ .
Замечание. Если в условии теоремы 4 производная f^{\prime\prime} > 0, то f’ строго возрастает, и поэтому, в силу замечания к теореме 3, функция f строго выпукла на I. Обратное, однако, неверно. Из строгой выпуклости f не следует, что f^{\prime\prime} > 0. Например, функция f(x) = x^4 строго выпукла на (− \infty, + \infty), однако f’ (x) = 4x^3 , f^{\prime\prime}(x) = 12x^2 и f^{\prime\prime}(0) = 0.
Пример 1. Пусть f(x) = x^\alpha (0 < x < +\infty). Тогда f’ (x) = \alpha x ^{ \alpha−1} , f^{\prime\prime}(x) = \alpha (\alpha − 1) x^{\alpha −2}. Если \alpha \in (0, 1), то f^{\prime\prime}(x) < 0 и f вогнута (выпукла вверх). Если \alpha \in (− \infty, 0) \cup (1, + \infty), то f^{\prime\prime}(x) > 0 и f выпукла вниз.
Пример 2. Для функции f(x) = \sin x имеем f’ (x) = \cos x, f^{\prime\prime}(x) =− \sin x. При x \in (2k\pi,(2k + 1)\pi) имеем f^{\prime\prime}(x) < 0, т. е. f выпукла вверх, а при x \in ((2k− 1)\pi, 2k\pi) имеем f^{\prime\prime}(x) > 0, т. е. f выпукла вниз.
Точки перегиба. Точкой перегиба называется такая точка графика функции y = f(x), которая разделяет его выпуклую и вогнутую части.
Определение. Пусть функция f определена на интервале (a, b) и точка x_0 \in (a, b). Если на (a, x_0) функция f выпукла, а на (x_0, b) – вогнута, или на (a, x_0) f вогнута, а на (x_0, b) – выпукла, то точка (x_0, f (x_0)) называется точкой перегиба функции f.
Если существует f^{\prime\prime} (x_0) и (x_0, f (x_0)) – точка перегиба, то f^{\prime\prime} (x_0) = 0. Действительно, существование f^{\prime\prime} (x_0) предполагает существование f’ (x) в некоторой окрестности точки x_0. Если при переходе через точку x_0 функция f меняет характер выпуклости, то, согласно теореме 3, при переходе через точку x_0 производная f’ (x) меняет характер монотонности. Значит, в точке x_0 производная f’ (x) имеет экстремум, откуда, в силу теоремы Ферма, f^{\prime\prime} (x_0) = 0.
Однако условие f^{\prime\prime} (x_0) = 0 не означает, что (x_0, f (x_0)) – точка перегиба функции f. Например, для функции f(x) = x^4 имеем f^{\prime\prime}(0) = 0, но в точке (0, 0) перегиба нет.
Достаточным условием перегиба для дважды дифференцируемой функции является условие сохранения знака второй производной f^{\prime\prime} слева от x_0, справа от x_0 и его изменения при переходе через точку x_0.
Теорема 5. Пусть функция f определена на интервале I и точка x_0 \in I. Пусть, далее, существует f^{\prime\prime}(x) (x \in I), f^{\prime\prime} (x_0) = 0 и f^{\prime\prime}(x) \leqslant 0 при x < x_0 и f^{\prime\prime}(x) \geqslant 0 при x > x_0. Тогда (x_0, f (x_0)) – точка перегиба, и при переходе через точку x_0 функция меняет характер выпуклости с выпуклости вверх на выпуклость вниз.
Эта теорема является следствием теоремы 3.
Примеры решения задач
Пример 1.
Найти интервалы, при которых кубическая функция y = x^3 выпукла вниз и выпукла вверх.
Пример 2.
Найти точки перегиба функции f(x) = {e^{-x}}^2.
Пример 3. Найти точки перегиба функции f(x) = x^3- 3x^2+ x.
Пример 4. Найти точки перегиба функции f(x) = \arccos(x + 2).
Пример 5. Найти точки перегиба функции y = \frac{\ln(x)}{x}.
Литература
- Коляда В.И., Кореновский А. А. Курс лекций по математическому анализу.- Одесса : Астропринт , 2009. стр.149-154;
- Кудрявцев Л. Д. Курс математического анализа : учебник для вузов: В 3 т. Т. 1. Дифференциальное и интегральное исчисления функций одной переменной / Л. Д. Кудрявцев. 5-е изд., перераб. и доп. — Москва: Дрофа, 2003. стр. 365-378
- Фихтенгольц Г. М. Курс дифференциального и интегрального исчисления: учеб. пособие для ун-тов и пед. ин-тов. Т. 1 / Г. М. Фихтенгольц. — 5-е изд., стереотип. — Москва: Физматгиз, стр. 294-303.
- З. М. Лысенко. Лекции по математическому анализу.
Выпуклые функции и точки перегиба
Этот тест проверит ваши знания касательно темы «Выпуклые функции и точки перегиба»