\documentclass[a4paper,draft,oneside]{amsbook}
\usepackage{amsmath,amsthm}
\usepackage[T2A]{fontenc}
\usepackage[cp1251]{inputenc}
\usepackage[english,russian]{babel}
\usepackage{amsfonts}
\usepackage{latexsym}



\tolerance 4550

\renewcommand*{\proofname}{Доказательство}
\newcommand*{\ld}{L_2(\mathbb R^d)}
\newcommand*{\Rd}{\mathbb R^d}
\newcommand*{\RR}{\mathbb R}
\newcommand*{\lf}{L_2^{\varphi}(\mathbb R^d)}
\newcommand*{\cd}{(\cdot)}
\newcommand*{\Ds}{\Delta_\sigma}
\newcommand*{\lT}{L_2([0,2\pi])}
\newcommand*{\wa}{\widehat\alpha}
\newcommand*{\wb}{\widetilde b}
\newcommand*{\ws}{\widehat\sigma}
\newcommand*{\wxi}{\widehat\xi}
\newcommand*{\wm}{\widehat m}
\newcommand*{\wx}{\widehat x}
\newcommand*{\wz}{\widehat z}
\newcommand*{\wu}{\widehat u}
\newcommand*{\wL}{\widehat L}
\newcommand*{\wJ}{\widehat J}
\newcommand*{\wh}{\widehat h}
%\newcommand*{\co}{\rm co}
\newcommand*{\cone}{\rm cone}
\newcommand*{\wy}{\widehat y}
\newcommand*{\wl}{\widehat l}
\newcommand*{\ov}{\overline}
\newcommand*{\wt}{\widehat\tau}
\newcommand*{\wv}{\widehat\varphi}
\newcommand*{\wM}{\widehat M}
\newcommand*{\Wt}{W_2^2([0,2\pi])}
\newcommand*{\wf}{\widehat f}
%\newcommand*{\intt}{\rm int}
%\newcommand*{\cl}{\rm cl}
%\newcommand*{\spa}{\rm span}
\newcommand*{\la}{\langle}
\newcommand*{\ra}{\rangle}
\newcommand*{\LL}{\mathcal L}
\renewcommand{\labelenumi}{\theenumi.}


{\theoremstyle{remark}\newtheorem{example}{\bf Пример}[section]}

\newtheorem{lemma}{Лемма}
\newtheorem{theorem}{Теорема}
\newtheorem{corollary}{Следствие}
\newtheorem{proposition}{Предложение}

\DeclareMathOperator*{\extr}{extr}
\DeclareMathOperator*{\infp}{inf\vphantom p}
\DeclareMathOperator*{\intt}{int}
\DeclareMathOperator*{\cl}{cl}
\DeclareMathOperator*{\spa}{span}
\DeclareMathOperator*{\co}{co}
\DeclareMathOperator*{\dom}{dom}
\DeclareMathOperator*{\epi}{epi}
\DeclareMathOperator*{\IM}{Im}
\DeclareMathOperator*{\Ker}{Ker}
\DeclareMathOperator*{\const}{const}

\begin{document}


\title[Вариационное исчисление]{Вариационное исчисление и оптимальное управление}
%\section[Вариационное исчисление]{Вариационное исчисление и оптимальное управление\\ К.Ю. Осипенко}
\author{К.~Ю.~Осипенко}

\maketitle

\tableofcontents

\newpage

\section*{Предисловие}

В основе предлагаемого пособия лежат лекции, который автор читал на механико-математическом факультете МГУ. В пособии подробно излагается метод множителей Лагранжа и основные задачи оптимального управления, поэтому оно может быть полезно студентам МФТИ, изучающим курсы ``Методы оптимизации'' и ``Методы оптимального управления''. Автор существенно использовал в пособии книгу В.~М.~Алексеева, В.~М.~Тихомирова, С.~В.~Фомина \cite{ATF} и конспекты лекций Г.~Г.~Магарил-Ильяева. Своим приятным долгом автор считает выражение глубокой благодарности за ценные обсуждения и советы своим коллегам профессорам Э.~М.~Галееву, Г.~Г.~Магарил-Ильяеву и В.~М.~Тихомирову.


\section*{Введение}

Многие причины побуждают ставить и решать экстремальные задачи,
т.~е. задачи на максимум и минимум. Интерес к ним проявился уже на
заре развития математики и основными стимулами были любознательность
и стремление к совершенству.

Среди наиболее ранних, точно решенных задач
--- так называемая {\it изопериметрическая задача}
--- задача о форме кривой заданной длины, охватывающей наибольшую
площадь (ответ в ней приводил в своих сочинениях еще
Аристотель --- IV в. до н. э.) и задача о форме поверхности заданной
площади, охватывающей наибольший объем. Ответы на эти задачи для
мыслителей Древней Греции были символами совершенства человеческого
разума. Крупнейшие их представители: Евклид, Архимед и Аполлоний
ставили и решали различные геометрические задачи на экстремум.
Задача {\it о параллелограмме наибольшей площади, который можно
вписать в треугольник} приводится в ``Началах'' Евклида (III в. до
н.~э.); задача {\it о шаровом сегменте максимального объема при
заданной площади шаровой части поверхности этого сегмента}
содержится в сочинениях Архимеда (тоже III в. до н. э.); задача {\it
о минимальном расстоянии от точки плоскости до эллипса и о нормалях
к эллипсу из произвольной точки плоскости} была поставлена и решена
Аполлонием (III--II в. до н. э.) в его знаменитых ``Кониках''.

Долгое время каждая задача решалась индивидуально, по-сво\-е\-му. Первый
шаг к исследованию экстремальных задач был сделан П.~Ферма в 1638
году, который доказал (в современных терминах), что производная
функции в точке ее локального экстремума равна нулю (хотя понимание
этого явления можно извлечь и из более ранних высказываний
И.~Кеплера). Данное событие обычно считают началом становления
теории экстремума.

Затем от рассмотрения задач на максимум и минимум для функций одного переменного перешли к рассмотрению экстремальных задач, где переменные --- сами функции, т.~е. элементы бесконечномерных пространств. Эти задачи породили новое направление в математике, получившее название {\it вариационного исчисления}. Рождение вариационного исчисления часто связывают с задачей о брахистохроне, поставленной И.~Бернулли в 1696 году. Это задача о форме кривой наискорейшего ската, т.~е. о форме кривой, соединяющей две точки в вертикальной плоскости, вдоль которой тело под действием силы тяжести без трения проходит путь от одной точки до другой за кратчайшее время (постановка, по-видимому,
была навеяна более ранними размышлениями Галилея на эту тему).

Основным мотивом для развития вариационного исчисления явилось то, что многие законы природы, как выяснилось, имеют экстремальный характер, т.~е. они неким загадочным образом являются решениями задач на максимум и минимум. Л.~Эйлер по этому поводу высказался так: ``В мире не
происходит ничего, в чем не был бы виден смысл какого-нибудь
максимума или минимума''.

\chapter{Экстремальные задачи без ограничений}

\section{Экстремальные задачи, их формализация}

Задачи на экстремум изначально ставятся, как правило, на языке той области знаний, из которой они происходят. Для того, чтобы эти задачи исследовать математическими средствами, необходимо перевести их на математический язык, т.~е. {\it формализовать}. Этот процесс заключается в описании минимизируемого или максимизируемого функционала $f$ вместе со своей областью определения
$X$ и множеством ограничений $C\subset X$. Формализованная
экстремальная задача записывается так
\begin{equation}\label{P}
f(x)\to\min(\max),\quad x\in C,
\end{equation}
и заключается в нахождении таких точек $x\in C$, в которых
функционал $f$ достигает своего минимума (максимума) на $C$. Такие
точки называются {\it глобальными} или {\it абсолютными минимумами
(максимумами)} в задаче \eqref{P} или ее {\it решениями}. Если нас
интересуют и точки минимума, и точки максимума, то вместо
$\min(\max)$ пишем $\extr$ и говорим о задаче на экстремум
функционала $f$.

Отметим еще, что если $\wx$ --- решение задачи \eqref{P} на минимум
(максимум), то ясно, что $\wx$ --- решение аналогичной задачи на
максимум (минимум) с функционалом $-f$ вместо $f$.

Точки из множества ограничений $C$ называются {\it допустимыми} в
задаче \eqref{P}. Если $C=X$, то задача \eqref{P} называется задачей
{\it без ограничений}.

При решении многих конкретных задач нашей целью будет нахождение
глобальных экстремумов, но для этого предварительно приходится
исследовать задачу на наличие локальных экстремумов (т.~е. локальных
минимумов и максимумов). Если в $X$ определено понятие ``окрестности
точки'', то точка $\wx\in C$ называется {\it локальным минимумом} ({\it
максимумом}) в задаче \eqref{P}, если существует такая ее окрестность
$U$, что $f(x)\ge f(\wx)$ ($f(x)\le f(\wx)$) для всех допустимых $x\in U$ (т.~е. для всех $x\in C\cap U$).

\section{Производная отображения}

Как уже отмечалось первым шагом к исследованию экстремальных задач был результат П.~Ферма о равенстве нулю производной в точке локального экстремума функции. Для того чтобы сформулировать этот результат в достаточно общем виде, дадим определение производной отображения.

Пусть $X$ и $Y$ --- линейные нормированные пространства. Совокупность всех линейных непрерывных операторов  $\Lambda\colon X\to Y$ обозначим через $\LL(X,Y)$. Это нормированное пространство с нормой
$$\|\Lambda\|=\sup_{\|x\|_X\le1}\|\Lambda x\|_Y.$$
В случае, когда $Y=\RR$, $\LL(X,\RR)$ совпадает с множеством всех линейных непрерывных функционалов на $X$ и называется {\it сопряженным пространством} к $X$. Сопряженное пространство к $X$ обозначается $X^*$.

Одним из основных примеров рассматриваемых в дальнейшем нормированных пространств будет являться пространство $\Rd$, под которым мы будем понимать совокупность всех упорядоченных наборов $x=\begin{pmatrix}x_1\\
\vdots\\x_d\end{pmatrix}$
из $d$ действительных чисел (если $d=1$, то это просто
множество действительных чисел, и мы пишем $\RR$ вместо $\RR^1$). Элементы $x\in\Rd$ называются {\it векторами} или {\it вектор-столбцами}, а числа $x_j$, $j=1,\ldots,d$,
--- {\it координатами вектора $x$}. Для экономии места, элементы $\Rd$
будем записывать так $x=(x_1,\ldots,x_d)^{T}$, где символ $^T$ обозначает транспонирование строки в столбец (в общем случае --- транспонирование матрицы). В $\Rd$ естественным образом вводится операция (покоординатного) сложения векторов и операция (покоординатного) умножения вектора на число, превращающие это множество в вещественное линейное пространство.

Пусть $x=(x_1,\ldots,x_d)^T\in\Rd$. Величина
$$|x|=\sqrt{x_1^2+\ldots+x_d^2}$$
называется {\it длиной} или {\it модулем} вектора $x$.
Положив для $x\in\Rd$
$$\|x\|_{\Rd}=|x|$$
(такая норма называется {\it евклидовой нормой}), получим линейное нормированное пространство $\Rd$.

Пусть $a=(a_1,\ldots,a_d$) --- вектор-строка из $d$ действительных
чисел. Для каждого $x=(x_1,\ldots,x_d)^{T}\in\Rd$
положим
$$a\cdot x=\sum_{j=1}^da_jx_j.$$
Это матричное произведение вектор-строки $a$ на вектор-столбец $x$, которое иногда называют {\it внутренним произведением}. Ясно, что отображение $x\mapsto a\cdot x$ есть линейный функционал на $\Rd$. Легко понять, что и любой линейный функционал $l$ на $\Rd$ задается подобным образом с $a=(l(e_1),\ldots,l(e_d))$, где
$$e_1=(1,0,\ldots,0)^T,\ldots,e_d=(0,\ldots,0,1)^T$$
--- {\it стандартный базис} в $\Rd$. Таким образом, сопряженное пространство $(\Rd)^*$ можно отождествить с множеством, элементами которого являются наборы из $d$ действительных чисел, но расположенные в строку (с аналогичными операциями сложения и умножения на числа).


Пусть $X$ и $Y$ --- нормированные пространства, а $U$ --- открытое подмножество $X$. Отображение $F\colon U\to Y$ называется дифференцируемым в точке $\wx\in U$, если
найдется такой оператор $\Lambda\in\mathcal L(X,Y)$, что для всех $h\in X$, для которых $\wx+h\in U$ справедливо представление
\begin{equation}\label{Dif}
F(\wx+h)=F(\wx)+\Lambda h+r(h),
\end{equation}
где $r(h)=o(\|h\|_X)$ ($\|r(h)\|_Y/\|h\|_X\to0$ при $h\to0$). Линейный оператор $\Lambda$ называется производной отображения $F$ в точке $\wx$ и обозначается $F'(\wx)$. Нетрудно показать единственность оператора $\Lambda$, удовлетворяющего равенству \eqref{Dif}.

Если отображение $F$ дифференцируемо в каждой точке $U$, то определено отображение $F'\colon U\to\LL(X,Y)$, сопоставляющее $x\in U$ производную $F'(x)$. Если это отображение непрерывно в $\wx\in U$ (на $U$), то говорят, что отображение {\it $F$ непрерывно дифференцируемо\/} в $\wx$ (на $U$).

Рассмотрим некоторые примеры.

\begin{example}\label{32}
Пусть $U$ --- окрестность точки $\wx\in\Rd$. Тогда функция $f\colon U\to\RR$ дифференцируема в точке
$\wx$, если существует линейный функционал на $\Rd$,
т.~е. вектор $a=(a_1,\ldots,a_d)\in(\Rd)^*$ такой, что
для всех $h\in\Rd$, для которых $\wx+h\in U$
справедливо представление
$$f(\wx+h)=f(\wx)+a\cdot h+r(h),$$
где $|r(h)|/|h|\to0$ при $h\to0$, т.~е. $r(h)=o(|h|)$.

Отсюда легко следует (беря в качестве $h$ векторы
$(h_1,0,\ldots,0)^T$, $\ldots$, $(0,\ldots,0,h_d)^T$), что $a_j$
есть частная производная функции $f$ по переменной $x_j$ в точке $\wx$, $j=1,\ldots d$. Таким образом,
$$f'(\wx)=\left(\frac{\partial
f}{\partial x_1}(\wx),\ldots,\frac{\partial f}{\partial x_d}(\wx)\right).$$

В классическом анализе обозначают $h=(dx_1,\ldots,dx_d)^T$ и тогда
$$f'(\wx)\cdot h=\frac{\partial f}{\partial x_1}(\wx)dx_1+\ldots+\frac{\partial
f}{\partial x_d}(\wx)dx_d. $$
Это выражение называется дифференциалом $f$ и
обозначается $df(\wx)$.
\end{example}

\begin{example}\label{33}
Пусть теперь $U\subset\RR^{d_1}$ и задано отображение $F\colon U\to\RR^{d_2}$. Линейный оператор $\Lambda\in\LL(\RR^{d_1},\RR^{d_2})$ будем отождествлять с его матрицей в стандартных базисах
$$e_1=(1,0,\ldots,0)^T,\ldots,e_{d_1}=(0,\ldots,0,1)^T$$
и
$$e'_1=(1,0,\ldots,0)^T,\ldots,e'_{d_2}=(0,\ldots,0,1)^T$$
в $\RR^{d_1}$ и $\RR^{d_2}$ соответственно, т.~е. если $\Lambda e_j=\sum_{i=1}^{d_2}a_{ij}e'_i$, $j=1,\ldots,d_1$, то матрицей оператора $\Lambda$ называется матрица (мы ее обозначаем
той же буквой) $\Lambda=(a_{ij})_{1\le i\le d_2, 1\le j\le d_1}$ размера $d_2\times d_1$. В этом случае $\Lambda x$ --- произведение матрицы $\Lambda$ на вектор $x$. Из определения дифференцируемости вытекает, что отображение $F$ дифференцируемо в точке $\wx\in U$, если существует линейный оператор $\Lambda\in\LL(\RR^{d_1},\RR^{d_2})$, т.~е. матрица $\Lambda$ размера $d_2\times d_1$ такая, что для всех $h\in\RR^{d_1}$, для которых $\wx+h\in U$, справедливо представление
$$F(\wx+h)=F(\wx)+\Lambda h+r(h),$$
где $|r(h)|/|h|\to0$ при $h\to0$, т.~е. $r(h)=o(|h|)$. Матрица
$\Lambda$ называется в этом случае производной отображения $F$ в точке $\wx$ и обозначается $F'(\wx)$.

Отображение $F\colon U\to\RR^{d_2}$ можно записать в виде
$$F(x)=(f_1(x),\ldots,f_{d_2}(x))^T,$$
где $f_j\colon U\to\RR$, $j=1,\ldots,d_2$ ($f_j(x)$ --- это $j$-ая координата вектора $F(x)$ в стандартном базисе в $\RR^{d_2}$). Легко проверить, что $F$ дифференцируемо в точке $\wx$ тогда и только тогда, когда функции $f_j$, $j=1,\ldots,d_2$, дифференцируемы в $\wx$. При этом строки матрицы $F'(\wx)$ являются векторами $f'_1(\wx),\ldots,f'_{d_2}(\wx)$.
Производную $F'(\wx)$ называют {\it матрицей Якоби} отображения $F$
в точке $\wx$. Тем самым
$$F'(\wx)=\begin{pmatrix}
\dfrac{\partial f_1}{\partial x_1}(\wx)&\dfrac{\partial f_1}{\partial x_2}(\wx)&\ldots&\dfrac{\partial f_1}{\partial x_{d_1}}(\wx)\\[10pt]
\dfrac{\partial f_2}{\partial x_1}(\wx)&\dfrac{\partial f_2}{\partial x_2}(\wx)&\ldots&\dfrac{\partial f_2}{\partial x_{d_1}}(\wx)\\
\hdotsfor{4}\\
\dfrac{\partial f_{d_2}}{\partial x_1}(\wx)&\dfrac{\partial f_{d_2}}{\partial x_2}(\wx)&\ldots&\dfrac{\partial f_{d_2}}{\partial x_{d_1}}(\wx)\end{pmatrix}.$$
\end{example}


\section{Теорема о среднем}

Если $x,y\in X$, то множество $[x,y]=\{z\in X:z=(1-\lambda)x+\lambda y,\ 0\le\lambda\le1\}$ называется {\it отрезком}, соединяющий точки $x$ и $y$.

\begin{theorem}[о среднем]
Пусть $X$, $Y$ --- нормированные пространства, $U$ --- открытое множество в $X$, отображение $F\colon U\to Y$ дифференцируемо на $U$ и $[x,y]\subset U$. Тогда $$\|F(y)-F(x)\|_Y\le\sup_{z\in [x,y]}\|F'(z)\|\|y-x\|_X.$$
\end{theorem}

\begin{proof}
Если $F(y)=F(x)$, то утверждение теоремы очевидно. Пусть $F(y)\ne F(x)$. Тогда по следствию из теоремы Хана--Банаха (см. \cite[стр. 195]{KF}) найдется элемент $y^*\in Y^*$ такой, что $\|y^*\|_{Y^*}=1$ и
\begin{equation}\label{ts}
\la y^*,F(y)-F(x)\ra=\|F(y)-F(x)\|_Y.
\end{equation}
Рассмотрим функцию
$$\varphi(t)=\la y^*,F(x+t(y-x))\ra,\quad0\le t\le1.$$
В силу дифференцируемости $F$ при достаточно малых $\Delta t$ имеем
\begin{multline*}
\varphi(t+\Delta t)-\varphi(t)=\la y^*,F(x+(t+\Delta t)(y-x))-F(x+t(y-x))\ra\\
=\la y^*,F'(x+t(y-x))(y-x)\ra\Delta t+o(\Delta t).
\end{multline*}
Тем самым функция $\varphi$ дифференцируема в интервале $(0,1)$ и
$$\varphi'(t)=\la y^*,F'(x+t(y-x))(y-x)\ra.$$
Следовательно, по теореме Лагранжа существует такое $0<\theta<1$,
что $\varphi(1)-\varphi(0)=\varphi'(\theta)$, или
$$\la y^*,F(y)-F(x)\ra=\la y^*,F'(x+\theta(y-x))(y-x)\ra.$$
Отсюда, учитывая \eqref{ts},
$$\|F(y)-F(x)\|_Y\le\|F'(x+\theta(y-x))\|\|y-x\|_X\le\sup_{z\in [x,y]}\|F'(z)\|\|y-x\|_X.$$
\end{proof}

Пусть $\Lambda\in\LL(X,Y)$. Применяя теорему о среднем к отображению $G(x)=F(x)-\Lambda x$, получаем
\begin{equation}\label{TS}
\|F(y)-F(x)-\Lambda(y-x)\|_Y\le\sup_{z\in [x,y]}\|F'(z)-\Lambda\|\|y-x\|_X.
\end{equation}

\section{Теорема Ферма для гладких задач без ограничений}

В этом пункте будет доказан изначальный результат теории экстремума
--- теорема Ферма (необходимое условие экстремума для гладких задач
без ограничений).

Пусть $U$ --- открытое подмножество нормированного пространства $X$ и $f:U\to\RR$. Рассмотрим задачу
\begin{equation}\label{PP}
f(x)\to\extr,\quad x\in U.
\end{equation}

\begin{theorem}[Ферма]
Если $\wx$ --- локальный экстремум в задаче \eqref{PP} и функция $f$
дифференцируема в $\wx$, то
\begin{equation}\label{11}
f'(\wx)=0.
\end{equation}
\end{theorem}

\begin{proof} Допустим, что линейный функционал $f'(\wx)$ отличен от нуля. Тогда найдется элемент $x\in X$ такой, что $f'(\wx)\cdot x>0$.
В силу открытости $U$ существует $\delta>0$ такое, что $\wx+tx\in U$ для всех $|t|<\delta$. Дифференцируемость $f$ в $\wx$ означает, что при таких $t$
$$f(\wx+tx)=f(\wx)+t(f'(\wx)\cdot x+o(t)/t).$$
Пусть $\delta_0\le\delta$ таково, что
$$|o(t)/t|<f'(\wx)\cdot x/2.$$
Тогда $f(\wx+tx)>f(\wx)$ для всех $t\in(0,\delta_0)$ и $f(\wx+tx)<f(\wx)$ для всех $t\in(-\delta_0,0)$. Получили противоречие с тем, что $\wx$ --- локальный экстремум.
\end{proof}

\section{Вторая производная отображения}

Пусть $X$ и $Y$ --- нормированные пространства, а $U$ --- открытое подмножество $X$. Если отображение $F\colon U\to Y$ дифференцируемо в каждой точке $U$, то определено отображение $F'\colon U\to\LL(X,Y)$, сопоставляющее $x\in U$ производную $F'(x)$.

Дадим определение второй производной. Пусть отображение $F'\colon U\to\LL(X,Y)$ дифференцируемо в точке $\wx$. Тогда говорят, что $F$ дважды дифференцируема
в $\wx$ и соответствующую (вторую) производную обозначают $F''(\wx)$.
Тем самым для всех $h\in X$, для которых $\wx+h\in U$, имеет место равенство
$$F'(\wx+h)=F'(\wx)+F''(\wx)h+o(\|h\|_X).$$
Ясно, что $F''(\wx)\in\LL(X,\LL(X,Y))$.

Пространство $\LL(X,\LL(X,Y))$ изометрически изоморфно пространству
$\LL^2(X,Y)$ всех непрерывных билинейных отображений $B\colon X\times X\to Y$ с нормой $$\|B\|=\sup_{\|x_1\|_X\le1,\ \|x_2\|_X\le1}\|B[x_1,x_2]\|_Y.$$
Этот изоморфизм осуществляется сопоставлением каждому отображению $\Lambda\in\LL(X,\LL(X,Y))$ отображения $B\colon X\times X\to Y$, действующего по правилу: $B[x_1,x_2]=\Lambda x_1[x_2]$ (действие оператора $\Lambda x_1$ на элементе $x_2$). Очевидно, что $B$ --- билинейное отображение.

\begin{example}\label{51}
Найдем первую и вторую производную функции $F(h)=B[h,h]$, где $B$ --- билинейное отображение. Имеем
$$F(h+\Delta h)-F(h)=B[\Delta h,h]+B[h,\Delta h]+B[\Delta h,\Delta h].$$
Так как $\|B[\Delta h,\Delta h]\|_Y\le\|B\|\|\Delta h\|_X^2$, то
$$F'(h)\xi=B[\xi,h]+B[h,\xi].$$
Далее, получаем
$$F'(h+\Delta h)\xi-F'(h)\xi=B[\xi,\Delta h]+B[\Delta h,\xi].$$
Таким образом, при всех $h,\xi,\eta\in X$
\begin{equation}\label{hh}
F''(h)[\eta,\xi]=B[\xi,\eta]+B[\eta,\xi].
\end{equation}
\end{example}

\begin{example}
Пусть $U$ --- окрестность точки $\wx\in\Rd$ и функция $f\colon U\to\RR$ дважды дифференцируема во всех точках из $U$. Тогда, как было показано в примере \ref{32},
$$f'(x)=\left(\frac{\partial
f}{\partial x_1}(x),\ldots,\frac{\partial f}{\partial x_d}(x)\right).$$
аналогично примеру \ref{33} (здесь $f'\colon U\to(\Rd)^*$) получаем, что если функция $f'$ дифференцируема в точке $\wx$, то функции $\dfrac{\partial f}{\partial x_j}$, $j=1,\ldots,d$, дифференцируемы в точке $\wx$ и
\begin{equation}\label{Ge}
f''(\wx)=\begin{pmatrix}
\dfrac{\partial^2f}{\partial x_1^2}(\wx)&\dfrac{\partial^2f}{\partial x_1\partial x_2}(\wx)&\ldots&\dfrac{\partial^2f}{\partial x_1\partial x_d}(\wx)\\[10pt]
\dfrac{\partial^2f}{\partial x_2\partial x_1}(\wx)&\dfrac{\partial^2 f}{\partial x_2^2}(\wx)&\ldots&\dfrac{\partial^2f}{\partial x_2\partial x_d}(\wx)\\
\hdotsfor{4}\\
\dfrac{\partial^2f}{\partial x_d\partial x_1}(\wx)&\dfrac{\partial^2 f}{\partial x_d\partial x_2}(\wx)&\ldots&\dfrac{\partial^2f}{\partial x_d^2}(\wx)\end{pmatrix}.
\end{equation}
Эту матрицу называют {\it матрицей Гесса} или {\it
гессианом функции $f$ в точке $\wx$}.
\end{example}

Известно (см., например, \cite[Теорема~14.13]{IP}), что у дважды дифференцируемой функции смешанные производные совпадают
$$\dfrac{\partial^2 f}{\partial x_j\partial x_k}=\dfrac{\partial^2 f}{\partial x_k\partial x_j}.$$
Тем самым для дважды дифференцируемой функции матрица Гесса симметричная.

\section{Теорема о смешанных производных}

Мы докажем более общий результат. Пусть $X$ и $Y$ --- нормированные пространства, а $U$ --- открытое подмножество $X$.

\begin{theorem}[о смешанных производных]\label{SP}
Если отображение $F\colon U\to Y$ дважды дифференцируемо в точке $\wx\in U$, то для всех $\xi,\eta\in X$
$$F''(\wx)[\eta,\xi]=F''(\wx)[\xi,\eta].$$
\end{theorem}

\begin{proof}
Из определения второй производной для $x$ достаточно близких к $\wx$
$$F'(x)-F'(\wx)=F''(\wx)(x-\wx)+\alpha(x)\|x-\wx\|_X,$$
где $\alpha\in\LL(X,Y)$ и $\alpha(x)\to0$ при $x\to\wx$. При достаточно малых $\eta$ положим
$$\varphi(x)=F(x+\eta)-F(x).$$
Имеем
\begin{multline*}
\varphi'(x)=F'(x+\eta)-F'(\wx)-(F'(x)-F'(\wx))=\\
F''(\wx)(x+\eta-\wx)+\alpha(x+\eta)\|x+\eta-\wx\|_X-
F''(\wx)(x-\wx)-\alpha(x)\|x-\wx\|_X\\
=F''(\wx)\eta+\alpha(x+\eta)\|x+\eta-\wx\|_X-\alpha(x)\|x-\wx\|_X.
\end{multline*}
При $x=\wx$ получаем
\begin{equation}\label{FF}
\varphi'(\wx)=F''(\wx)\eta+\alpha(\wx+\eta)\|\eta\|_X.
\end{equation}
Таким образом,
$$\varphi'(x)-\varphi'(\wx)=\alpha(x+\eta)\|x+\eta-\wx\|_X
-\alpha(x)\|x-\wx\|_X-\alpha(\wx+\eta)\|\eta\|_X.$$
Для произвольного $\varepsilon>0$ найдется $\delta>0$ такое, что при $\|x-\wx\|_X<\delta$ выполняется неравенство $\|\alpha(x)\|<\varepsilon$. Поэтому, если $\|x-\wx\|_X<\delta/2$ и $\|\eta\|_X<\delta/2$, то $\|\alpha(x+\eta)\|<\varepsilon$, $\|\alpha(x)\|<\varepsilon$ и $\|\alpha(\wx+\eta)\|<\varepsilon$.
Следовательно,
\begin{multline}\label{var}
\|\varphi'(x)-\varphi'(\wx)\|\le\varepsilon(\|x-\wx\|_X+\|\eta\|_X)+
\varepsilon\|x-\wx\|_X+\varepsilon\|\eta\|_X\\
=2\varepsilon(\|x-\wx\|_X+\|\eta\|_X).
\end{multline}
Для достаточно малых $\eta$ и $\xi$ положим
$$\Delta(\eta,\xi)=F(\wx+\xi+\eta)-F(\wx+\xi)-F(\wx+\eta)+F(\wx)=\varphi(\wx+\xi)-\varphi(\wx).$$
Из \eqref{FF} имеем
$$\varphi'(\wx)\xi=F''(\wx)[\eta,\xi]+\alpha(\wx+\eta)\xi\|\eta\|_X.$$
Отсюда
\begin{multline*}
\|\Delta(\eta,\xi)-F''(\wx)[\eta,\xi]\|_Y=\|\varphi(\wx+\xi)-\varphi(\wx)
-F''(\wx)[\eta,\xi]\|_Y\\
=\|\varphi(\wx+\xi)-\varphi(\wx)
-\varphi'(\wx)\xi-\alpha(\wx+\eta)\xi\|\eta\|_X\|_Y.
\end{multline*}
Используя \eqref{TS}, получаем
\begin{multline*}
\|\Delta(\eta,\xi)-F''(\wx)[\eta,\xi]\|_Y\le\sup_{x\in[\wx,\wx+\xi]}
\|\varphi'(x)-\varphi'(\wx)\|\|\xi\|_X\\
+\|\alpha(\wx+\eta)\|\|\xi\|_X\|\eta\|_X.
\end{multline*}
Отсюда, с учетом \eqref{var}, при $\|\xi\|_X<\delta/2$ и $\|\eta\|_X<\delta/2$ получаем
\begin{multline*}
\|\Delta(\eta,\xi)-F''(\wx)[\eta,\xi]\|_Y\le
2\varepsilon(\|\xi\|_X+\|\eta\|_X)\|\xi\|_X+
\varepsilon\|\xi\|_X\|\eta\|_X\\
\le3\varepsilon(\|\xi\|_X+\|\eta\|_X)\|\xi\|_X.
\end{multline*}
Пусть теперь $\xi$ и $\eta$ --- произвольные элементы $X$. Для достаточно малого $t\in\mathbb R$ будем иметь
$$\|\Delta(t\eta,t\xi)-t^2F''(\wx)[\eta,\xi]\|_Y\le
3t^2\varepsilon(\|\xi\|_X+\|\eta\|_X)\|\xi\|_X.$$
Поскольку $\Delta(t\eta,t\xi)=\Delta(t\xi,t\eta)$, то
$$\|t^2F''(\wx)[\eta,\xi]-t^2F''(\wx)[\xi,\eta]\|_Y\le3t^2
\varepsilon(\|\xi\|_X+\|\eta\|_X)^2.$$
После сокращения на $t^2$ в силу произвольности $\varepsilon$ приходим к доказываемому равенству.
\end{proof}

\section{Формула Тейлора}

\begin{theorem}[Формула Тейлора]
Пусть $X$ и $Y$ --- нормированные пространства, $U$ --- окрестность точки $\wx\in X$. Если отображение $F\colon U\to Y$ дважды дифференцируемо в точке $\wx$, то имеет место формула Тейлора
$$F(\wx+h)=F(\wx)+F'(\wx)h+\frac12 F''(\wx)[h,h]+r(h),$$
где $r(h)=o(\|h\|_X^2)$, т.~е. $\|r(h)\|_Y/\|h\|_X^2\to0$ при $h\to 0$.
\end{theorem}

\begin{proof}
Очевидно, что $r(0)=0$. Из примера~\ref{51} следует, что $r'(0)=0$. Таким образом, из \eqref{TS} получаем
%\begin{multline*}
$$\|r(h)\|_Y=\|r(h)-r(0)-r'(0)h\|_Y\le
\sup_{h_1\in[0,h]}\|r'(h_1)-r'(0)\|\|h\|_X.$$
%\end{multline*}
Из того же примера~\ref{51} (см. \eqref{hh}) и теоремы~\ref{SP} вытекает, что $r''(0)=0$. Поэтому
$$r'(h_1)-r'(0)=r''(0)h_1+o(\|h_1\|_X)
=\alpha(h_1)\|h_1\|_X,$$
где $\alpha(h_1)\to0$ при $h_1\to0$. В силу того, что $\|h_1\|_X\le\|h\|_X$, имеем
$$\|r'(h_1)-r'(0)\|\le\beta(h)\|h\|_X,$$
где $\beta(h)\to0$ при $h\to0$. Таким образом,
$$\|r(h)\|_Y\le\beta(h)\|h\|_X^2.$$
\end{proof}

\section{Необходимые и достаточные условия экстремума второго порядка}

Пусть $U$ --- открытое подмножество нормированного пространства $X$ и $f:U\to\RR$.

\begin{theorem}[необходимые условия экстремума второго порядка в задаче без ограничений]
Если $\wx$ --- локальный минимум (максимум) в задаче \eqref{PP} и функция $f$ дважды дифференцируема в $\wx$, то $f'(\wx)=0$ и для любого $h\in X$ выполняется неравенство
$$f''(\wx)[h,h]\ge0\quad(\le0).$$
\end{theorem}

\begin{proof}
Пусть, для определенности, $\widehat x$ --- локальный минимум функции $f$. По теорема Ферма $f'(\widehat x)=0$ и тогда по формуле Тейлора для любого $h\in X$ и достаточно малых $t\in\mathbb R$ имеем
$$0\le f(\widehat x+th)-f(\widehat x)=\frac12t^2f''(\wx)[h,h]+o(t^{2}).$$
Отсюда (деля на $t^{2}$ и устремляя $t$ к нулю)
получаем требуемое неравенство. Для локального максимума рассуждения аналогичны.
\end{proof}

Если $X=\Rd$, то $f''(\wx)$ --- матрица Гесса \eqref{Ge}. Тем самым из доказанной теоремы вытекает

\begin{corollary}
Если $X=\Rd$, $\wx$ --- локальный минимум (максимум) в задаче \eqref{PP} и функция $f$ дважды дифференцируема в $\wx$, то $f'(\wx)=0$ и для любого $h\in\Rd$ выполняется неравенство
$$h^Tf''(\wx)h\ge0\quad(\le0).$$
\end{corollary}

Перейдем теперь к достаточным условиям экстремума.

\begin{theorem}[достаточные условия экстремума второго порядка в задаче без ограничений]\label{TT}
Если в задаче \eqref{PP} функция $f$ дважды дифференцируема в $\wx$, $f'(\wx)=0$ и существует $\alpha>0$ такое, что для всех $h\in X$
$$f''(\wx)[h,h]\ge\alpha\|h\|^2_X\quad(\le-\alpha\|h\|^2_X),$$
то $\wx$ --- локальный минимум $($максимум$)$.
\end{theorem}

\begin{proof}
Предположим для определенности, что
$$f''(\wx)[h,h]\ge\alpha\|h\|^2_X.$$
Тогда для достаточно малых $h$ по формуле Тейлора
\begin{multline*}
f(\wx+h)-f(\wx)=\frac12f''(\wx)[h,h]+o(\|h\|_X^2)\ge\frac12
\alpha\|h\|_X^2+o(\|h\|_X^2)\\
=\left(\frac\alpha2+o(1)\right)\|h\|_X^2.
\end{multline*}
Отсюда получаем, что $f(\wx+h)-f(\wx)\ge0$, т.~е. $\wx$
--- локальный минимум. Для локального максимума доказательство аналогично.
\end{proof}

\begin{corollary}\label{S2}
Если $X=\Rd$, функция $f$ в задаче \eqref{PP} дважды дифференцируема в $\wx$, $f'(\wx)=0$ и для всех $h\in\Rd$, $h\ne0$,
\begin{equation}\label{Sil}
h^Tf''(\wx)h>0\quad(<0),
\end{equation}
то $\wx$ --- локальный минимум $($максимум$)$.
\end{corollary}

\begin{proof}
Пусть  $h^Tf''(\widehat x)h>0$ для любого ненулевого $h\in\Rd$. Функция
$h^Tf''(\widehat x)h$ непрерывна на $\Rd$. Обозначим через $\alpha$ ее
минимальное значение на единичной сфере
$$\mathbb S^{d-1}=\{\,x\in\Rd:|x|=1\,\}.$$
Ясно, что $\alpha>0$. Учитывая, что $h/|h|$ принадлежит $\mathbb S^{d-1}$, будем иметь
$$\frac{h^T}{|h|}f''(\widehat x)\frac h{|h|}\ge\alpha.$$
Следовательно, для всех $h\in\Rd$
$$h^Tf''(\widehat x)h\ge\alpha|h|^2.$$
Теперь утверждение следствия непосредственно вытекает из теоремы~\ref{TT}.
\end{proof}

Условия \eqref{Sil} означают, что квадратичная форма с матрицей \eqref{Ge} положительно (отрицательно) определена. Согласно
критерию Сильвестра это равносильно тому, что главные миноры этой матрицы положительны (чередуют знаки, причем первый --- отрицательный).

\chapter{Вспомогательные результаты}

\section{Строгая дифференцируемость}

Пусть $X$ --- нормированное пространство, $\wx\in X$ и $r>0$. Положим $$B_X(\wx,r)=\{\,x\in X:\|x-\wx\|_X<r\,\}.$$

Отображение $F\colon U\to Y$, где $U$ --- открытое подмножество $X$, называется {\it строго дифференцируемым в точке\/} $\wx\in U$, если найдется такой оператор $\Lambda\in\LL(X,Y)$, что для любого $\varepsilon>0$ существует $\delta=\delta(\varepsilon)>0$, обладающее тем свойством, что для всех $x_1,x_2\in B_X(\wx,\delta)$ справедливо неравенство
$$\|F(x_1)-F(x_2)-\Lambda(x_1-x_2)\|_Y\le\varepsilon\|x_1-x_2\|_X.$$

Отсюда следует (полагая $x_2=\wx$), что $F$ дифференцируемо в $\wx$ и тем самым $\Lambda=F'(\wx)$.

\begin{proposition}\label{Pr1}
Пусть $X$, $Y$ --- нормированные пространства, $U$ --- открытое подмножество $X$ и отображение $F\colon U\to Y$ непрерывно дифференцируемо в точке $\wx\in U$. Тогда $F$ строго дифференцируемо в $\wx$.
\end{proposition}

\begin{proof}
Пусть $\varepsilon>0$ и $\delta=\delta(\varepsilon)>0$ такое, что
$\|F'(x)-F'(\wx)\|<\varepsilon$ для $x\in B_X(\wx,\delta)$. Если $x_j\in B_X(\wx,\delta)$, $j=1,2$, то $[x_1,x_2]\subset B_X(\wx,\delta)$ и
тогда, положив $\Lambda=F'(\wx)$, в силу \eqref{TS}, получаем
$$\|F(x_1)-F(x_2)-F'(\wx)(x_1-x_2)\|_Y\le\varepsilon\|x_1-x_2\|_X,$$
т.~е. $F$ строго дифференцируемо в $\wx$.
\end{proof}

\section{Теорема о суперпозиции}

Пусть $X,Y,Z$ --- нормированные пространства, $U$ --- окрестность точки $\wx\in X$, $V$ --- окрестность точки $\wy\in Y$, $\varphi\colon U\to V$, $\varphi(\wx)=\wy$, $\psi\colon V\to Z$, $F=\psi\circ\varphi\colon U\to Z$ --- суперпозиция отображений $\varphi$ и $\psi$.

\begin{theorem}[о суперпозиции]\label{TS1}
Если отображение $\psi$ дифференцируемо (строго дифференцируемо) в точке $\wy$, а $\varphi$ дифференцируемо (строго дифференцируемо) в точке $\wx$, то отображение $F$ дифференцируемо (строго дифференцируемо) в точке $\wx$ и
$$F'(\wx)=\psi'(\wy)\circ\varphi'(\wx).$$
\end{theorem}

\begin{proof}
Положим для краткости $L=\varphi'(\wx)$ и $M=\psi'(\wy)$. Будем предполагать сначала строгую дифференцируемость $\psi$ в точке $\wy$ и $\varphi$ в точке $\wx$. По определению строгой дифференцируемости для любого $\varepsilon_1>0$ найдутся $\delta_1>0$ и $\delta_2>0$ такие, что для всех $x_1,x_2\in B_X(\wx,\delta_1)$ и для всех $y_1,y_2\in B_Y(\wy,\delta_2)$ справедливы неравенства
\begin{align}\label{DD1}
\|\varphi(x_1)-\varphi(x_2)-L(x_1-x_2)\|_Y&\le\varepsilon_1
\|x_1-x_2\|_X,\\
\|\psi(y_1)-\psi(y_2)-M(y_1-y_2)\|_Z&\le\varepsilon_1\|y_1-y_2\|_Y.
\label{DD2}
\end{align}
Для любого $\varepsilon>0$ выберем $\varepsilon_1>0$ так, чтобы выполнялось неравенство
$$\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2<\varepsilon.$$
По так выбранному $\varepsilon_1$ найдем $\delta_1>0$ и $\delta_2>0$ так, чтобы имели место неравенства \eqref{DD1} и \eqref{DD2}. Положим
$$\delta=\min\left(\delta_1,\frac{\delta_2}{\varepsilon_1+
\|L\|}\right).$$

Если теперь $x_1,x_2\in B_X(\wx,\delta)$, то из \eqref{DD1} имеем
\begin{multline}\label{DD3}
\|\varphi(x_1)-\varphi(x_2)\|_Y\le\|\varphi(x_1)-\varphi(x_2)-
L(x_1-x_2)\|_Y\\
+\|L(x_1-x_2)\|_Y
\le\varepsilon_1\|x_1-x_2\|_X+\|L\|\|x_1-x_2\|_X\\
=(\|L\|+\varepsilon_1)\|x_1-x_2\|_X.
\end{multline}
Полагая в этом неравенстве $x_1=\wx$, а потом $x_2=\wx$, получаем
$$\|\varphi(x_j)-\wy\|_Y<(\|L\|+\varepsilon_1)\delta\le\delta_2,\quad j=1,2.$$
Таким образом, для $y_j=\varphi(x_j)$, $j=1,2$, справедливо \eqref{DD2}. Пользуясь \eqref{DD2}, \eqref{DD1} и \eqref{DD3}, имеем
\begin{multline*}
\|F(x_1)-F(x_2)-M\circ L(x_1-x_2)\|_Z\\
\le\|\psi(\varphi(x_1))-\psi(\varphi(x_2))-
M(\varphi(x_1)
-\varphi(x_2))\|_Z\\
+\|M(\varphi(x_1)
-\varphi(x_2))-M\circ L(x_1-x_2)\|_Z\le\varepsilon_1\|\varphi(x_1)
-\varphi(x_2)\|_Y\\
+\|M\|\|\varphi(x_1)
-\varphi(x_2)-L(x_1-x_2)\|_Z\le\varepsilon_1(\|L\|+
\varepsilon_1)\|x_1-x_2\|_X\\
+\|M\|\varepsilon_1\|x_1-x_2\|_X=
(\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2)\|x_1-x_2\|_X
\le\varepsilon\|x_1-x_2\|_X.
\end{multline*}

Докажем теперь утверждение теоремы для случая, когда $\psi$ дифференцируемо в точке $\wy$ и $\varphi$ дифференцируемо в точке $\wx$. По определению дифференцируемости для любого $\varepsilon_1>0$ найдутся $\delta_1>0$ и $\delta_2>0$ такие, что для всех $\Delta x\in B_X(0,\delta_1)$ и для всех $\Delta y\in B_Y(0,\delta_2)$ справедливы неравенства
\begin{align}\label{DDD1}
\|\varphi(\wx+\Delta x)-\varphi(\wx)-L\Delta x\|_Y&\le\varepsilon_1
\|\Delta x\|_X,\\
\|\psi(\wy+\Delta y)-\psi(\wy)-M\Delta y\|_Y&\le\varepsilon_1
\|\Delta y\|_Y.
\label{DDD2}
\end{align}

Для любого $\varepsilon>0$ выберем $\varepsilon_1>0$ так, чтобы выполнялось неравенство
$$\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2<\varepsilon.$$
По так выбранному $\varepsilon_1$ найдем $\delta_1>0$ и $\delta_2>0$ так, чтобы имели место неравенства \eqref{DDD1} и \eqref{DDD2}. Положим
$$\delta=\min\left(\delta_1,\frac{\delta_2}{\varepsilon_1+
\|L\|}\right).$$

Если теперь $\Delta x\in B_X(0,\delta)$, то из \eqref{DDD1} имеем
\begin{multline}\label{DDD3}
\|\varphi(\wx+\Delta x)-\varphi(\wx)\|_Y\le\|\varphi(\wx+\Delta x)-\varphi(\wx)-
L\Delta x\|_Y\\
+\|L\Delta x\|_Y
\le\varepsilon_1\|\Delta x\|_X+\|L\|\|\Delta x\|_X\\
=(\|L\|+\varepsilon_1)\|\Delta x\|_X<(\|L\|+\varepsilon_1)\delta\le\delta_2.
\end{multline}

Таким образом, для $\Delta y=\varphi(\wx+\Delta x)-\varphi(\wx)$ справедливо неравенство \eqref{DDD2}. Имеем
\begin{multline*}
\|F(\wx+\Delta x)-F(\wx)-M\circ L\Delta x\|_Z\\
\le\|\psi(\varphi(\wx+\Delta x))-\psi(\varphi(\wx))-
M(\varphi(\wx+\Delta x)
-\varphi(\wx))\|_Z\\
+\|M(\varphi(\wx+\Delta x)
-\varphi(\wx))-M\circ L\Delta x\|_Z=\|\psi(\wy+\Delta y)-\psi(\wy)-M\Delta y\|_Z\\+\|M(\varphi(\wx+\Delta x)
-\varphi(\wx))-M\circ L\Delta x\|_Z\le\varepsilon_1\|\Delta y\|_Y\\
+\|M\|\|\varphi(\wx+\Delta x)
-\varphi(\wx)-L\Delta x\|_Y\le\varepsilon_1(\|L\|+
\varepsilon_1)\|\Delta x\|_X\\
+\|M\|\varepsilon_1\|\Delta x\|_X=
(\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2)\|\Delta x\|_X
\le\varepsilon\|\Delta x\|_X.
\end{multline*}
\end{proof}

\section{Теорема о полном дифференциале. Оператор Немыцкого}

Если $X$, $Y$ --- нормированные пространства, то норму в пространстве $X\times Y$ можно, например, определить следующим образом:
$$\|(x,y)\|_{X\times Y}=\max\{\|x\|_X,\|y\|_Y\}.$$
Пусть $W$ --- окрестность точки $(\wx,\wy)\in X\times Y$ и $F\colon W\to Z$, где $Z$ --- нормированное пространство. Если отображение $x\to F(x,\wy)$ (определенное на проекции $W$ на $X$) дифференцируемо в точке $\wx$, то соответствующую производную называют {\it частной производной отображения $F$ по $x$ в точке $(\wx,\wy)$} и обозначают $F_x(\wx,\wy)$. Аналогично, частную производную
$F$ по $y$ в точке $(\wx,\wy)$ обозначают $F_y(\wx,\wy)$.

\begin{theorem}[о полном дифференциале]\label{TD}
Пусть $X$, $Y$ и $Z$ --- нормированные пространства, $W$ --- открытое подмножество $X\times Y$ и $F\colon W\to Z$. Если частные производные $F_x$ и $F_y$ непрерывны в точке $(\wx,\wy)\in W$, то $F$ --- строго дифференцируемо в $(\wx,\wy)$ и
$$F'(\wx,\wy)(\xi,\eta)=F_x(\wx,\wy)\xi+F_y(\wx,\wy)\eta,\quad
\xi\in X,\ \eta\in Y.$$
\end{theorem}

\begin{proof}
Для любого $\varepsilon>0$ найдется $\delta>0$ такое, что
$U=B_X(\wx,\delta)\times B_Y(\wy,\delta)\subset W$ и для всех $(x,y)\in U$
$$\|F_x(x,y)-F_x(\wx,\wy)\|<\varepsilon/2,\quad\|F_y(x,y)-F_y(\wx,\wy)
\|<\varepsilon/2.$$
Имеем
\begin{multline*}
\Delta=F(x_1,y_1)-F(x_2,y_2)-F_x(\wx,\wy)(x_1-x_2)-F_y(\wx,\wy)(y_1-y_2)\\
=F(x_1,y_1)-F(x_2,y_1)-F_x(\wx,\wy)(x_1-x_2)\\
+F(x_2,y_1)-F(x_2,y_2)-F_y(\wx,\wy)(y_1-y_2)
\end{multline*}
По теореме о среднем (см.~\eqref{TS}) для всех $(x_1,y_1),(x_2,y_2)\in U$
\begin{multline*}
\|\Delta\|_Z\le\sup_{a\in[x_1,x_2]}\|F_x(a,y_1)-F_x(\wx,\wy)
\|\|x_1-x_2\|_X\\
+\sup_{b\in[y_1,y_2]}\|F_y(x_2,b)-F_y(\wx,\wy)\|\|y_1-y_2\|_Y\le\frac
\varepsilon2\|x_1-x_2\|_X+\frac\varepsilon2\|y_1-y_2\|_Y\\
\le\varepsilon\max\left\{\|x_1-x_2\|_X,\|y_1-y_2\|_Y\right\}.
\end{multline*}
\end{proof}

Пусть $G$ открытое подмножество $\mathbb R\times\mathbb R^{d_1}$ и
$f\colon G\to\mathbb R^{d_2}$ --- функция переменных $t\in\mathbb R$ и $x\in\mathbb R^{d_1}$, непрерывная вместе со своей частной производной $f_x$ на $G$. Пусть существует функция $x\in C([t_0,t_1],\mathbb R^{d_1})$ такая, что $\Gamma(x)=\{\,(t,x(t)):
t\in[t_0,t_1]\,\}\subset G$. Положим
$$U=\{\,x\in C([t_0,t_1],\mathbb R^{d_1}):\Gamma(x)\subset G\,\}.$$
Нетрудно убедиться, что $U$ открыто в $C([t_0,t_1],\mathbb R^{d_1})$. Отображение $F\colon U\to C([t_0,t_1],\mathbb R^{d_2})$, определенное по правилу
$$F(x)(t)=f(t,x(t))$$
называется {\it оператором Немыцкого}.

\section{Производная оператора Немыцкого}

\begin{proposition}\label{PN}
Оператор Немыцкого $F$ непрерывно дифференцируем на $U$ и $F'(x)h(t)=f_x(t,x(t))h(t)$ для любых $x\in U$, $h\in
C([t_0,t_1],\mathbb R^{d_1})$ и $t\in [t_0,t_1]$.
\end{proposition}

\begin{proof}
Пусть $\wx\in U$. Существует $\delta_0>0$ такое,  что компакт $$K=\{\,(t,x):t\in[t_0,t_1],\ |x-\wx(t)|\le\delta_0\,\}$$
принадлежит $G$. Пусть $\varepsilon>0$. Функция $f_x$ равномерно непрерывна на $K$ и поэтому найдется $0<\delta\le\delta_0$ такое, что если $|x_1-x_2|<\delta$, то $\|f_x(t,x_1)-f_x(t,x_2)\|<\varepsilon$ для всех $(t,x_j)\in K$, $j=1,2$.

Для любого $t\in[t_0,t_1]$ отображение $g\colon B_{\mathbb
R^{d_1}}(\wx(t),\delta)\to\mathbb R^{d_2}$, $g(x)= f(t,x)- f_x(t,\wx(t))x$, дифференцируемо на $B_{\mathbb R^{d_1}}(\wx(t),\delta)$ и его производная в точке $x$ имеет вид $g'(x)=f_x(t,x)- f_x(t,\wx(t))$. Пусть $x_j\in B_{C([t_0,t_1],\mathbb R^{d_1})}(\wx,\delta)$, $j=1,2$. Тогда $x_j(t)\in B_{\mathbb R^{d_1}}(\wx(t),\delta)$, $j=1,2$, и мы имеем по теореме о среднем, примененной к отображению $g$ (учитывая, что если $x\in[x_1(t),x_2(t)]$, то
$x\in B_{\mathbb R^{d_1}}(\wx(t),\delta)$)
\begin{multline*}
|f(t,x_1(t))-f(t,x_2(t))-f_x(t,\wx(t))(x_1(t)-x_2(t))|\le
\\
\le\sup_{x\in[x_1(t),x_2(t)]}\|f_x(t,x)-f_x(t,\wx(t))\|
|x_1(t)-x_2(t)|\le\varepsilon|x_1(t)-x_2(t)|.
\end{multline*}
Поскольку это верно для любого $t\in[t_0,t_1]$, то отсюда следует, что отображение $F$ строго дифференцируемо в $\wx$ и что $F'(\wx)h(t)=f_x(t,\wx(t))h(t)$. Так как $\wx$ --- произвольная функция из $U$, то $F$ дифференцируемо на $U$.

Докажем непрерывную дифференцируемость отображения $F$ на $U$. В силу равномерной непрерывности $f_x$ на компакте $K$ для любого $\varepsilon>0$ найдется $0<\delta\le\delta_0$ такое, что если $|x_1-x_2|<\delta$, то $\|f_x(t,x_1)-f_x(t,x_2)\|<\varepsilon$ для всех $(t,x_j)\in K$, $j=1,2$. Пусть $h\in C([t_0,t_1],\mathbb R^{d_1})$ и $x\in B_{C([t_0,t_1],\mathbb R^{d_1})}(\wx,\delta)$. Тогда $x(t)\in B_{\mathbb R^{d_1}}(\wx(t),\delta)$ для любого $t\in[t_0,t_1]$. Следовательно, для любого $t\in[t_0,t_1]$
\begin{multline*}
|F'(x)h(t)-F'(\wx)h(t)|=|f_x(t,x(t))h(t)-f_x(t,\wx(t))h(t)|\\
\le\|f_x(t,x(t))-f_x(t,\wx(t))\||h(t)|\le\varepsilon|h(t)|.
\end{multline*}
Отсюда вытекает непрерывность $F'$ для любой функции $\wx\in U$.
\end{proof}

{\bf Замечание.} Предложение~\ref{PN} остается справедливым, если $U$ заменить на
$$U^1=\{\,x\in C^1([t_0,t_1],\mathbb R^{d_1}):\Gamma(x)\subset G\,\}.$$


\section{Обобщенный оператор Немыцкого}

Нам понадобится еще один оператор, который является некоторым обобщением оператора Немыцкого. Пусть $G$ --- открытое подмножество $\mathbb R\times\mathbb R^{d_1}\times\mathbb R^{d_3}$ и $f\colon G\to\mathbb R^{d_2}$ --- функция переменных $t\in\mathbb R$, $x\in\mathbb R^{d_1}$ и $u\in\mathbb R^{d_3}$, непрерывная вместе со своими частными производными $f_x$ и $f_u$ на $G$. Пусть существует пара $(x,u)\in C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$ такая, что
$$\Gamma(x,u)=\{\,(t,x(t),u(t)):t\in[t_0,t_1]\,\}\subset G.$$
Положим
$$U=\{\,(x,u)\in C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3}):\Gamma(x,u)\subset G\,\}.$$
Легко проверить, что множество $U$ открыто в $C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$. Определим отображение $F\colon U\to C([t_0,t_1],\mathbb R^{d_2})$ по правилу
$$F(x,u)(t)=f(t,x(t),u(t)),$$
которое назовем {\it обобщенным оператором Немыцкого}.

\begin{corollary}\label{CN}
Обобщенный оператор Немыцкого  $F$ непрерывно дифференцируем на $U$ и
$$F'(x,u)(h(t),\xi(t))=f_x(t,x(t),u(t))h(t)+f_u(t,x(t),u(t))\xi(t)$$
для любых $(x,u)\in U$, $(h,\xi)\in C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$ и $t\in[t_0,t_1]$.
\end{corollary}

\begin{proof}
Частная производная по $x$ отображения $F$, учитывая замечание, сделанное после доказательства предложения~\ref{PN}, равна $f_x(t,x(t),u(t))$. Ее непрерывность на  $C([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$ вытекает из равномерной непрерывности $f_x(t,x,u)$ на компакте вида
$$K_1=\{\,(t,x,u):t\in[t_0,t_1],\ |x-\wx(t)|\le\delta_0,\ |u-\wu(t)|\le\delta_0\,\}.$$
Тем самым она непрерывна и на $C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$. Частная производная по $u$ также непрерывна в силу тех же причин. Поэтому по теореме о полном дифференциале (теорема~\ref{TD}) отображение $F$ непрерывно
дифференцируемо на $U$ и справедлива соответствующая формула для производной.
\end{proof}

\section{Лемма о правом обратном и лемма о замкнутости образа}

\begin{lemma}[о правом обратном]\label{L1}
Пусть $X$ и $Y$ --- банаховы пространства, $\Lambda\in\LL(X,Y)$ и $\IM\Lambda=Y$. Тогда существуют отображение $R\colon Y\to X$ и константа $\gamma>0$ такие, что $\Lambda R(y)=y$ и $\|R(y)\|_X\le
\gamma\|y\|_Y$ для любого $y\in Y$.
\end{lemma}

\begin{proof}
По теореме Банаха об открытом отображении \cite[стр. 243]{KF} множество $\Lambda(B_X(0,1))$ открыто.
Оно, очевидно, содержит ноль и тем самым содержит некоторый шар $B_Y(0,r)$, $r>0$,
т.~е. для каждого $z\in B_Y(0,r)$ найдется элемент $x(z)\in B_X(0,1)$ такой, что
$\Lambda x(z)=z$. Положим $R(0)=0$, а если $y\ne 0$, то
$$R(y)=\frac{2\|y\|_Y}rx\left(\frac r{2\|y\|_Y}y\right).$$
Тогда $\Lambda R(y)=y$ и $\|R(y)\|_X\le
\gamma\|y\|_Y$, где $\gamma=2/r$.
\end{proof}

\begin{lemma}[о замкнутости образа]\label{LZ}
Пусть $X$ и $Y$ --- банаховы пространства, $A\in\mathcal L(X,\mathbb R^d)$, $B\in\mathcal L(X,Y)$, $C\colon X\to\mathbb R^d\times Y$, $Cx=(Ax,Bx)$ и $\IM B=Y$. Тогда $\IM C$ --- замкнутое подпространство в $\mathbb R^d\times Y$.
\end{lemma}

\begin{proof}
Пусть $(y,z)\in\cl\IM C$ и пусть $\{x_n\}$
--- последовательность в $X$ такая, что $y=\lim_{n\to\infty}Ax_n$ и
$z=\lim_{n\to\infty}Bx_n$. Положим $h_n=R(Bx_n-z)$, где $R$ --- правый обратный к $B$, тогда $B(x_n-h_n)=z$. Так как $\|h_n\|_X=\|R(Bx_n-z)\|_X\le\gamma\|Bx_n-z\|_Y$, то $h_n\to0$ при $n\to\infty$ и поэтому $\lim_{n\to\infty}A(x_n-h_n)=y$. Таким
образом, $y$ принадлежит замыканию образа множества
$$X_z=\{\,x\in X:Bx=z\,\}$$
при отображении $A$. Но $A(X_z)$ --- линейное многообразие в $\mathbb R^d$ и тем самым замкнуто. Следовательно, существует такое $\ov x\in X$, что $B\ov x=z$ и $y=A\ov x$, т.~е. $(y,z)\in\IM C$.
\end{proof}

\section{Теорема о неявной функции}

\begin{theorem}[Обобщенная теорема о неявной функции]\label{TNF}
Пусть $\Sigma$ --- топологическое пространство, $X$ и $Y$ --- банаховы пространства, $U$ --- окрестность точки $\wx\in X$, $F\colon U\times\Sigma\to Y$ и $\ws\in\Sigma$. Если
\begin{enumerate}
\item [$1)$] $F(\wx,\ws)=0$;
\item [$2)$] $F$ непрерывно в точке $(\wx,\ws)$;
\item [$3)$] $F$ дифференцируемо по $x$ в точке $(\wx,\ws)$ и для каждого $\varepsilon>0$ существуют окрестности $U(\varepsilon)\subset U$ и $V(\varepsilon)$ точек $\wx$ и $\ws$ такие, что для всех $x,x'\in U(\varepsilon)$ и $\sigma\in V(\varepsilon)$ выполняется соотношение
$$\|F(x,\sigma)-F(x',\sigma)-F_x(\wx,\ws)(x-x')\|_Y\le\varepsilon
\|x-x'\|_X;$$
\item [$4)$] $\IM F_x(\wx,\ws)=Y$,
\end{enumerate}
то найдутся окрестности $U_0\subset U$ и $V_0$ точек $\wx$ и $\ws$, отображение $\varphi\colon U_0\times V_0\to U$ и константа $K>0$ такие, что $F(\varphi(x,\sigma),\sigma)=0$ и $\|\varphi(x,\sigma)-x\|_X\le K\|F(x,\sigma)\|_Y$ для всех $(x,\sigma)\in U_0\times V_0$.
\end{theorem}

\begin{proof}
Обозначим для краткости $\Lambda=F_x(\wx,\ws)$. Так как $\IM F_x(\wx,\ws)=Y$, то по лемме о правом обратном (лемма~\ref{L1}) существует отображение $R\colon Y\to X$ и константа $\gamma>0$ такие, что $\Lambda R(y)=y$ и $\|R(y)\|_X\le\gamma\|y\|_Y$ для всех $y\in Y$.

Пусть $\varepsilon_0>0$ таково, что $\theta=\varepsilon_0\gamma<1$ и
$U(\varepsilon_0)$ и $V(\varepsilon_0)$ --- окрестности точек $\wx$ и $\ws$, соответствующие $\varepsilon_0$ (из формулировки теоремы). Пусть $\delta>0$ такое, что $B_X(\wx,\delta)\subset U(\varepsilon_0)$. Выберем окрестности $U_0$ и $V_0$ так, что $U_0\subset B_X(\wx,\delta/2)$, $V_0\subset V(\varepsilon_0)$ и при этом $\|F(x,\sigma)\|_Y<\delta(1-\theta)/2\gamma$, если $(x,\sigma)\in U_0\times V_0$.

Пусть $(x,\sigma)\in U_0\times V_0$. Рассмотрим последовательность
\begin{equation}\label{NFi}
x_n=x_{n-1}-R(F(x_{n-1},\sigma)),\quad n\in\mathbb N,\quad x_0=x.
\end{equation}
Докажем, что эта последовательность принадлежит $B_X(\wx,\delta)$ и фундаментальна. Первое доказываем по индукции. Ясно, что $x_0\in B_X(\wx,\delta)$. Пусть $x_k\in B_X(\wx,\delta)$, $1\le k\le n$. Применяя к обеим частям \eqref{NFi} оператор $\Lambda$, получим
\begin{equation}\label{NFii}
\Lambda(x_n-x_{n-1})=-F(x_{n-1},\sigma).
\end{equation}
Используя последовательно \eqref{NFi}, оценку для правого обратного, \eqref{NFii}, условие $3)$ теоремы и затем итерируя процедуру, будем иметь
\begin{multline}\label{NFiii}
\|x_{n+1}-x_n\|_X\le\gamma\|F(x_n,\sigma)\|_Y=\gamma\|F(x_n,\sigma)-
F(x_{n-1},\sigma)\\
-\Lambda(x_n-x_{n-1})\|_Y\le\theta\|x_n-x_{n-1}\|_X\le\ldots\le\theta^n
\|x_1-x\|_X.
\end{multline}
Далее, по неравенству треугольника, \eqref{NFiii}, \eqref{NFi}, условию $2)$ теоремы и согласно определению окрестностей $U_0$ и $V_0$, получаем, что
\begin{multline}\label{NF4}
\|x_{n+1}-\wx\|_X\le\|x_{n+1}-x\|_X+\|x-\wx\|_X\\
\le\|x_{n+1}-x_n\|_X+\ldots+\|x_1-x\|_X+\|x-\wx\|_X\\
\le(\theta^n+\theta^{n-1}+\ldots+1)\|x_1-x\|_X
+\|x-\wx\|_X\\
\le\frac\gamma{1-\theta}\|F(x,\sigma)\|_Y+\|x-\wx\|_X<\frac\delta2+
\frac\delta2=\delta,
\end{multline}
т.~е. $x_{n+1}\in B_X(\wx,\delta)$ и значит, вся последовательность $\{x_n\}$ принадлежит $B_X(\wx,\delta)$.

Последовательность $\{x_n\}$ фундаментальна. Действительно, используя \eqref{NFiii} и рассуждая как в предыдущем неравенстве, будем иметь для всех $n,m\in\mathbb N$
\begin{multline*}
\|x_{n+m}-x_n\|_X\le\|x_{n+m}-x_{n+m-1}\|_X+\ldots+
\|x_{n+1}-x_n\|_X\le\\
\le(\theta^{n+m-1}+\ldots+\theta^n)\|x_1-x\|_X\le\frac{\theta^n}
{1-\theta}\|x_1-x\|_X\le\frac\delta2\theta^n.
\end{multline*}

Положим $\varphi(x,\sigma)=\lim_{n\to\infty}x_n$. Из \eqref{NF4} следует, что $\varphi(x,\sigma)\in B_X(\wx,\delta)\subset U$. Из условия $3)$ теоремы следует, что для каждого $\sigma\in V_0$ отображение $F(x,\sigma)$ непрерывно на $U_0$, и тогда переходя к пределу в \eqref{NFii} при $n\to\infty$, получаем, что $F(\varphi(x,\sigma),\sigma)=0$.

В \eqref{NF4} доказано, что $$\|x_{n}-x\|_X\le\frac\gamma{1-\theta}\|F(x,\sigma)\|_Y.$$
Переходя здесь к пределу при $n\to\infty$, приходим к неравенству $\|\varphi(x,\sigma)-x\|_X\le K\|F(x,\sigma)\|_Y$, где $K=\gamma/(1-\theta)$.
\end{proof}

Рассмотрим случай, когда $\Sigma$ состоит из одного элемента (зависимость от него отмечать не будем). Тогда из теоремы~\ref{TNF}, рассматривая вместо отображения $F(x)$ отображение $F(x)-F(\wx)$, получаем

\begin{corollary}\label{TNF1}
Пусть $X$ и $Y$ --- банаховы пространства, $U$ --- окрестность точки $\wx\in X$ и $F\colon U\to Y$. Если $F$ строго дифференцируемо в точке $\wx$ и $\IM F'(\wx)=Y$, то найдется окрестность $U_0\subset U$ точки $\wx$, отображение $\varphi\colon U_0\to U$ и константа $K>0$ такие, что $F(\varphi(x))=F(\wx)$ и $\|\varphi(x)-x\|_X\le K\|F(x)-F(\wx)\|_Y$ для всех $x\in U_0$.
\end{corollary}

\section{Теорема Люстерника}

Пусть $M$ --- непустое подмножество нормированного пространства $X$. Элемент $h\in X$ называется {\it касательным вектором к $M$ в точке $\wx\in M$}, если существуют $\varepsilon>0$ и отображение $r\colon (-\varepsilon,\varepsilon)\to X$ такие, что
$\wx+th+r(t)\in M$ для всех $t\in(-\varepsilon,\varepsilon)$ и $\|r(t)\|_X/t\to0$, при $t\to0$. Множество всех касательных векторов к $M$ в точке $\wx\in M$ обозначается через $T_{\wx}M$.

\begin{theorem}[Люстерника]\label{Lyu}
Пусть $X,Y$ --- банаховы пространства, $U$ --- окрестность точки $\wx\in X$, отображение $F\colon U\to Y$ --- строго дифференцируемо в $\wx$, $\IM F'(\wx)=Y$ и $M=\{\,x\in U:F(x)=F(\wx)\,\}$. Тогда $T_{\wx}M=\Ker F'(\wx)$.
\end{theorem}

\begin{proof}
Пусть $h\in T_{\wx}M$ и $r$ из определения касательного вектора. Тогда вследствие дифференцируемости $F$ в точке $\wx$ имеем $$0=F(\wx+th+r(t))-F(\wx)=tF'(\wx)h+o(t),$$
откуда (деля на $t$ и переходя к пределу при $t\to0$) следует, что $h\in\Ker F'(\wx)$.

Обратно, пусть $h\in\Ker F'(\wx)$. Отображение $F(x)$ удовлетворяет условиям следствия~\ref{TNF1}. Следовательно, найдется такая окрестность $U_0\subset U$ точки $\wx$, отображение $\varphi\colon U_0\to U$ и константа $K>0$, такие, что $F(\varphi(x))=F(\wx)$ и $\|\varphi(x)-x\|_X\le K\|F(x)-F(\wx)\|_Y$ для всех $x\in U_0$. Пусть $\varepsilon>0$ таково, что $\wx+th\in U_0$ при $t\in(-\varepsilon,\varepsilon)$. Положим $r(t)=\varphi(\wx+th)-\wx-th$. Имеем $F(\wx+th+r(t))=F(\wx)$ и
$$\|r(t)\|_X\le K\|F(\wx+th)-F(\wx)\|_Y=K\|tF'(\wx)h+o(t)\|_Y=K\|o(t)\|_Y,$$
т.~е. $h$ --- касательный вектор.
\end{proof}

\section{Теоремы отделимости}

Пусть $A$ и $B$ --- непустые подмножества нормированного пространства $X$. Говорят, что ненулевой функционал $x^*\in X^*$ {\it отделяет множества $A$ и $B$}, если
$$\sup_{x\in A}\la x^*,x\ra\le\inf_{x\in B}\la x^*,x\ra.$$
Если неравенство строгое, то говорят, что $x^*$ {\it строго отделяет $A$ и $B$}.

Пусть число $\gamma\in\mathbb R$ таково, что
$$\sup_{x\in A}\la x^*,x\ra\le\gamma\le\inf_{x\in B}\la x^*,x\ra.$$ Тогда, геометрически, отделимость множеств $A$ и $B$ означает, что они расположены по разные стороны от гиперплоскости
$$\{\,x\in X:\la x^*,x\ra=\gamma\,\}.$$

Напомним формулировку первой теоремы отделимости (см. \cite[стр. 243]{KF}).

\begin{theorem}[Первая теорема отделимости]\label{FTO}
Пусть $A$ и $B$ --- непустые выпуклые подмножества нормированного пространства $X$, причем $\intt A\ne\emptyset$ и $B\cap\intt A=\emptyset$. Тогда множества $A$ и $B$ отделимы.
\end{theorem}

Отсюда следует
\begin{theorem}[Вторая теорема отделимости]
Пусть $A$ --- непустое замкнутое выпуклое подмножество нормированного пространства $X$ и $\wx\notin A$. Тогда множества $A$ и $\wx$ строго отделимы.
\end{theorem}

\begin{proof}
Так как $A$ замкнуто, то дополнение к $A$ открыто и поэтому существует такое $r>0$, что открытый шар $B_X(\wx,r)$ не пересекается с $A$. Тогда по первой теореме отделимости существует ненулевой функционал $x^*\in X^*$ такой, что
$$\sup_{x\in A}\la x^*,x\ra\le\inf_{x\in B_X(\wx,r)}\la x^*,x\ra.$$
Но
$$\inf_{x\in B_X(\wx,r)}\la x^*,x\ra<\la x^*,\wx\ra,$$
так как ненулевой линейный непрерывный функционал не может достигать точной нижней грани во внутренней точке. Следовательно, множества $A$ и $\wx$ строго отделимы.
\end{proof}

\section{Леммы об аннуляторах}

Пусть $L$ --- подпространство нормированного пространства $X$. Множество
$$L^\perp=\{\,x^*\in X^*:\la x^*,x\ra=0,\ \forall\,x\in L\,\}$$
называется {\it аннулятором $L$}. Легко видеть, что $L^\perp$ --- замкнутое
подпространство в $X^*$.
\begin{lemma}[о нетривиальности аннулятора]\label{NA}
Пусть $L$ --- замкнутое подпространство нормированного пространства $X$, не совпадающее с $X$. Тогда $L^\perp$ содержит ненулевой элемент.
\end{lemma}
\begin{proof}
Так как $L\ne X$, то существует $\wx\notin L$. Множество $L$, очевидно, выпукло и по условию замкнуто, поэтому по второй теореме отделимости найдется ненулевой функционал $x^*\in X^*$ такой, что
\begin{equation}\label{otd}
\sup_{x\in L}\la x^*,x\ra<\la x^*,\wx\ra.
\end{equation}
Тогда $x^*\in L^\perp$. Действительно, если $\la x^*,x_0\ra\ne0$ для некоторого $x_0\in L$, то так как $\alpha x_0\in L$ для любого $\alpha\in\mathbb R$, мы имеем
$$\sup_{x\in L}\la x^*,x\ra\ge\sup_{\alpha\in \mathbb R}\la x^*,\alpha
x_0\ra=\sup_{\alpha\in \mathbb R}\alpha\la x^*, x_0\ra=+\infty,$$
что противоречит \eqref{otd}.
\end{proof}

\begin{lemma}[об аннуляторе ядра]\label{AK}
Пусть $X$ и $Y$ --- банаховы пространства, $A\in\LL(X,Y)$ и $\IM A=Y$.
Тогда  $(\Ker A)^\perp=\IM A^*$.
\end{lemma}
\begin{proof}
Пусть $x^*\in\IM A^*$. Тогда $x^*=A^*y*$, где $y*\in Y^*$. Для любого $x\in\Ker A$ имеем
$$\la x^*,x\ra=\la A^*y^*,x\ra=\la y^*,Ax\ra=0.$$
Тем самым $x^*\in(\Ker A)^\perp$.

Пусть $x^*\in(\Ker A)^\perp$. Образ оператора $M\colon X\to\mathbb R\times Y$,
$$Mx=(\la x^*,x\ra,Ax),$$
замкнут по лемме о замкнутости образа (лемма~\ref{LZ}) и не совпадает
с $\mathbb R\times Y$, так как $(1,0)\notin\IM M$. Следовательно, по лемме о нетривиальности аннулятора (лемма~\ref{NA}) существует ненулевой функционал $(\alpha,y^*)\in \mathbb R\times Y^*$ такой, что
$$\alpha\la x^*,x\ra+\la y^*,Ax\ra=0$$
для всех $x\in X$. При этом $\alpha\ne0$, ибо в противном случае
функционал $y^*$ был бы нулевым в силу того, что $\IM A=Y$. Таким образом,
$$\la x^*+\alpha^{-1}A^*y^*,x\ra=0$$
для всех $x\in X$. Следовательно,
$$x^*=A^*(-\alpha^{-1}y^*)\in\IM A^*.$$
\end{proof}

\chapter{Экстремальные задачи с ограничениями}

\section[Правило множителей Лагранжа]{Правило множителей Лагранжа для гладких задач с ограничениями типа равенств}

Пусть $U$ --- открытое подмножество банахова пространства $X$, $f:U\to\RR$ и $F\colon U\to Y$, где $Y$ --- банахово пространство. Задачу
\begin{equation}\label{TR}
f(x)\to\extr,\quad F(x)=0,
\end{equation}
называют {\it задачей с ограничениями типа равенств}. Если функция $f$ и отображение $F$ обладают некоторой гладкостью, то говорят о {\it гладкой задаче с ограничениями типа равенств}.

Сопоставим задаче \eqref{TR} {\it функцию Лагранжа}
$$\LL(x,\lambda_0,y^*)=\lambda_0f(x)+\la y^*,F(x)\ra,$$
где $\lambda_0\in\mathbb R$ и $y^*\in Y^*$ называются {\it множителями Лагранжа}.

\begin{theorem}[Правило множителей Лагранжа]\label{PML}
Если $\wx\in U$ --- локальный экстремум в задаче \eqref{TR}, функция $f$ --- дифференцируема в $\wx$, отображение $F$ --- строго дифференцируемо в $\wx$ и $\IM F'(\wx)$ --- замкнутое подпространство в $Y$, то найдутся, не равные одновременно нулю, множители Лагранжа $\lambda_0$ и $y^*$ такие, что
\begin{equation}\label{PL}
\LL_x(\wx,\lambda_0,y^*)=0\quad\Leftrightarrow\quad\lambda_0f'(\wx)
+(F'(\wx))^*y^*=0.
\end{equation}

Если $\IM F'(\wx)=Y$, то $\lambda_0\ne0$.
\end{theorem}

\begin{proof}
Рассмотрим сначала случай, когда $\IM F'(\wx)=Y$. Пусть $h\in\Ker F'(\wx)$. Отображение $F$ удовлетворяет условиям теоремы Люстерника (теорема~\ref{Lyu}) и поэтому $h\in T_{\wx}M$, т.~е. существуют $\varepsilon>0$ и отображение $r\colon(-\varepsilon,\varepsilon)\to X$ такие, что $F(\wx+th+r(t))=0$ для $t\in(-\varepsilon,\varepsilon)$ и $r(t)=o(t)$ при $t\to0$. Таким образом, элементы
$\wx+th+r(t)$, $t\in(-\varepsilon,\varepsilon)$, допустимы в \eqref{TR} и так как $\wx$ --- локальный экстремум в этой задаче, то $$f(\wx+th+r(t))-f(\wx)=t\la f'(\wx),h\ra+o(t)$$
сохраняет знак для достаточно малых $t$. Деля последнее соотношение на
$t>0$ и устремляя $t$ к нулю, получаем, что $\la f'(\wx),h\ra$ сохраняет знак. Но $h$ --- произвольный элемент из $\Ker F'(\wx)$ и поэтому $\la f'(\wx),h\ra=0$ для любого $h\in\Ker F'(\wx)$, т.~е. $f'(\wx)\in(\Ker F'(\wx))^\perp$. Согласно лемме об аннуляторе ядра (лемма~\ref{AK}) $f'(\wx)\in\IM(F'(\wx))^*$ и, следовательно, существует функционал $y^*\in Y^*$ такой, что $f'(\wx)=-(F'(\wx))^*y^*$, или $f'(\wx)+(F'(\wx))^*y^*=0$. Тем самым равенство \eqref{PL} с $\lambda_0=1$ доказано.

Пусть теперь $\IM F'(\wx)\ne Y$. Так как по условию подпространство $\IM F'(\wx)$ замкнуто, то по лемме о нетривиальности аннулятора (лемма~\ref{NA}) существует ненулевой функционал $y^*\in Y^*$ такой, что $\la y^*,F'(\wx)x\ra=0$ для любого $x\in X$, т.~е. $(F'(\wx))^*y^*=0$. Это доказывает утверждение теоремы в рассматриваемом случае с $\lambda_0=0$.
\end{proof}

Рассмотрим частный случай задачи \eqref{TR}, когда $X=\mathbb R^{d_1}$, $Y=\mathbb R^{d_2}$, а отображение $F$ задается функциями $f_j\colon \mathbb R^{d_1}\to\mathbb R$, $j=1,\ldots,d_2$, т.~е. $F(x)=(f_1(x),\ldots,f_{d_2}(x))^T$, $x\in \mathbb R^{d_1}$. Таким
образом, рассматривается задача
\begin{equation}\label{TRK}
f_0(x)\to\extr,\quad f_j(x)=0,\quad j=1,\ldots,d_2.
\end{equation}
В силу того, что линейные функционалы на $\mathbb R^{d_2}$ являются вектор-строками $(\lambda_1,\ldots,\lambda_{d_2})$, функция Лагранжа задачи \eqref{TRK} записывается в виде
$$\LL(x,\ov\lambda)=\sum_{j=0}^{d_2}\lambda_jf_j(x),$$
где $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_{d_2})$.

Классическим правилом множителей Лагранжа для гладких
конечномерных задач является следующее утверждение.

\begin{theorem}[Правило множителей Лагранжа в конечномерном случае]
Если $\wx$ --- локальный экстремум в задаче \eqref{TRK}, функция $f_0$ дифференцируема в $\wx$, а функции $f_j$, $j=1,\ldots,d_2$, строго дифференцируемы в $\wx$, то найдутся, не равные одновременно
нулю, множители Лагранжа $\lambda_0,\lambda_1,\ldots,\lambda_{d_2}$ такие, что
$$\LL_x(\wx,\ov\lambda)=0\quad\Leftrightarrow\quad\sum_{j=0}^{d_2}
\lambda_jf'_j(\wx)=0.$$

Если векторы $f'_1(\wx),\ldots,f'_{d_2}(\wx)$ линейно независимы, то $\lambda_0\ne0$.
\end{theorem}

Доказательство сразу следует из предыдущей теоремы, если учесть, что подпространство
$\IM F'(\wx)$ конечномерно и поэтому замкнуто, а линейная независимость векторов $f'_1(\wx),\ldots,f'_{d_2}(\wx)$ эквивалентна условию $\IM F'(\wx)=Y$.

Приведем пример, показывающий, что с $\lambda_0\ne0$ правило множителей Лагранжа может не выполняться. Рассмотрим задачу
$$x_1\to\min,\quad x_1^3-x_2^2=0.$$
Здесь $d_1=2$, $d_2=1$, $f_0(x)=x_1$, $f_1(x)=x_1^3-x_2^2$,
$$\LL(x,\lambda_0,\lambda_1)=\lambda_0x_1+\lambda_1(x_1^3-x_2^2).$$
Нетрудно убедиться, что точка $\wx=(0,0)$ является точкой минимума в рассматриваемой задаче. В силу того, что
$$\LL_x(0,\lambda_0,\lambda_1)=(\lambda_0,0)=0,$$
$\lambda_0$ не может быть отличным от нуля.

\section[Условия экстремума второго порядка]{Условия экстремума второго порядка для гладких задач с ограничениями типа равенств}

\begin{theorem}[Необходимые условия экстремума второго порядка]
Если $\wx$ --- локальный минимум $($максимум$)$ в задаче \eqref{TR},
функция $f$ и отображение $F$ дважды дифференцируемы в $\wx$ и $\IM F'(\wx)=Y$, то найдется множитель Лагранжа $y^*\in Y^*$ такой, что
\begin{equation}\label{eq1}
\LL_{x}(\wx,1,y^*)=0\quad\Leftrightarrow\quad f'(\wx)+(F'(\wx))^*y^*=0
\end{equation}
и для всех $h\in\Ker F'(\wx)$
\begin{multline}\label{eq2}
\LL_{xx}(\wx,1,y^*)[h,h]\ge0\ (\le0)\\
\Leftrightarrow\quad f''(\wx)[h,h]+\la y^*,F''(\wx)[h,h]\ra\ge0\ (\le0).
\end{multline}
\end{theorem}

\begin{proof}
Из дважды дифференцируемости отображения $F$ в точке $\wx$ следует непрерывность $F'$ в точке $\wx$. В силу предложения~\ref{Pr1} отображение $F$ является строго дифференцируемым. Поэтому соотношение \eqref{eq1} сразу следует из \eqref{PL}.

Докажем \eqref{eq2}. Пусть $h\in\Ker F'(\wx)$. Отображение $F$ удовлетворяет условиям теоремы Люстерника (теорема~\ref{Lyu}) и поэтому $h\in T_{\wx}M$, т.~е. существуют $\varepsilon>0$ и отображение $r\colon(-\varepsilon,\varepsilon)\to X$ такие, что $F(\wx+th+r(t))=0$ для $t\in(-\varepsilon,\varepsilon)$ и $r(t)=o(t)$ при $t\to0$. Если  $\wx$ --- локальный минимум, то $f(\wx+th+r(t))\ge f(\wx)$ для достаточно малых $t$. Теперь по формуле Тейлора имеем (учитывая \eqref{eq1}
\begin{multline*}
0\le f(\wx+th+r(t))-f(\wx)=\mathcal L(\wx+th+r(t),1,y^*)-\mathcal L(\wx,1,y^*)\\
=\frac12\mathcal L_{xx}(\wx,1,y^*)[th+r(t),th+r(t)]+o(t^2)\\
=\frac{t^2}2\mathcal L_{xx}(\wx,1,y^*)[h,h]+o(t^2),
\end{multline*}
откуда следует \eqref{eq2}.
\end{proof}


\begin{theorem}[Достаточные условия экстремума второго порядка в задаче с ограничениями типа равенств]
Пусть в задаче \eqref{TR} функция $f$ и отображение $F$ дважды дифференцируемы в допустимой точке $\wx$ и $\IM F'(\wx)$ --- замкнутое подпространство в $Y$. Тогда если найдутся множитель Лагранжа $y^*\in Y^*$ и число $\alpha>0$ такие, что
\begin{equation}\label{eq4}
\LL_x(\wx,1,y^*)=0
\end{equation}
и при всех $h\in\Ker F'(\wx)$
\begin{equation}\label{eq5}
\LL_{xx}(\wx,1,y^*)[h,h]\ge\alpha \|h\|^2_X\quad(\le-\alpha \|h\|^2_X),
\end{equation}
то $\wx$ --- локальный минимум $($максимум$)$ в задаче \eqref{TR}.
\end{theorem}

\begin{proof}
Рассмотрим отображение $G\colon X\to\IM F'(\wx)$, определенное по формуле $G(x)=F'(\wx)x$. Для него, очевидно, выполнены условия следствия~\ref{TNF1}, согласно которому существуют окрестность $U_0$ точки ноль, отображение $\varphi\colon U_0\to X$ и константа $K>0$ такие, что
\begin{equation}\label{eqi}
F'(\wx)(\varphi(x))=0
\end{equation}
и
\begin{equation}\label{eqii}
\|\varphi(x)-x\|_X\le K\|F'(\wx)x\|_Y
\end{equation}
для всех $x\in U_0$.

Можно считать, что в любой окрестности $\wx$ есть допустимые в \eqref{TR} точки (т.к. изолированная точка автоматически является и локальным минимумом, и локальным максимумом). Пусть $x\in U_0$ и $\wx+x$ --- допустимый элемент в задаче \eqref{TR}. Тогда по формуле Тейлора
$$0=F(\wx+x)=F'(\wx)x+\frac12 F''(\wx)[x,x]+o(\|x\|_X^2).$$
отсюда следует, что для достаточно малых $x$ справедливо неравенство
$$\|F'(\wx)x\|_Y\le\left(\frac12\|F''(\wx)\|+1\right)\|x\|_X^2,$$
а тогда из \eqref{eqii} получаем, что
$$\|\varphi(x)-x\|_X\le\gamma\|x\|_X^2,$$
где $\gamma=K(\|F''(\wx)\|/2+1)$. Следовательно,
$$\|\varphi(x)\|_X\le\|x\|_X+\gamma\|x\|_X^2=(1+\gamma\|x\|_X)\|x\|_X.$$ Считая, что
$\|x\|_X<1/\gamma$, имеем также оценку
$$\|\varphi(x)\|_X\ge
\|x\|_X-\|\varphi(x)-x\|_X\ge(1-\gamma\|x\|_X)\|x\|_X.$$


Обозначая, для краткости, $L(x)=\mathcal L(x,1,y^*)$, снова по формуле Тейлора
получаем (учитывая \eqref{eq4} и то, что $\wx+x$ --- допустимая точка)
$$f(\wx+x)=f(\wx)+\frac12 L''(\wx)[x,x]+o(\|x\|^2_X).$$
Отсюда, полагая $B=\|L''(\wx)\|$, учитывая, что $\varphi(x)\in\Ker F'(\wx)$ согласно \eqref{eqi}, полученные выше оценки, и считая, что выполнено первое из неравенств \eqref{eq5}, будем иметь
\begin{multline*}
f(\wx+x)-f(\wx)=\frac12 L''(\wx)[\varphi(x)-\varphi(x)+x,\varphi(x)-\varphi(x)+x]+
o(\|x\|_X^2)\\=
\frac12(L''(\wx)[\varphi(x),\varphi(x)]-2L''(\wx)[\varphi(x)-x,
\varphi(x)]\\+
L''(\wx)[\varphi(x)-x,\varphi(x)-x])+o(\|x\|_X^2)\ge\frac12
(\alpha\|\varphi(x)\|_X^2\\
-2B\|\varphi(x)\|_X\|\varphi(x)-x\|_X-B\|\varphi(x)-x\|_X^2)+o(\|x\|_X^2)
\\
\ge\frac12\|x\|_X^2(\alpha(1-\gamma\|x\|_X)^2-2B\gamma\|x\|_X(1+\gamma\|x\|_X)\\-
B\gamma^2\|x\|_X^2)+o(\|x\|_X^2).
\end{multline*}
Нетрудно убедиться, что выражение справа неотрицательно для
достаточно малых $x$ и поэтому $\wx$ --- локальный минимум. Случай, когда выполнено второе из неравенств \eqref{eq5} исследуется аналогично.
\end{proof}

\section{Гладкие задачи с ограничениями типа равенств и неравенств}

Пусть $U$ --- открытое подмножество банахова пространства $X$, $f_j:U\to\RR$, $j=0,1,\ldots,m$ и $F\colon U\to Y$, где $Y$ --- банахово пространство. Задачу
\begin{equation}\label{TR1}
f_0(x)\to\min,\quad f_j(x)\le0,\quad 1\le j\le m,\quad F(x)=0,
\end{equation}
называют {\it задачей с ограничениями типа равенств и неравенств}. Если функции $f_j$, $j=0,1,\ldots,m$, и отображение $F$ обладают некоторой гладкостью, то говорят
о {\it гладкой задаче с ограничениями типа равенств и неравенств}.

Сопоставим задаче \eqref{TR1} {\it функцию Лагранжа}
$$\LL(x,\ov\lambda,y^*)=\sum_{j=0}^m\lambda_jf_j(x)+\la y^*,F(x)\ra,$$
где $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)\in(\mathbb R^{m+1})^*$ и
$y^*\in Y^*$. Числа $\lambda_j$, $j=0,1,\ldots,m$, и функционал $y^*$ называются
{\it множителями Лагранжа}.

\begin{theorem}[Правило множителей Лагранжа в задаче с ограничениями типа равенств и неравенств]\label{T14}
Если $\wx$ --- локальный минимум в задаче \eqref{TR1}, функции $f_j$, $j=0,1,\ldots,m$, дифференцируемы в $\wx$, отображение $F$ строго дифференцируемо в $\wx$ и $\IM F'(\wx)$ --- замкнутое подпространство в $Y$, то найдутся такие множители Лагранжа $\lambda_0,\lambda_1,\ldots,\lambda_m$ и $y^*$, не равные нулю одновременно, для которых выполнены условия
\begin{itemize}
\item[$(a)$] $\LL_x(\wx,\ov\lambda,y^*)=0\Leftrightarrow
\sum_{j=0}^m\lambda_jf'_j(\wx)+(F'(\wx))^*y^*=0$ $($условие стационарности$)$;
\item[$(b)$] $\lambda_j\ge0$, $j=0,1,\ldots,m$ $($условие неотрицательности$)$;
\item[$(c)$] $\lambda_jf_j(\wx)=0$, $j=1,\ldots,m$ $($условие
дополняющей не\-жест\-кос\-ти$)$.
\end{itemize}
Если $\IM F'(\wx)=Y$ и существует вектор $h\in\Ker F'(\wx)$ такой, что
$\la f'_j(\wx),h\ra<0$ для всех $j\in J_0=\{j:f_j(\wx)=0,\ 1\le j\le m\}$, то $\lambda_0\ne0$.
\end{theorem}

\begin{proof}
Заметим сначала, что утверждение $(c)$ можно считать выполненным всегда. В самом деле, отбросим те ограничения среди неравенств, для которых $f_j(\wx)<0$. Тогда $\wx$ будет локальным экстремумом и в новой задаче. Если для этой задачи доказаны утверждения $(a)$ и $(b)$, то $(c)$  выполняется автоматически. Дополнив найденный набор множителей Лагранжа нулевыми компонентами, соответствующими тем номерам, где $f_j(\wx)<0$, получим утверждения $(a)$, $(b)$ и $(c)$ для исходной задачи.

Как и в доказательстве правила множителей Лагранжа для задачи с ограничениями типа равенств рассмотрим отдельно два случая.

$A)$ Вырожденный случай: $\IM F'(\wx)\ne Y$. Здесь, фактически, повторяется доказательство правила множителей Лагранжа для вырожденного случая в гладкой задаче с равенствами. В силу того, что подпространство $\IM F'(\wx)$ замкнуто, по лемме о нетривиальности аннулятора (лемма~\ref{NA}) существует ненулевой функционал $y^*\in Y^*$ такой, что $\la y^*,F'(\wx)x\ra=0$ для любого $x\in X$, т.~е. $(F'(\wx))^*y^*=0$. Остается положить $\lambda_j=0$, $j=0,1,\ldots,m$.

$B)$ Невырожденный случай: $\IM F'(\wx)=Y$. Рассмотрим множество
\begin{multline*}
C=\{\,((\mu_0,\mu_1,\ldots,\mu_m)^T,y)\in\mathbb R^{m+1}\times Y:\exists\, x\in
X:\mu_j>\la f'_j(\wx),x\ra,\\j=0,1,\ldots,m,\,\, y=F'(\wx)x\,\}.
\end{multline*}
Очевидно, что $C$ --- выпуклое множество. Докажем, что $0\notin C$. Предположим, что $0\in C$. Тогда существует такое $x_0\in X$, что $\la f'_j(\wx),x_0\ra<0$,
$j=0,1,\ldots,m$, и $F'(\wx)x_0=0$. По теореме Люстерника $x_0\in
T_{\wx}M$, где $M=\{\,x\in X:F(x)=F(\wx)=0\,\}$, т.~е. существуют
$\varepsilon>0$ и отображение $r\colon(-\varepsilon,\varepsilon)\to X$ такие, что
$F(\wx+tx_0+r(t))=0$ для всех $t\in(-\varepsilon,\varepsilon)$ и $\|r(t)\|_X=o(t)$
при $t\to0$. В силу дифференцируемости функций $f_j$, $j=0,1,\ldots,m$, в
точке $\wx$ имеем
$$f_j(\wx+tx_0+r(t))=f_j(\wx)+\la f'_j(\wx),x_0\ra t+o(t)<f_j(\wx)$$
для достаточно малых $t>0$. Это значит, что для таких $t$ точки $\wx+tx_0+r(t)$
допустимы в задаче \eqref{TR1}, а значение функционала $f_0$ на них меньше, чем
$f_0(\wx)$, в противоречие с тем, что $\wx$ --- локальный минимум. Итак, $0\notin
C$.

Покажем теперь, что $\intt C\ne\emptyset$. Рассмотрим множество
\begin{multline*}
C_0=\{\,((\mu_0,\mu_1,\ldots,\mu_m)^T,y)\in\mathbb R^{m+1}\times Y:
\mu_j>d,\ j=0,1,\ldots,m,\\
y\in F'(\wx)(B_X(0,1))\,\},\quad d=\max_{0\le j\le m}\|f'_j(\wx)\|.
\end{multline*}
По теореме Банаха об открытом отображении \cite[стр. 243]{KF} множество $F'(\wx)(B_X(0,1))$ открыто. Тем самым $C_0$ --- открытое множество. Покажем, что
$C_0\subset C$. Действительно, пусть $((\mu_0,\mu_1,\ldots,\mu_m)^T,y)\in C_0$ и $x\in
B_X(0,1)$ такое, что $y=F'(\wx)x$. Тогда $\mu_j>d\ge\la f'_j(\wx),x\ra$,
$j=0,\ldots,m$, и значит, $((\mu_0,\mu_1,\ldots,\mu_m)^T,y)\in C$, т.~е. $\intt C\ne\emptyset$.

В силу первой теоремы отделимости (теорема~\ref{FTO}) множество $C$ можно отделить от нуля, т.е. найдется ненулевой функционал $(\lambda_0,\lambda_1,\ldots,\lambda_m,y^*)\in
(\mathbb R^{m+1})^*\times Y^*$ такой, что
\begin{equation}\label{eqeqi}
\sum_{j=0}^m\lambda_j\mu_j+\la y^*,y\ra\ge0
\end{equation}
для всех $((\mu_0,\mu_1,\ldots,\mu_m)^T,y)\in C$. Наборы $((\mu_0,\mu_1,\ldots,\mu_m)^T,0)$, где $\mu_j>0$, $j=0,1\ldots,m$, принадлежат
$C$ (надо взять $x=0$). Подставляя их в \eqref{eqeqi}, получаем, что
$$\sum_{j=0}^m\lambda_j\mu_j\ge0$$
для всех $\mu_j>0$, $j=0,1\ldots,m$. Отсюда вытекают неравенства $\lambda_j\ge0$,
$j=0,1\ldots,m$, и утверждение $(b)$ теоремы доказано.

Для любого $x\in X$ и любого $\varepsilon>0$
$$((\la f'_0(\wx),x\ra+\varepsilon,\ldots,\la f'_m(\wx),x\ra+\varepsilon)^T, F'(\wx)x)\in C.$$
Из \eqref{eqeqi}, получаем, что
$$\sum_{j=0}^m\lambda_j\la f_j'(\wx),x\ra+\la y^*,F'(\wx)x\ra\ge-\varepsilon\sum_{j=0}^m\lambda_j.$$
В силу произвольности $\varepsilon$ левая часть этого неравенства (которая есть линейный функционал) неотрицательна на $X$ и значит, она равна нулю, а это равносильно утверждению $(a)$ теоремы.

Докажем последнее утверждение теоремы. Пусть выполнены его предположения  и $\lambda_0=0$. Если при некотором $1\le j\le m$, $f_j(\wx)\ne0$, то из $c)$ следует, что $\lambda_j=0$. Тем самым из $(a)$ вытекает, что
$$\sum_{j\in J_0}\lambda_j\la f'_j(\wx),h\ra=0.$$
В силу $b)$ и того, что $\la f'_j(\wx),h\ra<0$, $j\in J_0$, получаем, что $\lambda_j=0$, $j=0,1,\ldots,m$. Следовательно, из $a)$ вытекает, что $\la y^*,F'(\wx)x\ra=0$ для всех $x\in X$. Так как $\IM F'(\wx)=Y$, то $\la y^*,y\ra=0$ при всех $y\in Y$, т.е. $y^*=0$. Это противоречит тому, что не все множители Лагранжа равны нулю.
\end{proof}

\chapter{Выпуклые экстремальные задачи}

\section{Выпуклые задачи без ограничений}

Пусть $X$ --- вещественное линейное пространство и $f\colon X\to\ov{\mathbb R}=\mathbb R\cup\{+\infty\}$. Множества
\begin{gather*}
\dom f=\{\,x\in X:f(x)<+\infty\,\},\\
\epi f=\{\,(x,\alpha)\in X\times\mathbb R:\alpha\ge f(x),\ x\in\dom f\,\}
\end{gather*}
называются соответственно {\it эффективным множеством} и {\it надграфиком} (или {\it эпиграфом}) {\it функции}  $f$. Функцию $f$ называют {\it собственной}, если $\dom f\ne\emptyset$.

Для элементов расширенной прямой считается, что $a+(+\infty)=+\infty$ для всех $a\in\mathbb R$, $a\cdot(+\infty)=+\infty$, если $a>0$, $0\cdot(+\infty)=0$ и $+\infty+(+\infty)=+\infty$.

Функция $f\colon X\to\ov{\mathbb R}$ называется {\it выпуклой}, если ее надграфик выпуклое множество в $X\times\mathbb R$. Нетрудно проверить, что функция $f$ выпукла тогда и только тогда, когда для любых
$x_1,x_2\in X$ и любого $0\le\alpha\le1$ выполняется неравенство
$$f((1-\alpha)x_1+\alpha x_2)\le (1-\alpha)f(x_1)+\alpha f(x_2),$$
которое называется {\it неравенством Йенсена}.

\begin{theorem}
Пусть $X$ --- линейное нормированное пространство и $f\colon X\to\mathbb R$ --- дважды дифференцируема на $X$. Тогда $f$ --- выпуклая функция тогда и только тогда, когда $f''(x)[h,h]\ge0$ для всех $x\in X$ и всех $h\in X$.
\end{theorem}

\begin{proof}
Пусть $f$ --- выпуклая функция. Предположим, что существует $x\in X$ и $h\in X$ такие, что $f''(x)[h,h]<0$. По формуле Тейлора для $t\in\mathbb R$ имеем
\begin{align*}
f(x+th)&=f(x)+f'(x)ht+f''(x)[h,h]\frac{t^2}2+o(t^2),\\
f(x-th)&=f(x)-f'(x)ht+f''(x)[h,h]\frac{t^2}2+o(t^2).
\end{align*}
Отсюда, складывая эти равенства, получаем
$$f(x+th)-2f(x)+f(x-th)=f''(x)[h,h]t^2+o(t^2).$$
Следовательно, при достаточно малых $t$
$$f(x+th)-2f(x)+f(x-th)<0,$$
что противоречит выпуклости $f$.

Пусть теперь $f''(x)[h,h]\ge0$ для всех $x\in X$ и всех $h\in X$. Для произвольных $x_1,x_2\in X$ рассмотрим функцию
$$F(t)=f(x_1+t(x_2-x_1))-f(x_1)-t(f(x_2)-f(x_1)).$$
Имеем $F(0)=F(1)=0$, $$F''(t)=f''(x_1+t(x_2-x_1))[x_2-x_1,x_2-x_1]\ge0.$$
Предположим, что при некотором $t\in(0,1)$ \ $F(t)>0$. Тогда найдется точка $t_0\in(0,1)$, в которой функция $F$ будет достигать максимального значения и, значит, $F'(t_0)=0$. Поскольку $F''(t)\ge0$ при всех $t\in[t_0,1]$, то $F'(t)\ge0$ при $t\in[t_0,1]$. Тем самым функция $F$ не убывает на отрезке $[t_0,1]$, а значит, $F(1)>0$. Полученное противоречие доказывает, что $F(t)\le0$ для всех $t\in[0,1]$. Таким образом, для всех $t\in[0,1]$ справедливо неравенство
$$f((1-t)x_1+tx_2)\le(1-t)f(x_1)+tf(x_2),$$
что и означает выпуклость функции $f$.
\end{proof}

Пусть $X=\Rd$ и $f\colon\Rd\to\mathbb R$. Если $f$ --- дважды дифференцируема, то $f''(x)$ --- гессиан $f$ в точке $x$ (см.~\eqref{Ge}).
\begin{corollary}\label{SS1}
Если функция $f\colon\Rd\to\mathbb R$ дважды дифференцируема на $\Rd$, то она является выпуклой в том, и только в том случае, если ее гессиан в любой точке $x\in\Rd$ удовлетворяет условию
$$h^Tf''(x)h\ge0$$
для всех $h\in\Rd$ $($матрица гессиана в любой точке является неотрицательно определенной$)$.
\end{corollary}

\section{Субдифференциал. Теорема Ферма}

Пусть $X$ --- линейное нормированное пространство, $f\colon X\to\ov{\mathbb R}$, $\wx\in X$ и функция $f$ конечна в точке $\wx$.
{\it Субдифференциалом функции $f$ в точке $\wx$}
называется множество (возможно пустое)
$$\partial f(\wx)=\{\, x^*\in X^*:f(x)-f(\wx)\ge\la x^*,x-\wx\ra,\ \forall\, x\in X\,\}.$$

Следующее предложение показывает, что субдифференциал достаточно естественное обобщение понятия производной на выпуклые функции.

\begin{proposition}\label{P2}
Пусть $X$ --- линейное нормированное пространство и $f\colon X\to\ov{\mathbb R}$ --- выпуклая функция, дифференцируемая в точке $\wx$. Тогда $\partial f(\wx)=\{f'(\wx)\}$.
\end{proposition}

\begin{proof}
Пусть $x\in\ X$. Для любого $0<\alpha<1$ имеем по
неравенству Йенссена
$$f((1-\alpha)\wx+\alpha x)\le(1-\alpha)f(\wx)+\alpha f(x),$$
откуда
$$f(\wx+\alpha(x-\wx))-f(\wx)\le\alpha(f(x)-f(\wx)).$$
В силу дифференцируемости функции $f$ в точке $\wx$ имеем
$$\alpha\la f'(\wx),x-\wx\ra+o(\alpha)\le\alpha(f(x)-f(\wx)).$$
Сокращая на $\alpha$ и переходя к пределу при $\alpha\to0$, получаем, что $f'(\wx)\in\partial f(\wx)$.

Обратно, если $x^*\in\partial f(\wx)$, то для любого $x\in X$ и любого $t>0$ имеем $f(\wx+tx)-f(\wx)\ge t\la x^*,x\ra$.
Следовательно,
$$t\la f'(\wx),x\ra+o(t)\ge t\la x^*,x\ra,$$
т.~е. $\la f'(\wx),x\ra\ge\la x^*,x\ra$ для любого $x$ и значит,
$x^*=f'(\wx)$.
\end{proof}

Пусть $X$ --- линейное нормированное пространство и $f\colon X\to\ov {\mathbb R}$ --- собственная функция. Рассмотрим задачу
\begin{equation}\label{FF1}
f(x)\to\min,\quad x\in X.
\end{equation}

\begin{theorem}[Ферма в субдифференциальной форме]\label{FD}
Точка $\wx$ является глобальным минимумом в задаче \eqref{FF1} тогда и только тогда, когда $0\in\partial f(\wx)$.
\end{theorem}

\begin{proof}
Если $\wx$ --- глобальный минимум, то $f(x)-f(\wx)\ge0=\la0,x-\wx\ra$ для любого $x\in X$, т.~е. $0\in\partial f(\wx)$. Если $0\in\partial
f(\wx)$, то $f(x)-f(\wx)\ge\la0,x-\wx\ra=0$, т.~е. $f(x)\ge f(\wx)$ для любого $x\in X$.
\end{proof}

Если в задаче \eqref{FF1} функция $f$ --- выпуклая, то она называется {\it выпуклой задачей без ограничений}. Отметим, что в этом случае нет смысла говорить о локальных минимумах, поскольку любой локальный минимум является и глобальным. Действительно, пусть $\wx$ ---
локальный минимум, т.~е. существует такая окрестность $U$ точки $\wx$, что $f(\wx)\le f(x)$ для всех $x\in U$. Пусть теперь $x$ --- произвольная точка из $X$. Для достаточно малых $0<\alpha\le1$ точки $(1-\alpha)\wx+\alpha x$ принадлежат $U$ и поэтому (по неравенству Йенссена) $f(\wx)\le f((1-\alpha)\wx+\alpha x)\le(1-\alpha)f(\wx)+\alpha f(x)$, откуда следует, что $f(\wx)\le f(x)$.

Из предложения~\ref{P2} и теоремы~\ref{FD} вытекает

\begin{corollary}
Если в задаче \eqref{FF1} $f$ --- выпуклая функция, дифференцируемая в точке $\wx$, то $\wx$ --- глобальный минимум в том и только в том случае, если $f'(\wx)=0$.
\end{corollary}

\section[Выпуклые задачи с ограничениями]{Выпуклые задачи с ограничениями. Теорема Каруша--Куна--Таккера}

Пусть $X$ --- вещественное линейное пространство, $f_j\colon X\to\mathbb R$, $j=0,1,\ldots,m$, --- выпуклые функции и $A$ --- непустое выпуклое подмножество $X$. Задачу
\begin{equation}\label{eqp4}
f_0(x)\to\min,\quad f_j(x)\le 0,\quad j=1,\ldots,m,\quad x\in A
\end{equation}
называют {\it выпуклой задачей} или {\it задачей выпуклого программирования}.

Свяжем с задачей \eqref{eqp4} следующую функцию Лагранжа
$$\LL(x,\ov\lambda)=\sum_{j=0}^m\lambda_jf_j(x),$$
где $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$ --- набор множителей Лагранжа.

\begin{theorem}[Каруша--Куна--Таккера]
$1.$ Если $\wx$ ---  минимум в задаче \eqref{eqp4}, то найдется такой ненулевой набор множителей Лагранжа $\ov \lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$, что выполнены следующие условия
\begin{itemize}
\item[$(a)$] $\min_{x\in A}\LL(x,\ov\lambda)=\LL(\wx,\ov\lambda)$
$($условие минимума$)$;
\item[$(b)$] $\lambda_j\ge0$, $j=0,1,\ldots,m$ $($условие неотрицательности$)$;
\item[$(c)$] $\lambda_jf_j(\wx)=0$, $j=1,\ldots,m$ $($условие дополняющей не\-жест\-кос\-ти$)$.
\end{itemize}

$2.$ Если существует допустимая в \eqref{eqp4} точка $\wx$ и набор множителей Лагранжа $\ov
\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$, удовлетворяющие условиям $(a)$, $(b)$ и $(c)$ и при этом $\lambda_0>0$, то $\wx$ --- решение задачи \eqref{eqp4}.

$3.$ Если найдется точка $\ov x\in A$ такая, что $f_j(\ov x)<0$, $1\le j\le m$, то в $1$ $\lambda_0\ne0$ (условие Слейтера).
\end{theorem}

\begin{proof}
Пусть $\wx$ --- решение задачи \eqref{eqp4}. Рассмотрим множество
\begin{multline*}
M=\{\,\mu=(\mu_0,\mu_1,\ldots,\mu_m)^T\in\mathbb R^{m+1}:\exists\,x\in A:f_0(x)-f_0(\wx)<\mu_0,\\ f_j(x)\le\mu_j,\ j=1,\ldots,m\,\}.
\end{multline*}
Непосредственная проверка показывает, что это множество выпукло. Кроме того, легко видеть, что оно содержит все векторы с положительными компонентами (надо взять $x=\wx$) и тем самым его внутренность не пуста. Наконец, $0\notin M$, так как в противном случае нашелся бы элемент $\ov x\in A$ такой, что $f_j(\ov x)\le0$, $j=1,\ldots,m$, и $f_0(\ov
x)-f_0(\wx)<0$, в противоречие с тем, что $\wx$ --- минимум.

Согласно первой теореме отделимости найдется такой ненулевой
функционал, т.~е. вектор $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)\in
(\mathbb R^{m+1})^*$, что
\begin{equation}\label{eqkt}
\sum_{j=0}^m\lambda_j\mu_j\ge0
\end{equation}
для всех $\mu=(\mu_0,\mu_1,\ldots,\mu_m)^T\in M$. Пусть $\delta>0$. Подставляя в \eqref{eqkt} векторы $(1,\delta,\ldots,\delta)^T,\ldots,(\delta,\ldots,\delta,1)^T$, а затем устремляя $\delta$ к нулю, получаем, что $\lambda_j\ge0$, $j=0,1,\ldots,m$, т.~е. доказано утверждение $(b)$ теоремы.

Теперь подставим в \eqref{eqkt} векторы
$(\delta,\ldots,\delta,f_j(\wx),\delta,\ldots,\delta)^T$, $j=1,\ldots,m$ (они принадлежат $M$, надо взять $x=\wx$) и снова, устремляя $\delta$ к нулю, получим, что $\lambda_jf_j(\wx)\ge0$. Но $\lambda_jf_j(\wx)\le0$, так как $\lambda_j\ge0$, а $f_j(\wx)\le0$ и поэтому $\lambda_jf_j(\wx)=0$, $j=1,\ldots,m$, что доказывает утверждение $(c)$.

Пусть $x\in A$. Ясно, что $(f_0(x)-f_0(\wx)+\delta,f_1(x),\ldots,f_m(x))^T\in M$.
Подставляя этот вектор в \eqref{eqkt}, приходим (в пределе при $\delta\to0$) к неравенству $\sum_{j=0}^m\lambda_jf_j(x)\ge\lambda_0f_0(\wx)$. Добавляя справа нулевые слагаемые
$\lambda_jf_j(\wx)$, $j=1,\ldots,m$, получаем, что $\LL(x,\ov\lambda)\ge\LL(\wx,\ov\lambda)$ и $(a)$ доказано.

Докажем второе утверждение теоремы. Пусть $x$ --- допустимый элемент в задаче \eqref{eqkt}. Тогда, используя это обстоятельство вместе с $(b)$, $(a)$ и $(c)$, будем иметь
\begin{multline*}
\lambda_0f_0(x)\ge\lambda_0f_0(x)+\sum_{j=1}^m\lambda_jf_j(x)=
\LL(x,\ov\lambda)\ge\LL(\wx,\ov\lambda)\\=\lambda_0f_0(\wx)+
\sum_{j=1}^m\lambda_jf_j(\wx)=\lambda_0f_0(\wx).
\end{multline*}
Деля на $\lambda_0$, получаем требуемое.

Докажем последнее утверждение теоремы. Если  $\lambda_0=0$, то ненулевой множитель
Лагранжа находится среди остальных и поэтому (с учетом $(c)$) $\mathcal L(\ov
x,\ov\lambda)=\sum_{i=1}^m\lambda_if_i(\ov
x)<0=\sum_{i=1}^m\lambda_if_i(\wx)=\mathcal L(\wx,\ov\lambda)$, что противоречит
$(a)$.
\end{proof}

\chapter{Вариационное исчисление}

\section[Простейшая задача вариационного исчисления]{Простейшая задача вариационного исчисления. Уравнение Эйлера}

Принято считать, что вариационное исчисление родилось с задачи о брахистохроне, предложенной в 1696 г. И.~Бернулли для решения своим современникам. Задача была решена самим Бернулли, его братом Яковом, Ньютоном, Лейбницем и Лопиталем. Решения были разные, и вскоре еще было  решено несколько сходных задач.

В начале 18 века И.~Бернулли предложил Л.~Эйлеру (тогда молодому человеку, которого он консультировал по научным вопросам) найти общие методы решения подобных задач. Начиная с 1732 г. Л.~Эйлер начал активно этим заниматься и через 12 лет завершил свой фундаментальный труд ``Modus invineniondi lineas curvas maximive proprietate
gemdenties sive soluto problematis isoperimetrice latissimo sensu accepti'' (``Метод нахождения кривых линий, обладающих свойствами максимума или минимума, или решение изопериметрической задачи, взятой в самом широком смысле''), Лозанна, 1744 г. Там, в частности, была рассмотрена задача, которая ныне называется простейшей задачей
(классического) вариационного исчисления.

Пусть $[t_{0},t_{1}]$ --- отрезок числовой прямой,  $G$ --- открытое
подмножество $\mathbb R^3$, $L\colon G\to\mathbb R$
--- непрерывная функция переменных  $t$, $x$, $\dot x$ и
$x_0,x_1\in\mathbb R$. Задача
\begin{equation}\label{E1}
J(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t))\,dt\to\extr,\quad x(t_0)=x_0,\quad x(t_1)=x_1,
\end{equation}
называется {\it простейшей задачей $($классического$)$ вариационного
исчисления}. Функцию $L$ называют {\it интегрантом\/} или {\it лагранжианом\/} задачи.

Уточним постановку. Обозначим через $C([t_{0},t_{1}])$ и $C^1([t_{0},t_{1}])$
множества всех непрерывных и непрерывно дифференцируемых функций $x$ на
$[t_{0},t_{1}]$. Это нормированные пространства соответственно с нормами
\begin{align*}
\|x\|_{C([t_0,t_1])}&=\max_{t\in[t_0,t_1]}|x(t)|,\\
\|x\|_{C^1([t_0,t_1])}&=\max(\|x\|_
{C([t_0,t_1])},\|\dot
x\|_{C([t_0,t_1])}).
\end{align*}


Функция $x\in C^1([t_0,t_1])$ называется {\it допустимой в задаче
\eqref{E1}}, если  $\Gamma(x)=\{(t,x(t),\dot x(t))^T:t\in [t_{0},t_{1}]\}\subset G$ и $x(t_j)=x_j$, $j=0,1$.

Допустимая функция $\wx$  называется {\it слабым локальным минимумом
$($максимумом$)$} в задаче \eqref{E1}, если существует такое $\varepsilon>0$, что для
любой допустимой функции $x$, для которой $\|x-\wx\|_{C^1([t_0,t_1])}<\varepsilon$ выполняется неравенство
$J(x)\ge J(\wx)$ ($J(x)\le J(\wx)$). {\it Слабый локальный экстремум} --- это либо слабый локальный минимум, либо слабый локальный максимум.

Далее, если фиксирована функция $\wx$, то для сокращения записи
используем обозначения: $\wL_x(t)=L_x(t,\wx(t),\dot\wx(t))$ и аналогично для частной производной $L$ по $\dot x$.

\begin{theorem}[Необходимые условия экстремума в задаче \eqref{E1}]
Пусть $\wx$ доставляет слабый локальный экстремум в задаче \eqref{E1}. Тогда, если функция $L$ непрерывна вместе со своими частными производными по $x$ и $\dot x$ в окрестности $\Gamma(\wx)$, то $\wL_{\dot x}\in C^1([t_0,t_1])$ и для всех $t\in[t_0,t_1]$ выполнено уpавнение Эйлеpа
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0.$$
\end{theorem}

\begin{proof}
Пусть $x\in C^1([t_0,t_1])$ и $x(t_0)=x(t_1)=0$. Положим
$x_\alpha=\wx+\alpha x$, где $\alpha\in\mathbb R$. Для достаточно
малых $\alpha$ функция $x_\alpha$ принадлежит окрестности $\Gamma(\wx)$. Кроме того, очевидно, что $x_\alpha\in C^1([t_0,t_1])$ и $x_\alpha(t_j)=x_j$, $j=0,1$. Тем самым для достаточно малых $\alpha$ функции $x_\alpha$ допустимы в задаче \eqref{E1}. Функция $\wJ(\alpha)=J(x_{\alpha})$ имеет в нуле локальный экстремум. Имеет место представление
$$\wJ(\alpha)=I\circ F\circ D\circ S(\alpha),$$
где $S(\alpha)=\wx+\alpha x$, $D(x)=(x,\dot x)$, $F(x,u)(t)=L(t,x(t),u(t))$ и
$$I(x)=\int_{t_0}^{t_1}x(t)\,dt.$$
В силу дифференцируемости обобщенного оператора Немыцкого (следствие~\ref{CN}), теоремы о производной суперпозиции функций (теорема~\ref{TS1}) и того, что производная линейного оператора есть сам этот линейный оператор ($I'=I$, $D'=D$), получаем
$$\frac{d\wJ(\alpha)}{d\alpha}\bigg|_{\alpha=0}=I\circ F'\circ D\circ S'(\alpha)\bigg|_{\alpha=0}=\int_{t_0}^{t_1}
\left(\wL_x(t)x(t)+\wL_{\dot x}(t)\dot x(t)\right)\,dt.$$
По теореме Ферма производная $\wJ(\alpha)$ в нуле равна нулю. Следовательно,
\begin{equation}\label{V1}
\int_{t_0}^{t_1}
\left(\wL_x(t)x(t)+\wL_{\dot x}(t)\dot x(t)\right)\,dt=0.
\end{equation}

Пусть $p$ такая функция, что $\dot p=\wL_x$. Тогда, интегрирую по частям, получаем
$$\int_{t_0}^{t_1}\wL_x(t)x(t)\,dt=\int_{t_0}^{t_1}\dot p(t)x(t)\,dt=-\int_{t_0}^{t_1}p(t)\dot x(t)\,dt.$$
Поэтому, из \eqref{V1} следует, что для всех функций $x\in C^1([t_0,t_1])$, для которых $x(t_0)=x(t_1)=0$ справедливо равенство
$$\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)\right)\dot x(t)\,dt=0.$$
Но тогда для любой константы $c\in\mathbb R$ справедливо и такое равенство
\begin{equation}\label{V2}
\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)+c\right)\dot x(t)\,dt=0.
\end{equation}
Выберем $c$ так, чтобы
$$\int_{t_0}^{t_1}(-p(t)+\wL_{\dot x}(t)+c)\,dt=0.$$
Рассмотрим функцию
$$x(t)=\int_{t_0}^t(-p(\tau)+\wL_{\dot x}(\tau)+c)\,d\tau.$$
Ясно, что $x\in C^1([t_0,t_1])$ и $x(t_0)=x(t_1)=0$. Подставим эту функцию в \eqref{V2}. Тогда получим
$$\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)+c\right)^2dt=0.$$
Отсюда следует, что $-p+\wL_{\dot x}+c=0$. Тем самым  $\wL_{\dot x}\in C^1([t_0,t_1])$. Дифференцируя равенство $p=\wL_{\dot x}+c$ и учитывая, что $\dot p=\wL_{x}$, получаем уравнение Эйлера.
\end{proof}

\section{Задача Больца}

Пусть, как и в предыдущем случае, $[t_{0},t_{1}]$ --- отрезок числовой прямой,  $G$
--- открытое подмножество $\mathbb R^3$, $L\colon G\to\mathbb R$
--- непрерывная функция переменных $t$, $x$ и $\dot x$. Пусть, кроме того, задана функция $l\colon W\to \mathbb R$, где $W$ --- открытое
подмножество $\mathbb R^2$. Задача
\begin{equation}\label{V3}
\mathcal B(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t))\,dt
+l(x(t_0),x(t_1))\to\extr
\end{equation}
называется {\it задачей Больца}.

Функция $x\in C^1([t_0,t_1])$ называется {\it допустимой в задаче
\eqref{V3}}, если  $\Gamma(x)=\{(t,x(t),\dot x(t))^T:t\in [t_0,t_1]\}\subset
G$ и $(x(t_0),x(t_1))^T\in W$.

Слабый локальный экстремум определяется аналогично предыдущему случаю.

Функции $\wL_x$ и $\wL_{\dot x}$ определяются как и раньше, и
кроме того, для функции $l(\xi_0,\xi_1)$ полагаем  $\wl_{\xi_j}=l_{\xi_j}(\wx(t_0),\wx(t_1))$, $j=0,1$.

\begin{theorem}[Необходимые условия экстремума в задаче \eqref{V3}]
Пусть $\wx$ доставляет слабый локальный экстремум в задаче \eqref{V3}. Тогда, если функция $L$ непрерывна вместе со своими частными производными по $x$ и $\dot x$ в окрестности $\Gamma(\wx)$, а функция $l$ непрерывна вместе со своими частными производными по $\xi_0$ и $\xi_1$ в окрестности точки $(\wx(t_0),\wx(t_1))^T$, то
$\wL_{\dot x}\in C^1([t_0,t_1])$, для всех $t\in[t_0,t_1]$
выполнено уpавнение Эйлеpа
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0,$$
а, кроме того, выполняется условие трансверсальности
$$\wL_{\dot x}(t_j)=(-1)^j\wl_{\xi_j},\quad j=0,1.$$
\end{theorem}

\begin{proof}
Пусть $x\in C^1([t_0,t_1])$ и $x_{\alpha}=\wx+\alpha x$. Рассуждая точно так же, как и в предыдущей теореме, приходим к соотношению
\begin{multline}\label{V4}
\frac{d \mathcal
B(x_{\alpha})}{d\alpha}\bigg|_{\alpha=0}=\int_{t_0}^{t_1}
\left(\wL_x(t)x(t)+\wL_{\dot x}(t)\dot x(t)\right)\,dt\\
+\wl_{\xi_0}x(t_0)+\wl_{\xi_1}x(t_1)=0.
\end{multline}
Пусть $p$ --- решение задачи Коши $\dot p=\wL_x(t)$, $p(t_1)=-\wl_{\xi_1}$. Тем самым $$p(t)=-\wl_{\xi_1}-\int_t^{t_1}\wL_x(\tau)\,d\tau,\quad t\in[t_0,t_1].$$
Подставляя $\dot p$ в \eqref{V4} вместо $\wL_x$ и интегрируя по частям, получаем, что
\begin{equation}\label{V5}
\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)\right)\dot
x(t)\,dt+(\wl_{\xi_0}-p(t_0))x(t_0)=0.
\end{equation}
Пусть теперь $x$ --- решение задачи Коши $\dot x=-p(t)+\wL_{\dot x}(t)$, $x(t_0)= \wl_{\xi_0}-p(t_0)$, т.~е.
$$x(t)=\wl_{\xi_0}-p(t_0)+\int_{t_0}^t(-p(\tau)+\wL_{\dot x}(\tau))\,d\tau,\quad t\in[t_0,t_1].$$
Ясно, что $x\in C^1([t_0,t_1])$. Подставляя $x$ в \eqref{V5}, приходим к равенству
$$\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)
\right)^2\,dt+(\wl_{\xi_0}-p(t_0))^2=0,$$
откуда следует равенство $p=\wL_{\dot x}$, равносильное, в силу определения $p$, уравнению Эйлера, а также соотношение $p(t_0)=\wl_{\xi_0}$, или $\wL_{\dot x}(t_0)=\wl_{\xi_0}$. Условие $\wL_{\dot x}(t_1)=-\wl_{\xi_1}$ входит в определение $p$.
\end{proof}

Мы рассмотрели ``одномерные'' варианты простейшей задачи и задачи Больца. Совершенно аналогично рассматриваются их векторные аналоги, когда $x=(x_1,\ldots,x_d)^T$. В этом случае роль пространств $C([t_0,t_1])$ и $C^1([t_0,t_1])$ играют пространства
$C([t_0,t_1],\mathbb R^d)$ и $C^1([t_0,t_1],\mathbb R^d)$ --- соответственно непрерывных и непрерывно дифференцируемых вектор-функций со значениями в $\mathbb R^d$. Они определяются аналогично одномерным вариантам, где $|x(t)|=\sqrt{x_1^2(t)+\ldots+x_d^2(t)}$. Необходимые условия экстремума здесь имеют тот же вид и их доказательства остаются прежними. Но формулы, разумеется, надо понимать векторно. Например,
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0\ \Leftrightarrow\ -\frac d{dt}\wL_{\dot x_j}(t)+\wL_{x_j}(t)=0,\quad j=1,\ldots,d.$$

\section{Интегралы уравнения Эйлера}

Напомним, что первым интегралом дифференциального уравнения называется функция, которая постоянна на решениях данного уравнения.

Если лагранжиан $L$ не зависит от переменной $x$, то уравнение Эйлера имеет очевидный первый интеграл
$$p(t)=L_{\dot x}(t,\dot{\wx}(t))=\const,$$
который называется {\it интегралом импульса}.

Если лагранжиан $L$ не зависит от переменной $t$, то уравнение Эйлера имеет первый интеграл
$$H(t)=L_{\dot x}(\wx(t),\dot{\wx}(t))\dot{\wx}(t)-L(\wx(t),\dot{\wx}(t))=\const.$$
Он называется {\it интегралом энергии}.

Для доказательства вычислим производную функции $H$ (учитывая,
что $\wx$ удовлетворяет уравнению Эйлера)
\begin{multline*}
\frac{dH}{dt}=L_{\dot x}(\wx(t),\dot{\wx}(t))\ddot{\wx}(t)+\frac d{dt}L_{\dot
x}(\wx(t),\dot{\wx}(t))\dot{\wx}(t)-L_x(\wx(t),\dot{\wx}(t))\dot{\wx}(t)\\-
L_{\dot x}(\wx(t),\dot{\wx}(t))\ddot{\wx}(t)=\left(\frac d{dt}L_{\dot
x}(\wx(t),\dot{\wx}(t))-L_x(\wx(t),\dot{\wx}(t))\right)\dot{\wx}(t)=0.
\end{multline*}
При доказательстве мы предположили существование $\ddot{\wx}$

\section{Задача Лагранжа. Общая постановка}

Пусть $[t_0,t_1]$ --- конечный отрезок, $G$ --- открытое подмножество $\mathbb R\times\mathbb R^{d_1}\times\mathbb R^{d_2}$, $W$ --- открытое подмножество $\mathbb R^{d_1}\times\mathbb R^{d_1}$, функции $L_j\colon G\to\mathbb R$, $j=0,1,\ldots,m$, отображение
$\varphi\colon G\to\mathbb R^{d_1}$ (переменных $t\in\mathbb R$, $x=(x_1,\ldots,x_{d_1})^T\in\mathbb R^{d_1}$, $u=(u_1,\ldots,u_{d_2})^T\in\mathbb R^{d_2}$) и функции $l_j\colon W\to\mathbb R$, $j=0,1,\ldots,m$ (переменных $\xi_0$ и $\xi_1$) непрерывны на своей области определения. Задача
\begin{multline}\label{Lag}
f_0(x,u)=\int_{t_0}^{t_1}L_0(t,x(t),u(t))\,dt+l_0(x(t_0),x(t_1))\to\min,\\
\dot x=\varphi(t,x,u),\\
f_j(x,u)=\int_{t_0}^{t_1}L_j(t,x(t),u(t))\,dt+l_j(x(t_0),x(t_1))\le0,\ 1\le j\le m',\\
f_j(x,u)=\int_{t_0}^{t_1}L_j(t,x(t),u(t))\,dt+l_j(x(t_0),x(t_1))=0,\\
m'+1\le j\le m,
\end{multline}
называется {\it задачей Лагранжа вариационного исчисления} (в понтрягинской форме).

Уточним постановку. Положим
$$Z=C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_2}).$$
Норму в $Z$ введем следующим образом:
$$\|(x,u)\|_Z=\|x\|_{C^1([t_0,t_1],\mathbb R^{d_1})}+\|u\|_{C([t_0,t_1],\mathbb R^{d_2})}.$$
Пара $(x,u)\in Z$ называется {\it допустимой в задаче \eqref{Lag}},
если
\begin{multline*}
\Gamma(x,u)=\{\,(t,x(t),u(t)):t\in[t_0,t_1]\,\}\subset G,\quad(x(t_0),x(t_1))\in W,\\
\dot x(t)=\varphi(t,x(t),u(t))\mbox{ для всех }t\in[t_0,t_1],\\
f_j(x,u)\le0,\ 1\le j\le m',\quad f_j(x,u)=0,\ m'+1\le j\le m.
\end{multline*}

Допустимая пара $(\wx,\wu)$ называется {\it слабым локальным минимумом в задаче \eqref{Lag}}, если существует такое $\varepsilon>0$, что для любой допустимой пары $(x,u)$, для которой $\|(x,u)-(\wx,\wu)\|_Z<\varepsilon$ выполнено неравенство $f_0(x,u)\ge f_0(\wx,\wu)$.

Функцией Лагранжа задачи \eqref{Lag} назовем функцию
$$\LL(x,u,\ov\lambda)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t),u(t))\,dt+l(x(t_0),x(t_1)),$$
где
\begin{align*}
L(t,x,\dot x,u)&=\sum_{j=0}^m\lambda_jL_j(t,x,u)+p(t)(\dot x-\varphi(t,x,u)),\\ l(\xi_0,\xi_1)&=\sum_{j=0}^m\lambda_jl_j(\xi_0,\xi_1)
\end{align*}
и вектор $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m,p)\in(\mathbb
R^{m+1})^*\times C^1([t_0,t_1],(\mathbb R^{d_1})^*)$ ---  набор множителей Лагранжа.

Если фиксирована пара $(\wx,\wu)$, то, как и раньше, для
сокращения записи используем обозначения: $\wL_x(t)=L_x(t,\wx(t),\dot{\wx}(t),\wu(t))$ и аналогично для частной производной по $\dot{\wx}$ и по $u$, частных производных отображения $\varphi$, $l$ и т.~д.

\begin{theorem}[Необходимые условия минимума в задаче \eqref{Lag}]
Пусть $(\wx,\wu)$ доставляет слабый локальный минимум в задаче \eqref{Lag}. Тогда, если функции $L_j$, $0\le j\le m$, и отображение $\varphi$ непрерывны вместе со своими частными производными по $x$ и $u$ в окрестности множества $\Gamma(\wx,\wu)$, а функции $l_j$, $0\le j\le m$, непрерывно дифференцируемы в окрестности точки
$(\wx(t_0),\wx(t_1))$, то найдется ненулевой набор множителей
Лагранжа $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m,p)\in(\mathbb
R^{m+1})^*\times C^1([t_0,t_1],(\mathbb R^{d_1})^*)$ такой, что
выполняются
\begin{itemize}
\item[$(a)$] условия стационарности $($уравнения Эйлера--Лагранжа$)$:
\begin{gather*}
-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0\ \Leftrightarrow\ -\dot
p(t)=p(t)\wv_x(t)-\sum_{j=0}^m\lambda_j\wL_{jx}(t),\\
\wL_u(t)=0\ \Leftrightarrow\ p(t)\wv_u(t)=\sum_{j=0}^m\lambda_j\wL_{ju}(t);
\end{gather*}
\item[$(b)$] $\lambda_j\ge0$, $j=0,1,\ldots m'$ $($условия
неотрицательности$)$;
\item[$(c)$] $\lambda_jf_j(\wx,\wu)=0$, $j=1,\ldots,m'$ $($условия
дополняющей не\-жест\-кос\-ти$)$;
\item[$(d)$] $\wL_{\dot x}(t_j)=(-1)^j\wl_{\xi_j}$, $j=0,1$
$($условия трансверсальности$)$.
\end{itemize}
\end{theorem}

\begin{proof}
Положим $\xi=(x,u)$, $\wxi=(\wx,\wu)$ и $\Phi(\xi)=(G(\xi),F(\xi))$, где $G(\xi)=(f_{m'+1}(\xi),\ldots,f_m(\xi))^T$, $F(\xi)=\dot x-\varphi(t,x,u)$. Тогда задача \eqref{Lag} может быть переписана в виде
\begin{equation}\label{Lag1}
f_0(\xi)\to\min,\quad f_j(\xi)\le0,\quad 1\le j\le m',\quad\Phi(\xi)=0.
\end{equation}
Будем применять к этой задаче теорему~\ref{T14}. Из дифференциальных свойств функций $L_j$ и $l_j$, $j=0,1,\ldots,m$, и $\varphi$, утверждений относительно дифференцируемости суперпозиций отображений и производной обобщенного оператора Немыцкого следует дифференцируемость отображений $f_j$, $j=0,1,\ldots,m'$, и строгая дифференцируемость отображений $F$ и $G$.

Покажем, что $\IM F'(\wxi)=C([t_0,t_1],\mathbb R^{d_1})$. Пусть $y\in C([t_0,t_1],\mathbb R^{d_1})$. Имеем
$$F'(\wxi)(h,v)(t)=\dot h(t)-\wv_x(t)h(t)-\wv_u(t)v(t).$$
Положим $v=0$. Уравнение
\begin{equation}\label{eqyy}
\dot h-\wv_x(t)h=y(t)
\end{equation}
является линейной системой дифференциальных уравнений с непрерывными коэффициентами. Поэтому для любого $y\in C([t_0,t_1],\mathbb R^{d_1})$ существует решение этой системы $h\in C^1([t_0,t_1],\mathbb R^{d_1})$. В силу леммы о замкнутости образа (лемма~\ref{LZ}) $\IM\Phi'(\wxi)$ --- замкнутое подпространство.

Таким образом, все условия теоремы~\ref{T14} выполнены. Тогда существует ненулевой набор множителей Лагранжа $\ov\lambda=(\lambda_0,\ldots,\lambda_{m'},\eta^*)$ такой, что для функции Лагранжа
\begin{multline*}
\LL_1(\xi,\ov\lambda)=\sum_{j=0}^{m'}\lambda_jf_j(\xi)+
\la\eta^*,\Phi(\xi)\ra\\
=\sum_{j=0}^{m'}\lambda_jf_j(\xi)+\la\mu^*,G(\xi)\ra+\la y^*,F(\xi)\ra
=\sum_{j=0}^m\lambda_jf_j(\xi)+\la y^*,F(\xi)\ra,
\end{multline*}
выполняются условия стационарности $\LL_1'(\wxi,\ov\lambda)=0$, а, кроме того, выполнены условия неотрицательности $\lambda_j\ge0$, $j=0,1,\ldots,m'$ и условия дополняющей не\-жест\-кос\-ти $\lambda_jf_j(\wx,\wu)=0$, $j=1,\ldots,m'$.

Займемся исследованием условия стационарности, из которого получаем
уравнения
\begin{multline}\label{Lyy}
\LL_{1x}(\wxi,\ov\lambda)h(t)=\int_{t_0}^{t_1}\wM(t)h(t)\,dt
+\wl_{\xi_0}h(t_0)+\wl_{\xi_1}h(t_1)\\
+\la y^*,\dot h(t)-\wv_x(t)h(t)\ra=0,
\end{multline}
где
$$\wM=\sum_{j=0}^m\lambda_j\wL_{jx},$$
а также
\begin{equation}\label{Luu}
\LL_{1u}(\wxi,\ov\lambda)v(t)=\int_{t_0}^{t_1}\biggl(\sum_{j=0}^m\lambda_j
\wL_{ju}(t)\biggr)v(t)\,dt
-\la y^*,\wv_u(t)v(t)\ra=0.
\end{equation}

Пусть $y\in C([t_0,t_1],\mathbb R^{d_1})$, а $h\in C^1([t_0,t_1],\mathbb R^{d_1})$ является решением системы \eqref{eqyy} с начальным условием $h(t_0)=h_0$. Тогда из \eqref{Lyy} имеем
$$\la y^*,y\ra=-\int_{t_0}^{t_1}\wM(t)h(t)\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}
h(t_1).$$
Определим функцию $p$ как решение системы
\begin{equation}\label{LMM}
-\dot p-p\wv_x(t)+\wM(t)=0,
\end{equation}
удовлетворяющее условию $p(t_1)=-\wl_{\xi_1}$. Из \eqref{eqyy} получаем
$$p(t)\wv_x(t)h(t)=p(t)\dot h(t)-p(t)y(t).$$
Тогда, выражая $\wM$ из \eqref{LMM}, получаем
\begin{multline*}
\la y^*,y\ra=-\int_{t_0}^{t_1}(\dot p(t)+p(t)\wv_x(t))h(t)\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}h(t_1)\\
=-\int_{t_0}^{t_1}(\dot p(t)h(t)+p(t)\dot h(t)-p(t)y(t))\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}h(t_1)\\
=\int_{t_0}^{t_1}p(t)y(t)\,dt-\int_{t_0}^{t_1}\frac d{dt}(p(t)h(t))\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}h(t_1)\\
=\int_{t_0}^{t_1}p(t)y(t)\,dt+(p(t_0)-\wl_{\xi_0})h_0.
\end{multline*}
Полагая $h_0=0$, получаем, что
$$\la y^*,y\ra=\int_{t_0}^{t_1}p(t)y(t)\,dt,$$
а полагая $y=0$, в силу произвольности $h_0$ получаем, что $p(t_0)=\wl_{\xi_0}$.

Учитывая вид функционала $y^*$, из \eqref{Luu} имеем
$$\int_{t_0}^{t_1}\biggl(\sum_{j=0}^m\lambda_j
\wL_{ju}(t)-p(t)\wv_u(t)\biggr)v(t)\,dt=0.$$
В силу того, что это равенство справедливо для любой функции $v\in C([t_0,t_1],\mathbb R^{d_2})$, получаем, что
$$p(t)\wv_u(t)=\sum_{j=0}^m\lambda_j\wL_{ju}(t).$$
\end{proof}


\section{Задача со старшими производными. Уравнение Эйлера--Пуассона}

В качестве следствия теоремы, доказанной в предыдущем разделе, получим необходимые условия экстремума в задаче со старшими производными.

Пусть $[t_0,t_1]$ --- отрезок числовой прямой,  $G$ --- открытое
подмножество $\mathbb R^{n+2}$, $L\colon G\to\mathbb R$ --- непрерывная функция (переменные которой обозначаем  $t,x,\dot x,\ldots,x^{(n)}$) и
$x^{(k)}_j\in\mathbb R$, $k=0,1,\ldots,n-1$, $j=0,1$. Задача
\begin{multline}\label{EP}
J(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t),\ldots,x^{(n)}(t))\,dt\to\min,\\
x^{(k)}(t_j)=x^{(k)}_j,\quad k=0,1,\ldots,n-1,\quad j=0,1,
\end{multline}
называется {\it  задачей со старшими производными}.

Обозначим через $C^n([t_0,t_1])$ пространство всех $n$ раз непрерывно дифференцируемых функций $x$ на $[t_0,t_1]$ с нормой
$$\|x\|_{C^n([t_0,t_1])}=\max(\|x\|_{C([t_0,t_1])},\|\dot
x\|_{C([t_0,t_1])},\ldots,\|x^{(n)}\|_{C([t_0,t_1])}).$$
Функция $x\in C^n([t_0,t_1])$ называется {\it допустимой в задаче \eqref{EP}}, если
$$\Gamma(x)=\{(t,x(t),\dot x(t),\ldots,x^{(n)}(t))^T:t\in[t_0,t_1]\}\subset G$$
и $x^{(k)}(t_j)=x^{(k)}_j$, $k=0,1,\ldots,n-1$, $j=0,1$.

Допустимая функция $\wx$  называется {\it слабым локальным минимумом в задаче \eqref{EP}}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$, для которой $\|x-\wx\|_{C^n([t_0,t_1])}<\varepsilon$ выполняется неравенство
$J(x)\ge J(\wx)$.

\begin{theorem}[Необходимые условия минимума в задаче
\eqref{EP}. Уравнение Эйлера--Пуассона]
Пусть $\wx$ --- слабый локальный минимум в \eqref{EP}, функция $L$ непрерывна вместе с частными производными $L_{x^{(k)}}$ в окрестности $\Gamma(\wx)$, $\wL_{x^{(k)}}\in C^k([t_0,t_1])$, $k=1,\ldots,n-1$, и $\wL_{x^{(n)}}\in C^{n-1}([t_0,t_1])$. Тогда $\wL_{x^{(n)}}\in C^n([t_0,t_1])$ и для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлеpа--Пуассона
$$\sum_{k=0}^n(-1)^k\frac{d^k}{dt^k}\wL_{x^{(k)}}(t)=0.$$
\end{theorem}

\begin{proof}
Обозначая $x=x_1$, $\dot x_1=x_2$, \ldots, $\dot x_{n-1}=x_n$, $\dot x_n=u$,
задачу \eqref{EP} можно записать как задачу Лагранжа
\begin{multline}\label{EP1}
\int_{t_0}^{t_1}L(t,x_1(t),\ldots,x_n(t),u(t))\,dt\to\min,\\
\dot x_1=x_2,\ \ldots,\ \dot x_{n-1}=x_n,\ \dot x_n=u,\\ x_k(t_j)=x^{(k-1)}_j,\ k=1,\ldots,n,\ j=0,1.
\end{multline}
Простая проверка показывает, что если $\wx$ --- слабый локальный минимум в задаче \eqref{EP}, то вектор-функция $(\wx_1,\ldots,\wx_n,\wu)^T$ --- слабый локальный минимум в данной задаче. Согласно общей теореме~\ref{Lag} найдутся такие множители Лагранжа $\lambda_0$ и $p=(p_1,\ldots,p_n)\in C^1([t_0,t_1],(\mathbb R^n)^*)$, не равные одновременно нулю, что имеют место равенства
\begin{gather*}
-\dot p(t)=p(t)\wv_x(t)-\lambda_0\wL_x(t),\\
p(t)\wv_u(t)=\lambda_0\wL_u(t).
\end{gather*}
Поскольку $\varphi(t,x,u)=(x_2,\ldots,x_n,u)^T$, то эти равенства имеют вид
\begin{equation}\label{EPP}
\arraycolsep=0.08em
\begin{array}{rcl}
-\dot p_1(t)&=&-\lambda_0\wL_{x_1}(t),\\
-\dot p_2(t)&=&p_1(t)-\lambda_0\wL_{x_2}(t),\\
\hdotsfor{3}\\
-\dot p_n(t)&=&p_{n-1}(t)-\lambda_0\wL_{x_n}(t),\\
p_n(t)&=&\lambda_0\wL_u(t).
\end{array}
\end{equation}

Если $\lambda_0=0$, то сразу видно, что и $p=0$. Будем считать, что $\lambda_0=1$. Из второго равенства следует, что $p_2\in C^2([t_0,t_1])$, из третьего --- $p_3\in C^3([t_0,t_1])$, наконец, из предпоследнего --- $p_n\in C^n([t_0,t_1])$. Тогда из последнего равенства следует, что $\wL_{x^{(n)}}\in C^n([t_0,t_1])$.

Из соотношений \eqref{EPP} выводим (учитывая условия теоремы и переходя к прежним обозначениям: $x_1=x$, $x_2=\dot x$, \ldots, $x_n=x^{(n-1)}$, $u=x^{(n)}$), что
\begin{multline*}
\wL_x(t)=\dot p_1(t)=-\ddot p_2(t)+\frac d{dt}\wL_{\dot x}(t)=\ldots=(-1)^{n-1}p_n^{(n)}(t)\\
+\sum_{k=1}^{n-1}(-1)^{k-1}\frac{d^k}{dt^k}\wL_{x^{(k)}}(t)=
(-1)^{n-1}\frac{d^n}{dt^n}\wL_{x^{(n)}}(t)\\
+\sum_{k=1}^{n-1}(-1)^{k-1}\frac{d^k}{dt^k}\wL_{x^{(k)}}(t).
\end{multline*}
Это, очевидно, равносильно уравнению Эйлера--Пуассона.
\end{proof}

\section{Изопериметрическая задача}

Получим теперь необходимые условия экстремума в изопериметрической задаче.

Пусть $[t_0,t_1]$ --- отрезок числовой прямой,  $G$ --- открытое
подмножество $\mathbb R^{2d+1}$, функции $f_j\colon G\to\mathbb R$,
$j=0,1,\ldots,m$ (переменных $t\in\mathbb R$, $x\in\mathbb R^d$ и
$\dot x\in\mathbb R^d$) непрерывны на $G$, $\alpha_j\in\mathbb R$,
$j=1,\ldots,m$, и $x_j\in\mathbb R^d$, $j=0,1$. Задача
\begin{multline}\label{Iz}
J(x)=\int_{t_0}^{t_1}f_0(t,x(t),\dot x(t))\,dt\to\min,\\
\int_{t_0}^{t_1}f_j(t,x(t),\dot x(t))\,dt=\alpha_j,\
1\le j\le m,\quad x(t_0)=x_0,\quad x(t_1)=x_1
\end{multline}
называется {\it изопериметрической задачей}. Ясно, что это частный
случай задачи \eqref{Lag} (дифференциальная связь: $\dot x=u$).

Функция $x$ называется {\it допустимой в задаче \eqref{Iz}}, если  $x\in C^1([t_0,t_1],\mathbb R^d)$,
\begin{gather*}
\Gamma(x)=\{(t,x(t),\dot x(t))^T:t\in[t_0,t_1]\}\subset G,\\
\int_{t_0}^{t_1}f_j(t,x(t),\dot x(t))\,dt=\alpha_j,\ 1\le j\le
m,\quad x(t_j)=x_j,\ j=0,1.
\end{gather*}
Допустимая функция $\wx$  называется {\it слабым локальным минимумом} в задаче \eqref{Iz}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$, для которой $\|x-\wx\|_{C^1([t_0,t_1],\mathbb
R^d)}<\varepsilon$ выполняется неравенство $J(x)\ge J(\wx)$.

Положим
$$L(t,x,\dot x,\ov\lambda)=\sum_{j=0}^m\lambda_jf_j(t,x,\dot x),\quad\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m).$$

\begin{theorem}[Необходимые условия минимума в задаче \eqref{Iz}]
Пусть $\wx$ доставляет слабый локальный минимум в задаче \eqref{Iz}. Тогда, если  функции $f_j$, $j=0,1,\ldots,m$, непрерывны вместе со своими частными производными по $x$ и $\dot x$ в окрестности $\Gamma(\wx)$, то найдется такой ненулевой набор множителей Лагранжа
$\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$, что $\wL_{\dot x}\in C^1([t_0,t_1],\mathbb R^d)$ и для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлеpа
\begin{equation}\label{IzE}
-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0.
\end{equation}
\end{theorem}

\begin{proof}
Рассмотрим следующую задачу Лагранжа
\begin{multline}\label{Iz1}
\int_{t_0}^{t_1}f_0(t,x(t),u(t))\,dt\to\min,\quad \dot x=u,\\
\int_{t_0}^{t_1}f_j(t,x(t),u(t))\,dt=\alpha_j,\
1\le j\le m,\quad x(t_0)=x_0,\quad x(t_1)=x_1.
\end{multline}
Несложная проверка показывает, что если $\wx$ --- слабый локальный экстремум в задаче \eqref{Iz}, то $(\wx,\wu)$, где $\wu=\dot{\wx}$, --- слабый локальный экстремум в данной задаче.

Согласно теореме о необходимых условиях минимума в задаче \eqref{Lag} найдутся такие множители Лагранжа $(\lambda_0,\lambda_1,\ldots,\lambda_m)$ и $p\in C^1([t_0,t_1],(\mathbb R^d)^*)$, не все равные нулю, что
\begin{gather*}
-\dot p=p\wv_x(t)-\sum_{j=0}^m\lambda_jf_{jx}(t,\wx,\wu),\\
p(t)\wv_u(t)=\sum_{j=0}^m\lambda_jf_{ju}(t,\wx,\wu).
\end{gather*}
Поскольку $\varphi(t,x,u)=u$, то получаем равенства
\begin{gather*}
-\dot p=-\sum_{j=0}^m\lambda_jf_{jx}(t,\wx,\wu),\\
p(t)=\sum_{j=0}^m\lambda_jf_{ju}(t,\wx,\wu).
\end{gather*}
Подставляя в эти равенства $\dot\wx$ вместо $\wu$ убеждаемся, что
$\wL_{\dot x}\in C^1([t_0,t_1],\mathbb R^d)$ и имеет место равенство \eqref{IzE}.
\end{proof}

\chapter{Оптимальное управление}

\section{Задачи оптимального управления}

Вариационное исчисление, как уже говорилось, интенсивно развивалось в 18 веке (в основном усилиями Эйлера, Лагранжа и Лежандра). В 19 веке в его развитии приняли участие такие математики как Пуассон, Вейерштрасс, Гильберт и Пуанкаре. К началу 20 века предмет, в существенном, оказался исчерпанным. Построение теории экстремума (как она представлялась в те времена), казалось, завершено. Но впоследствии появились выпуклые задачи, а затем, в начале 50-х годов прошлого века родилось оптимальное управление --- новое направление в теории экстремума, охватывающее вариационное исчисление. Необходимые условия экстремума в задачах оптимального управления были получены в школе Л.~С.~Понтрягина. Основной результат называется принципом максимума Понтрягина. В этом разделе рассматривается задача оптимального управления и доказываются для нее необходимые условия минимума.

Пусть $[t_0,t_1]$ --- конечный отрезок, $G$ --- открытое подмножество $\mathbb R\times\mathbb R^{d_1}$, $U$ --- непустое подмножество $\mathbb R^{d_2}$, функция $f\colon G\times U\to\mathbb R$ и отображение $\varphi\colon G\times U\to\mathbb R^{d_1}$ (переменных $t\in\mathbb R$, $x=(x_1,\ldots,x_{d_1})^T\in\mathbb R^{d_1}$ и $u=(u_1,\ldots,u_{d_2})^T\in\mathbb R^{d_2}$) непрерывны на $G\times U$ и $x_0,x_1\in\mathbb R^{d_1}$. Задача
\begin{multline}\label{OU}
J(x,u)=\int_{t_0}^{t_1} f(t,x(t),u(t))\,dt\to\min,\quad\dot
x=\varphi(t,x,u),\\
u(t)\in U,\quad x(t_0)=x_0,\quad x(t_1)=x_1
\end{multline}
называется {\it задачей оптимального управления}. Переменную $x$ часто называют фазовой переменной, а $u$ --- управлением.

Уточним постановку. Пусть $PC^1([t_0,t_1],\mathbb R^{d_1})$ --- совокупность всех кусочно-непрерывно дифференцируемых, а $PC([t_0,t_1],\mathbb R^{d_2})$ --- кусочно-непрерывных функций на $[t_0,t_1]$ со значениями соответственно в $\mathbb R^{d_1}$ и $\mathbb R^{d_2}$. Пара $(x,u)\in PC^1([t_0,t_1],\mathbb R^{d_1})\times
PC([t_0,t_1],\mathbb R^{d_2})$ называется {\it допустимой в задаче \eqref{OU}}, если
$$\Gamma(x)=\{\,(t,x(t)):t\in[t_0,t_1]\,\}\subset G,$$
включение $u(t)\in U$ и равенство $\dot x(t)=\varphi(t,x(t),u(t))$ выполняются для всех $t\in [t_0,t_1]$, где функция $u$ непрерывна и $x(t_0)=x_0$, $x(t_1)=x_1$.


\section{Принцип максимума}

Допустимая пара $(\wx,\wu)$ называется {\it сильным локальным минимумом в задаче \eqref{OU}}, если существует такое $\varepsilon>0$, что для любой допустимой пары $(x,u)$, для которой $\|x-\wx\|_{C([t_0,t_1],\mathbb R^{d_1})}<\varepsilon$ выполнено неравенство $J(x,u)\ge J(\wx,\wu)$.

Функцией Лагранжа для задачи \eqref{OU} будем называть функцию
$$\LL(x,u,\ov\lambda)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t),u(t),\lambda_0,p(t))\,dt,$$
где
$$L(t,x,\dot x,u,\lambda_0,p)=\lambda_0f(t,x,u)+p(\dot
x-\varphi(t,x,u)).$$

Функцию
$$H(t,x,u,\lambda_0,p)=p\varphi(t,x,u)-\lambda_0f(t,x,u)$$
называют {\it функцией  Понтрягина задачи \eqref{OU}}.

\begin{theorem}[Необходимые условия минимума в задаче \eqref{OU}. Принцип максимума Понтрягина]\label{PPM}
Пусть $(\wx,\wu)$ доставляет сильный локальный минимум в задаче \eqref{OU}. Тогда, если функция $f$ и отображение $\varphi$ непрерывны вместе со своими частными производными по $x$ в $G\times U$, то найдется ненулевой набор множителей Лагранжа $\ov\lambda=(\lambda_0,p)\in \mathbb R\times PC^1([t_0,t_1],(\mathbb R^{d_1})^*)$ такой, что выполнено условие стационарности по $x$
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0\ \Leftrightarrow\ -\dot p=p\wv_x(t)-\lambda_0\wf_{x}(t)$$
и в точках непрерывности $\wu$ условие минимума по $u$
\begin{equation}\label{PM}
\min_{u\in U}L(t,\wx(t),\dot {\wx}(t),u,\lambda_0,p(t))=L(t,\wx(t),\dot{\wx}(t),\wu(t),
\lambda_0,p(t)).
\end{equation}
\end{theorem}

Условие \eqref{PM} может быть записано в виде условия максимума по $u$
$$\max_{u\in U}H(t,\wx(t),u,\lambda_0,p(t))=H(t,\wx(t),\wu(t),\lambda_0,p(t)).$$
В силу этого соотношения необходимые условия в задаче
оптимального управления и называют ``Принципом максимума Понтрягина''.


Сформулированная задача оптимального управления не самая общая, но достаточно представительная. Мы получим необходимые условия для более простого варианта, когда правый конец свободен, т.~е. получим необходимые условия минимума в задаче
\begin{multline}\label{PM1}
J(x,u)=\int_{t_0}^{t_1} f(t,x(t),u(t))\,dt\to\min,\quad\dot
x=\varphi(t,x,u),\\ u(t)\in U,\quad x(t_0)=x_0.
\end{multline}
Эти условия минимума те же, что и в задаче \eqref{OU}, но добавляется еще условие трансверсальности $p(t_1)=0$.


Для доказательства теоремы нам потребуются две леммы. Далее считаем, что функции $f$ и $\varphi$ удовлетворяют условиям теоремы~\ref{PPM}.

\begin{figure}[h]
$$\begin{picture}(200,140)
\put(10,10){\vector(1,0){160}}
\put(20,0){\vector(0,1){135}}
\put(165,0){$t$}
\put(10,129){$u$}
\put(20,10){\circle*{2}}
\put(10,0){$0$}
\put(100,10){\circle*{2}}
\put(80,10){\circle*{2}}
\put(44,56){$\wu(t)$}
\put(122,84){$\wu(t)$}
\put(89,112){$v$}
\put(79,59.7){\vector(3,1){1}}
\put(100,10){\line(0,1){100}}
\put(80,110){\vector(1,0){20}}
\put(80,10){\line(0,1){100}}
\qbezier(28,30)(50,50)(80,60)
\qbezier(100,68)(130,80)(160,82)
\put(80,110){\vector(1,0){20}}
\put(70,0){$\tau$}
\put(74,0){$\scriptscriptstyle-$}
\put(80,0){$\alpha$}
\put(98,0){$\tau$}
\end{picture}$$
\caption{}\label{4ris}
\end{figure}

Пусть $(\wx,\wu)$ --- допустимая пара в задаче \eqref{OU} $($или \eqref{PM1}$)$, $\tau\in (t_0,t_1)$ --- точка непрерывности $\wu$, $\alpha>0$ столь мало, что функция $\wu$ непрерывна на $[\tau-\alpha,\tau]$ и $v\in U$. Положим
$$u_\alpha(t,\tau,v)=\begin{cases}
\wu(t),&t\notin[\tau-\alpha,\tau),\\
v,&t\in[\tau-\alpha,\tau).\end{cases}$$
Функцию $u_\alpha(t,\tau,v)$ называют {\it игольчатой вариацией} $\wu$, а пару $(\tau,v)$ --- {\it иголкой}.

\begin{lemma}[об игольчатой вариации]
Найдется такое $\alpha_0>0$, что для любого $0\le\alpha<\alpha_0$ существует единственное решение $x_\alpha(t,\tau,v)$ задачи Коши
$$\dot x=\varphi(t,x,u_\alpha(t,\tau,v)),\quad  x(t_0)=x_0,$$
определенное на всем отрезке $[t_0,t_1]$, причем $x_\alpha(t,\tau,v)=\wx(t)$ при $t\in[t_0,\tau-\alpha]$ и, кроме того, при $\alpha\to0$
\begin{itemize}
\item[1)] функция $x_\alpha(t,\tau,v)\to\wx(t)$ в метрике пространства $C([t_0,t_1],\mathbb R^{d_1})$;
\item[2)] функция
$$\frac{x_\alpha(t,\tau,v)-\wx(t)}\alpha\to y_{\tau v}(t)$$
в метрике пространства $C([\tau,t_1],\mathbb R^{d_1})$, где функция $y_{\tau v}$ в точках непрерывности $\wu$, лежащих на отрезке $[\tau,t_1]$, удовлетворяет уравнению
\begin{equation}\label{eIg}
\dot y_{\tau v}=\wv_x(t)y_{\tau v}
\end{equation}
с начальным условием
\begin{equation}\label{eIgg}
y_{\tau v}(\tau)=\varphi(\tau,\wx(\tau),v)-\varphi(\tau,\wx(\tau),
\wu(\tau)).
\end{equation}
\end{itemize}
\end{lemma}

\begin{lemma}[о производной функционала]
Пусть $(\wx,\wu)$ --- допустимая пара в задаче \eqref{OU} $($или \eqref{PM1}$)$. Тогда для функции $$J(\alpha)=J(x_\alpha(t,\tau,v),u_\alpha(t,\tau,v))$$
имеет место равенство
\begin{equation}\label{eIg1}
J'(0+0)=\Delta_{\tau v}f+\int_{\tau}^{t_1}\wf_x(t)y_{\tau v}(t)\,dt,
\end{equation}
где $\Delta_{\tau v}f=f(\tau,\wx(\tau),v)- f(\tau,\wx(\tau),\wu(\tau))$ и $y_{\tau v}$ --- решение задачи \eqref{eIg}--\eqref{eIgg}.
\end{lemma}

\begin{proof}
Имеем
\begin{multline*}
J'(0+0)=\lim_{\alpha\to0+0}\frac{J(\alpha)-J(0)}\alpha\\
=\lim_{\alpha\to0+0}\frac1\alpha\int_{\tau-\alpha}^\tau(f(t,
x_\alpha(t,\tau,v),v)-f(t,\wx(t),\wu(t)))\,dt\\
+\lim_{\alpha\to0+0}\frac1\alpha\int_\tau^{t_1}(f(t,
x_\alpha(t,\tau,v),\wu(t))-f(t,\wx(t),\wu(t)))\,dt.
\end{multline*}
Имеем в силу дифференцируемости $f$ по $x$
\begin{multline*}
f(t,x_\alpha(t,\tau,v),\wu(t))-f(t,\wx(t),\wu(t))\\
=\wf_x(t)[x_\alpha
(t,\tau,v)-\wx(t)]+o(x_\alpha(t,\tau,v)-\wx(t)).
\end{multline*}
Поэтому
%\begin{multline*}
$$\lim_{\alpha\to0+0}\frac1\alpha\int_\tau^{t_1}(f(t,
x_\alpha(t,\tau,v),\wu(t))-f(t,\wx(t),\wu(t)))\,dt
=\int_\tau^{t_1}\wf_x(t)y_{\tau v}(t)\,dt.$$
%\end{multline*}
К первому интегралу применим теорему о среднем для интегралов и тогда в итоге получим
\begin{multline*}
J'(0+0)=\lim_{\alpha\to0+0}(f(\xi,x_\alpha(\xi,\tau,v),v)-f(\xi,
\wx(\xi),\wu(\xi)))\\+\int_{\tau}^{t_1}\wf_x(t)y_{\tau v}(t)\,dt,
\end{multline*}
где $\xi\in[\tau-\alpha,\tau]$. Когда $\alpha\to0+0$, то, очевидно, $\xi\to\tau$, $x_\alpha(\xi,\tau,v)\to\wx(\tau)$ согласно лемме об игольчатой вариации, а $\wu(\xi)\to\wu(\tau)$, так как $\wu$ непрерывна в точке $\tau$. Формула \eqref{eIg1} доказана.
\end{proof}

\section{Доказательство принципа максимума}

\begin{proof}[Доказательство принципа максимума]
Пусть $(\wx,\wu)$ --- сильный локальный минимум в задаче \eqref{PM1}. Обозначая через $p$ --- решение линейной системы
\begin{equation}\label{Piii}
-\dot p=p\wv_x(t)-\wf_x(t),\quad p(t_1)=0,
\end{equation}
получаем условие стационарности по $x$ и условие трансверсальности.

Так как пара $(\wx,\wu)$ доставляет минимум, то необходимо $J'(0+0)\ge0$, или согласно \eqref{eIg1}
$$\Delta_{\tau v}f+\int_\tau^{t_1}\wf_x(t)y_{\tau v}(t)\,dt\ge0.$$
Подставим сюда вместо функции $\wf_x$ ее выражение из \eqref{Piii}, а затем вместо функции $\wv_xy_{\tau v}$ ее выражение из \eqref{eIg} и, учитывая, что $p(t_1)=0$, а $y_{\tau v}(\tau)=\varphi(\tau,\wx(\tau),v)-\varphi(\tau,\wx(\tau), \wu(\tau))$, будем иметь
\begin{multline*}
0\le\Delta_{\tau v}f+\int_{\tau}^{t_1}(\dot p(t)y_{\tau v}(t)+p(t)\dot
y_{\tau v}(t))\,dt=\Delta_{\tau v}f+p(t)y_{\tau v}(t)|_\tau^{t_1}\\=f(\tau,\wx(\tau),v)- f(\tau,\wx(\tau),\wu(\tau))\\
-p(\tau)(\varphi(\tau,\wx(\tau),v)-\varphi(\tau,\wx(\tau),\wu(\tau))),
\end{multline*}
или
\begin{multline*}
p(\tau)\varphi(\tau,\wx(\tau),v)-f(\tau,\wx(\tau),v)\\
\le p(\tau)\varphi(\tau,\wx(\tau),\wu(\tau))-f(\tau,\wx(\tau),\wu(\tau))
\end{multline*}
Таким образом, для любой точки $\tau$, где функция $\wu$ непрерывна, максимум выражения слева по всем $v\in U$ достигается в точке $\wu(\tau)$. Это и есть условие максимума из теоремы.
\end{proof}


\section[Необходимые условия сильного экстремума]{Необходимые условия сильного экстремума
в простейшей задаче вариационного исчисления. Условие Вейрштрасса и Лежандра}

Чтобы не усложнять выкладки, всюду далее будем иметь дело с классическим (скалярным) вариантом простейшей задачи вариационного исчисления, хотя все доказываемые утверждения справедливы и для векторного варианта. Для определенности будем рассматривать задачу на минимум
\begin{equation}\label{WW}
J(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t))\,dt\to\min,\quad x(t_j)=x_j,\ j=0,1.
\end{equation}

Здесь $[t_0,t_1]$ --- отрезок числовой прямой, непрерывная функция $L$ переменных $t\in\mathbb R$, $x\in\mathbb R$ и $\dot x\in\mathbb R$ определена на множестве $G\times\mathbb R$, где $G\subset\mathbb R^2$ --- открытое множество и $x_j\in\mathbb R$, $j=0,1$.

Напомним также, что функция $x\in C^1([t_0,t_1])$ называется {\it допустимой в задаче \eqref{WW}}, если
$$\Gamma(x)=\{\,((t,x(t))^T,\dot x(t)):t\in[t_0,t_1]\,\}\subset G\times\mathbb R$$
и $x(t_j)=x_j$, $j=0,1$, и допустимая функция $\wx$  называется {\it слабым локальным минимумом} в задаче \eqref{WW}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$,
для которой $\|x-\wx\|_{C^1([t_0,t_1]}<\varepsilon$ выполняется неравенство $J(x)\ge J(\wx)$.

В вариационном исчислении, наряду со слабым экстремумом, рассматривают еще и сильный
локальный экстремум, где близость функций измеряется в пространстве $C([t_0,t_1])$.
Точнее говоря, обозначим через $PC^1([t_0,t_1])$ пространство кусочно-непрерывно-дифференцируемых функций на $[t_0,t_1]$. Функция $x\in PC^1([t_0,t_1])$ называется допустимой в задаче \eqref{WW}, если для всех точек непрерывности функции $\dot x$ выполнено условие $(t,x(t),\dot x(t))\in G$ и, кроме того, $x(t_j)=x_j$, $j=0,1$. Скажем, что допустимая функция $\wx$ доставляет {\it сильный локальный минимум} в задаче \eqref{WW}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$, для которой $\|x-\wx\|_{C([t_0,t_1])}<\varepsilon$ выполняется неравенство $J(x)\ge J(\wx)$.

Заметим, что если функция $\wx$ доставляет сильный минимум в задаче \eqref{WW} и при этом $\wx\in C^1([t_0,t_1])$, то $\wx$ является и слабым минимумом в этой задаче. Действительно, пусть $\varepsilon>0$ такое, что как только $x\in PC^1([t_0,t_1])$ и $\|x-\wx\|_{C([t_0,t_1])}<\varepsilon$, то $J(x)\ge J(\wx)$. Если теперь $x\in C^1([t_0,t_1])$ и $\|x-\wx\|_{C^1([t_0,t_1])}<\varepsilon$, то так как, в частности, $x\in PC^1([t_0,t_1])$ и $\|x-\wx\|_{C([t_0,t_1])}\le\|x-\wx\|_{C^1([t_0,t_1])}<\varepsilon$,
получаем, что $J(x)\ge J(\wx)$.

Таким образом, необходимые условия слабого минимума для $\wx\in C^1([t_0,t_1])$ являются необходимыми условиями и сильного минимума.

Функция, для которой выполнено уравнение Эйлера называется {\it экстремалью} (или {\it стационарной точкой}) задачи.

Пусть $\wx$ --- экстремаль в задаче \eqref{WW} и существует
$$\wL_{\dot x\dot x}(t)=L_{\dot x\dot x}(t,\wx(t),\dot {\wx}(t)).$$
Говорят, что на функции $\wx$ выполнено {\it условие Лежандра}, если
$\wL_{\dot x\dot x}(t)\ge0$ для всех $t\in[t_0,t_1]$  и {\it усиленное условие Лежандра}, если $\wL_{\dot x\dot x}(t)>0$ для всех $t\in[t_0,t_1]$.

Пусть $f\colon\mathbb R\to\mathbb R$ --- дифференцируемая функция. Функция
$$\mathcal E(x,x')= f(x')-f(x)-f'(x)(x'-x)$$
называется {\it функцией Вейерштрасса} (соответствующей функции $f$). Геометрически, $\mathcal E(x,x')$ --- разность между значением функции $f$ и функции $g(y)=f(x)+f'(x)(y-x)$ (график которой есть касательная к графику функции $f$ в точке $x$) в точке $x'$.

Если $f$ --- выпуклая функция, то ${\mathcal E}(x,x')\ge0$ для всех $x,x'\in\mathbb R$. Действительно, пусть $x,x'\in\mathbb R$ и $0<\alpha<1$. По неравенству Йенссена
$$f((1-\alpha)x+\alpha x')\le(1-\alpha)f(x)+\alpha f(x'),$$
откуда
$$\alpha^{-1}(f(x+\alpha(x'-x))-f(x))\le f(x')-f(x).$$
Переходя к пределу при $\alpha\to0$, получаем, что $f(x')-f(x)\ge f'(x)(x'-x)$.

Пусть $L$ --- интегрант в задаче \eqref{WW}. Если $L$ --- дифференцируемая функция по $\dot x$ на множестве $G\times\mathbb R$, то функция
$${\mathcal E}(t,x,\dot x,u)= L(t,x,u)-L(t,x,\dot x)-L_{\dot x}(t,x,\dot x)(u-\dot x),$$
определенная на $G\times\mathbb R\times\mathbb R$, называется {\it функцией Вейерштрасса функционала $J$}. Ясно, что при каждых $t$ и $x$
--- это функция Вейерштрасса, соответствующая функции $G(\dot x)=L(t,x,\dot x)$.

Говорят, что на экстремали $\wx$ выполнено {\it условие Вейрштрасса}, если ${\mathcal E}(t,\wx(t),\dot{\wx}(t),u)\ge0$ для всех $u\in\mathbb R$ и $t\in[t_0,t_1]$.

\begin{theorem}[Необходимые условия сильного минимума в задаче \eqref{WW}]
Пусть функция $\wx\in C^1([t_0,t_1])$ доставляет сильный локальный минимум в задаче \eqref{WW}. Тогда, если интегрант $L$ непрерывен вместе с частными производными по $x$ и $\dot x$ в $G\times\mathbb R$,
то
\begin{itemize}
\item[$(a)$] для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлера
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0;$$
\item[$(b)$] выполнено условие Вейерштрасса, т.~е. для всех $t\in[t_0,t_1]$ и $u\in\mathbb R$ справедливо неравенство
$${\mathcal E}(t,\wx(t),\dot{\wx}(t),u)\ge0;$$
\item[$(c)$] если существует $\wL_{\dot x\dot x}$, то выполнено условие Лежандра, т.~е. $\wL_{\dot x\dot x}(t)\ge0$ для всех
$t\in [t_0,t_1]$.
\end{itemize}
\end{theorem}

\begin{proof}
Запишем задачу \eqref{WW} как задачу оптимального управления
\begin{equation}\label{WW2}
\int_{t_0}^{t_1}L(t,x(t),u(t))\,dt\to\min,\quad\dot x=u,\quad
x(t_0)=x_0,\ x(t_1)=x_1.
\end{equation}
Легко видеть, что $\wx$ доставляет сильный локальный минимум в \eqref{WW} тогда и только тогда, когда пара $(\wx,\wu)$, где $\wu=\dot\wx$ является сильным локальным минимумом в \eqref{WW2}.

Согласно принципу максимума (теорема~\ref{PPM}) найдутся такой ненулевой набор множителей Лагранжа $\ov\lambda=(\lambda_0,p)\in\mathbb R\times PC^1([t_0,t_1])$, что для всех $t\in[t_0,t_1]$ выполнено условие стационарности по $x$
\begin{equation}\label{WWS}
-\dot p(t)+\lambda_0\wL_x(t)=0
\end{equation}
и условие минимума по $u$
\begin{equation}\label{WWSU}
\min_{u\in\mathbb R}\left(\lambda_0L(t,\wx(t),u)-p(t)u\right)=
\lambda_0L(t,\wx(t),\dot{\wx}(t))-p(t)\dot{\wx}(t).
\end{equation}

Если $\lambda_0=0$, то $p=\const$ вследствие \eqref{WWS}. Тогда из \eqref{WWSU} следует, что эта константа обязана быть нулевой и тем самым все множители Лагранжа нулевые. Итак, $\lambda_0\ne0$ и можно считать, что $\lambda_0=1$.

Условие \eqref{WWSU} означает, что для всех $t\in[t_0,t_1]$ функция $f(u)=L(t,\wx(t),u)-p(t)u$ на $\mathbb R$ достигает минимума в точке $\dot{\wx}(t)$ и, следовательно, по теореме Ферма производная этой функции в данной точке равна нулю, т.~е. $p(t)=\wL_{\dot x}(t)$. Вместе с \eqref{WWS} это дает уравнение Эйлера.

Необходимое условия минимума второго порядка  функции $f$ заключаются в том, что
$\widehat L_{\dot x\dot x}(t)\ge0$, т.~е. выполнено условие Лежандра.

Из соотношения \eqref{WWSU} и доказанного равенства $p(t)=\wL_{\dot x}(t)$ следует, что
$$L(t,\wx(t),u)-L_{\dot x}(t,\wx(t),\dot{\wx}(t))u\ge L(t,\wx(t),\dot{\wx}(t))- L_{\dot x}(t,\wx(t),\dot{\wx}(t))\dot {\wx}(t)$$
для всех $u\in\mathbb R$ и $t\in[t_0,t_1]$ или, что
то же
$$L(t,\wx(t),u)-L(t,\wx(t),\dot{\wx}(t))-L_{\dot x}(t,\wx(t),\dot{\wx}(t))(u-\dot{\wx}(t))\ge0,$$
т.~е. выполнено условие Вейерштрасса.
\end{proof}

\section[Необходимые условия слабого экстремума]{Необходимые условия слабого экстремума
в простейшей задаче вариационного исчисления. Условие Якоби}

Предположим, что $\wx$ --- экстремаль задачи \eqref{WW} и выполнено условие:
\begin{multline}\label{E*}
L\mbox{ \ непрерывна вместе с \ }L_x,\ L_{\dot x},\ L_{xx},\ L_{x\dot x},\ L_{\dot xx},\ L_{\dot x\dot x}\\
\mbox{в некоторой окрестности \ }\Gamma(\wx).
\end{multline}
Пусть $h\in C^1([t_0,t_1])$, $h(t_0)=h(t_1)=0$. Рассмотрим функцию (одного переменного)
\begin{equation}\label{WW*}
\varphi(\lambda)=\int_{t_0}^{t_1}L(t,\wx(t)+\lambda h(t),\dot{\wx}(t)+\lambda\dot h(t))\,dt.
\end{equation}
Тогда для достаточно малых по модулю $\lambda$
\begin{multline*}
\varphi'(\lambda)=\int_{t_0}^{t_1}(L_x(t,\wx(t)+\lambda h(t),\dot\wx(t)+\lambda\dot h(t))h(t)\\
+L_{\dot x}(t,\wx(t)+\lambda h(t),\dot\wx(t)+\lambda\dot h(t))\dot h(t))\,dt
\end{multline*}
и дифференцируя еще раз, получаем, что
\begin{multline*}
\varphi''(0)=\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+\wL_{x \dot
x}(t)h(t)\dot h(t)+\wL_{\dot x x}(t)\dot h(t)h(t)\right.\\
\left.+\wL_{\dot x \dot x}(t)\dot h^2(t)\right)dt=\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+2\wL_{x\dot x}(t)h(t)\dot h(t)\right.\\
\left.+\wL_{\dot x\dot x} (t)\dot h^2(t)\right)dt.
\end{multline*}
Функционал $\varphi''(0)$ (как функцию от $h$) обозначим через $Q(h)$
и рассмотрим задачу
$$Q(h)\to\min,\quad h(t_0)=h(t_1)=0.$$
Уравнение Эйлера для данной задачи имеет вид
$$-\frac d{dt}\left(\wL_{\dot xx}(t)h(t)+\wL_{\dot x\dot x}(t)\dot
h(t)\right)+\wL_{xx}(t)h(t)+\wL_{x\dot x}(t)\dot h(t)=0$$
и называется {\it уравнением Якоби} исходной задачи \eqref{WW}.

Пусть на $\wx$ выполнено усиленное условие Лежандра. Точка $\tau\in(t_0,t_1]$ называется {\it сопряженной точкой к $t_0$}, если
существует нетривиальное решение $h$ уравнения Якоби, для которого
$h(t_0)=h(\tau)=0$.

Говорят, что на $\wx$ выполнено {\it условие Якоби}, если в интервале
$(t_0,t_1)$ нет точек сопряженных к $t_0$ и {\it усиленное условие Якоби}, если полуинтервал $(t_0,t_1]$ не содержит точек сопряженных к $t_0$.

При доказательстве необходимых условий слабого минимума в задаче \eqref{WW} нам понадобится один несложный технический результат, который приводим без доказательства (см. \cite[стр. 69]{ATF}).

\begin{lemma}[о скруглении углов]
Пусть в задаче \eqref{WW} интегрант $L$ непрерывен по совокупности переменных. Тогда
\begin{multline*}
\inf\{\,J(x):x\in PC^1([t_0,t_1])\ x(t_0)=x_0,\ x(t_1)=x_1\,\}\\=\inf\{\,J(x):x\in C^1([t_0,t_1]),\ x(t_0)=x_0,\ x(t_1)=x_1\,\}.
\end{multline*}
\end{lemma}

\begin{theorem}[Необходимые условия слабого минимума в задаче \eqref{WW}]
Пусть $\wx\in C^1([t_0,t_1])$ доставляет слабый локальный минимум в задаче \eqref{WW}. Тогда, если выполнено условие \eqref{E*}, то для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлера, условие Лежандра и в случае выполнения усиленного условия Лежандра --- условие Якоби.
\end{theorem}

\begin{proof}
Уравнение Эйлера, как необходимое условие слабого экстремума, уже было доказано раньше. Доказательство, заключается в том, что если $\wx$
--- локальный минимум, то ноль есть локальный минимум для функции $\varphi$, определенной соотношением \eqref{WW*} и тогда необходимо $\varphi'(0)=0$. Расшифровка этого условия и приводит к уравнению Эйлера.

Докажем условие Лежандра, расшифровывая необходимое условие минимума второго порядка $\varphi''(0)\ge0$. Согласно формуле для $\varphi''(0)$, выписанной выше, данное условие равносильно тому, что $Q(h)\ge0$ для всех $h\in C^1([t_0,t_1])$ таких, что $h(t_0)=h(t_1)=0$. Это означает, что функция $\wh=0$ есть слабый абсолютный минимум в задаче
\begin{multline}\label{QQi}
Q(h)=\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+2\wL_{x \dot
x}(t)h(t)\dot h(t)\right.\\
\left.+\wL_{\dot x\dot x}(t)\dot h^2(t)\right)\,dt \to\min,\quad
h(t_0)=h(t_1)=0.
\end{multline}
По лемме о скруглении углов $\wh=0$ доставляет и сильный абсолютный минимум в этой задаче. Тогда, по уже доказанному, на $\wh$ должно выполняться условие Лежандра, которое в данном случае имеет тот же вид $\wL_{\dot x\dot x}(t)\ge0$.

Докажем условие Якоби. Предположим противное, что существует точка $\tau\in(t_0,t_1)$ и нетривиальное решение $\ov h$ уравнения Якоби такое, что $\ov h(t_0)=\ov h(\tau)=0$. Пусть функция $\widetilde h$ такова, что $\widetilde h(t)=\ov h(t)$, если $t_0\le t\le\tau$ и $\widetilde h(t)=0$, если $\tau\le t\le t_1$. Заметим, что $\dot{\ov h}(\tau)\ne0$, так как в противном случае, по теореме единственности, функция $\ov h$ была бы тождественным нулем. Далее, интегрируя по частям ($\ov h(t_0)=\ov h(\tau)=0$), получим
\begin{multline*}
Q(\widetilde h)=\int_{t_0}^{\tau}\left(\wL_{xx}(t)\ov h^2(t)+2\wL_{\dot x x}(t)\ov h(t)\dot {\ov h}(t)+\widehat L_{\dot x
\dot x}(t)\dot{\ov h}^2(t)\right)\,dt\\
=\int_{t_0}^{\tau}\left(\wL_{xx}(t)\ov h(t)+\wL_{x\dot x}(t)\dot
{\ov h}(t)\right)\ov h(t)\,dt+\int_{t_0}^{\tau}\left(\wL_{\dot x x}(t)\ov h(t)\right.\\
\left.+\wL_{\dot x\dot x}(t)\dot{\ov h}(t)\right)\dot{\ov h}(t)\,dt
=\int_{t_0}^{\tau}\left(-\frac d{dt}\left(\wL_{\dot xx}(t)\ov h(t)+\wL_{\dot x\dot x}(t)\dot{\ov h}(t)\right)\right.\\
\left.+\wL_{xx}(t)\ov h(t)+\wL_{x\dot x}(t)\dot {\ov h}(t)\right)\ov h(t)\,dt.
\end{multline*}
Поскольку $\ov h$ удовлетворяет уравнению Якоби, то отсюда следует, что
$Q(\widetilde h)=0$. Это означает, что наряду с $\widehat h=0$, функция
$\widetilde h$ также доставляет сильный минимум в задаче \eqref{QQi}. Запишем эту задачу как задачу оптимального управления
\begin{multline*}
\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+2\wL_{\dot x
x}(t)h(t)u(t)+\wL_{\dot x\dot x}(t)u^2(t)\right)\,dt \to\min,\\
\dot h=u,\quad h(t_0)=h(t_1)=0.
\end{multline*}
Согласно принципу максимума найдутся такие множители Лагранжа $\lambda_0$ и $p\in PC^1([t_0,t_1])$, не равные одновременно нулю, что
выполнено условие стационарности по $h$
$$-\dot p(t)+2\lambda_0\wL_{xx}(t)\widetilde h(t)+2\lambda_0\wL_{\dot x
x}(t)\dot {\widetilde h}(t)=0$$
и условие минимума по $u$
\begin{multline}\label{QQii}
\min_{u\in\mathbb R}(2\lambda_0\wL_{\dot xx}(t)\widetilde h(t)u+\lambda_0\wL_{\dot x\dot x}(t)u^2-p(t)u)\\
=2\lambda_0\wL_{\dot xx}(t)\widetilde h(t)\dot{\widetilde h}(t)+\lambda_0\wL_{\dot x\dot x}(t)\dot{\widetilde h}^2(t)-p(t)\dot{\widetilde h}(t).
\end{multline}
Как и раньше проверяется, что $\lambda_0\ne0$. Пусть $\lambda_0=1/2$.

Из \eqref{QQii} следует, что для каждого $t\in[t_0,t_1]$ дифференцируемая на $\mathbb R$ функция
$$f(u)=\wL_{\dot xx}(t)\widetilde h(t)u+(1/2)\wL_{\dot x\dot x}(t)u^2-p(t)u$$
достигает минимума в точке $\dot{\widetilde h}$. Следовательно, по теореме Ферма, ее производная в этой точке равна нулю
\begin{equation}\label{QQiii}
p(t)=\wL_{\dot xx}(t){\widetilde h}(t)+\wL_{\dot x\dot x}(t)\dot{\widetilde h}(t).
\end{equation}
По определению $\widetilde h(t)=0$, если $t\ge\tau$  и поэтому из \eqref{QQiii} вытекает, что $p(\tau+0)=0$. Но функция $p$ непрерывна и поэтому (снова из \eqref{QQiii}) получаем $0=p(\tau-0)=\wL_{\dot x\dot x}(\tau)\dot{\widetilde h}(\tau-0)=\wL_{\dot x\dot x}(\tau)\dot{\ov h}(\tau)\ne0$, так как $\dot{\ov h}(\tau)\ne0$ (как уже было отмечено) и $\wL_{\dot x\dot x}(\tau)>0$ в силу того, что выполнено усиленное условие Лежандра. Пришли к противоречию и тем самым условие Якоби доказано.
\end{proof}

\section[Теория поля]{Теория поля и достаточные условия сильного
экстремума в простейшей задаче вариационного исчисления}

В этом параграфе рассматривается фрагмент теории поля и достаточных условий экстремума в вариационном исчислении на примере простейшей задачи.

Пусть $\{x(\cdot,\lambda)\}$ --- семейство экстремалей простейшей задачи вариационного исчисления \eqref{WW} (т.~е. для функций $x(\cdot,\lambda)\in C^1([t_0,t_1],\mathbb R)$ выполняется
уравнение Эйлера) и параметр $\lambda$ принадлежит некоторому открытому множеству в $\mathbb R$.

Пусть $\wx\cd$ --- фиксированный элемент данного семейства экстремалей. Будем говорить, что функция $\wx\cd$ {\it окружена полем экстремалей $\{x(\cdot,\lambda)\}$}, если существует открытое множество $G$, содержащее множество (график $\wx\cd$) $\{(t,\wx(t))^T\in\mathbb
R^2:t\in[t_0,t_1]\}$, что для любой точки $(\tau,\xi)\in G$ существует единственная экстремаль семейства, проходящая через эту точку, т.~е. существует единственное $\lambda=\lambda(\tau,\xi)$
такое, что $x(\tau,\lambda(\tau,\xi))=\xi$. При этом, для каждого $t\in[t_0,t_1]$ отображение $\lambda\mapsto x(t,\lambda)$ и отображение $(\tau,\xi)\mapsto\lambda(\tau,\xi)$ непрерывно
дифференцируемы.

Функция $u\colon G\to\mathbb R$, $u(\tau,\xi)=\dfrac d{dt}x(t,\lambda(\tau,\xi))_{|_{t=\tau}}$,
называется {\it функцией наклона поля}.

Если существует такая точка $(t_*,x_*)$, что $x(t_*,\lambda)=x_*$
для всех $\lambda$, то семейство $\{x(\cdot,\lambda)\}$ называется
{\it центральным полем экстремалей} (с центром в $(t_*,x_*)$).

\begin{figure}[h]
$$\begin{picture}(200,140)
\put(10,10){\vector(1,0){160}}
\put(20,0){\vector(0,1){135}}
\put(165,0){$t$}
\put(10,129){$x$}
\put(20,10){\circle*{2}}
\put(10,0){$0$}
\qbezier(70,60)(90,90)(170,100)
\qbezier(70,60)(90,80)(170,80)
\qbezier(70,60)(90,100)(170,120)
\qbezier(70,60)(90,70)(170,70)
\qbezier(70,60)(60,50)(50,20)
\qbezier(70,60)(60,53)(50,40)
\qbezier(70,60)(60,51)(50,30)
\qbezier(70,60)(60,48)(54,16)
\put(130,85){\oval(55,50)}
\put(133,83){$G$}
\put(70,10){\line(0,1){50}}
\put(70,60){\line(-1,0){50}}
\put(68,0){$t_*$}
\put(6,60){$x_*$}
\end{picture}$$
\caption{}\label{rispo}
\end{figure}

\begin{theorem}[Достаточные условия сильного минимума в простейшей
задаче] Пусть $\wx\cd$ --- экстремаль в задаче \eqref{WW}, окруженная в области $G$ центральным полем экстремалей с центром в точке $(t_*,\wx(t_*))$, $t_*<t_0$, такая, что $x(t_j)=x_j$, $j=0,1$. Если интегрант $L$ непрерывно дифференцируем на $G\times\mathbb R$ и функция $\dot
x\mapsto L(t,x,\dot x)$ --- выпуклая функция на $\mathbb R$, то $\wx\cd$ --- сильный локальный минимум в задаче \eqref{WW}.
\end{theorem}

\begin{proof} Рассмотрим функцию $S\colon G\to\mathbb R$, определенную равенством
$$S(\tau,\xi)=\int_{t_*}^\tau L(t,x(t,\lambda(\tau,\xi)),\dot x(t,\lambda(\tau,\xi)))\,dt.$$
Она называется {\it $S$-функцией центрального поля
$\{x(\cdot,\lambda)\}$}. Эта функция непрерывно дифференцируема на
$G$ как суперпозиция непрерывно дифференцируемых функций. Подсчитаем
ее частные производные. Имеем
\begin{multline*}
\frac{\partial
S(\tau,\xi)}{\partial\tau}=L(\tau,x(\tau,\lambda(\tau,\xi)),\dot
x(\tau,\lambda(\tau,\xi)))\\+\int_{t_*}^\tau
(L_x(t,x(t,\lambda(\tau,\xi)),\dot
x(t,\lambda(\tau,\xi)))x_\lambda(t,\lambda(\tau,\xi))\lambda_\tau(\tau,\xi)\\
+L_{\dot x}(t,x(t,\lambda(\tau,\xi)),\dot
x(t,\lambda(\tau,\xi)))\dot
x_\lambda(t,\lambda(\tau,\xi))\lambda_\tau(\tau,\xi))\,dt.
\end{multline*}
Интегрируя по частям во втором слагаемом в интеграле и учитывая, что
функции $x(\cdot,\lambda)$ --- экстремали, получим
\begin{multline*}
\frac{\partial S(\tau,\xi)}{\partial
\tau}=L(\tau,x(\tau,\lambda(\tau,\xi)),\dot
x(\tau,\lambda(\tau,\xi)))\\+L_{\dot
x}(t,x(t,\lambda(\tau,\xi)),\dot
x(t,\lambda(\tau,\xi)))x_\lambda(t,\lambda(\tau,\xi))\lambda_\tau(\tau,\xi))|_{t_*}^\tau.
\end{multline*}

Дифференцируя тождество $x(\tau,\lambda(\tau,\xi))=\xi$ по $\tau$,
получаем, что  $\dot x(\tau,\lambda(\tau,\xi))+
x_\lambda(\tau,\lambda(\tau,\xi))\lambda_\tau(\tau,\xi)=0$. Теперь
учитывая, что по определению $\dot
x(\tau,\lambda(\tau,\xi))=u(\tau,\xi)$ и что
$x_\lambda(t_*,\lambda(\tau,\xi))=0$ (так как поле центрально),
приходим к равенству
\begin{equation}\label{Stau}
\frac{\partial
S(\tau,\xi)}{\partial\tau}=L(\tau,\xi,u(\tau,\xi))-L_{\dot
x}(\tau,\xi,u(\tau,\xi))u(\tau,\xi).
\end{equation}


Аналогичные вычисления показывают, что
\begin{multline*}
\frac{\partial S(\tau,\xi)}{\partial\xi}=\int_{t_*}^\tau
(L_x(t,x(t,\lambda(\tau,\xi)),\dot
x(t,\lambda(\tau,\xi)))x_\lambda(t,\lambda(\tau,\xi))\lambda_\xi(\tau,\xi)\\
+L_{\dot x}(t,x(t,\lambda(\tau,\xi)),\dot
x(t,\lambda(\tau,\xi)))\dot
x_\lambda(t,\lambda(\tau,\xi))\lambda_\xi(\tau,\xi))\,dt\\= L_{\dot
x}(t,x(t,\lambda(\tau,\xi)),\dot
x(t,\lambda(\tau,\xi)))x_\lambda(t,\lambda(\tau,\xi))\lambda_\xi(\tau,\xi))|_{t_*}^\tau.
\end{multline*}
Дифференцируя тождество $x(\tau,\lambda(\tau,\xi))\!=\xi$ по $\xi$,
получаем
$$x_\lambda(\tau,\lambda(\tau,\xi))\lambda_\xi(\tau,\xi)\!=1$$
и учитывая снова, что $\dot x(\tau,\lambda(\tau,\xi))=u(\tau,\xi)$ и
$x_\lambda(t_*,\lambda(\tau,\xi))=0$, приходим к соотношению
\begin{equation}\label{Sxi}
\frac{\partial S(\tau,\xi)}{\partial\xi}=L_{\dot
x}(\tau,\xi,u(\tau,\xi)).
\end{equation}

Пусть $x\cd\in PC^1([t_0,t_1])$ --- допустимая функция в задаче
\eqref{WW}, график которой принадлежит $G$.
%\footnote{Нетрудно проверить, что множество $\{\,x\cd\in C([t_0,t_1])\mid (t,x(t))\in
%G,\,\,t\in[t_0,t_1]\,\}$ открыто в $C([t_0,t_1])$ и тем самым есть
%окрестность $\wx\cd$ в $C([t_0,t_1])$.}
Рассматривая функцию $S$ на графике $x\cd$, получаем функцию $t\mapsto S(t,x(t))$ на
$[t_0,t_1]$. Ясно, что эта функция принадлежит $PC^1([t_0,t_1])$ и,
за исключением конечного числа точек, будем иметь (учитывая
выражения для частных производных функции $S$)
\begin{multline}\label{ip}
S'(t,x(t))=L(t,x(t),u(t,x(t)))\\
-L_{\dot x}(t,x(t),u(t,x(t)))\,u(t,x(t))+L_{\dot
x}(t,x(t),u(t,x(t)))\,\dot{x}(t).
\end{multline}
Если $x\cd=\wx\cd$, то  $u(t,\wx(t))=\dot{\wx}(t)$ и тогда
\begin{equation}\label{iip}
S'(t,\wx(t))=L(t,\wx(t),\dot{\wx}(t)).
\end{equation}
Теперь, используя \eqref{iip}, а затем \eqref{ip}, получим
\begin{multline*}
J(x\cd)-J(\wx\cd)=\int_{t_0}^{t_1}L(t,x(t),\dot{x}(t))\,dt-\int_{t_0}^{t_1}
L(t,\wx(t),\dot{\wx}(t))\,dt\\=
\int_{t_0}^{t_1}L(t,x(t),\dot{x}(t))\,dt-\int_{t_0}^{t_1}S'(t,\wx(t))\,dt=
\int_{t_0}^{t_1}L(t,x(t),\dot{x}(t))\,dt\\-
(S(t_1,x_1)-S(t_0,x_0))=
\int_{t_0}^{t_1}L(t,x(t),\dot{x}(t))\,dt-\int_{t_0}^{t_1}S'(t,x(t))\,dt\\=
\int_{t_0}^{t_1}(L(t,x(t),\dot x(t))-L(t,x(t),u(t,x(t)))\\-L_{\dot x}(t,x(t),u(t,x(t)))(\dot
x(t)-u(t,x(t)))\,dt\\
=\int_{t_0}^{t_1}\mathcal E(t,x(t),u(t,x(t)),\dot x(t))\,dt.
\end{multline*}

Формула
$$J(x\cd)-J(\wx\cd)=\int_{t_0}^{t_1}\mathcal
E(t,x(t),u(t,x(t)),\dot x(t))\,dt$$
называется {\it основной формулой Вейрштрасса}.

Поскольку функция $\dot x\mapsto L(t,x,\dot x)$ выпукла на $\mathbb
R$ для любых $(t,x)\in G$, то $\mathcal E(t,x(t),u(t,x(t)),\dot
x(t))\ge0$ для всех $t\in[t_0,t_1]$ и значит, $J(x\cd)\ge
J(\wx\cd)$.
\end{proof}

{\bf Замечание}. Обозначим
$$\mathcal H(\tau,\xi,p)=p\cdot u(\tau,\xi)-L(\tau,\xi,u(\tau,\xi)).$$
Тогда на $G$ функция $S$ удовлетворяет следующему уравнению в частных производных
$$\frac{\partial S(\tau,\xi)}{\partial\tau}+\mathcal
H\left(\tau,\xi,\frac{\partial S(\tau,\xi)}{\partial\xi}\right)=0,$$
которое называется {\it уравнением Гамильтона--Якоби}.

Действительно, из равенств \eqref{Sxi} и \eqref{Stau} получаем
\begin{multline*}
\mathcal H\left(\tau,\xi,\frac{\partial S(\tau,\xi)}{\partial\xi}\right)=\frac{\partial S(\tau,\xi)}{\partial\xi}u(\tau,\xi)-L(\tau,\xi,u(\tau,\xi))\\
=L_{\dot x}(\tau,\xi,u(\tau,\xi))u(\tau,\xi)-L(\tau,\xi,u(\tau,\xi))=-\frac{\partial S(\tau,\xi)}{\partial\tau}.
\end{multline*}


\section{Избранные задачи}

\noindent{\bf 1. Задача о гармоническом осцилляторе}.

\smallskip

Согласно закону Гука, сила притяжения материальной точки пружиной пропорциональна уклонению точки. Второй закон Ньютона утверждает, что движение точки под воздействием силы пружины, описывается
дифференциальным уравнением: $m\ddot x=F$ и тем самым $m\ddot x=-kx$. Соответствующий закон движения (как и вообще все законы классической механики) является следствием {\it принципа
стационарного действия}, согласно которому траектория $x(t)$ материальной точки является стационарной точкой {\it функционала действия}
$$J(x(\cdot))=\int\left(\frac{m\dot x^2(t)}2-\frac{kx^2(t)}2\right)\,dt.$$

Мы рассмотрим следующую задачу
$$J(x\cd)=\int_0^T(\dot x^2(t)-x^2(t))\,dt\to\min,\quad x(0)=x(T)=0,$$%\eqno(2)
где $T>0$.

Уравнение Эйлера имеет вид
$$\ddot x+x=0.$$
Его общее решение
$$x(t)=C_1\cos t+C_2\sin t.$$
Если $T\ne k\pi$, $k\in\mathbb N$, то единственная экстремаль --- тождественный нуль. Если $T=k\pi$, то имеется однопараметрическое семейство экстремалей $x(t,C)=C\sin t$.

Пусть $\wx\cd$ --- допустимая экстремаль. На этой экстремали выполнено усиленное условие
Лежандра, так как $L_{\dot x\dot x}=2$ и условие Вейерштрасса, поскольку функция $\dot
x\mapsto \dot x^2-x^2$ выпукла. Уравнение Якоби имеет тот же вид, что и уравнение Эйлера
$$\ddot h+h=0.$$

Если $T>\pi$, то $\wx\cd$ не может доставлять ни слабый, ни сильный минимум, поскольку на $(0,T)$ точка $\pi$ является сопряженной к нулю и значит, не выполнено необходимое условие Якоби. Докажем, что в этом случае значение задачи $-\infty$. Положим
$$x_n(t)=n\sin\frac\pi Tt,\quad n\in\mathbb N.$$
Имеем
\begin{multline*}
\int_0^T(\dot x^2_n(t)-x^2_n(t))\,dt=n^2\int_0^T\left(\frac{\pi^2}{T^2}\cos^2\frac\pi Tt-
\sin^2\frac\pi Tt\right)\,dt\\
=-n^2T+n^2\left(1+\frac{\pi^2}{T^2}\right)\int_0^T\cos^2\frac\pi Tt\,dt=-n^2T+n^2\left(1+\frac{\pi^2}{T^2}\right)\frac T2\\
=n^2\frac{\pi^2-T^2}{2T}.
\end{multline*}
Отсюда видно, что $J(x_n\cd)\to-\infty$ при $n\to\infty$.

Если $T<\pi$, то $\wx\cd=0$ можно окружить полем экстремалей $x(t,\lambda)=\lambda\sin(t+\varepsilon)$, где $0<\varepsilon<\pi-T$. Действительно, для любых $\tau\in[0,T]$ и любых $\xi\in\mathbb R$ при $\lambda=\xi/\sin(\tau+\varepsilon)$ имеем
$x(\tau,\lambda)=\lambda\sin(\tau+\varepsilon)=\xi$. Семейство $\{x(\cdot,\lambda)\}$ является
центральным полем экстремалей с центром в точке $(-\varepsilon,0)$. Таким образом, для экстремали $\wx\cd=0$ выполнены условия теоремы о достаточных условиях сильного минимума и,
следовательно, $\wx\cd=0$ --- сильный минимум.

Пусть $T=\pi$. Тогда для любой допустимой функции $x\cd\in C^1([t_0,t_1])$
\begin{multline*}
\int_0^\pi(\dot x(t)-x(t)\ctg t)^2\,dt=\int_0^\pi(\dot x^2(t)+x^2(t)\ctg^2t\,dt-\int_0^\pi\ctg t\,dx^2(t)\\
=\int_0^\pi(\dot x^2(t)+x^2(t)\ctg^2t)\,dt-x^2(t)\ctg t\big|_0^\pi-\int_0^\pi\frac{x^2(t)}{\sin^2t}\,dt\\
=\int_0^\pi(\dot x^2(t)-x^2(t))\,dt.
\end{multline*}
Отсюда вытекает, что любой допустимой функции $x\cd\in C^1([t_0,t_1])$ выполняется неравенство $J(x\cd)\ge0$. Тем самым функция $\wx\cd=0$ является глобальным минимумом.

\vskip3pt

{\bf Ответ.} {\it При $0<T\le\pi$ решением задачи о гармоническом осцилляторе является
тождественный нуль. При $T>\pi$ значение задачи равно $-\infty$. }


\smallskip

\noindent{\bf 2.  Аэродинамическая задача Ньютона}

\smallskip

В ``Началах натуральной философии'' (1687) Ньютон описал не\-кую
среду (типа разреженного воздуха), поставил и решил вопрос о том,
когда {\it ``тело, образующееся при вращении кривой вокруг оси при
движении в упомянутой среде $[...]$ будет испытывать меньшее
сопротивление, нежели всякое иное тело вращения при той же высоте и
наибольшей ширине''}.

Формализованная постановка этой задачи, как задачи оптимального
управления, имеет вид
$$\int_0^{t_1}{{tdt}\over{1+u^2(t)}}\to\min,\quad\dot x=u,\quad
x(0)=0,\quad x(t_1)=x_1,\quad u\ge0,$$%\eqno(1)
где $x_1>0$.

\begin{figure}[h]
$$\begin{picture}(300,120)
\put(145,50){\vector(1,0){90}}
\put(145,50){\line(-1,0){80}}
\put(155,52.5){\vector(-2,-1){70}}
\put(155,52.5){\line(2,1){40}}
\put(150,45){\vector(0,1){80}}
 \put(150,45){\line(0,-1){42}}
\put(142,125){$x$}
\put(152,40){$O$}
\put(85,10){$y$}
\put(233,40){$t$}
\qbezier(110,100)(120,90)(150,90)
\qbezier(110,100)(120,110)(150,110)
\qbezier(150,90)(180,90)(190,100)
\qbezier(150,110)(180,110)(190,100)
\qbezier(110,100)(150,0)(190,100)
\put(190,100){\line(0,-1){50}}
\put(190,100){\line(-1,0){40}}
\put(188,40){$t_1$}
\put(137,98){$x_1$}
\end{picture}$$
\caption{}\label{elpar1}
\end{figure}

Функция Лагранжа этой задачи такова
$${\mathcal L}(x(\cdot),u(\cdot),\ov\lambda)=\int_0^{t_1}L(t,x(t),\dot
x(t),u(t),p(t),\lambda_0)dt,$$
где $L(t,x,\dot x,u,p,\lambda_0)=\lambda_0 t/(1+u^2)+p(\dot x -u)$ и
$\ov\lambda=(\lambda_0,p(\cdot))$.

Согласно принципу максимума должно выполняться уравнение Эйлера по
$x$:
\begin{equation}\label{ni}
-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0\,\,
 \Leftrightarrow\,\,-\dot p=0\,\,
\Leftrightarrow \,\,p={\rm const}
\end{equation}
и условие минимума по $u$:
\begin{equation}\label{nii}
\min_{u\ge0}\left(\frac{\lambda_0 t}{1+u^2}-pu\right)=\frac{\lambda_0t}{1+\wu^2(t)}-p\wu(t).
\end{equation}

Проверим, что $\lambda_0\ne0$. Если $\lambda_0=0$, то необходимо $p\ne0$, так как множители Лагранжа не могут быть все нулевые. Но, если $p\ne0$, то из \eqref{nii} следует, что $\wu(t)\equiv0$ и тогда
$$\wx(t_1)=\int_0^{t_1}\wu(t)dt=0$$
в противоречие с условием $x(t_1)=x_1>0$. Итак, $\lambda_0\ne0$ и мы можем считать, что $\lambda_0=1$.

Отметим еще, что $p<0$. Действительно, если $p\ge0$, то при любом $t\ge0$ функция $u\to f(t,u)=t/(1+u^2)-pu$ монотонно убывает и поэтому соотношение \eqref{nii} не может выполняться.

Определим, при каких $t$ минимум функции $f(t,\cdot)$ достигается в точке $u=0$. Это означает, что $f(t,0)\le f(t,u)$ при всех $u\ge0$. Рассмотрим соответствующее неравенство
$$t\le\frac t{1+u^2}-pu.$$
Это неравенство можно записать в виде
$$\frac{tu}{1+u^2}\le-p.$$
Отсюда видно, что оно выполнено для $t\ge0$ и таких, что
$$\frac t{-p}\le\min_{u>0}\frac{1+u^2}u=2.$$
Положим $\xi=-2p$. Тогда при $0\le t<\xi$ минимум функции $f(t,\cdot)$ достигается в единственной точке $u=0$. Значит, $\wu(t)=0$, при $0\le t<\xi$. Следовательно, $\wx(t)=0$ при $0\le t<\xi$.

Пусть $t>\xi$. Тогда при $u\in[0,1)$
\begin{multline*}
f(t,u)-f(t,1)=\frac t{1+u^2}-pu-\frac t2+p=t\left(\frac1{1+u^2}-\frac12\right)-p(u-1)\\
>-2p\left(\frac1{1+u^2}-\frac12\right)-p(u-1)=\frac{-2p}{1+u^2}-pu+2p\\
=-p\left(\frac2{1+u^2}-2+u\right)=-pu\frac{(1-u)^2}{1+u^2}\ge0.
\end{multline*}
Тем самым при $t>\xi$ минимум $f(t,\cdot)$ достигается в некоторой точке $u\ge1$. В точке $t=\xi$ функция $\wu\cd$ имеет разрыв, а функция $\wx\cd$ --- излом. Оптимальное управление $\wu\cd$ можно найти из условия $f_u(t,u)=0$, из которого следует, что
$$t=-\frac{p(1+u^2)^2}{2u}=-\frac p2\left(\frac1u+2u+u^3\right).$$
Из того, что при $u\ge1$
$$\frac{dt}{du}=-\frac p2\left(-\frac1{u^2}+2+3u^2\right)>0.$$
вытекает, что каждому $t>\xi$ соответствует ровно одно $u\ge1$, удовлетворяющее уравнению $f_u(t,u)=0$. При этом $u$ строго возрастает с ростом $t$.

\begin{figure}[h]
$$\begin{picture}(300,120)
\put(100,10){\vector(1,0){130}}
\put(105,5){\vector(0,1){110}}
\put(140,10){\circle*{2}}
\put(105,50){\circle*{2}}
\put(140,10){\line(0,1){40}}
\put(105,50){\line(1,0){35}}
\put(140,50){\circle*{2}}
\put(97,110){$t$}
\put(107,0){$O$}
\put(228,0){$u$}
\put(140,0){$1$}
\put(97,48){$\xi$}
\put(159,48){$t=-\frac{p(1+u^2)^2}{2u}$}
\qbezier(140,50)(180,60)(200,100)
\end{picture}$$
\caption{}\label{uutt}
\end{figure}

В силу того, что $dx/dt=u$, имеем
%\begin{equation}\label{derr}
$$\frac{dx}{du}=\frac{dx}{dt}\frac{dt}{du}=u\frac{dt}{du}=-\frac p2\left(-\frac1u+2u+3u^3\right).$$
%\end{equation}
Отсюда
$$\wx=-\frac p2\left(\ln\frac1u+u^2+\frac34u^4\right)+c.$$
Тем самым получаем параметрическое представление при $u\ge1$ (т.~е. при $t\ge\xi$)
\begin{align*}
\wx&=-\frac p2\left(\ln\frac1u+u^2+\frac34u^4\right)+c,\\
t&=-\frac p2\left(\frac1u+2u+u^3\right).
\end{align*}

В силу непрерывности $\wx\cd$ и того, что $\wx(t)=0$ при $0\le t<\xi$, вытекает, что $\wx(\xi)=0$. Следовательно, $c=7p/8$. Итак, если $0\le t\le-2p$, то $\wx(t)=0$, а при $t\ge-2p$ кривая $\wx\cd$ задается параметрически
\begin{align*}
\wx(t,p)&=-\frac p2\left(\ln\frac1u+u^2+\frac34u^4\right)+\frac78p,\\
t&=-\frac p2\left(\frac1u+2u+u^3\right),
\end{align*}
где $p<0$ и определяется из условия $\wx(t_1,p)=x_1$. Эту кривую называют {\it кривой Ньютона}.

\begin{figure}[h]
$$\begin{picture}(300,120)
\put(100,10){\vector(1,0){130}}
\put(105,5){\vector(0,1){110}}
\put(120,10){\circle*{2}}
\put(105,10){\circle*{2}}
\put(97,110){$x$}
\put(94,0){$O$}
\put(228,0){$t$}
\put(120,0){$2$}
%\put(97,48){$\xi$}
\qbezier(120,10)(160,60)(160,100)
\qbezier(140,10)(178,60)(184,100)
\put(105,10){\line(1,1){88}}
\put(181.3,86.3){\circle*{2}}
\put(181.3,86.3){\line(0,-1){76.3}}
\put(181.3,86.3){\line(-1,0){76.3}}
\put(148.2,53.2){\circle*{2}}
\put(92,86){$x_1$}
\put(178,0){$t_1$}
\end{picture}$$
\caption{}\label{cnew}
\end{figure}

Покажем, что всякая прямая $y=kt$ пересекает кривую Ньютона. Действительно, функция $\wx(\cdot,p)$ непрерывна и выпукла, так как
$$\frac{d^2x}{dt^2}=\frac{du}{dt}=\frac1{dt/du}=\frac1{-\dfrac p2\left(-\dfrac1{u^2}+2+3u^2\right)}>0.$$
Кроме того,
$$\lim_{t\to+\infty}\frac xt=\lim_{t\to+\infty}\frac{dx}{dt}=\lim_{t\to+\infty}u=+\infty.$$
Из параметрического представления кривой Ньютона видно, что кривая $\wx(cd,p)$ получается из кривой $\wx(cd,-1)$ гомотетией с центром $O$ и коэффициентом $|p|$. Поэтому, чтобы провести кривую Ньютона через заданную точку $(t_1,x_1)$ нужно найти точку пересечения прямой $x=x_1t/t_1$ с кривой $\wx(cd,-1)$, а затем сделать гомотетию кривой $\wx(cd,-1)$, при которой точка пересечения переходит в точку $(t_1,x_1)$.

Убедимся, что кривая Ньютона доставляет абсолютный минимум в задаче. Пусть $x\cd$ --- допустимая функция в исходной задаче, т.~е. она кусочно непрерывно дифференцируема, $x(0)=0$ и $x(t_1)=x_1$. Тогда в силу \eqref{nii} ($\lambda_0=1$)
$$\frac t{1+\dot x^2(t)}-p\dot x(t)\ge\frac t{1+\wu^2(t)}-p\wu(t).$$
Интегрируя это неравенство с учетом того, что
$$\int_0^{t_1}\dot x(t)\,dt=\int_0^{t_1}\dot{\wx}(t)\,dt=x_1,$$
получаем требуемое
$$\int_0^{t_1}\frac{t\,dt}{1+\dot x^2(t)}\ge\int_0^{t_1}\frac{t\,dt}{1+\dot{\wx}^2(t)}.$$

В результате поверхность, которая решает поставленную задачу, изображена на рис.~\ref{nopt}.
\begin{figure}[h]
$$\begin{picture}(300,120)
\put(145,50){\vector(1,0){90}}
\put(145,50){\line(-1,0){80}}
\put(155,52.5){\vector(-2,-1){70}}
\put(155,52.5){\line(2,1){40}}
\put(150,45){\vector(0,1){80}}
 \put(150,45){\line(0,-1){42}}
\put(142,125){$x$}
\put(152,40){$O$}
\put(85,10){$y$}
\put(233,40){$t$}
\qbezier(110,100)(120,90)(150,90)
\qbezier(110,100)(120,110)(150,110)
\qbezier(150,90)(180,90)(190,100)
\qbezier(150,110)(180,110)(190,100)
\qbezier(160,50)(180,70)(190,100)
\qbezier(140,50)(120,70)(110,100)
\put(190,100){\line(0,-1){50}}
\put(190,100){\line(-1,0){40}}
\put(188,40){$t_1$}
\put(137,98){$x_1$}
\qbezier(140,50)(145,48)(150,48)
\qbezier(140,50)(145,52)(150,52)
\qbezier(160,50)(155,48)(150,48)
\qbezier(160,50)(155,52)(150,52)
\end{picture}$$
\caption{}\label{nopt}
\end{figure}



\begin{thebibliography}{11}

\bibitem{ATF} Алексеев~В.~М., Тихомиров~В.~М., Фомин~С.~В. Оптимальное
управление. М.: Наука, 1979.

\bibitem{IP} Ильин В.~А., Позняк Э.~Г. Основы математического анализа:
В 2-х ч. Часть I. М: Физматлит, 2005.

\bibitem{KF} Колмогоров А.~Н., Фомин С.~В. Элементы теории функций и
фукционального анализа. М.: ФИЗМАТЛИТ, 2004.


\end{thebibliography}


\end{document}