\documentclass[12pt,draft,a4paper]{amsart}
\usepackage{amsmath,amsthm}
\usepackage[T2A]{fontenc}
\usepackage[cp1251]{inputenc}
\usepackage[english,russian]{babel}
\usepackage{amsfonts}
\usepackage{latexsym}



\tolerance 3550

\renewcommand*{\proofname}{Доказательство}
\newcommand*{\ld}{L_2(\mathbb R^d)}
\newcommand*{\Rd}{\mathbb R^d}
\newcommand*{\RR}{\mathbb R}
\newcommand*{\lf}{L_2^{\varphi}(\mathbb R^d)}
\newcommand*{\cd}{(\cdot)}
\newcommand*{\Ds}{\Delta_\sigma}
\newcommand*{\lT}{L_2([0,2\pi])}
\newcommand*{\wa}{\widehat\alpha}
\newcommand*{\wb}{\widetilde b}
\newcommand*{\ws}{\widehat\sigma}
\newcommand*{\wxi}{\widehat\xi}
\newcommand*{\wm}{\widehat m}
\newcommand*{\wx}{\widehat x}
\newcommand*{\wz}{\widehat z}
\newcommand*{\wu}{\widehat u}
\newcommand*{\wL}{\widehat L}
\newcommand*{\wJ}{\widehat J}
\newcommand*{\wh}{\widehat h}
%\newcommand*{\co}{\rm co}
\newcommand*{\cone}{\rm cone}
\newcommand*{\wy}{\widehat y}
\newcommand*{\wl}{\widehat l}
\newcommand*{\ov}{\overline}
\newcommand*{\wt}{\widehat\tau}
\newcommand*{\wv}{\widehat\varphi}
\newcommand*{\wM}{\widehat M}
\newcommand*{\Wt}{W_2^2([0,2\pi])}
\newcommand*{\wf}{\widehat f}
%\newcommand*{\intt}{\rm int}
%\newcommand*{\cl}{\rm cl}
%\newcommand*{\spa}{\rm span}
\newcommand*{\la}{\langle}
\newcommand*{\ra}{\rangle}
\newcommand*{\LL}{\mathcal L}


{\theoremstyle{remark}\newtheorem{example}{\bf Пример}[section]}

\newtheorem{lemma}{Лемма}
\newtheorem{theorem}{Теорема}
\newtheorem{corollary}{Следствие}
\newtheorem{proposition}{Предложение}

\DeclareMathOperator*{\extr}{extr}
\DeclareMathOperator*{\infp}{inf\vphantom p}
\DeclareMathOperator*{\intt}{int}
\DeclareMathOperator*{\cl}{cl}
\DeclareMathOperator*{\spa}{span}
\DeclareMathOperator*{\co}{co}
\DeclareMathOperator*{\dom}{dom}
\DeclareMathOperator*{\epi}{epi}
\DeclareMathOperator*{\IM}{Im}
\DeclareMathOperator*{\Ker}{Ker}
\DeclareMathOperator*{\const}{const}

\begin{document}

\begin{center}\large
МИНОБРНАУКИ РОССИИ\\
\vspace{15pt} \large
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования\\[3pt]
\bf ``МАТИ --- Российский государственный\\[3pt]
технологический университет\\[3pt]
имени К.~Э.~Циолковского''\\[25pt]
\large
Кафедра ``Высшая математика''\\[60pt]

\bf К.~Ю.~Осипенко\\[50pt]

\bf\Large ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ И ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ\\[225pt]


Москва 2014
\thispagestyle{empty}
\end{center}

\newpage

\tableofcontents

\newpage

\section{Введение}

Многие причины побуждают ставить и решать экстремальные задачи,
т.~е. задачи на максимум и минимум. Интерес к ним проявился уже на
заре развития математики и основными стимулами были любознательность
и стремление к совершенству.

Среди наиболее ранних, точно решенных задач
--- так называемая {\it изопериметрическая задача}
--- задача о форме кривой заданной длины, охватывающей наибольшую
площадь (ответ в ней приводил в своих сочинениях еще
Аристотель --- IV в. до н. э.) и задача о форме поверхности заданной
площади, охватывающей наибольший объем. Ответы на эти задачи для
мыслителей Древней Греции были символами совершенства человеческого
разума. Крупнейшие их представители: Евклид, Архимед и Аполлоний
ставили и решали различные геометрические задачи на экстремум.
Задача {\it о параллелограмме наибольшей площади, который можно
вписать в треугольник} приводится в ``Началах'' Евклида (III в. до
н.~э.); задача {\it о шаровом сегменте максимального объема при
заданной площади шаровой части поверхности этого сегмента}
содержится в сочинениях Архимеда (тоже III в. до н. э.); задача {\it
о минимальном расстоянии от точки плоскости до эллипса и о нормалях
к эллипсу из произвольной точки плоскости} была поставлена и решена
Аполлонием (III--II в. до н. э.) в его знаменитых ``Кониках''.

Долгое время каждая задача решалась индивидуально, по-своему. Первый
шаг к исследованию экстремальных задач был сделан П.~Ферма в 1638
году, который доказал (в современных терминах), что производная
функции в точке ее локального экстремума равна нулю (хотя понимание
этого явления можно извлечь и из более ранних высказываний
И.~Кеплера). Данное событие обычно считают началом становления
теории экстремума.

Затем от рассмотрения задач на максимум и минимум для функций одного переменного перешли к рассмотрению экстремальных задач, где переменные --- сами функции, т.~е. элементы бесконечномерных пространств. Эти задачи породили новое направление в математике, получившее название {\it вариационного исчисления}. Рождение вариационного исчисления часто связывают с задачей о брахистохроне, поставленной И.~Бернулли в 1696 году. Это задача о форме кривой наискорейшего ската, т.~е. о форме кривой, соединяющей две точки в вертикальной плоскости, вдоль которой тело под действием силы тяжести без трения проходит путь от одной точки до другой за кратчайшее время (постановка, по-видимому,
была навеяна более ранними размышлениями Галилея на эту тему).

Основным мотивом для развития вариационного исчисления явилось то, что многие законы природы, как выяснилось, имеют экстремальный характер, т.~е. они неким загадочным образом являются решениями задач на максимум и минимум. Л.~Эйлер по этому поводу высказался так: ``В мире не
происходит ничего, в чем не был бы виден смысл какого-нибудь
максимума или минимума''.

\section{Экстремальные задачи, их формализация}

Задачи на экстремум изначально ставятся, как правило, на языке той области знаний, из которой они происходят. Для того, чтобы эти задачи исследовать математическими средствами, необходимо перевести их на математический язык, т.~е. {\it формализовать}. Этот процесс заключается в описании минимизируемого или максимизируемого функционала $f$ вместе со своей областью определения
$X$ и множеством ограничений $C\subset X$. Формализованная
экстремальная задача записывается так
\begin{equation}\label{P}
f(x)\to\min(\max),\quad x\in C,
\end{equation}
и заключается в нахождении таких точек $x\in C$, в которых
функционал $f$ достигает своего минимума (максимума) на $C$. Такие
точки называются {\it глобальными} или {\it абсолютными минимумами
(максимумами)} в задаче \eqref{P} или ее {\it решениями}. Если нас
интересуют и точки минимума, и точки максимума, то вместо
$\min(\max)$ пишем $\extr$ и говорим о задаче на экстремум
функционала $f$.

Отметим еще, что если $\wx$ --- решение задачи \eqref{P} на минимум
(максимум), то ясно, что $\wx$ --- решение аналогичной задачи на
максимум (минимум) с функционалом $-f$ вместо $f$.

Точки из множества ограничений $C$ называются {\it допустимыми} в
задаче \eqref{P}. Если $C=X$, то задача \eqref{P} называется задачей
{\it без ограничений}.

При решении многих конкретных задач нашей целью будет нахождение
глобальных экстремумов, но для этого предварительно приходится
исследовать задачу на наличие локальных экстремумов (т.~е. локальных
минимумов и максимумов). Если в $X$ определено понятие ``окрестности
точки'', то точка $\wx\in C$ называется {\it локальным минимумом} ({\it
максимумом}) в задаче \eqref{P}, если существует такая ее окрестность
$U$, что $f(x)\ge f(\wx)$ ($f(x)\le f(\wx)$) для всех допустимых $x\in U$ (т.~е. для всех $x\in C\cap U$).

\section{Производная отображения. Теорема о среднем}

Как уже отмечалось первым шагом к исследованию экстремальных задач был результат П.~Ферма о равенстве нулю производной в точке локального экстремума функции. Для того чтобы сформулировать этот результат в достаточно общем виде, дадим определение производной отображения.

Пусть $X$ и $Y$ --- линейные нормированные пространства. Совокупность всех линейных непрерывных операторов  $\Lambda\colon X\to Y$ обозначим через $\LL(X,Y)$. Это нормированное пространство с нормой
$$\|\Lambda\|=\sup_{\|x\|_X\le1}\|\Lambda x\|_Y.$$
В случае, когда $Y=\RR$, $\LL(X,\RR)$ совпадает с множеством всех линейных непрерывных функционалов на $X$ и называется {\it сопряженным пространством} к $X$. Сопряженное пространство к $X$ обозначается $X^*$.

Одним из основных примеров рассматриваемых в дальнейшем нормированных пространств будет являться пространство $\Rd$, под которым мы будем понимать совокупность всех упорядоченных наборов $x=\begin{pmatrix}x_1\\
\vdots\\x_d\end{pmatrix}$
из $d$ действительных чисел (если $d=1$, то это просто
множество действительных чисел, и мы пишем $\RR$ вместо $\RR^1$). Элементы $x\in\Rd$ называются {\it векторами} или {\it вектор-столбцами}, а числа $x_j$, $j=1,\ldots,d$,
--- {\it координатами вектора $x$}. Для экономии места, элементы $\Rd$
будем записывать так $x=(x_1,\ldots,x_d)^{T}$, где символ $^T$ обозначает транспонирование строки в столбец (в общем случае --- транспонирование матрицы). В $\Rd$ естественным образом вводится операция (покоординатного) сложения векторов и операция (покоординатного) умножения вектора на число, превращающие это множество в вещественное линейное пространство.

Пусть $x=(x_1,\ldots,x_d)^T\in\Rd$. Величина
$$|x|=\sqrt{x_1^2+\ldots+x_d^2}$$
называется {\it длиной} или {\it модулем} вектора $x$.
Положив для $x\in\Rd$
$$\|x\|_{\Rd}=|x|$$
(такая норма называется {\it евклидовой нормой}), получим линейное нормированное пространство $\Rd$.

Пусть $a=(a_1,\ldots,a_d$) --- вектор-строка из $d$ действительных
чисел. Для каждого $x=(x_1,\ldots,x_d)^{T}\in\Rd$
положим
$$a\cdot x=\sum_{j=1}^da_jx_j.$$
Это матричное произведение вектор-строки $a$ на вектор-столбец $x$, которое иногда называют {\it внутренним произведением}. Ясно, что отображение $x\mapsto a\cdot x$ есть линейный функционал на $\Rd$. Легко понять, что и любой линейный функционал $l$ на $\Rd$ задается подобным образом с $a=(l(e_1),\ldots,l(e_d))$, где
$$e_1=(1,0,\ldots,0)^T,\ldots,e_d=(0,\ldots,0,1)^T$$
--- {\it стандартный базис} в $\Rd$. Таким образом, сопряженное пространство $(\Rd)^*$ можно отождествить с множеством, элементами которого являются наборы из $d$ действительных чисел, но расположенные в строку (с аналогичными операциями сложения и умножения на числа).


Пусть $X$ и $Y$ --- нормированные пространства, а $U$ --- открытое подмножество $X$. Отображение $F\colon U\to Y$ называется дифференцируемым в точке $\wx\in U$, если
найдется такой оператор $\Lambda\in\mathcal L(X,Y)$, что для всех $h\in X$, для которых $\wx+h\in U$ справедливо представление
\begin{equation}\label{Dif}
F(\wx+h)=F(\wx)+\Lambda h+r(h),
\end{equation}
где $r(h)=o(\|h\|_X)$ ($\|r(h)\|_Y/\|h\|_X\to0$ при $h\to0$). Линейный оператор $\Lambda$ называется производной отображения $F$ в точке $\wx$ и обозначается $F'(\wx)$. Нетрудно показать единственность оператора $\Lambda$, удовлетворяющего равенству \eqref{Dif}.

Если отображение $F$ дифференцируемо в каждой точке $U$, то определено отображение $F'\colon U\to\LL(X,Y)$, сопоставляющее $x\in U$ производную $F'(x)$. Если это отображение непрерывно в $\wx\in U$ (на $U$), то говорят, что отображение {\it $F$ непрерывно дифференцируемо\/} в $\wx$ (на $U$).

Если $X$, $Y$ --- нормированные пространства, то норму в пространстве $X\times Y$ можно, например, определить следующим образом:
$$\|(x,y)\|_{X\times Y}=\max\{\|x\|_X,\|y\|_Y\}.$$
Пусть $W$ --- окрестность точки $(\wx,\wy)\in X\times Y$ и $F\colon W\to Z$, где $Z$ --- нормированное пространство. Если отображение $x\to F(x,\wy)$ (определенное на проекции $W$ на $X$) дифференцируемо в точке $\wx$, то соответствующую производную называют {\it частной производной отображения $F$ по $x$ в точке $(\wx,\wy)$} и обозначают $F_x(\wx,\wy)$. Аналогично, частную производную
$F$ по $y$ в точке $(\wx,\wy)$ обозначают $F_y(\wx,\wy)$.

Рассмотрим некоторые примеры.

\begin{example}\label{32}
Пусть $U$ --- окрестность точки $\wx\in\Rd$. Тогда функция $f\colon U\to\RR$ дифференцируема в точке
$\wx$, если существует линейный функционал на $\Rd$,
т.~е. вектор $a=(a_1,\ldots,a_d)\in(\Rd)^*$ такой, что
для всех $h\in\Rd$, для которых $\wx+h\in U$
справедливо представление
$$f(\wx+h)=f(\wx)+a\cdot h+r(h),$$
где $|r(h)|/|h|\to0$ при $h\to0$, т.~е. $r(h)=o(|h|)$.

Отсюда легко следует (беря в качестве $h$ векторы
$(h_1,0,\ldots,0)^T$, $\ldots$, $(0,\ldots,0,h_d)^T$), что $a_j$
есть частная производная функции $f$ по переменной $x_j$ в точке $\wx$, $j=1,\ldots d$. Таким образом,
$$f'(\wx)=\left(\frac{\partial
f}{\partial x_1}(\wx),\ldots,\frac{\partial f}{\partial x_d}(\wx)\right).$$

В классическом анализе обозначают $h=(dx_1,\ldots,dx_d)^T$ и тогда
$$f'(\wx)\cdot h=\frac{\partial f}{\partial x_1}(\wx)dx_1+\ldots+\frac{\partial
f}{\partial x_d}(\wx)dx_d. $$
Это выражение называется дифференциалом $f$ и
обозначается $df(\wx)$.
\end{example}

\begin{example}\label{33}
Пусть теперь $U\subset\RR^{d_1}$ и задано отображение $F\colon U\to\RR^{d_2}$. Линейный оператор $\Lambda\in\LL(\RR^{d_1},\RR^{d_2})$ будем отождествлять с его матрицей в стандартных базисах
$$e_1=(1,0,\ldots,0)^T,\ldots,e_{d_1}=(0,\ldots,0,1)^T$$
и
$$e'_1=(1,0,\ldots,0)^T,\ldots,e'_{d_2}=(0,\ldots,0,1)^T$$
в $\RR^{d_1}$ и $\RR^{d_2}$ соответственно, т.~е. если $\Lambda e_j=\sum_{i=1}^{d_2}a_{ij}e'_i$, $j=1,\ldots,d_1$, то матрицей оператора $\Lambda$ называется матрица (мы ее обозначаем
той же буквой) $\Lambda=(a_{ij})_{1\le i\le d_1, 1\le j\le d_2}$ размера $d_2\times d_1$. В этом случае $\Lambda x$ --- произведение матрицы $\Lambda$ на вектор $x$. Из определения дифференцируемости вытекает, что отображение $F$ дифференцируемо в точке $\wx\in U$, если существует линейный оператор $\Lambda\in\LL(\RR^{d_1},\RR^{d_2})$, т.~е. матрица $\Lambda$ размера $d_2\times d_1$ такая, что для всех $h\in\RR^{d_1}$, для которых $\wx+h\in U$, справедливо представление
$$F(\wx+h)=F(\wx)+\Lambda h+r(h),$$
где $|r(h)|/|h|\to0$ при $h\to0$, т.~е. $r(h)=o(|h|)$. Матрица
$\Lambda$ называется в этом случае производной отображения $F$ в точке $\wx$ и обозначается $F'(\wx)$.

Отображение $F\colon U\to\RR^{d_2}$ можно записать в виде
$F(x)=(f_1(x),\ldots,f_{d_1}(x))^T$, где $f_j\colon U\to\RR$, $j=1,\ldots,d_1$ ($f_j(x)$ --- это $j$-ая координата вектора $F(x)$ в стандартном базисе в $\RR^{d_2}$). Легко проверить, что $F$ дифференцируемо в точке $\wx$ тогда и только тогда, когда функции $f_j$, $j=1,\ldots,d_1$, дифференцируемы в $\wx$. При этом строки матрицы $F'(\wx)$ являются векторами $f'_1(\wx),\ldots,f'_{d_2}(\wx)$.
Производную $F'(\wx)$ называют {\it матрицей Якоби} отображения $F$
в точке $\wx$. Тем самым
$$F'(\wx)=\begin{pmatrix}
\dfrac{\partial f_1}{\partial x_1}(\wx)&\dfrac{\partial f_1}{\partial x_2}(\wx)&\ldots&\dfrac{\partial f_1}{\partial x_{d_1}}(\wx)\\[10pt]
\dfrac{\partial f_2}{\partial x_1}(\wx)&\dfrac{\partial f_2}{\partial x_2}(\wx)&\ldots&\dfrac{\partial f_2}{\partial x_{d_1}}(\wx)\\
\hdotsfor{4}\\
\dfrac{\partial f_{d_2}}{\partial x_1}(\wx)&\dfrac{\partial f_{d_2}}{\partial x_2}(\wx)&\ldots&\dfrac{\partial f_{d_2}}{\partial x_{d_1}}(\wx)\end{pmatrix}.$$
\end{example}

Если $x,y\in X$, то множество $[x,y]=\{z\in X:z=(1-\lambda)x+\lambda y,\ 0\le\lambda\le1\}$ называется {\it отрезком}, соединяющий точки $x$ и $y$.

\begin{theorem}[о среднем]
Пусть $X$, $Y$ --- нормированные пространства, $U$ --- открытое множество в $X$, отображение $F\colon U\to Y$ дифференцируемо на $U$ и $[x,y]\subset U$. Тогда $$\|F(y)-F(x)\|_Y\le\sup_{z\in [x,y]}\|F'(z)\|\|y-x\|_X.$$
\end{theorem}

\begin{proof}
Если $F(y)=F(x)$, то утверждение теоремы очевидно. Пусть $F(y)\ne F(x)$. Тогда по следствию из теоремы Хана--Банаха (см. \cite[стр. 195]{KF}) найдется элемент $y^*\in Y^*$ такой, что $\|y^*\|_{Y^*}=1$ и
\begin{equation}\label{ts}
\la y^*,F(y)-F(x)\ra=\|F(y)-F(x)\|_Y.
\end{equation}
Рассмотрим функцию
$$\varphi(t)=\la y^*,F(x+t(y-x))\ra,\quad0\le t\le1.$$
В силу дифференцируемости $F$ при достаточно малых $\Delta t$ имеем
\begin{multline*}
\varphi(t+\Delta t)-\varphi(t)=\la y^*,F(x+(t+\Delta t)(y-x))-F(x+t(y-x))\ra\\
=\la y^*,F'(x+t(y-x))(y-x)\ra\Delta t+o(\Delta t).
\end{multline*}
Тем самым функция $\varphi$ дифференцируема в интервале $(0,1)$ и
$$\varphi'(t)=\la y^*,F'(x+t(y-x))(y-x)\ra.$$
Следовательно, по теореме Лагранжа существует такое $0<\theta<1$,
что $\varphi(1)-\varphi(0)=\varphi'(\theta)$, или
$$\la y^*,F(y)-F(x)\ra=\la y^*,F'(x+\theta(y-x))(y-x)\ra.$$
Отсюда, учитывая \eqref{ts},
$$\|F(y)-F(x)\|_Y\le\|F'(x+\theta(y-x))\|\|y-x\|_X\le\sup_{z\in [x,y]}\|F'(z)\|\|y-x\|_X.$$
\end{proof}

Пусть $\Lambda\in\LL(X,Y)$. Применяя теорему о среднем к отображению $G(x)=F(x)-\Lambda x$, получаем
\begin{equation}\label{TS}
\|F(y)-F(x)-\Lambda(y-x)\|_Y\le\sup_{z\in [x,y]}\|F'(z)-\Lambda\|\|y-x\|_X.
\end{equation}

\section{Теорема Ферма для гладких задач без ограничений}

В этом пункте будет доказан изначальный результат теории экстремума
--- теорема Ферма (необходимое условие экстремума для гладких задач
без ограничений).

Пусть $U$ --- открытое подмножество нормированного пространства $X$ и $f:U\to\RR$. Рассмотрим задачу
\begin{equation}\label{PP}
f(x)\to\extr,\quad x\in U.
\end{equation}

\begin{theorem}[Ферма]
Если $\wx$ --- локальный экстремум в задаче \eqref{PP} и функция $f$
дифференцируема в $\wx$, то
\begin{equation}\label{11}
f'(\wx)=0.
\end{equation}
\end{theorem}

\begin{proof} Допустим, что линейный функционал $f'(\wx)$ отличен от нуля. Тогда найдется элемент $x\in X$ такой, что $f'(\wx)\cdot x>0$.
В силу открытости $U$ существует $\delta>0$ такое, что $\wx+tx\in U$ для всех $|t|<\delta$. Дифференцируемость $f$ в $\wx$ означает, что при таких $t$
$$f(\wx+tx)=f(\wx)+t(f'(\wx)\cdot x+o(t)/t).$$
Пусть $\delta_0\le\delta$ таково, что
$$|o(t)/t|<f'(\wx)\cdot x/2.$$
Тогда $f(\wx+tx)>f(\wx)$ для всех $t\in(0,\delta_0)$ и $f(\wx+tx)<f(\wx)$ для всех $t\in(-\delta_0,0)$. Получили противоречие с тем, что $\wx$ --- локальный экстремум.
\end{proof}

\section{Вторая производная отображения. Формула Тейлора}

Пусть $X$ и $Y$ --- нормированные пространства, а $U$ --- открытое подмножество $X$. Если отображение $F\colon U\to Y$ дифференцируемо в каждой точке $U$, то определено отображение $F'\colon U\to\LL(X,Y)$, сопоставляющее $x\in U$ производную $F'(x)$.

Дадим определение второй производной. Пусть отображение $F'\colon U\to\LL(X,Y)$ дифференцируемо в точке $\wx$. Тогда говорят, что $F$ дважды дифференцируема
в $\wx$ и соответствующую (вторую) производную обозначают $F''(\wx)$.
Тем самым для всех $h\in X$, для которых $\wx+h\in U$, имеет место равенство
$$F'(\wx+h)=F'(\wx)+F''(\wx)h+o(\|h\|_X).$$
Ясно, что $F''(\wx)\in\LL(X,\LL(X,Y))$.

Пространство $\LL(X,\LL(X,Y))$ изометрически изоморфно пространству
$\LL^2(X,Y)$ всех непрерывных билинейных отображений $B\colon X\times X\to Y$ с нормой $$\|B\|=\sup_{\|x_1\|_X\le1,\ \|x_2\|_X\le1}\|B[x_1,x_2]\|_Y.$$
Этот изоморфизм осуществляется сопоставлением каждому отображению $\Lambda\in\LL(X,\LL(X,Y))$ отображения $B\colon X\times X\to Y$, действующего по правилу: $B[x_1,x_2]=\Lambda x_1[x_2]$ (действие оператора $\Lambda x_1$ на элементе $x_2$). Очевидно, что $B$ --- билинейное отображение.

\begin{example}\label{51}
Найдем первую и вторую производную функции $F(h)=B[h,h]$, где $B$ --- билинейное отображение. Имеем
$$F(h+\Delta h)-F(h)=B[\Delta h,h]+B[h,\Delta h]+B[\Delta h,\Delta h].$$
Так как $\|B[\Delta h,\Delta h]\|_Y\le\|B\|\|\Delta h\|_X^2$, то
$$F'(h)\xi=B[\xi,h]+B[h,\xi].$$
Далее, получаем
$$F'(h+\Delta h)\xi-F'(h)\xi=B[\xi,\Delta h]+B[\Delta h,\xi].$$
Таким образом, при всех $h,\xi,\eta\in X$
\begin{equation}\label{hh}
F''(h)[\xi,\eta]=B[\xi,\eta]+B[\eta,\xi].
\end{equation}
\end{example}

\begin{example}
Пусть $U$ --- окрестность точки $\wx\in\Rd$ и функция $f\colon U\to\RR$ дважды дифференцируема во всех точках из $U$. Тогда, как было показано в примере \ref{32},
$$f'(x)=\left(\frac{\partial
f}{\partial x_1}(x),\ldots,\frac{\partial f}{\partial x_d}(x)\right).$$
аналогично примеру \ref{33} (здесь $f'\colon U\to(\Rd)^*$) получаем, что если функция $f'$ дифференцируема в точке $\wx$, то функции $\dfrac{\partial f}{\partial x_j}$, $j=1,\ldots,d$, дифференцируемы в точке $\wx$ и
\begin{equation}\label{Ge}
f''(\wx)=\begin{pmatrix}
\dfrac{\partial^2f}{\partial x_1^2}(\wx)&\dfrac{\partial^2f}{\partial x_1\partial x_2}(\wx)&\ldots&\dfrac{\partial^2f}{\partial x_1\partial x_d}(\wx)\\[10pt]
\dfrac{\partial^2f}{\partial x_2\partial x_1}(\wx)&\dfrac{\partial^2 f}{\partial x_2^2}(\wx)&\ldots&\dfrac{\partial^2f}{\partial x_2\partial x_d}(\wx)\\
\hdotsfor{4}\\
\dfrac{\partial^2f}{\partial x_d\partial x_1}(\wx)&\dfrac{\partial^2 f}{\partial x_d\partial x_2}(\wx)&\ldots&\dfrac{\partial^2f}{\partial x_d^2}(\wx)\end{pmatrix}.
\end{equation}
Эту матрицу называют {\it матрицей Гесса} или {\it
гессианом функции $f$ в точке $\wx$}.
\end{example}

Известно (см., например, \cite[Теорема~14.13]{IP}), что у дважды дифференцируемой функции смешанные производные совпадают
$$\dfrac{\partial^2 f}{\partial x_j\partial x_k}=\dfrac{\partial^2 f}{\partial x_k\partial x_j}.$$
Тем самым для дважды дифференцируемой функции матрица Гесса симметричная.

Мы докажем более общий результат. Пусть $X$ и $Y$ --- нормированные пространства, а $U$ --- открытое подмножество $X$.

\begin{theorem}[о смешанных производных]\label{SP}
Если отображение $F\colon U\to Y$ дважды дифференцируемо в точке $\wx\in U$, то для всех $\xi,\eta\in X$
$$F''(\wx)[\xi,\eta]=F''(\wx)[\eta,\xi].$$
\end{theorem}

\begin{proof}
Из определения второй производной для $x$ достаточно близких к $\wx$
$$F'(x)-F'(\wx)=F''(\wx)(x-\wx)+\alpha(x)\|x-\wx\|_X,$$
где $\alpha\in\LL(X,Y)$ и $\alpha(x)\to0$ при $x\to\wx$. При достаточно малых $\eta$ положим
$$\varphi(x)=F(x+\eta)-F(x).$$
Имеем
\begin{multline*}
\varphi'(x)=F'(x+\eta)-F'(\wx)-(F'(x)-F'(\wx))=\\
F''(\wx)(x+\eta-\wx)+\alpha(x+\eta)\|x+\eta-\wx\|_X-
F''(\wx)(x-\wx)-\alpha(x)\|x-\wx\|_X\\
=F''(\wx)\eta+\alpha(x+\eta)\|x+\eta-\wx\|_X-\alpha(x)\|x-\wx\|_X.
\end{multline*}
При $x=\wx$ получаем
\begin{equation}\label{FF}
\varphi'(\wx)=F''(\wx)\eta+\alpha(\wx+\eta)\|\eta\|_X.
\end{equation}
Таким образом,
$$\varphi'(x)-\varphi'(\wx)=\alpha(x+\eta)\|x+\eta-\wx\|_X
-\alpha(x)\|x-\wx\|_X-\alpha(\wx+\eta)\|\eta\|_X.$$
Для произвольного $\varepsilon>0$ найдется $\delta>0$ такое, что при $\|x-\wx\|_X<\delta$ выполняется неравенство $\|\alpha(x)\|<\varepsilon$. Поэтому, если $\|x-\wx\|_X<\delta/2$ и $\|\eta\|_X<\delta/2$, то $\|\alpha(x+\eta)\|<\varepsilon$, $\|\alpha(x)\|<\varepsilon$ и $\|\alpha(\wx+\eta)\|<\varepsilon$.
Следовательно,
\begin{multline}\label{var}
\|\varphi'(x)-\varphi'(\wx)\|\le\varepsilon(\|x-\wx\|_X+\|\eta\|_X)+
\varepsilon\|x-\wx\|_X+\varepsilon\|\eta\|_X\\
=2\varepsilon(\|x-\wx\|_X+\|\eta\|_X).
\end{multline}
Для достаточно малых $\eta$ и $\xi$ положим
$$\Delta(\eta,\xi)=F(\wx+\xi+\eta)-F(\wx+\xi)-F(\wx+\eta)+F(\wx).$$
Учитывая \eqref{FF}, имеем
\begin{multline*}
\|\Delta(\eta,\xi)-F''(\wx)[\eta,\xi]\|_Y=\|\varphi(\wx+\xi)-\varphi(\wx)
-F''(\wx)[\eta,\xi]\|_Y\\
=\|\varphi(\wx+\xi)-\varphi(\wx)
-\varphi'(\wx)\xi-\alpha(\wx+\eta)\xi\|\eta\|_X\|_Y.
\end{multline*}
Используя \eqref{TS}, получаем
\begin{multline*}
\|\Delta(\eta,\xi)-F''(\wx)[\eta,\xi]\|_Y\le\sup_{x\in[\wx,\wx+\xi]}
\|\varphi'(x)-\varphi'(\wx)\|\|\xi\|_X\\
+\|\alpha(\wx+\eta)\|\xi\|_X\|\eta\|_X.
\end{multline*}
Отсюда, с учетом \eqref{var}, при $\|\xi\|_X<\delta/2$ и $\|\eta\|_X<\delta/2$ получаем
\begin{multline*}
\|\Delta(\eta,\xi)-F''(\wx)[\eta,\xi]\|_Y\le
2\varepsilon(\|\xi\|_X+\|\eta\|_X)\|\xi\|_X+
\varepsilon\|\xi\|_X\|\eta\|_X\\
\le3\varepsilon(\|\xi\|_X+\|\eta\|_X)\|\xi\|_X.
\end{multline*}
Пусть теперь $\xi$ и $\eta$ --- произвольные элементы $X$. Для достаточно малого $t\in\mathbb R$ будем иметь
$$\|\Delta(t\eta,t\xi)-t^2F''(\wx)[\eta,\xi]\|_Y\le
3t^2\varepsilon(\|\xi\|_X+\|\eta\|_X)\|\xi\|_X.$$
Поскольку $\Delta(t\eta,t\xi)=\Delta(t\xi,t\eta)$, то
$$\|t^2F''(\wx)[\eta,\xi]-t^2F''(\wx)[\xi,\eta]\|_Y\le3t^2
\varepsilon(\|\xi\|_X+\|\eta\|_X)^2.$$
После сокращения на $t^2$ в силу произвольности $\varepsilon$ приходим к доказываемому равенству.

\end{proof}

\begin{theorem}[Формула Тейлора]
Пусть $X$ и $Y$ --- нормированные пространства, $U$ --- окрестность точки $\wx\in X$. Если отображение $F\colon U\to Y$ дважды дифференцируемо в точке $\wx$, то имеет место формула Тейлора
$$F(\wx+h)=F(\wx)+F'(\wx)h+\frac12 F''(\wx)[h,h]+r(h),$$
где $r(h)=o(\|h\|_X^2)$, т.~е. $\|r(h)\|_Y/\|h\|_X^2\to0$ при $h\to 0$.
\end{theorem}

\begin{proof}
Очевидно, что $r(0)=0$. Из примера~\ref{51} следует, что $r'(0)=0$. Таким образом, из \eqref{TS} получаем
%\begin{multline*}
$$\|r(h)\|_Y=\|r(h)-r(0)-r'(0)h\|_Y\le
\sup_{h_1\in[0,h]}\|r'(h_1)-r'(0)\|\|h\|_X.$$
%\end{multline*}
Из того же примера~\ref{51} (см. \eqref{hh}) и теоремы~\ref{SP} вытекает, что $r''(0)=0$. Поэтому
$$r'(h_1)-r'(0)=r''(0)h_1+o(\|h_1\|_X)
=\alpha(h_1)\|h_1\|_X,$$
где $\alpha(h_1)\to0$ при $h_1\to0$. В силу того, что $\|h_1\|_X\le\|h\|_X$, имеем
$$\|r'(h_1)-r'(0)\|\le\beta(h)\|h\|_X,$$
где $\beta(h)\to0$ при $h\to0$. Таким образом,
$$\|r(h)\|_Y\le\beta(h)\|h\|_X^2.$$
\end{proof}

\section{Необходимые и достаточные условия экстремума второго порядка}

Пусть $U$ --- открытое подмножество нормированного пространства $X$ и $f:U\to\RR$.

\begin{theorem}[необходимые условия экстремума второго порядка в задаче без ограничений]
Если $\wx$ --- локальный минимум (максимум) в задаче \eqref{PP} и функция $f$ дважды дифференцируема в $\wx$, то $f'(\wx)=0$ и для любого $h\in X$ выполняется неравенство
$$f''(\wx)[h,h]\ge0\quad(\le0).$$
\end{theorem}

\begin{proof}
Пусть, для определенности, $\widehat x$ --- локальный минимум функции $f$. По теорема Ферма $f'(\widehat x)=0$ и тогда по формуле Тейлора для любого $h\in X$ и достаточно малых $t\in\mathbb R$ имеем
$$0\le f(\widehat x+th)-f(\widehat x)=\frac12t^2f''(\wx)[h,h]+o(t^{2}).$$
Отсюда (деля на $t^{2}$ и устремляя $t$ к нулю)
получаем требуемое неравенство. Для локального максимума рассуждения аналогичны.
\end{proof}

Если $X=\Rd$, то $f''(\wx)$ --- матрица Гесса \eqref{Ge}. Тем самым из доказанной теоремы вытекает

\begin{corollary}
Если $X=\Rd$, $\wx$ --- локальный минимум (максимум) в задаче \eqref{PP} и функция $f$ дважды дифференцируема в $\wx$, то $f'(\wx)=0$ и для любого $h\in\Rd$ выполняется неравенство
$$h^Tf''(\wx)h\ge0\quad(\le0).$$
\end{corollary}

Перейдем теперь к достаточным условиям экстремума.

\begin{theorem}[достаточные условия экстремума второго порядка в задаче без ограничений]\label{TT}
Если в задаче \eqref{PP} функция $f$ дважды дифференцируема в $\wx$, $f'(\wx)=0$ и существует $\alpha>0$ такое, что для всех $h\in X$
$$f''(\wx)[h,h]\ge\alpha\|h\|^2_X\quad(\le\alpha\|h\|^2_X),$$
то $\wx$ --- локальный минимум $($максимум$)$.
\end{theorem}

\begin{proof}
Предположим для определенности, что
$$f''(\wx)[h,h]\ge\alpha\|h\|^2_X.$$
Тогда для достаточно малых $h$ по формуле Тейлора
\begin{multline*}
f(\wx+h)-f(\wx)=\frac12f''(\wx)[h,h]+o(\|h\|_X^2)\ge\frac12
\alpha\|h\|_X^2+o(\|h\|_X^2)\\
=\left(\frac\alpha2+o(1)\right)\|h\|_X^2.
\end{multline*}
Отсюда получаем, что $f(\wx+h)-f(\wx)\ge0$, т.~е. $\wx$
--- локальный минимум. Для локального максимума доказательство аналогично.
\end{proof}

\begin{corollary}\label{S2}
Если $X=\Rd$, функция $f$ в задаче \eqref{PP} дважды дифференцируема в $\wx$, $f'(\wx)=0$ и для всех $h\in\Rd$, $h\ne0$,
\begin{equation}\label{Sil}
h^Tf''(\wx)h>0\quad(<0),
\end{equation}
то $\wx$ --- локальный минимум $($максимум$)$.
\end{corollary}

\begin{proof}
Пусть  $h^Tf''(\widehat x)h>0$ для любого ненулевого $h\in\Rd$. Функция
$h^Tf''(\widehat x)h$ непрерывна на $\Rd$. Обозначим через $\alpha$ ее
минимальное значение на единичной сфере
$$\mathbb S^{d-1}=\{\,x\in\Rd:|x|=1\,\}.$$
Ясно, что $\alpha>0$. Учитывая, что $h/|h|$ принадлежит $\mathbb S^{d-1}$, будем иметь
$$\frac{h^T}{|h|}f''(\widehat x)\frac h{|h|}>\alpha.$$
Следовательно, для всех $h\in\Rd$
$$h^Tf''(\widehat x)h\ge\alpha|h|^2.$$
Теперь утверждение следствия непосредственно вытекает из теоремы~\ref{TT}.
\end{proof}

Условия \eqref{Sil} означают, что квадратичная форма с матрицей \eqref{Ge} положительно (отрицательно) определена. Согласно
критерию Сильвестра это равносильно тому, что главные миноры этой матрицы положительны (чередуют знаки, причем первый --- отрицательный).

Заметим, что в бесконечномерном пространстве условия следствия~\ref{S2} уже не являются достаточными для экстремума. Приведем соответствующий пример. Пусть
$$X=l_2=\biggl\{\,x=(x_1,x_2,\ldots):
\|x\|_{l_2}=\biggl(\sum_{j=1}^\infty x_j^2\biggr)^{1/2}<\infty\,\biggr\}.$$
Рассмотрим отображение $f\colon l_2\to\RR$, задаваемое равенством
$$f(x)=\sum_{j=1}^\infty\left(\frac{x_j^2}{j^3}-x_j^4\right).$$
Нетрудно убедиться, что
$$f'(x)h=\sum_{j=1}^\infty\left(\frac{2x_jh_j}{j^3}-4x_j^3h_j\right),
\quad f''(x)[h,h]=\sum_{j=1}^\infty\left(\frac{2h_j^2}
{j^3}-12x_j^2h_j^2\right).$$
Следовательно, $f'(0)=0$ и при всех $h\in l_2$, $h\ne0$,
$$f''(0)[h,h]=\sum_{j=1}^\infty\frac{2h_j^2}{j^3}>0.$$
Тем не менее, $\wx=0$ не является локальным минимумом, т.~к. $f(0)=0$,
$$f(e_k/k)=\frac1{k^5}-\frac1{k^4}<0,\quad k=2,3,\ldots,$$
где $e_k$ --- $k$-ый базисный вектор
$$(e_k)_j=\begin{cases}1,&j=k,\\
0,&j\ne k,\end{cases}\quad j=1,2,\ldots,$$
и любая окрестность нуля при достаточно больших $k$ содержит точки $e_k/k$.

\section{Строгая дифференцируемость. Теорема о суперпозиции}

Пусть $X$ --- нормированное пространство, $\wx\in X$ и $r>0$. Положим $$B_X(\wx,r)=\{\,x\in X:\|x-\wx\|_X<r\,\}.$$

Отображение $F\colon U\to Y$, где $U$ --- открытое подмножество $X$, называется {\it строго дифференцируемым в точке\/} $\wx\in U$, если найдется такой оператор $\Lambda\in\LL(X,Y)$, что для любого $\varepsilon>0$ существует $\delta=\delta(\varepsilon)>0$, обладающее тем свойством, что для всех $x_1,x_2\in B_X(\wx,\delta)$ справедливо неравенство
$$\|F(x_1)-F(x_2)-\Lambda(x_1-x_2)\|_Y\le\varepsilon\|x_1-x_2\|_X.$$

Отсюда следует (полагая $x_2=\wx$), что $F$ дифференцируемо в $\wx$ и тем самым $\Lambda=F'(\wx)$.

\begin{proposition}\label{Pr1}
Пусть $X$, $Y$ --- нормированные пространства, $U$ --- открытое подмножество $X$ и отображение $F\colon U\to Y$ непрерывно дифференцируемо в точке $\wx\in U$. Тогда $F$ строго дифференцируемо в $\wx$.
\end{proposition}

\begin{proof}
Пусть $\varepsilon>0$ и $\delta=\delta(\varepsilon)>0$ такое, что
$\|F'(x)-F'(\wx)\|<\varepsilon$ для $x\in B_X(\wx,\delta)$. Если $x_j\in B_X(\wx,\delta)$, $j=1,2$, то $[x_1,x_2]\subset B_X(\wx,\delta)$ и
тогда, положив $\Lambda=F'(\wx)$, в силу \eqref{TS}, получаем
$$\|F(x_1)-F(x_2)-F'(\wx)(x_1-x_2)\|_Y\le\varepsilon\|x_1-x_2\|_X,$$
т.~е. $F$ строго дифференцируемо в $\wx$.
\end{proof}

Пусть $X,Y,Z$ --- нормированные пространства, $U$ --- окрестность точки $\wx\in X$, $V$ --- окрестность точки $\wy\in Y$, $\varphi\colon U\to V$, $\varphi(\wx)=\wy$, $\psi\colon V\to Z$, $F=\psi\circ\varphi\colon U\to Z$ --- суперпозиция отображений $\varphi$ и $\psi$.

\begin{theorem}[о суперпозиции]\label{TS1}
Если отображение $\psi$ дифференцируемо (строго дифференцируемо) в точке $\wy$, а $\varphi$ дифференцируемо (строго дифференцируемо) в точке $\wx$, то отображение $F$ дифференцируемо (строго дифференцируемо) в точке $\wx$ и
$$F'(\wx)=\psi'(\wy)\circ\varphi'(\wx).$$
\end{theorem}

\begin{proof}
Положим для краткости $L=\varphi'(\wx)$ и $M=\psi'(\wy)$. Будем предполагать сначала строгую дифференцируемость $\psi$ в точке $\wy$ и $\varphi$ в точке $\wx$. По определению строгой дифференцируемости для любого $\varepsilon_1>0$ найдутся $\delta_1>0$ и $\delta_2>0$ такие, что для всех $x_1,x_2\in B_X(\wx,\delta_1)$ и для всех $y_1,y_2\in B_Y(\wy,\delta_2)$ справедливы неравенства
\begin{align}\label{DD1}
\|\varphi(x_1)-\varphi(x_2)-L(x_1-x_2)\|_Y&\le\varepsilon_1
\|x_1-x_2\|_X,\\
\|\psi(y_1)-\psi(y_2)-M(y_1-y_2)\|_Z&\le\varepsilon_1\|y_1-y_2\|_Y.
\label{DD2}
\end{align}
Для любого $\varepsilon>0$ выберем $\varepsilon_1>0$ так, чтобы выполнялось неравенство
$$\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2<\varepsilon.$$
По так выбранному $\varepsilon_1$ найдем $\delta_1>0$ и $\delta_2>0$ так, чтобы имели место неравенства \eqref{DD1} и \eqref{DD2}. Положим
$$\delta=\min\left(\delta_1,\frac{\delta_2}{\varepsilon_1+
\|L\|}\right).$$

Если теперь $x_1,x_2\in B_X(\wx,\delta)$, то из \eqref{DD1} имеем
\begin{multline}\label{DD3}
\|\varphi(x_1)-\varphi(x_2)\|_Y\le\|\varphi(x_1)-\varphi(x_2)-
L(x_1-x_2)\|_Y\\
+\|L(x_1-x_2)\|_Y
\le\varepsilon_1\|x_1-x_2\|_X+\|L\|\|x_1-x_2\|_X\\
=(\|L\|+\varepsilon_1)\|x_1-x_2\|_X.
\end{multline}
Полагая в этом неравенстве $x_1=\wx$, а потом $x_2=\wx$, получаем
$$\|\varphi(x_j)-\wy\|_Y<(\|L\|+\varepsilon_1)\delta\le\delta_2,\quad j=1,2.$$
Таким образом, для $y_j=\varphi(x_j)$, $j=1,2$, справедливо \eqref{DD2}. Пользуясь \eqref{DD2}, \eqref{DD1} и \eqref{DD3}, имеем
\begin{multline*}
\|F(x_1)-F(x_2)-M\circ L(x_1-x_2)\|_Z\\
\le\|\psi(\varphi(x_1))-\psi(\varphi(x_2))-
M(\varphi(x_1)
-\varphi(x_2))\|_Z\\
+\|M(\varphi(x_1)
-\varphi(x_2))-M\circ L(x_1-x_2)\|_Z\le\varepsilon_1\|\varphi(x_1)
-\varphi(x_2)\|_Y\\
+\|M\|\|\varphi(x_1)
-\varphi(x_2)-L(x_1-x_2)\|_Z\le\varepsilon_1(\|L\|+
\varepsilon_1)\|x_1-x_2\|_X\\
+\|M\|\varepsilon_1\|x_1-x_2\|_X=
(\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2)\|x_1-x_2\|_X
\le\varepsilon\|x_1-x_2\|_X.
\end{multline*}

Докажем теперь утверждение теоремы для случая, когда $\psi$ дифференцируемо в точке $\wy$ и $\varphi$ дифференцируемо в точке $\wx$. По определению дифференцируемости для любого $\varepsilon_1>0$ найдутся $\delta_1>0$ и $\delta_2>0$ такие, что для всех $\Delta x\in B_X(0,\delta_1)$ и для всех $\Delta y\in B_Y(0,\delta_2)$ справедливы неравенства
\begin{align}\label{DDD1}
\|\varphi(\wx+\Delta x)-\varphi(\wx)-L\Delta x\|_Y&\le\varepsilon_1
\|\Delta x\|_X,\\
\|\psi(\wy+\Delta y)-\psi(\wy)-M\Delta y\|_Y&\le\varepsilon_1
\|\Delta y\|_Y.
\label{DDD2}
\end{align}

Для любого $\varepsilon>0$ выберем $\varepsilon_1>0$ так, чтобы выполнялось неравенство
$$\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2<\varepsilon.$$
По так выбранному $\varepsilon_1$ найдем $\delta_1>0$ и $\delta_2>0$ так, чтобы имели место неравенства \eqref{DDD1} и \eqref{DDD2}. Положим
$$\delta=\min\left(\delta_1,\frac{\delta_2}{\varepsilon_1+
\|L\|}\right).$$

Если теперь $\Delta x\in B_X(0,\delta)$, то из \eqref{DDD1} имеем
\begin{multline}\label{DDD3}
\|\varphi(\wx+\Delta x)-\varphi(\wx)\|_Y\le\|\varphi(\wx+\Delta x)-\varphi(\wx)-
L\Delta x\|_Y\\
+\|L\Delta x\|_Y
\le\varepsilon_1\|\Delta x\|_X+\|L\|\|\Delta x\|_X\\
=(\|L\|+\varepsilon_1)\|\Delta x\|_X<(\|L\|+\varepsilon_1)\delta\le\delta_2.
\end{multline}

Таким образом, для $\Delta y=\varphi(\wx+\Delta x)-\varphi(\wx)$ справедливо неравенство \eqref{DDD2}. Имеем
\begin{multline*}
\|F(\wx+\Delta x)-F(\wx)-M\circ L\Delta x\|_Z\\
\le\|\psi(\varphi(\wx+\Delta x))-\psi(\varphi(\wx))-
M(\varphi(\wx+\Delta x)
-\varphi(\wx))\|_Z\\
+\|M(\varphi(\wx+\Delta x)
-\varphi(\wx))-M\circ L\Delta x\|_Z=\|\psi(\wy+\Delta y)-\psi(\wy)-M\Delta y\|_Z\\+\|M(\varphi(\wx+\Delta x)
-\varphi(\wx))-M\circ L\Delta x\|_Z\le\varepsilon_1\|\Delta y\|_Y\\
+\|M\|\|\varphi(\wx+\Delta x)
-\varphi(\wx)-L\Delta x\|_Y\le\varepsilon_1(\|L\|+
\varepsilon_1)\|\Delta x\|_X\\
+\|M\|\varepsilon_1\|\Delta x\|_X=
(\varepsilon_1\|M\|+\varepsilon_1\|L\|+\varepsilon_1^2)\|\Delta x\|_X
\le\varepsilon\|\Delta x\|_X.
\end{multline*}
\end{proof}

\section{Теорема о полном дифференциале. Производная оператора Немыцкого}

\begin{theorem}[о полном дифференциале]\label{TD}
Пусть $X$, $Y$ и $Z$ --- нормированные пространства, $W$ --- открытое подмножество $X\times Y$ и $F\colon W\to Z$. Если частные производные $F_x$ и $F_y$ непрерывны в точке $(\wx,\wy)\in W$, то $F$ --- строго дифференцируемо в $(\wx,\wy)$ и
$$F'(\wx,\wy)(\xi,\eta)=F_x(\wx,\wy)\xi+F_y(\wx,\wy)\eta,\quad
\xi\in X,\ \eta\in Y.$$
\end{theorem}

\begin{proof}
Для любого $\varepsilon>0$ найдется $\delta>0$ такое, что
$U=B_X(\wx,\delta)\times B_Y(\wy,\delta)\subset W$ и для всех $(x,y)\in U$
$$\|F_x(x,y)-F_x(\wx,\wy)\|<\varepsilon/2,\quad\|F_y(x,y)-F_y(\wx,\wy)
\|<\varepsilon/2.$$
Имеем
\begin{multline*}
\Delta=F(x_1,y_1)-F(x_2,y_2)-F_x(\wx,\wy)(x_1-x_2)-F_y(\wx,\wy)(y_1-y_2)\\
=F(x_1,y_1)-F(x_2,y_1)-F_x(\wx,\wy)(x_1-x_2)\\
+F(x_2,y_1)-F(x_2,y_2)-F_y(\wx,\wy)(y_1-y_2)
\end{multline*}
По теореме о среднем (см.~\eqref{TS}) для всех $(x_1,y_1),(x_2,y_2)\in U$
\begin{multline*}
\|\Delta\|_Z\le\sup_{a\in[x_1,x_2]}\|F_x(a,y_1)-F_x(\wx,\wy)
\|\|x_1-x_2\|_X\\
+\sup_{b\in[y_1,y_2]}\|F_x(x_2,b)-F_x(\wx,\wy)\|\|y_1-y_2\|_Y\le\frac
\varepsilon2\|x_1-x_2\|_X+\frac\varepsilon2\|y_1-y_2\|_Y\\
\le\varepsilon\max\left\{\|x_1-x_2\|_X,\|y_1-y_2\|_Y\right\}.
\end{multline*}
\end{proof}

Пусть $G$ открытое подмножество $\mathbb R\times\mathbb R^{d_1}$ и
$f\colon G\to\mathbb R^{d_2}$ --- функция переменных $t\in\mathbb R$ и $x\in\mathbb R^{d_1}$, непрерывная вместе со своей частной производной $f_x$ на $G$. Пусть существует функция $x\in C([t_0,t_1],\mathbb R^{d_1})$ такая, что $\Gamma(x)=\{\,(t,x(t)):
t\in[t_0,t_1]\,\}\subset G$. Положим
$$U=\{\,x\in C([t_0,t_1],\mathbb R^{d_1}):\Gamma(x)\subset G\,\}.$$ Нетрудно убедиться, что $U$ открыто в $C([t_0,t_1],\mathbb R^{d_1})$. Отображение $F\colon U\to C([t_0,t_1],\mathbb R^{d_2})$, определенное по правилу
$$F(x)(t)=f(t,x(t))$$
называется {\it оператором Немыцкого}.

\begin{proposition}\label{PN}
Оператор Немыцкого $F$ непрерывно дифференцируем на $U$ и $F'(x)h(t)=f_x(t,x(t))h(t)$ для любых $x\in U$, $h\in
C([t_0,t_1],\mathbb R^{d_1})$ и $t\in [t_0,t_1]$.
\end{proposition}

\begin{proof}
Пусть $\wx\in U$. Существует $\delta_0>0$ такое,  что компакт $$K=\{\,(t,x):t\in[t_0,t_1],\ |x-\wx(t)|\le\delta_0\,\}$$
принадлежит $G$. Пусть $\varepsilon>0$. Функция $f_x$ равномерно непрерывна на $K$ и поэтому найдется $0<\delta\le\delta_0$ такое, что если $|x_1-x_2|<\delta$, то $\|f_x(t,x_1)-f_x(t,x_2)\|<\varepsilon$ для всех $(t,x_j)\in K$, $j=1,2$.

Для любого $t\in[t_0,t_1]$ отображение $g\colon B_{\mathbb
R^{d_1}}(\wx(t),\delta)\to\mathbb R^{d_2}$, $g(x)= f(t,x)- f_x(t,\wx(t))x$, дифференцируемо на $B_{\mathbb R^{d_1}}(\wx(t),\delta)$ и его производная в точке $x$ имеет вид $g'(x)=f_x(t,x)- f_x(t,\wx(t))$. Пусть $x_j\in B_{C([t_0,t_1],\mathbb R^{d_1})}(\wx,\delta)$, $j=1,2$. Тогда $x_j(t)\in B_{\mathbb R^{d_1}}(\wx(t),\delta)$, $j=1,2$, и мы имеем по теореме о среднем, примененной к отображению $g$ (учитывая, что если $x\in[x_1(t),x_2(t)]$, то
$x\in B_{\mathbb R^n}(\wx(t),\delta)$)
\begin{multline*}
|f(t,x_1(t))-f(t,x_2(t))-f_x(t,\wx(t))(x_1(t)-x_2(t))|\le
\\
\le\sup_{x\in[x_1(t),x_2(t)]}\|f_x(t,x)-f_x(t, \wx(t))\|
|x_1(t)-x_2(t)|\le\varepsilon|x_1(t)-x_2(t)|.
\end{multline*}
Поскольку это верно для любого $t\in[t_0,t_1]$, то отсюда следует, что отображение $F$ строго дифференцируемо в $\wx$ и что $F'(\wx)h(t)=f_x(t,\wx(t))h(t)$. Так как $\wx$ --- произвольная функция из $U$, то $F$ дифференцируемо на $U$.

Непрерывная дифференцируемость отображения $F$ на $U$ проверяется непосредственно, используя равномерную непрерывность $f_x$ на соответствующем компакте.
\end{proof}

Нам понадобится еще один оператор, который является некоторым обобщением оператора Немыцкого. Пусть $G$ --- открытое подмножество $\mathbb R\times\mathbb R^{d_1}\times\mathbb R^{d_3}$ и $f\colon G\to\mathbb R^{d_2}$ --- функция переменных $t\in\mathbb R$, $x\in\mathbb R^{d_1}$ и $u\in\mathbb R^{d_3}$, непрерывная вместе со своими частными производными $f_x$ и $f_u$ на $G$. Пусть существует пара $(x,u)\in C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$ такая, что
$$\Gamma(x,u)=\{\,(t,x(t),u(t)):t\in[t_0,t_1]\,\}\subset G.$$
Положим
$$U=\{\,(x,u)\in C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3}):\Gamma(x,u)\subset G\,\}.$$
Легко проверить, что множество  открыто в $C([t_0,t_1],\mathbb R^{d_1})$. Определим отображение $F\colon U\to C([t_0,t_1],\mathbb R^{d_2})$ по правилу
$$F(x,u)(t)=f(t,x(t),u(t)),$$
которое назовем {\it обобщенным оператором Немыцкого}.

\begin{corollary}\label{CN}
Обобщенный оператор Немыцкого  $F$ непрерывно дифференцируем на $U$ и
$$F'(x,u)(h(t),\xi(t))=f_x(t,x(t),u(t))h(t)+f_u(t,x(t),u(t))\xi(t)$$
для любых $(x,u)\in U$, $(h,\xi)\in C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$ и $t\in[t_0,t_1]$.
\end{corollary}

\begin{proof}
Частная производная по $x$ отображения $F$, согласно предложению~\ref{PN}, равна $f_x(t,x(t),u(t))$. Ее непрерывность на  $C([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$ вытекает из равномерной непрерывности $f_x(t,x,u)$ на компакте вида
$$K_1=\{\,(t,x,u):t\in[t_0,t_1],\ |x-\wx(t)|\le\delta_0,\ |u-\wu(t)|\le\delta_0\,\}.$$
Тем самым она непрерывна и на $C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_3})$. Частная производная по $u$ также непрерывна в силу тех же причин. Поэтому по теореме о полном дифференциале (теорема~\ref{TD}) отображение $F$ непрерывно
дифференцируемо на $U$ и справедлива соответствующая формула для производной.
\end{proof}

\section{Лемма о правом обратном. Теорема о неявной функции. Теорема Люстерника}

\begin{lemma}[о правом обратном]\label{L1}
Пусть $X$ и $Y$ --- банаховы пространства, $\Lambda\in\LL(X,Y)$ и $\IM\Lambda=Y$. Тогда существуют отображение $R\colon Y\to X$ и константа $\gamma>0$ такие, что $\Lambda R(y)=y$ и $\|R(y)\|_X\le
\gamma\|y\|_Y$ для любого $y\in Y$.
\end{lemma}

\begin{proof}
По теореме Банаха об открытом отображении \cite[стр. 243]{KF} множество $\Lambda(B_X(0,1))$ открыто.
Оно, очевидно, содержит ноль и тем самым содержит некоторый шар $B_Y(0,r)$, $r>0$,
т.~е. для каждого $z\in B_Y(0,r)$ найдется элемент $x(z)\in B_X(0,1)$ такой, что
$\Lambda x(z)=z$. Положим $R(0)=0$, а если $y\ne 0$, то
$$R(y)=\frac{2\|y\|_Y}rx\left(\frac r{2\|y\|_Y}y\right).$$
Тогда $\Lambda R(y)=y$ и $\|R(y)\|_X\le
\gamma\|y\|_Y$, где $\gamma=2/r$.
\end{proof}

\begin{lemma}[о замкнутости образа]\label{LZ}
Пусть $X$ и $Y$ --- банаховы пространства, $A\in\mathcal L(X,\mathbb R^d)$, $B\in\mathcal L(X,Y)$, $C\colon X\to\mathbb R^d\times Y$, $Cx=(Ax,Bx)$ и $\IM B=Y$. Тогда $\IM C$ --- замкнутое подпространство в $\mathbb R^d\times Y$.
\end{lemma}

\begin{proof}
Пусть $(y,z)\in\cl\IM C$ и пусть $\{x_n\}$
--- последовательность в $X$ такая, что $y=\lim_{n\to\infty}Ax_n$ и
$z=\lim_{n\to\infty}Bx_n$. Положим $h_n=R(Bx_n-z)$, где $R$ --- правый обратный к $B$, тогда $B(x_n-h_n)=z$. Так как $\|h_n\|_X=\|R(Bx_n-z)\|_X\le\gamma\|Bx_n-z\|_Y$, то $h_n\to0$ при $n\to\infty$ и поэтому $\lim_{n\to\infty}A(x_n-h_n)=y$. Таким
образом, $y$ принадлежит замыканию образа множества
$$X_z=\{\,x\in X:Bx=z\,\}$$
при отображении $A$. Но $A(X_z)$ --- линейное многообразие в $\mathbb R^d$ и тем самым замкнуто. Следовательно, существует такое $\ov x\in X$, что $B\ov x=z$ и $y=A\ov x$, т.~е. $(y,z)\in\IM C$.
\end{proof}

\begin{theorem}[Обобщенная теорема о неявной функции]\label{TNF}
Пусть $\Sigma$ --- топологическое пространство, $X$ и $Y$ --- банаховы пространства, $U$ --- окрестность точки $\wx\in X$, $F\colon U\times\Sigma\to Y$ и $\ws\in\Sigma$. Если
\begin{enumerate}
\item [$1)$] $F(\wx,\ws)=0$;
\item [$2)$] $F$ непрерывно в точке $(\wx,\ws)$;
\item [$3)$] $F$ дифференцируемо по $x$ в точке $(\wx,\ws)$ и для каждого $\varepsilon>0$ существуют окрестности $U(\varepsilon)\subset U$ и $V(\varepsilon)$ точек $\wx$ и $\ws$ такие, что для всех $x,x'\in U(\varepsilon)$ и $\sigma\in V(\varepsilon)$ выполняется соотношение
$$\|F(x,\sigma)-F(x',\sigma)-F_x(\wx,\ws)(x-x')\|_Y\le\varepsilon
\|x-x'\|_X;$$
\item [$4)$] $\IM F_x(\wx,\ws)=Y$,
\end{enumerate}
то найдутся окрестности $U_0\subset U$ и $V_0$ точек $\wx$ и $\ws$, отображение $\varphi\colon U_0\times V_0\to U$ и константа $K>0$ такие, что $F(\varphi(x,\sigma),\sigma)=0$ и $\|\varphi(x,\sigma)-x\|_X\le K\|F(x,\sigma)\|_Y$ для всех $(x,\sigma)\in U_0\times V_0$.
\end{theorem}

\begin{proof}
Обозначим для краткости $\Lambda=F_x(\wx,\ws)$. Так как $\IM F_x(\wx,\ws)=Y$, то по лемме о правом обратном (лемма~\ref{L1}) существует отображение $R\colon Y\to X$ и константа $\gamma>0$ такие, что $\Lambda R(y)=y$ и $\|R(y)\|_X\le\gamma\|y\|_Y$ для всех $y\in Y$.

Пусть $\varepsilon_0>0$ таково, что $\theta=\varepsilon_0\gamma<1$ и
$U(\varepsilon_0)$ и $V(\varepsilon_0)$ --- окрестности точек $\wx$ и $\ws$, соответствующие $\varepsilon_0$ (из формулировки теоремы). Пусть $\delta>0$ такое, что $B_X(\wx,\delta)\subset U(\varepsilon_0)$. Выберем окрестности $U_0$ и $V_0$ так, что $U_0\subset B_X(\wx,\delta/2)$, $V_0\subset V(\varepsilon_0)$ и при этом $\|F(x,\sigma)\|_Y<\delta(1-\theta)/2\gamma$, если $(x,\sigma)\in U_0\times V_0$.

Пусть $(x,\sigma)\in U_0\times V_0$. Рассмотрим последовательность
\begin{equation}\label{NFi}
x_n=x_{n-1}-R(F(x_{n-1},\sigma)),\quad n\in\mathbb N,\quad x_0=x.
\end{equation}
Докажем, что эта последовательность принадлежит $B_X(\wx,\delta)$ и фундаментальна. Первое доказываем по индукции. Ясно, что $x_0\in B_X(\wx,\delta)$. Пусть $x_k\in B_X(\wx,\delta)$, $1\le k\le n$. Применяя к обеим частям \eqref{NFi} оператор $\Lambda$, получим
\begin{equation}\label{NFii}
\Lambda(x_n-x_{n-1})=-F(x_{n-1},\sigma).
\end{equation}
Используя последовательно \eqref{NFi}, оценку для правого обратного, \eqref{NFii}, условие $3)$ теоремы и затем итерируя процедуру, будем иметь
\begin{multline}\label{NFiii}
\|x_{n+1}-x_n\|_X\le\gamma\|F(x_n,\sigma)\|_Y=\gamma\|F(x_n,\sigma)-
F(x_{n-1},\sigma)\\
-\Lambda(x_n-x_{n-1})\|_Y\le\theta\|x_n-x_{n-1}\|_X\le\ldots\le\theta^n
\|x_1-x\|_X.
\end{multline}
Далее, по неравенству треугольника, \eqref{NFiii}, \eqref{NFi}, условию $2)$ теоремы и согласно определению окрестностей $U_0$ и $V_0$, получаем, что
\begin{multline}\label{NF4}
\|x_{n+1}-\wx\|_X\le\|x_{n+1}-x\|_X+\|x-\wx\|_X\\
\le\|x_{n+1}-x_n\|_X+\ldots+\|x_1-x\|_X+\|x-\wx\|_X\\
\le(\theta^n+\theta^{n-1}+\ldots+1)\|x_1-x\|_X
+\|x-\wx\|_X\\
\le\frac\gamma{1-\theta}\|F(x,\sigma)\|_Y+\|x-\wx\|_X<\frac\delta2+
\frac\delta2=\delta,
\end{multline}
т.~е. $x_{n+1}\in B_X(\wx,\delta)$ и значит, вся последовательность $\{x_n\}$ принадлежит $B_X(\wx,\delta)$.

Последовательность $\{x_n\}$ фундаментальна. Действительно, используя \eqref{NFiii} и рассуждая как в предыдущем неравенстве, будем иметь для всех $n,m\in\mathbb N$
\begin{multline*}
\|x_{n+m}-x_n\|_X\le\|x_{n+m}-x_{n+m-1}\|_X+\ldots+
\|x_{n+1}-x_n\|_X\le\\
\le(\theta^{n+m-1}+\ldots+\theta^n)\|x_1-x\|_X\le\frac{\theta^n}
{1-\theta}\|x_1-x\|_X\le\frac\delta2\theta^n.
\end{multline*}

Положим $\varphi(x,\sigma)=\lim_{n\to\infty}x_n$. Из \eqref{NF4} следует, что $\varphi(x,\sigma)\in B_X(\wx,\delta)\subset U$. Из условия $3)$ теоремы следует, что для каждого $\sigma\in V_0$ отображение $F(x,\sigma)$ непрерывно на $U_0$, и тогда переходя к пределу в \eqref{NFii} при $n\to\infty$, получаем, что $F(\varphi(x,\sigma),\sigma)=0$.

В \eqref{NF4} доказано, что $$\|x_{n}-x\|_X\le\frac\gamma{1-\theta}\|F(x,\sigma)\|_Y.$$
Переходя здесь к пределу при $n\to\infty$, приходим к неравенству $\|\varphi(x,\sigma)-x\|_X\le K\|F(x,\sigma)\|_Y$, где $K=\gamma/(1-\theta)$.
\end{proof}

Рассмотрим случай, когда $\Sigma$ состоит из одного элемента (зависимость от него отмечать не будем). Тогда из теоремы~\ref{TNF}, рассматривая вместо отображения $F(x)$ отображение $F(x)-F(\wx)$, получаем

\begin{corollary}\label{TNF1}
Пусть $X$ и $Y$ --- банаховы пространства, $U$ --- окрестность точки $\wx\in X$ и $F\colon U\to Y$. Если $F$ строго дифференцируемо в точке $\wx$ и $\IM F'(\wx)=Y$, то найдется окрестность $U_0\subset U$ точки $\wx$, отображение $\varphi\colon U_0\to U$ и константа $K>0$ такие, что $F(\varphi(x))=F(\wx)$ и $\|\varphi(x)-x\|_X\le K\|F(x)-F(\wx)\|_Y$ для всех $x\in U_0$.
\end{corollary}

Пусть $M$ --- непустое подмножество нормированного пространства $X$. Элемент $h\in X$ называется {\it касательным вектором к $M$ в точке $\wx\in M$}, если существуют $\varepsilon>0$ и отображение $r\colon (-\varepsilon,\varepsilon)\to X$ такие, что
$\wx+th+r(t)\in M$ для всех $t\in(-\varepsilon,\varepsilon)$ и $\|r(t)\|_X/t\to0$, при $t\to0$. Множество всех касательных векторов к $M$ в точке $\wx\in M$ обозначается через $T_{\wx}M$.

\begin{theorem}[Люстерника]\label{Lyu}
Пусть $X,Y$ --- банаховы пространства, $U$ --- окрестность точки $\wx\in X$, отображение $F\colon U\to Y$ --- строго дифференцируемо в $\wx$, $\IM F'(\wx)=Y$ и $M=\{\,x\in U:F(x)=F(\wx)\,\}$. Тогда $T_{\wx}M=\Ker F'(\wx)$.
\end{theorem}

\begin{proof}
Пусть $h\in T_{\wx}M$ и $r$ из определения касательного вектора. Тогда вследствие дифференцируемости $F$ в точке $\wx$ имеем $$0=F(\wx+th+r(t))-F(\wx)=tF'(\wx)h+o(t),$$
откуда (деля на $t$ и переходя к пределу при $t\to0$) следует, что $h\in\Ker F'(\wx)$.

Обратно, пусть $h\in\Ker F'(\wx)$. Отображение $F(x)$ удовлетворяет условиям следствия~\ref{TNF1}. Следовательно, найдется такая окрестность $U_0\subset U$ точки $\wx$, отображение $\varphi\colon U_0\to U$ и константа $K>0$, такие, что $F(\varphi(x))=F(\wx)$ и $\|\varphi(x)-x\|_X\le K\|F(x)-F(\wx)\|_Y$ для всех $x\in U_0$. Пусть $\varepsilon>0$ таково, что $\wx+th\in U_0$ при $t\in(-\varepsilon,\varepsilon)$. Положим $r(t)=\varphi(\wx+th)-\wx-th$. Имеем $F(\wx+th+r(t))=F(\wx)$ и
$$\|r(t)\|_X\le K\|F(\wx+th)-F(\wx)\|_Y=K\|tF'(\wx)h+o(t)\|_Y=K\|o(t)\|_Y,$$
т.~е. $h$ --- касательный вектор.
\end{proof}

\section{Теоремы отделимости. Леммы об аннуляторах}

Пусть $A$ и $B$ --- непустые подмножества нормированного пространства $X$. Говорят, что ненулевой функционал $x^*\in X^*$ {\it отделяет множества $A$ и $B$}, если
$$\sup_{x\in A}\la x^*,x\ra\le\inf_{x\in B}\la x^*,x\ra.$$
Если неравенство строгое, то говорят, что $x^*$ {\it строго отделяет $A$ и $B$}.

Пусть число $\gamma\in\mathbb R$ таково, что
$$\sup_{x\in A}\la x^*,x\ra\le\gamma\le\inf_{x\in B}\la x^*,x\ra.$$ Тогда, геометрически, отделимость множеств $A$ и $B$ означает, что они расположены по разные стороны от гиперплоскости
$$\{\,x\in X:\la x^*,x\ra=\gamma\,\}.$$

Напомним формулировку первой теоремы отделимости (см. \cite[стр. 243]{KF}).

\begin{theorem}[Первая теорема отделимости]\label{FTO}
Пусть $A$ и $B$ --- непустые выпуклые подмножества нормированного пространства $X$, причем $\intt A\ne\emptyset$ и $B\cap\intt A=\emptyset$. Тогда множества $A$ и $B$ отделимы.
\end{theorem}
Отсюда следует
\begin{theorem}[Вторая теорема отделимости]
Пусть $A$ --- непустое замкнутое выпуклое подмножество нормированного пространства $X$ и $\wx\notin A$. Тогда множества $A$ и $\wx$ строго отделимы.
\end{theorem}

\begin{proof}
Так как $A$ замкнуто, то дополнение к $A$ открыто и поэтому существует такое $r>0$, что открытый шар $B_X(\wx,r)$ не пересекается с $A$. Тогда по первой теореме отделимости существует ненулевой функционал $x^*\in X^*$ такой, что
$$\sup_{x\in A}\la x^*,x\ra\le\inf_{x\in B_X(\wx,r)}\la x^*,x\ra.$$
Но
$$\inf_{x\in B_X(\wx,r)}\la x^*,x\ra<\la x^*,\wx\ra,$$
так как ненулевой линейный непрерывный функционал не может достигать точной нижней грани во внутренней точке. Следовательно, множества $A$ и $\wx$ строго отделимы.
\end{proof}

Пусть $L$ --- подпространство нормированного пространства $X$. Множество
$$L^\perp=\{\,x^*\in X^*:\la x^*,x\ra=0,\ \forall\,x\in L\,\}$$
называется {\it аннулятором $L$}. Легко видеть, что $L^\perp$ --- замкнутое
подпространство в $X^*$.
\begin{lemma}[о нетривиальности аннулятора]\label{NA}
Пусть $L$ --- замкнутое подпространство нормированного пространства $X$, не совпадающее с $X$. Тогда $L^\perp$ содержит ненулевой элемент.
\end{lemma}
\begin{proof}
Так как $L\ne X$, то существует $\wx\notin L$. Множество $L$, очевидно, выпукло и по условию замкнуто, поэтому по второй теореме отделимости найдется ненулевой функционал $x^*\in X^*$ такой, что
\begin{equation}\label{otd}
\sup_{x\in L}\la x^*,x\ra<\la x^*,\wx\ra.
\end{equation}
Тогда $x^*\in L^\perp$. Действительно, если $\la x^*,x_0\ra\ne0$ для некоторого $x_0\in L$, то так как $\alpha x_0\in L$ для любого $\alpha\in\mathbb R$, мы имеем
$$\sup_{x\in L}\la x^*,x\ra\ge\sup_{\alpha\in \mathbb R}\la x^*,\alpha
x_0\ra=\sup_{\alpha\in \mathbb R}\alpha\la x^*, x_0\ra=+\infty,$$
что противоречит \eqref{otd}.
\end{proof}

\begin{lemma}[об аннуляторе ядра]\label{AK}
Пусть $X$ и $Y$ --- банаховы пространства, $A\in\LL(X,Y)$ и $\IM A=Y$.
Тогда  $(\Ker A)^\perp=\IM A^*$.
\end{lemma}
\begin{proof}
Пусть $x^*\in\IM A^*$. Тогда $x^*=A^*y*$, где $y*\in Y^*$. Для любого $x\in\Ker A$ имеем
$$\la x^*,x\ra=\la A^*y^*,x\ra=\la y^*,Ax\ra=0.$$
Тем самым $x^*\in(\Ker A)^\perp$.

Пусть $x^*\in(\Ker A)^\perp$. Образ оператора $M\colon X\to\mathbb R\times Y$,
$$Mx=(\la x^*,x\ra,Ax),$$
замкнут по лемме о замкнутости образа (лемма~\ref{LZ}) и не совпадает
с $\mathbb R\times Y$, так как $(1,0)\notin\IM M$. Следовательно, по лемме о нетривиальности аннулятора (лемма~\ref{NA}) существует ненулевой функционал $(\alpha,y^*)\in \mathbb R\times Y^*$ такой, что
$$\alpha\la x^*,x\ra+\la y^*,Ax\ra=0$$
для всех $x\in X$. При этом $\alpha\ne0$, ибо в противном случае
функционал $y^*$ был бы нулевым в силу того, что $\IM A=Y$. Таким образом,
$$\la x^*+\alpha^{-1}A^*y^*,x\ra=0$$
для всех $x\in X$. Следовательно,
$$x^*=A^*(-\alpha^{-1}y^*)\in\IM A^*.$$
\end{proof}


\section{Правило множителей Лагранжа для гладких задач с ограничениями типа равенств}

Пусть $U$ --- открытое подмножество банахова пространства $X$, $f:U\to\RR$ и $F\colon U\to Y$, где $Y$ --- банахово пространство. Задачу
\begin{equation}\label{TR}
f(x)\to\extr,\quad F(x)=0,
\end{equation}
называют {\it задачей с ограничениями типа равенств}. Если функция $f$ и отображение $F$ обладают некоторой гладкостью, то говорят о {\it гладкой задаче с ограничениями типа равенств}.

Сопоставим задаче \eqref{TR} {\it функцию Лагранжа}
$$\LL(x,\lambda_0,y^*)=\lambda_0f(x)+\la y^*,F(x)\ra,$$
где $\lambda_0\in\mathbb R$ и $y^*\in Y^*$ называются {\it множителями Лагранжа}.

\begin{theorem}[Правило множителей Лагранжа]\label{PML}
Если $\wx\in U$ --- локальный экстремум в задаче \eqref{TR}, функция $f$ --- дифференцируема в $\wx$, отображение $F$ --- строго дифференцируемо в $\wx$ и $\IM F'(\wx)$ --- замкнутое подпространство в $Y$, то найдутся, не равные одновременно нулю, множители Лагранжа $\lambda_0$ и $y^*$ такие, что
\begin{equation}\label{PL}
\LL_x(\wx,\lambda_0,y^*)=0\quad\Leftrightarrow\quad\lambda_0f'(\wx)
+(F'(\wx))^*y^*=0.
\end{equation}

Если $\IM F'(\wx)=Y$, то $\lambda_0\ne0$.
\end{theorem}

\begin{proof}
Рассмотрим сначала случай, когда $\IM F'(\wx)=Y$. Пусть $h\in\Ker F'(\wx)$. Отображение $F$ удовлетворяет условиям теоремы Люстерника (теорема~\ref{Lyu}) и поэтому $h\in T_{\wx}M$, т.~е. существуют $\varepsilon>0$ и отображение $r\colon(-\varepsilon,\varepsilon)\to X$ такие, что $F(\wx+th+r(t))=0$ для $t\in(-\varepsilon,\varepsilon)$ и $r(t)=o(t)$ при $t\to0$. Таким образом, элементы
$\wx+th+r(t)$, $t\in(-\varepsilon,\varepsilon)$, допустимы в \eqref{TR} и так как $\wx$ --- локальный экстремум в этой задаче, то $$f(\wx+th+r(t))-f(\wx)=t\la f'(\wx),h\ra+o(t)$$
сохраняет знак для достаточно малых $t$. Деля последнее соотношение на
$t>0$ и устремляя $t$ к нулю, получаем, что $\la f'(\wx),h\ra$ сохраняет знак. Но $h$ --- произвольный элемент из $\Ker F'(\wx)$ и поэтому $\la f'(\wx),h\ra=0$ для любого $h\in\Ker F'(\wx)$, т.~е. $f'(\wx)\in(\Ker F'(\wx))^\perp$. Согласно лемме об аннуляторе ядра (лемма~\ref{AK}) $f'(\wx)\in\IM(F'(\wx))^*$ и, следовательно, существует функционал $y^*\in Y^*$ такой, что $f'(\wx)=-(F'(\wx))^*y^*$, или $f'(\wx)+(F'(\wx))^*y^*=0$. Тем самым равенство \eqref{PL} с $\lambda_0=1$ доказано.

Пусть теперь $\IM F'(\wx)\ne Y$. Так как по условию подпространство $\IM F'(\wx)$ замкнуто, то по лемме о нетривиальности аннулятора (лемма~\ref{NA}) существует ненулевой функционал $y^*\in Y^*$ такой, что $\la y^*,F'(\wx)x\ra=0$ для любого $x\in X$, т.~е. $(F'(\wx))^*y^*=0$. Это доказывает утверждение теоремы в рассматриваемом случае с $\lambda_0=0$.
\end{proof}

Рассмотрим частный случай задачи \eqref{TR}, когда $X=\mathbb R^{d_1}$, $Y=\mathbb R^{d_2}$, а отображение $F$ задается функциями $f_j\colon \mathbb R^{d_1}\to\mathbb R$, $j=1,\ldots,d_2$, т.~е. $F(x)=(f_1(x),\ldots,f_{d_2}(x))^T$, $x\in \mathbb R^{d_1}$. Таким
образом, рассматривается задача
\begin{equation}\label{TRK}
f_0(x)\to\extr,\quad f_j(x)=0,\quad j=1,\ldots,d_2.
\end{equation}
Поскольку линейные функционалы на $\mathbb R^{d_2}$ являются вектор-строками $(\lambda_1,\ldots,\lambda_{d_2})$, то функция Лагранжа задачи \eqref{TRK} записывается в виде
$$\LL(x,\ov\lambda)=\sum_{j=0}^{d_2}\lambda_jf_j(x),$$
где $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_{d_2})$.

Классическим правилом множителей Лагранжа для гладких
конечномерных задач является следующее утверждение.

\begin{theorem}[Правило множителей Лагранжа в конечномерном случае]
Если $\wx$ --- локальный экстремум в задаче \eqref{TRK}, функция $f_0$ дифференцируема в $\wx$, а функции $f_j$, $j=1,\ldots,d_2$, строго дифференцируемы в $\wx$, то найдутся, не равные одновременно
нулю, множители Лагранжа $\lambda_0,\lambda_1,\ldots,\lambda_{d_2}$ такие, что
$$\LL_x(\wx,\ov\lambda)=0\quad\Leftrightarrow\quad\sum_{j=0}^{d_2}
\lambda_jf'_j(\wx)=0.$$

Если векторы $f'_1(\wx),\ldots,f'_{d_2}(\wx)$ линейно независимы, то $\lambda_0\ne0$.
\end{theorem}

Доказательство сразу следует из предыдущей теоремы, если учесть, что подпространство
${\rm Im}\,F'(\wx)$ конечномерно и поэтому замкнуто, а линейная независимость векторов $f'_1(\wx),\ldots,f'_{d_2}(\wx)$ эквивалентна условию $\IM F'(\wx)=Y$.

Приведем пример, показывающий, что с $\lambda_0\ne0$ правило множителей Лагранжа может не выполняться. Рассмотрим задачу
$$x_1\to\min,\quad x_1^3-x_2^2=0.$$
Здесь $d_1=2$, $d_2=1$, $f_0(x)=x_1$, $f_1(x)=x_1^3-x_2^2$,
$$\LL(x,\lambda_0,\lambda_1)=\lambda_0x_1+\lambda_1(x_1^3-x_2^2).$$
Нетрудно убедиться, что точка $\wx=(0,0)$ является точкой минимума в рассматриваемой задаче. В силу того, что
$$\LL_x(0,\lambda_0,\lambda_1)=(\lambda_0,0)=0,$$
$\lambda_0$ не может быть отличным от нуля.


\section{Условия экстремума второго порядка для гладких задач с ограничениями типа равенств}

\begin{theorem}[Необходимые условия экстремума второго порядка]
Если $\wx$ --- локальный минимум $($максимум$)$ в задаче \eqref{TR},
функция $f$ и отображение $F$ дважды дифференцируемы в $\wx$ и $\IM F'(\wx)=Y$, то найдется множитель Лагранжа $y^*\in Y^*$ такой, что
\begin{equation}\label{eq1}
\LL_{x}(\wx,1,y^*)=0\quad\Leftrightarrow\quad f'(\wx)+(F'(\wx))^*y^*=0
\end{equation}
и для всех $h\in\Ker F'(\wx)$
\begin{multline}\label{eq2}
\LL_{xx}(\wx,1,y^*)[h,h]\ge0\ (\le0)\\
\Leftrightarrow\quad f''(\wx)[h,h]+\la y^*,F''(\wx)[h,h]\ra\ge0\ (\le0)\end{multline}
\end{theorem}

\begin{proof}
Из дважды дифференцируемости отображения $F$ в точке $\wx$ следует непрерывность $F'$ в точке $\wx$. В силу предложения~\ref{Pr1} отображение $F$ является строго дифференцируемым. Поэтому соотношение \eqref{eq1} сразу следует из \eqref{PL}.

Докажем \eqref{eq2}. Пусть $h\in\Ker F'(\wx)$. Отображение $F$ удовлетворяет условиям теоремы Люстерника (теорема~\ref{Lyu}) и поэтому $h\in T_{\wx}M$, т.~е. существуют $\varepsilon>0$ и отображение $r\colon(-\varepsilon,\varepsilon)\to X$ такие, что $F(\wx+th+r(t))=0$ для $t\in(-\varepsilon,\varepsilon)$ и $r(t)=o(t)$ при $t\to0$. Если  $\wx$ --- локальный минимум, то $f(\wx+th+r(t))\ge f(\wx)$ для достаточно малых $t$. Теперь по формуле Тейлора имеем (учитывая \eqref{eq1}
\begin{multline*}
0\le f(\wx+th+r(t))-f(\wx)=\mathcal L(\wx+th+r(t),1,y^*)-\mathcal L(\wx,1,y^*)\\
=\frac12\mathcal L_{xx}(\wx,1,y^*)[th+r(t),th+r(t)]+o(t^2)\\
=\frac{t^2}2\mathcal L_{xx}(\wx,1,y^*)[h,h]+o(t^2),
\end{multline*}
откуда следует \eqref{eq2}.
\end{proof}


\begin{theorem}[Достаточные условия экстремума второго порядка в задаче с
ограничениями типа равенств] Пусть в задаче \eqref{TR} функция $f$ и отображение $F$ дважды дифференцируемы в допустимой точке $\wx$ и $\IM F'(\wx)$ --- замкнутое подпространство в $Y$. Тогда если найдутся множитель Лагранжа $y^*\in Y^*$ и число $\alpha>0$ такие, что
\begin{equation}\label{eq4}
\LL_x(\wx,1,y^*)=0
\end{equation}
и при всех $h\in\Ker F'(\wx)$
\begin{equation}\label{eq5}
\LL_{xx}(\wx,1,y^*)[h,h]\ge\alpha \|h\|^2_X\quad(\le\alpha \|h\|^2_X),
\end{equation}
то $\wx$ --- локальный минимум $($максимум$)$ в задаче \eqref{TR}.
\end{theorem}

\begin{proof}
Рассмотрим отображение $G\colon X\to\IM F'(\wx)$, определенное по формуле $G(x)=F'(\wx)x$. Для него, очевидно, выполнены условия следствия~\ref{TNF1}, согласно которому существуют окрестность $U_0$ точки ноль, отображение $\varphi\colon U_0\to X$ и константа $K>0$ такие, что
\begin{equation}\label{eqi}
F'(\wx)(\varphi(x))=0
\end{equation}
и
\begin{equation}\label{eqii}
\|\varphi(x)-x\|_X\le K\|F'(\wx)x\|_Y
\end{equation}
для всех $x\in U_0$.

Можно считать, что в любой окрестности $\wx$ есть допустимые в \eqref{TR} точки (т.к. изолированная точка автоматически является и локальным минимумом, и локальным максимумом). Пусть $x\in U_0$ и $\wx+x$ --- допустимый элемент в задаче \eqref{TR}. Тогда по формуле Тейлора
$$0=F(\wx+x)=F'(\wx)x+\frac12 F''(\wx)[x,x]+o(\|x\|_X^2).$$
отсюда следует, что для достаточно малых $x$ справедливо неравенство
$$\|F'(\wx)x\|_Y\le\left(\frac12\|F''(\wx)\|+1\right)\|x\|_X^2,$$
а тогда из \eqref{eqii} получаем, что
$$\|\varphi(x)-x\|_X\le\gamma\|x\|_X^2,$$
где $\gamma=K(\|F''(\wx)\|/2+1)$. Следовательно,
$$\|\varphi(x)\|_X\le\|x\|+\gamma\|x\|_X^2=(1+\gamma\|x\|_X)\|x\|_X.$$ Считая, что
$\|x\|_X<1/\gamma$, имеем также оценку
$$\|\varphi(x)\|_X\ge
\|x\|_X-\|\varphi(x)-x\|_X\ge(1-\gamma\|x\|_X)\|x\|_X.$$


Обозначая, для краткости, $L(x)=\mathcal L(x,1,y^*)$, снова по формуле Тейлора
получаем (учитывая \eqref{eq4} и то, что $\wx+x$ --- допустимая точка)
$$f(\wx+x)=f(\wx)+\frac12 L''(\wx)[x,x]+o(\|x\|^2_X).$$
Отсюда, полагая $B=\|L''(\wx)\|$, учитывая, что $\varphi(x)\in\Ker F'(\wx)$ согласно \eqref{eqi}, полученные выше оценки, и считая, что выполнено первое из неравенств \eqref{eq5}, будем иметь
\begin{multline*}
f(\wx+x)-f(\wx)=\frac12 L''(\wx)[\varphi(x)-\varphi(x)+x,\varphi(x)-\varphi(x)+x]+
o(\|x\|_X^2)\\=
\frac12(L''(\wx)[\varphi(x),\varphi(x)]-2L''(\wx)[\varphi(x)-x,
\varphi(x)]\\+
L''(\wx)[\varphi(x)-x,\varphi(x)-x])+o(\|x\|_X^2)\ge\frac12
(\alpha\|\varphi(x)\|_X^2\\
-2B\|\varphi(x)\|_X\|\varphi(x)-x\|_X-B\|\varphi(x)-x\|_X^2)+o(\|x\|_X^2)
\\
\ge\frac12\|x\|_X^2(\alpha(1-\gamma\|x\|_X)^2-2B\gamma\|x\|_X(1+\gamma\|x\|_X)\\-
B\gamma^2\|x\|_X^2)+o(\|x\|_X^2).
\end{multline*}
Нетрудно убедиться, что выражение справа неотрицательно для
достаточно малых $x$ и поэтому $\wx$ --- локальный минимум. Случай, когда выполнено второе из неравенств \eqref{eq5} исследуется аналогично.
\end{proof}

\section{Гладкие задачи с ограничениями типа равенств и неравенств}

Пусть $U$ --- открытое подмножество банахова пространства $X$, $f_j:U\to\RR$, $j=0,1,\ldots,m$ и $F\colon U\to Y$, где $Y$ --- банахово пространство. Задачу
\begin{equation}\label{TR1}
f_0(x)\to\min,\quad f_j(x)\le0,\quad 1\le j\le m,\quad F(x)=0,
\end{equation}
называют {\it задачей с ограничениями типа равенств и неравенств}. Если функции $f_j$, $j=0,1,\ldots,m$, и отображение $F$ обладают некоторой гладкостью, то говорят
о {\it гладкой задаче с ограничениями типа равенств и неравенств}.

Сопоставим задаче \eqref{TR1} {\it функцию Лагранжа}
$$\LL(x,\ov\lambda,y^*)=\sum_{j=0}^m\lambda_jf_j(x)+\la y^*,F(x)\ra,$$
где $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)\in(\mathbb R^{m+1})^*$ и
$y^*\in Y^*$. Числа $\lambda_j$, $j=0,1,\ldots,m$, и функционал $y^*$ называются
{\it множителями Лагранжа}.

\begin{theorem}[Правило множителей Лагранжа в задаче с ограничениями типа равенств и неравенств]\label{T14}
Если $\wx$ --- локальный минимум в задаче \eqref{TR1}, функции $f_j$, $j=0,1,\ldots,m$, дифференцируемы в $\wx$, отображение $F$ строго дифференцируемо в $\wx$ и $\IM F'(\wx)$ --- замкнутое подпространство в $Y$, то найдутся такие множители Лагранжа $\lambda_0,\lambda_1,\ldots,\lambda_m$ и $y^*$, не равные нулю одновременно, для которых выполнены условия
\begin{itemize}
\item[$(a)$] $\LL_x(\wx,\ov\lambda,y^*)=0\Leftrightarrow
\sum_{j=0}^m\lambda_jf'_j(\wx)+(F'(\wx))^*y^*=0$ $($условие стационарности$)$;
\item[$(b)$] $\lambda_j\ge0$, $j=0,1,\ldots,m$ $($условие неотрицательности$)$;
\item[$(c)$] $\lambda_jf_j(\wx)=0$, $j=1,\ldots,m$ $($условие
дополняющей не\-жест\-кос\-ти$)$.
\end{itemize}
Если $\IM F'(\wx)=Y$ и существует вектор $h\in\Ker F'(\wx)$ такой, что
$\la f'_j(\wx),h\ra<0$ для всех $j\in J_0=\{j:f_j(\wx)=0,\ 1\le j\le m\}$, то $\lambda_0\ne0$.

\end{theorem}

\begin{proof}
Заметим сначала, что утверждение $(c)$ можно считать выполненным всегда. В самом деле, отбросим те ограничения среди неравенств, для которых $f_j(\wx)<0$. Тогда $\wx$ будет локальным экстремумом и в новой задаче. Если для этой задачи доказаны утверждения $(a)$ и $(b)$, то $(c)$  выполняется автоматически. Дополнив найденный набор множителей Лагранжа нулевыми компонентами, соответствующими тем номерам, где $f_j(\wx)<0$, получим утверждения $(a)$, $(b)$ и $(c)$ для исходной задачи.

Как и в доказательстве правила множителей Лагранжа для задачи с ограничениями типа равенств рассмотрим отдельно два случая.

$A)$ Вырожденный случай: $\IM F'(\wx)\ne Y$. Здесь, фактически, повторяется доказательство правила множителей Лагранжа для вырожденного случая в гладкой задаче с равенствами. В силу того, что подпространство $\IM F'(\wx)$ замкнуто, по лемме о нетривиальности аннулятора (лемма~\ref{NA}) существует ненулевой функционал $y^*\in Y^*$ такой, что $\la y^*,F'(\wx)x\ra=0$ для любого $x\in X$, т.~е. $(F'(\wx))^*y^*=0$. Остается положить $\lambda_j=0$, $j=0,1,\ldots,m$.

$B)$ Невырожденный случай: $\IM F'(\wx)=Y$. Рассмотрим множество
\begin{multline*}
C=\{\,(\mu_0,\mu_1,\ldots,\mu_m,y)\in\mathbb R^{m+1}\times Y:\exists\, x\in
X:\mu_j>\la f'_j(\wx),x\ra,\\j=0,1,\ldots,m,\,\, y=F'(\wx)x\,\}.
\end{multline*}
Очевидно, что $C$ --- выпуклое множество. Докажем, что $0\notin C$. Предположим, что $0\in C$. Тогда существует такое $x_0\in X$, что $\la f'_j(\wx),x_0\ra<0$,
$j=0,1,\ldots,m$, и $F'(\wx)x_0=0$. По теореме Люстерника $x_0\in
T_{\wx}M$, где $M=\{\,x\in X:F(x)=F(\wx)=0\,\}$, т.~е. существуют
$\varepsilon>0$ и отображение $r\colon(-\varepsilon,\varepsilon)\to X$ такие, что
$F(\wx+tx_0+r(t))=0$ для всех $t\in(-\varepsilon,\varepsilon)$ и $\|r(t)\|_X=o(t)$
при $t\to0$. В силу дифференцируемости функций $f_j$, $j=0,1,\ldots,m$, в
точке $\wx$ имеем
$$f_j(\wx+tx_0+r(t))=f_j(\wx)+\la f'_j(\wx),x_0\ra t+o(t)<f_j(\wx)$$
для достаточно малых $t>0$. Это значит, что для таких $t$ точки $\wx+tx_0+r(t)$
допустимы в задаче \eqref{TR1}, а значение функционала $f_0$ на них меньше, чем
$f_0(\wx)$, в противоречие с тем, что $\wx$ --- локальный минимум. Итак, $0\notin
C$.

Покажем теперь, что $\intt C\ne\emptyset$. Рассмотрим множество
\begin{multline*}
C_0=\{\,(\mu_0,\mu_1,\ldots,\mu_m,y)\in\mathbb R^{m+1}\times Y:
\mu_j>d,\ j=0,1,\ldots,m,\\
y\in F'(\wx)(B_X(0,1))\,\},\quad d=\max_{0\le j\le m}\|f'_j(\wx)\|.
\end{multline*}
По теореме Банаха об открытом отображении \cite[стр. 243]{KF} множество $F'(\wx)(B_X(0,1))$ открыто. Тем самым $C_0$ --- открытое множество. Покажем, что
$C_0\subset C$. Действительно, пусть $(\mu_0,\mu_1,\ldots,\mu_m,y)\in C_0$ и $x\in
B_X(0,1)$ такое, что $y=F'(\wx)x$. Тогда $\mu_j>d\ge\la f'_j(\wx),x\ra$,
$j=0,\ldots,m$, и значит, $(\mu_0,\mu_1,\ldots,\mu_m,y)\in C$, т.~е. $\intt C\ne\emptyset$.

В силу первой теоремы отделимости (теорема~\ref{FTO}) множество $C$ можно отделить от нуля, т.е. найдется ненулевой функционал $(\lambda_0,\lambda_1,\ldots,\lambda_m,y^*)\in
(\mathbb R^{m+1})^*\times Y^*$ такой, что
\begin{equation}\label{eqeqi}
\sum_{j=0}^m\lambda_j\mu_j+\la y^*,y\ra\ge0
\end{equation}
для всех $(\mu_0,\mu_1,\ldots,\mu_m,y)\in C$. Наборы $(\mu_0,\mu_1,\ldots,\mu_m,0)$, где $\mu_j>0$, $j=0,1\ldots,m$, принадлежат
$C$ (надо взять $x=0$). Подставляя их в \eqref{eqeqi}, получаем, что
$$\sum_{j=0}^m\lambda_j\mu_j\ge0$$
для всех $\mu_j>0$, $j=0,1\ldots,m$. Отсюда вытекают неравенства $\lambda_j\ge0$,
$j=0,1\ldots,m$, и утверждение $(b)$ теоремы доказано.

Для любого $x\in X$ и любого $\varepsilon>0$
$$(\la f'_0(\wx),x\ra+\varepsilon,\ldots,\la f'_m(\wx),x\ra+\varepsilon, F'(\wx)x)\in C.$$
Из \eqref{eqeqi}, получаем, что
$$\sum_{j=0}^m\lambda_j\la f_j(\wx),x\ra+\la y^*,F'(\wx)x\ra\ge-\varepsilon\sum_{j=0}^m\lambda_j.$$
В силу произвольности $\varepsilon$ левая часть этого неравенства (которая есть линейный функционал) неотрицательна на $X$ и значит, она равна нулю, а это равносильно утверждению $(a)$ теоремы.



Докажем последнее утверждение теоремы. Пусть выполнены его предположения  и $\lambda_0=0$. Если при некотором $1\le j\le m$, $f_j(\wx)\ne0$, то из $c)$ следует, что $\lambda_j=0$. Тем самым из $(a)$ вытекает, что
$$\sum_{j\in J_0}\lambda_j\la f'_j(\wx),h\ra=0.$$
В силу $b)$ и того, что $\la f'_j(\wx),h\ra<0$, $j\in J_0$, получаем, что $\lambda_j=0$, $j=0,1,\ldots,m$. Следовательно, из $a)$ вытекает, что $\la y^*,F'(\wx)x\ra=0$ для всех $x\in X$. Так как $\IM F'(\wx)=Y$, то $\la y^*,y\ra=0$ при всех $y\in Y$, т.е. $y^*=0$. Это противоречит тому, что не все множители Лагранжа равны нулю.
\end{proof}

\section{Выпуклые задачи без ограничений. Субдифференциал. Теорема Ферма}

Пусть $X$ --- вещественное линейное пространство и $f\colon X\to\ov{\mathbb R}=\mathbb R\cup\{+\infty\}$. Множества
\begin{gather*}
\dom f=\{\,x\in X:f(x)<+\infty\,\},\\
\epi f=\{\,(x,\alpha)\in X\times\mathbb R:\alpha\ge f(x),\ x\in\dom f\,\}
\end{gather*}
называются соответственно {\it эффективным множеством} и {\it надграфиком} (или {\it эпиграфом}) {\it функции}  $f$. Функцию $f$ называют {\it собственной}, если $\dom f\ne\emptyset$.

Для элементов расширенной прямой считается, что $a+(+\infty)=+\infty$ для всех $a\in\mathbb R$, $a\cdot(+\infty)=+\infty$, если $a>0$, $0\cdot(+\infty)=0$ и $+\infty+(+\infty)=+\infty$.

Функция $f\colon X\to\ov{\mathbb R}$ называется {\it выпуклой}, если ее надграфик выпуклое множество в $X\times\mathbb R$. Нетрудно проверить, что функция $f$ выпукла тогда и только тогда, когда для любых
$x_1,x_2\in X$ и любого $0\le\alpha\le1$ выполняется неравенство
$$f((1-\alpha)x_1+\alpha x_2)\le (1-\alpha)f(x_1)+\alpha f(x_2),$$
которое называется {\it неравенством Йенссена}.

\begin{theorem}
Пусть $X$ --- линейное нормированное пространство и $f\colon X\to\mathbb R$ --- дважды дифференцируема на $X$. Тогда $f$ --- выпуклая функция тогда и только тогда, когда $f''(x)[h,h]\ge0$ для всех $x\in X$ и всех $h\in X$.
\end{theorem}

\begin{proof}
Пусть $f$ --- выпуклая функция. Предположим, что существует $x\in X$ и $h\in X$ такие, что $f''(x)[h,h]<0$. По формуле Тейлора для $t\in\mathbb R$ имеем
\begin{align*}
f(x+th)&=f(x)+f'(x)ht+f''(x)[h,h]\frac{t^2}2+o(t^2),\\
f(x-th)&=f(x)-f'(x)ht+f''(x)[h,h]\frac{t^2}2+o(t^2).
\end{align*}
Отсюда, складывая эти равенства, получаем
$$f(x+th)-2f(x)+f(x-th)=f''(x)[h,h]t^2+o(t^2).$$
Следовательно, при достаточно малых $t$
$$f(x+th)-2f(x)+f(x-th)<0,$$
что противоречит выпуклости $f$.

Пусть теперь $f''(x)[h,h]\ge0$ для всех $x\in X$ и всех $h\in X$. Для произвольных $x_1,x_2\in X$ рассмотрим функцию
$$F(t)=f(x_1+t(x_2-x_1))-f(x_1)-t(f(x_2)-f(x_1)).$$
Имеем $F(0)=F(1)=0$, $$F''(t)=f''(x_1+t(x_2-x_1))[x_2-x_1,x_2-x_1]\ge0.$$
Предположим, что при некотором $t\in(0,1)$ \ $F(t)>0$. Тогда найдется точка $t_0\in(0,1)$, в которой функция $F$ будет достигать максимального значения и, значит, $F'(t_0)=0$. Поскольку $F''(t)\ge0$ при всех $t\in[t_0,1]$, то $F'(t)\ge0$ при $t\in[t_0,1]$. Тем самым функция $F$ не убывает на отрезке $[t_0,1]$, а значит, $F(1)>0$. Полученное противоречие доказывает, что $F(t)\le0$ для всех $t\in[0,1]$. Таким образом, для всех $t\in[0,1]$ справедливо неравенство
$$f((1-t)x_1+tx_2)\le(1-t)f(x_1)+tf(x_2),$$
что и означает выпуклость функции $f$.
\end{proof}

Пусть $X=\Rd$ и $f\colon\Rd\to\mathbb R$. Если $f$ --- дважды дифференцируема, то $f''(x)$ --- гессиан $f$ в точке $x$ (см.~\eqref{Ge}).
\begin{corollary}\label{SS1}
Если функция $f\colon\Rd\to\mathbb R$ дважды дифференцируема на $\Rd$, то она является выпуклой в том, и только в том случае, если ее гессиан в любой точке $x\in X$ удовлетворяет условию
$$h^Tf''(x)h\ge0$$
для всех $h\in X$ $($матрица гессиана в любой точке является неотрицательно определенной$)$.
\end{corollary}

Пусть $X$ --- линейное нормированное пространство, $f\colon X\to\ov{\mathbb R}$, $\wx\in X$ и функция $f$ конечна в точке $\wx$.
{\it Субдифференциалом функции $f$ в точке $\wx$}
называется множество (возможно пустое)
$$\partial f(\wx)=\{\, x^*\in X^*:f(x)-f(\wx)\ge\la x^*,x-\wx\ra,\ \forall\, x\in X\,\}.$$

Следующее предложение показывает, что субдифференциал достаточно естественное обобщение понятия производной на выпуклые функции.

\begin{proposition}\label{P2}
Пусть $X$ --- линейное нормированное пространство и $f\colon X\to\ov{\mathbb R}$ --- выпуклая функция, дифференцируемая в точке $\wx$. Тогда $\partial f(\wx)=\{f'(\wx)\}$.
\end{proposition}

\begin{proof}
Пусть $x\in\ X$. Для любого $0<\alpha<1$ имеем по
неравенству Йенссена
$$f((1-\alpha)\wx+\alpha x)\le(1-\alpha)f(\wx)+\alpha f(x),$$
откуда
$$f(\wx+\alpha(x-\wx))-f(\wx)\le\alpha(f(x)-f(\wx)).$$
В силу дифференцируемости функции $f$ в точке $\wx$ имеем
$$\alpha\la f'(\wx),x-\wx\ra+o(\alpha)\le\alpha(f(x)-f(\wx)).$$
Сокращая на $\alpha$ и переходя к пределу при $\alpha\to0$, получаем, что $f'(\wx)\in\partial f(\wx)$.

Обратно, если $x^*\in\partial f(\wx)$, то для любого $x\in X$ и любого $t>0$ имеем $f(\wx+tx)-f(\wx)\ge t\la x^*,x\ra$.
Следовательно,
$$t\la f'(\wx),x\ra+o(t)\ge t\la x^*,x\ra,$$
т.~е. $\la f'(\wx),x\ra\ge\la x^*,x\ra$ для любого $x$ и значит,
$x^*=f'(\wx)$.
\end{proof}

Пусть $X$ --- линейное нормированное пространство и $f\colon X\to\ov {\mathbb R}$ --- собственная функция. Рассмотрим задачу
\begin{equation}\label{FF1}
f(x)\to\min,\quad x\in X.
\end{equation}

\begin{theorem}[Ферма в субдифференциальной форме]\label{FD}
Точка $\wx$ является глобальным минимумом в задаче \eqref{FF1} тогда и только тогда, когда $0\in\partial f(\wx)$.
\end{theorem}

\begin{proof}
Если $\wx$ --- глобальный минимум, то $f(x)-f(\wx)\ge0=\la0,x-\wx\ra$ для любого $x\in X$, т.~е. $0\in\partial f(\wx)$. Если $0\in\partial
f(\wx)$, то $f(x)-f(\wx)\ge\la0,x-\wx\ra=0$, т.~е. $f(x)\ge f(\wx)$ для любого $x\in X$.
\end{proof}

Если в задаче \eqref{FF1} функция $f$ --- выпуклая, то она называется {\it выпуклой задачей без ограничений}. Отметим, что в этом случае нет смысла говорить о локальных минимумах, поскольку любой локальный минимум является и глобальным. Действительно, пусть $\wx$ ---
локальный минимум, т.~е. существует такая окрестность $U$ точки $\wx$, что $f(\wx)\le f(x)$ для всех $x\in U$. Пусть теперь $x$ --- произвольная точка из $X$. Для достаточно малых $0<\alpha\le1$ точки $(1-\alpha)\wx+\alpha x$ принадлежат $U$ и поэтому (по неравенству Йенссена) $f(\wx)\le f((1-\alpha)\wx+\alpha x)\le(1-\alpha)f(\wx)+\alpha f(x)$, откуда следует, что $f(\wx)\le f(x)$.

Из предложения~\ref{P2} и теоремы~\ref{FD} вытекает

\begin{corollary}
Если в задаче \eqref{FF1} $f$ --- выпуклая функция, дифференцируемая в точке $\wx$, то $\wx$ --- глобальный минимум в том и только в том случае, если $f'(\wx)=0$.
\end{corollary}

\section{Выпуклые задачи с ограничениями. Теорема Каруша--Куна--Таккера}

Пусть $X$ --- вещественное линейное пространство, $f_j\colon X\to\mathbb R$, $j=0,1,\ldots,m$, --- выпуклые функции и $A$ --- непустое выпуклое подмножество $X$. Задачу
\begin{equation}\label{eqp4}
f_0(x)\to\min,\quad f_j(x)\le 0,\quad j=1,\ldots,m,\quad x\in A
\end{equation}
называют {\it выпуклой задачей} или {\it задачей выпуклого программирования}.

Свяжем с задачей \eqref{eqp4} следующую функцию Лагранжа
$$\LL(x,\ov\lambda)=\sum_{j=0}^m\lambda_jf_j(x),$$
где $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$ --- набор множителей Лагранжа.

\begin{theorem}[Каруша--Куна--Таккера]
Если $\wx$ ---  минимум в задаче \eqref{eqp4}, то найдется такой ненулевой набор множителей Лагранжа $\ov \lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$, что выполнены следующие условия
\begin{itemize}
\item[$(a)$] $\min_{x\in A}\LL(x,\ov\lambda)=\LL(\wx,\ov\lambda)$
$($условие минимума$)$;
\item[$(b)$] $\lambda_j\ge0$, $j=0,1,\ldots,m$ $($условие неотрицательности$)$;
\item[$(c)$] $\lambda_jf_j(\wx)=0$, $j=1,\ldots,m$ $($условие дополняющей не\-жест\-кос\-ти$)$.
\end{itemize}

Если существует допустимая в \eqref{eqp4} точка $\wx$ и набор множителей Лагранжа $\ov
\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$, удовлетворяющие условиям $(a)$, $(b)$ и $(c)$ и при этом $\lambda_0>0$, то $\wx$ --- решение задачи \eqref{eqp4}.

Если найдется точка $\ov x\in A$ такая, что $f_j(\ov x)<0$, $1\le j\le m$, то $\lambda_0\ne0$ (условие Слейтера).
\end{theorem}

\begin{proof}
Пусть $\wx$ --- решение задачи \eqref{eqp4}. Рассмотрим множество
\begin{multline*}
M=\{\,\mu=(\mu_0,\mu_1,\ldots,\mu_m)^T\in\mathbb R^{m+1}:\exists\,x\in A:f_0(x)-f_0(\wx)<\mu_0,\\ f_j(x)\le\mu_j,\ j=1,\ldots,m\,\}.
\end{multline*}
Непосредственная проверка показывает, что это множество выпукло. Кроме того, легко видеть, что оно содержит все векторы с положительными компонентами (надо взять $x=\wx$) и тем самым его внутренность не пуста. Наконец, $0\notin M$, так как в противном случае нашелся бы элемент $\ov x\in A$ такой, что $f_j(\ov x)\le0$, $j=1,\ldots,m$, и $f_0(\ov
x)-f_0(\wx)<0$, в противоречие с тем, что $\wx$ --- минимум.


Согласно первой теореме отделимости найдется такой ненулевой
функционал, т.~е. вектор $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)\in
(\mathbb R^{m+1})^*$, что
\begin{equation}\label{eqkt}
\sum_{j=0}^m\lambda_j\mu_j\ge0
\end{equation}
для всех $\mu=(\mu_0,\mu_1,\ldots,\mu_m)^T\in M$. Пусть $\delta>0$. Подставляя в \eqref{eqkt} векторы $(1,\delta,\ldots,\delta)^T,\ldots,(\delta,\ldots,\delta,1)^T$, а затем устремляя $\delta$ к нулю, получаем, что $\lambda_j\ge0$, $j=0,1,\ldots,m$, т.~е. доказано утверждение $(b)$ теоремы.

Теперь подставим в \eqref{eqkt} векторы
$(\delta,\ldots,\delta,f_j(\wx),\delta,\ldots,\delta)^T$, $j=1,\ldots,m$ (они принадлежат $M$, надо взять $x=\wx$) и снова, устремляя $\delta$ к нулю, получим, что $\lambda_jf_j(\wx)\ge0$. Но $\lambda_jf_j(\wx)\le0$, так как $\lambda_j\ge0$, а $f_j(\wx)\le0$ и поэтому $\lambda_jf_j(\wx)=0$, $j=1,\ldots,m$, что доказывает утверждение $(c)$.

Пусть $x\in A$. Ясно, что $(f_0(x)-f_0(\wx)+\delta,f_1(x),\ldots,f_m(x))^T\in M$.
Подставляя этот вектор в \eqref{eqkt}, приходим (в пределе при $\delta\to0$) к неравенству $\sum_{j=0}^m\lambda_jf_j(x)\ge\lambda_0f_0(\wx)$. Добавляя справа нулевые слагаемые
$\lambda_jf_j(\wx)$, $j=1,\ldots,m$, получаем, что $\LL(x,\ov\lambda)\ge\LL(\wx,\ov\lambda)$ и $(a)$ доказано.

Докажем второе утверждение теоремы. Пусть $x$ --- допустимый элемент в задаче \eqref{eqkt}. Тогда, используя это обстоятельство вместе с $(b)$, $(a)$ и $(c)$, будем иметь
\begin{multline*}
\lambda_0f_0(x)\ge\lambda_0f_0(x)+\sum_{j=1}^m\lambda_jf_j(x)=
\LL(x,\ov\lambda)\ge\LL(\wx,\ov\lambda)\\=\lambda_0f_0(x)+
\sum_{j=1}^m\lambda_jf_j(\wx)=\lambda_0f_0(\wx).
\end{multline*}
Деля на $\lambda_0$, получаем требуемое.

Докажем последнее утверждение теоремы. Если  $\lambda_0=0$, то ненулевой множитель
Лагранжа находится среди остальных и поэтому (с учетом $(c)$) $\mathcal L(\ov
x,\ov\lambda)=\sum_{i=1}^m\lambda_if_i(\ov
x)<0=\sum_{i=1}^m\lambda_if_i(\wx)=\mathcal L(\wx,\ov\lambda)$, что противоречит
$(a)$.
\end{proof}

\section{Простейшая задача вариационного исчисления. Уравнение Эйлера}

Принято считать, что вариационное исчисление родилось с задачи о брахистохроне, предложенной в 1696 г. И.~Бернулли для решения своим современникам. Задача была решена самим Бернулли, его братом Яковом, Ньютоном, Лейбницем и Лопиталем. Решения были разные, и вскоре еще было  решено несколько сходных задач.

В начале 18 века И.~Бернулли предложил Л.~Эйлеру (тогда молодому человеку, которого он консультировал по научным вопросам) найти общие методы решения подобных задач. Начиная с 1732 г. Л.~Эйлер начал активно этим заниматься и через 12 лет завершил свой фундаментальный труд ``Modus invineniondi lineas curvas maximive proprietate
gemdenties sive soluto problematis isoperimetrice latissimo sensu accepti'' (``Метод нахождения кривых линий, обладающих свойствами максимума или минимума, или решение изопериметрической задачи, взятой в самом широком смысле''), Лозанна, 1744 г. Там, в частности, была рассмотрена задача, которая ныне называется простейшей задачей
(классического) вариационного исчисления.

Пусть $[t_{0},t_{1}]$ --- отрезок числовой прямой,  $G$ --- открытое
подмножество $\mathbb R^3$, $L\colon G\to\mathbb R$
--- функция переменных  $t$, $x$, $\dot x$ и
$x_0,x_1\in\mathbb R$. Задача
\begin{equation}\label{E1}
J(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t))\,dt\to\extr,\quad x(t_0)=x_0,\quad x(t_1)=x_1,
\end{equation}
называется {\it простейшей задачей $($классического$)$ вариационного
исчисления}. Функцию $L$ называют {\it интегрантом\/} или {\it лагранжианом\/} задачи.

Уточним постановку. Обозначим через $C([t_{0},t_{1}])$ и $C^1([t_{0},t_{1}])$
множества всех непрерывных и непрерывно дифференцируемых функций $x$ на
$[t_{0},t_{1}]$. Это нормированные пространства соответственно с нормами
\begin{align*}
\|x\|_{C([t_0,t_1])}&=\max_{t\in[t_0,t_1]}|x(t)|,\\
\|x\|_{C^1([t_0,t_1])}&=\max(\|x\|_
{C([t_0,t_1])},\|\dot
x\|_{C([t_0,t_1])}).
\end{align*}


Функция $x\in C^1([t_0,t_1])$ называется {\it допустимой в задаче
\eqref{E1}}, если  $\Gamma(x)=\{(t,x(t),\dot x(t)):t\in [t_{0},t_{1}]\}\subset G$ и $x(t_j)=x_j$, $j=0,1$.

Допустимая функция $\wx$  называется {\it слабым локальным минимумом
$($максимумом$)$} в задаче \eqref{E1}, если существует такое $\varepsilon>0$, что для
любой допустимой функции $x$, для которой $\|x-\wx\|_{C^1([t_0,t_1])}<\varepsilon$ выполняется неравенство
$J(x)\ge J(\wx)$ ($J(x)\le J(\wx)$). {\it Слабый локальный экстремум} --- это либо слабый локальный минимум, либо слабый локальный максимум.

Далее, если фиксирована функция $\wx$, то для сокращения записи
используем обозначения: $\wL_x(t)=L_x(t,\wx(t),\dot\wx(t))$ и аналогично для частной производной $L$ по $\dot x$.

\begin{theorem}[Необходимые условия экстремума в задаче \eqref{E1}]
Пусть $\wx$ доставляет слабый локальный экстремум в задаче \eqref{E1}. Тогда, если функция $L$ непрерывна вместе со своими частными производными по $x$ и $\dot x$ в окрестности $\Gamma(\wx)$, то $\wL_{\dot x}\in C^1([t_0,t_1])$ и для всех $t\in[t_0,t_1]$ выполнено уpавнение Эйлеpа
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0.$$
\end{theorem}

\begin{proof}
Пусть $x\in C^1([t_0,t_1])$ и $x(t_0)=x(t_1)=0$. Положим
$x_\alpha=\wx+\alpha x$, где $\alpha\in\mathbb R$. Для достаточно
малых $\alpha$ функция $x_\alpha$ принадлежит окрестности $\Gamma(\wx)$. Кроме того, очевидно, что $x_\alpha\in C^1([t_0,t_1])$ и $x_\alpha(t_j)=x_j$, $j=0,1$. Тем самым для достаточно малых $\alpha$ функции $x_\alpha$ допустимы в задаче \eqref{E1}. Функция $\wJ(\alpha)=J(x_{\alpha})$ имеет в нуле локальный экстремум. В силу теоремы о производной суперпозиции функций (теорема~\ref{TS1}) и дифференцировании оператора Немыцкого (следствие~\ref{CN}) эта
функция дифференцируема в нуле и тогда по теореме Ферма ее производная в нуле равна нулю. Следовательно,
\begin{equation}\label{V1}
\frac{d\wJ(\alpha)}{d\alpha}\bigg|_{\alpha=0}=\int_{t_0}^{t_1}
\left(\wL_x(t)x(t)+\wL_{\dot x}(t)\dot x(t)\right)\,dt=0.
\end{equation}
Пусть $p$ такая функция, что $\dot p=\wL_x$. Тогда, интегрирую по частям, получаем
$$\int_{t_0}^{t_1}\wL_x(t)x(t)\,dt=\int_{t_0}^{t_1}\dot p(t)x(t)\,dt=-\int_{t_0}^{t_1}p(t)\dot x(t)\,dt.$$
Поэтому, из \eqref{V1} следует, что для всех функций $x\in C^1([t_0,t_1])$, для которых $x(t_0)=x(t_1)=0$ справедливо равенство
$$\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)\right)\dot x(t)\,dt=0.$$
Но тогда для любой константы $c\in\mathbb R$ справедливо и такое равенство
\begin{equation}\label{V2}
\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)+c\right)\dot x(t)\,dt=0.
\end{equation}
Выберем $c$ так, чтобы
$$\int_{t_0}^{t_1}(-p(t)+\wL_{\dot x}(t)+c)\,dt=0.$$
Рассмотрим функцию
$$x(t)=\int_{t_0}^t(-p(\tau)+\wL_{\dot x}(\tau)+c)\,d\tau.$$
Ясно, что $x\in C^1([t_0,t_1])$ и $x(t_0)=x(t_1)=0$. Подставим эту функцию в \eqref{V2}. Тогда получим
$$\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)+c\right)^2dt=0.$$
Отсюда следует, что $-p+\wL_{\dot x}+c=0$. Тем самым  $\wL_{\dot x}\in C^1([t_0,t_1])$. Дифференцируя равенство $p=\wL_{\dot x}+c$ и учитывая, что $\dot p=\wL_{x}$, получаем уравнение Эйлера.
\end{proof}

\section{Задача Больца. Интегралы уравнения Эйлера}

Пусть, как и в предыдущем случае, $[t_{0},t_{1}]$ --- отрезок числовой прямой,  $G$
--- открытое подмножество $\mathbb R^3$, $L\colon G\to\mathbb R$
--- непрерывная функция переменных $t$, $x$ и $\dot x$. Пусть, кроме того, задана функция $l\colon W\to \mathbb R$, где $W$ --- открытое
подмножество $\mathbb R^2$. Задача
\begin{equation}\label{V3}
\mathcal B(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t))\,dt
+l(x(t_0),x(t_1))\to\extr
\end{equation}
называется {\it задачей Больца}.

Функция $x\in C^1([t_0,t_1])$ называется {\it допустимой в задаче
\eqref{V3}}, если  $\Gamma(x)=\{(t,x(t),\dot x(t)):t\in [t_0,t_1]\}\subset
G$ и $(x(t_0),x(t_1))\in W$.

Слабый локальный экстремум определяется аналогично предыдущему случаю.

Функции $\wL_x$ и $\wL_{\dot x}$ определяются как и раньше, и
кроме того, для функции $l(\xi_0,\xi_1)$ полагаем  $\wl_{\xi_j}=l_{\xi_j}(\wx(t_0),\wx(t_1))$, $j=0,1$.

\begin{theorem}[Необходимые условия экстремума в задаче \eqref{V3}]
Пусть $\wx$ доставляет слабый локальный экстремум в задаче \eqref{V3}. Тогда, если функция $L$ непрерывна вместе со своими частными производными по $x$ и $\dot x$ в окрестности $\Gamma(\wx)$, а функция $l$ непрерывна вместе со своими частными производными по $\xi_0$ и $\xi_1$ в окрестности точки $(\wx(t_0),\wx(t_1))$, то
$\wL_{\dot x}\in C^1([t_0,t_1])$, для всех $t\in[t_0,t_1]$
выполнено уpавнение Эйлеpа
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0,$$
а, кроме того, выполняется условие трансверсальности
$$\wL_{\dot x}(t_j)=(-1)^j\wl_{\xi_j},\quad j=0,1.$$
\end{theorem}

\begin{proof}
Пусть $x\in C^1([t_0,t_1])$ и $x_{\alpha}=\wx+\alpha x$. Рассуждая точно так же, как и в предыдущей теореме, приходим к соотношению
\begin{multline}\label{V4}
\frac{d \mathcal
B(x_{\alpha})}{d\alpha}\bigg|_{\alpha=0}=\int_{t_0}^{t_1}
\left(\wL_x(t)x(t)+\wL_{\dot x}(t)\dot x(t)\right)\,dt\\
+\wl_{\xi_0}x(t_0)+\wl_{\xi_1}x(t_1)=0.
\end{multline}
Пусть $p$ --- решение задачи Коши $\dot p=\wL_x(t)$, $p(t_1)=-\wl_{\xi_1}$. Тем самым $$p(t)=-\wl_{\xi_1}-\int_t^{t_1}\wL_x(\tau)\,d\tau,\quad t\in[t_0,t_1].$$
Подставляя $\dot p$ в \eqref{V4} вместо $\wL_x$ и интегрируя по частям, получаем, что
\begin{equation}\label{V5}
\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)\right)\dot
x(t)\,dt+(\wl_{\xi_0}-p(t_0))x(t_0)=0.
\end{equation}
Пусть теперь $x$ --- решение задачи Коши $\dot x=-p(t)+\wL_{\dot x}(t)$, $x(t_0)= \wl_{\xi_0}-p(t_0)$, т.~е.
$$x(t)=\wl_{\xi_0}-p(t_0)+\int_{t_0}^t(-p(\tau)+\wL_{\dot x}(\tau))\,d\tau,\quad t\in[t_0,t_1].$$
Ясно, что $x\in C^1([t_0,t_1])$. Подставляя $x$ в \eqref{V5}, приходим к равенству
$$\int_{t_0}^{t_1}\left(-p(t)+\wL_{\dot x}(t)
\right)^2\,dt+(\wl_{\xi_0}-p(t_0))^2=0,$$
откуда следует равенство $p=\wL_{\dot x}$, равносильное, в силу определения $p$, уравнению Эйлера, а также соотношение $p(t_0)=\wl_{\xi_0}$, или $\wL_{\dot x}(t_0)=\wl_{\xi_0}$. Условие $\wL_{\dot x}(t_1)=-\wl_{\xi_1}$ входит в определение $p$.
\end{proof}

Мы рассмотрели ``одномерные'' варианты простейшей задачи и задачи Больца. Совершенно аналогично рассматриваются их векторные аналоги, когда $x=(x_1,\ldots,x_d)^T$. В этом случае роль пространств $C([t_0,t_1])$ и $C^1([t_0,t_1])$ играют пространства
$C([t_0,t_1],\mathbb R^d)$ и $C^1([t_0,t_1],\mathbb R^d)$ --- соответственно непрерывных и непрерывно дифференцируемых вектор-функций со значениями в $\mathbb R^d$. Они определяются аналогично одномерным вариантам, где $|x(t)|=\sqrt{x_1^2(t)+\ldots+x_d^2(t)}$. Необходимые условия экстремума здесь имеют тот же вид и их доказательства остаются прежними. Но формулы, разумеется, надо понимать векторно. Например,
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0\ \Leftrightarrow\ -\frac d{dt}\wL_{\dot x_j}(t)+\wL_{x_j}(t)=0,\quad j=1,\ldots,d.$$

Напомним, что первым интегралом дифференциального уравнения называется функция, которая постоянна на решениях данного уравнения.

Если лагранжиан $L$ не зависит от переменной $x$, то уравнение Эйлера имеет очевидный первый интеграл
$$p(t)=L_{\dot x}(t,\dot{\wx}(t))=\const,$$
который называется {\it интегралом импульса}.

Если лагранжиан $L$ не зависит от переменной $t$, то уравнение Эйлера имеет первый интеграл
$$H(t)=L_{\dot x}(\wx(t),\dot{\wx}(t))\dot{\wx}(t)-L(\wx(t),\dot{\wx}(t))=\const.$$
Он называется {\it интегралом энергии}.

Для доказательства вычислим производную функции $H$ (учитывая,
что $\wx\cd$ удовлетворяет уравнению Эйлера)
\begin{multline*}
\frac{dH}{dt}=L_{\dot x}(\wx(t),\dot{\wx}(t))\ddot{\wx}(t)+\frac d{dt}L_{\dot
x}(\wx(t),\dot{\wx}(t))\dot{\wx}(t)-L_x(\wx(t),\dot{\wx}(t))\dot{\wx}(t)\\-
L_{\dot x}(\wx(t),\dot{\wx}(t))\ddot{\wx}(t)=\left(\frac d{dt}L_{\dot
x}(\wx(t),\dot{\wx}(t))-L_x(\wx(t),\dot{\wx}(t))\right)\dot{\wx}(t)=0.
\end{multline*}
При доказательстве мы предположили существование $\ddot{\wx}$.

\section{Задача Лагранжа. Общая постановка}

Пусть $[t_0,t_1]$ --- конечный отрезок, $G$ --- открытое подмножество $\mathbb
R\times\mathbb R^{d_1}\times\mathbb R^{d_2}$, $W$ --- открытое подмножество $\mathbb R^{d_1}\times\mathbb R^{d_1}$, функции $L_j\colon G\to\mathbb R$, $j=0,1,\ldots,m$, и отображение
$\varphi\colon G\to\mathbb R^{d_1}$ (переменных $t\in\mathbb R$, $x=(x_1,\ldots,x_{d_1})^T\in\mathbb R^{d_1}$, $u=(u_1,\ldots,u_{d_2})^T\in\mathbb R^{d_2}$) и функции $l_j\colon W\to\mathbb R$, $j=0,1,\ldots,m$ (переменных $\xi_0$ и $\xi_1$) непрерывны на своей области определения. Задача
\begin{multline}\label{Lag}
f_0(x,u)=\int_{t_0}^{t_1}L_0(t,x(t),u(t))\,dt+l_0(x(t_0),x(t_1))\to\min,\\
\dot x=\varphi(t,x,u),\\
f_j(x,u)=\int_{t_0}^{t_1}L_j(t,x(t),u(t))\,dt+l_j(x(t_0),x(t_1))\le0,\ 1\le j\le m',\\
f_j(x,u)=\int_{t_0}^{t_1}L_j(t,x(t),u(t))\,dt+l_j(x(t_0),x(t_1))=0,\\
m'+1\le j\le m,
\end{multline}
называется {\it задачей Лагранжа вариационного исчисления} (в понтрягинской форме).

Уточним постановку. Положим
$$Z=C^1([t_0,t_1],\mathbb R^{d_1})\times C([t_0,t_1],\mathbb R^{d_2}).$$
Норму в $Z$ введем следующим образом:
$$\|(x,u)\|_Z=\|x\|_{C^1([t_0,t_1],\mathbb R^{d_1})}+\|u\|_{C([t_0,t_1],\mathbb R^{d_2})}.$$
Пара $(x,u)\in Z$ называется {\it допустимой в задаче \eqref{Lag}},
если
\begin{multline*}
\Gamma(x,u)=\{\,(t,x(t),u(t)):t\in[t_0,t_1]\,\}\subset G,\quad(x(t_0),x(t_1))\in W,\\
\dot x(t)=\varphi(t,x(t),u(t))\mbox{ для всех }t\in[t_0,t_1],\\
f_j(x,u)\le0,\ 1\le j\le m',\quad f_j(x,u)=0,\ m'+1\le j\le m.
\end{multline*}

Допустимая пара $(\wx,\wu)$ называется {\it слабым локальным минимумом в задаче \eqref{Lag}}, если существует такое $\varepsilon>0$, что для любой допустимой пары $(x,u)$, для которой $\|(x,u)-(\wx,\wu)\|_Z<\varepsilon$ выполнено неравенство $f_0(x,u)\ge f_0(\wx,\wu)$.

Функцией Лагранжа задачи \eqref{Lag} назовем функцию
$$\LL(x,u,\ov\lambda)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t),u(t))\,dt+l(x(t_0),x(t_1)),$$
где
\begin{align*}
L(t,x,\dot x,u)&=\sum_{j=0}^m\lambda_jL_j(t,x,u)+p(t)(\dot x-\varphi(t,x,u)),\\ l(\xi_0,\xi_1)&=\sum_{j=0}^m\lambda_jl_j(\xi_0,\xi_1)
\end{align*}
и вектор $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m,p)\in(\mathbb
R^{m+1})^*\times C^1([t_0,t_1],(\mathbb R^{d_1})^*)$ ---  набор множителей Лагранжа.

Если фиксирована пара $(\wx,\wu)$, то, как и раньше, для
сокращения записи используем обозначения: $\wL_x(t)=L_x(t,\wx(t),\wu(t))$ и аналогично для частной производной по $u$, частных производных отображения $\varphi$, $l$ и т.~д.

\begin{theorem}[Необходимые условия минимума в задаче \eqref{Lag}]
Пусть $(\wx\cd,\wu\cd)$ доставляет слабый локальный минимум в задаче \eqref{Lag}. Тогда, если функции $L_j$, $0\le j\le m$, и отображение $\varphi$ непрерывны вместе со своими частными производными по $x$ и $u$ в окрестности множества $\Gamma(\wx,\wu)$, а функции $l_j$, $0\le j\le m$, непрерывно дифференцируемы в окрестности точки
$(\wx(t_0),\wx(t_1))$, то найдется ненулевой набор множителей
Лагранжа $\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m,p)\in(\mathbb
R^{m+1})^*\times C^1([t_0,t_1],(\mathbb R^{d_1})^*)$ такой, что
выполняются
\begin{itemize}
\item[$(a)$] условия стационарности $($уравнения Эйлера--Лагранжа$)$:
\begin{gather*}
-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0\ \Leftrightarrow\ -\dot
p(t)=p(t)\wv_x(t)-\sum_{j=0}^m\lambda_j\wL_{jx}(t),\\
\wL_u(t)=0\ \Leftrightarrow\ p(t)\wv_u(t)=\sum_{j=0}^m\lambda_j\wL_{ju}(t);
\end{gather*}
\item[$(b)$] $\lambda_j\ge0$, $j=0,1,\ldots m'$ $($условия
неотрицательности$)$;
\item[$(c)$] $\lambda_jf_j(\wx,\wu)=0$, $j=1,\ldots,m'$ $($условия
дополняющей не\-жест\-кос\-ти$)$;
\item[$(d)$] $\wL_{\dot x}(t_j)=(-1)^j\wl_{\xi_j}$, $j=0,1$
$($условия трансверсальности$)$.
\end{itemize}
\end{theorem}

\begin{proof}
Положим $\xi=(x,u)$, $\wxi=(\wx,\wu)$ и $\Phi(\xi)=(G(\xi),F(\xi))$, где $G(\xi)=(f_{m'+1}(\xi),\ldots,f_m(\xi))^T$, $F(\xi)=\dot x-\varphi(t,x,u)$. Тогда задача \eqref{Lag} может быть переписана в виде
\begin{equation}\label{Lag1}
f_0(\xi)\to\min,\quad f_j(\xi)\le0,\quad 1\le j\le m',\quad\Phi(\xi)=0.
\end{equation}
Будем применять к этой задаче теорему~\ref{T14}. Из дифференциальных свойств функций $L_j$ и $l_j$, $j=0,1,\ldots,m$, и $\varphi$, утверждений относительно дифференцируемости суперпозиций отображений и производной обобщенного оператора Немыцкого следует дифференцируемость отображений $f_j$, $j=0,1,\ldots,m'$, и строгая дифференцируемость отображений $F$ и $G$.

Покажем, что $\IM F'(\wxi)=C([t_0,t_1],\mathbb R^{d_1})$. Пусть $y\in C([t_0,t_1],\mathbb R^{d_1})$. Имеем
$$F'(\wxi)(h,v)(t)=\dot h(t)-\wv_x(t)h(t)-\wv_u(t)v(t).$$
Положим $v=0$. Уравнение
\begin{equation}\label{eqyy}
\dot h-\wv_x(t)h=y(t)
\end{equation}
является линейной системой дифференциальных уравнений с непрерывными коэффициентами. Поэтому для любого $y\in C([t_0,t_1],\mathbb R^{d_1})$ существует решение этой системы $h\in C^1([t_0,t_1],\mathbb R^{d_1})$. В силу леммы о замкнутости образа (лемма~\ref{LZ}) $\IM\Phi'(\wxi)$ --- замкнутое подпространство.

Таким образом, все условия теоремы~\ref{T14} выполнены. Тогда существует ненулевой набор множителей Лагранжа $\ov\lambda=(\lambda_0,\ldots,\lambda_{m'},\eta^*)$ такой, что для функции Лагранжа
\begin{multline*}
\LL_1(\xi,\ov\lambda)=\sum_{j=0}^{m'}\lambda_jf_j(\xi)+
\la\eta^*,\Phi(\xi)\ra\\
=\sum_{j=0}^{m'}\lambda_jf_j(\xi)+\la\mu^*,G(\xi)\ra+\la y^*,F(\xi)\ra
=\sum_{j=0}^m\lambda_jf_j(\xi)+\la y^*,F(\xi)\ra,
\end{multline*}
выполняются условия стационарности $\LL_1'(\wxi,\ov\lambda)=0$, а, кроме того, выполнены условия неотрицательности $\lambda_j\ge0$, $j=0,1,\ldots,m'$ и условия дополняющей не\-жест\-кос\-ти $\lambda_jf_j(\wx,\wu)=0$, $j=1,\ldots,m'$.

Займемся исследованием условия стационарности, из которого получаем
уравнения
\begin{multline}\label{Lyy}
\LL_{1x}(\wxi,\ov\lambda)h(t)=\int_{t_0}^{t_1}\wM(t)h(t)\,dt
+\wl_{\xi_0}h(t_0)+\wl_{\xi_1}h(t_1)\\
+\la y^*,\dot h(t)-\wv_x(t)h(t)\ra=0,
\end{multline}
где
$$\wM=\sum_{j=0}^m\lambda_j\wL_{jx},$$
а также
\begin{equation}\label{Luu}
\LL_{1u}(\wxi,\ov\lambda)v(t)=\int_{t_0}^{t_1}\biggl(\sum_{j=0}^m\lambda_j
\wL_{ju}(t)\biggr)v(t)\,dt
-\la y^*,\wv_u(t)v(t)\ra=0.
\end{equation}

Пусть $y\in C([t_0,t_1],\mathbb R^{d_1})$, а $h\in C^1([t_0,t_1],\mathbb R^{d_1})$ является решением системы \eqref{eqyy} с начальным условием $h(t_0)=h_0$. Тогда из \eqref{Lyy} имеем
$$\la y^*,y\ra=-\int_{t_0}^{t_1}\wM(t)h(t)\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}
h(t_1).$$
Определим функцию $p$ как решение системы
\begin{equation}\label{LMM}
-\dot p-p\wv_x(t)+\wM(t)=0,
\end{equation}
удовлетворяющее условию $p(t_1)=-\wl_{\xi_1}$. Из \eqref{eqyy} получаем
$$p(t)\wv_x(t)h(t)=p(t)\dot h(t)-p(t)y(t).$$
Тогда, выражая $\wM$ из \eqref{LMM}, получаем
\begin{multline*}
\la y^*,y\ra=-\int_{t_0}^{t_1}(\dot p(t)+p(t)\wv_x(t))h(t)\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}h(t_1)\\
=-\int_{t_0}^{t_1}(\dot p(t)h(t)+p(t)\dot h(t)-p(t)y(t))\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}h(t_1)\\
=\int_{t_0}^{t_1}p(t)y(t)\,dt-\int_{t_0}^{t_1}\frac d{dt}(p(t)h(t))\,dt-\wl_{\xi_0}h_0-\wl_{\xi_1}h(t_1)\\
=\int_{t_0}^{t_1}p(t)y(t)\,dt+(p(t_0)-\wl_{\xi_0})h_0.
\end{multline*}
Полагая $h_0=0$, получаем, что
$$\la y^*,y\ra=\int_{t_0}^{t_1}p(t)y(t)\,dt,$$
а полагая $y=0$, в силу произвольности $h_0$ получаем, что $p(t_0)=\wl_{\xi_1}$.

Учитывая вид функционала $y^*$, из \eqref{Luu} имеем
$$\int_{t_0}^{t_1}\biggl(\sum_{j=0}^m\lambda_j
\wL_{ju}(t)-p(t)\wv_u(t)\biggr)v(t)\,dt=0.$$
В силу того, что это равенство справедливо для любой функции $v\in C([t_0,t_1],\mathbb R^{d_2})$, получаем, что
$$p(t)\wv_u(t)=\sum_{j=0}^m\lambda_j\wL_{ju}(t).$$
\end{proof}

\section{Задача со старшими производными. Уравнение Эйлера--Пуассона. Изопериметрическая задача}

В качестве следствия теоремы, доказанной в предыдущем разделе, получим необходимые условия экстремума в задаче со старшими производными и изопериметрической задаче.

Пусть $[t_0,t_1]$ --- отрезок числовой прямой,  $G$ --- открытое
подмножество $\mathbb R^{d+2}$, $L\colon G\to\mathbb R$ --- непрерывная функция (переменные которой обозначаем  $t,x,\dot x,\ldots,x^{(d)}$) и
$x^{(k)}_j\in\mathbb R$, $k=0,1,\ldots,d-1$, $j=0,1$. Задача
\begin{multline}\label{EP}
J(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t),\ldots,x^{(d)}(t))\,dt\to\min,\\
x^{(k)}(t_j)=x^{(k)}_j,\quad k=0,1,\ldots,d-1,\quad j=0,1,
\end{multline}
называется {\it  задачей со старшими производными}.

Обозначим через $C^d([t_0,t_1])$ пространство всех $d$ раз непрерывно дифференцируемых функций $x$ на $[t_0,t_1]$ с нормой
$$\|x\|_{C^d([t_0,t_1])}=\max(\|x\|_{C([t_0,t_1])},\|\dot
x\|_{C([t_0,t_1])},\ldots,\|x^{(d)}\|_{C([t_0,t_1])}).$$
Функция $x\in C^d([t_0,t_1])$ называется {\it допустимой в задаче \eqref{EP}}, если
$$\Gamma(x)=\{(t,x(t),\dot x(t),\ldots,x^{(d)}(t))^T:t\in[t_0,t_1]\}\subset G$$
и $x^{(k)}(t_j)=x^{(k)}_j$, $k=0,1,\ldots,d-1$, $j=0,1$.

Допустимая функция $\wx$  называется {\it локальным минимумом в задаче
\eqref{EP}}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$, для которой $\|x-\wx\|_{C^d([t_0,t_1])}<\varepsilon$ выполняется неравенство
$J(x)\ge J(\wx)$.

\begin{theorem}[Необходимые условия минимума в задаче
\eqref{EP}. Уравнение Эйлера--Пуассона]
Пусть $\wx$ --- локальный минимум в \eqref{EP}, функция $L$ непрерывна вместе с частными производными $L_{x^{(k)}}$ в окрестности $\Gamma(\wx)$, $\wL_{x^{(k)}}\in C^k([t_0,t_1])$, $k=1,\ldots,d-1$, и $\wL_{x^{(d)}}\in C^{d-1}([t_0,t_1])$. Тогда $\wL_{x^{(d)}}\in C^d([t_0,t_1])$ и для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлеpа--Пуассона
$$\sum_{k=0}^d(-1)^k\frac{d^k}{dt^k}\wL_{x^{(k)}}(t)=0.$$
\end{theorem}

\begin{proof}
Обозначая $x=x_1$, $\dot x_1=x_2$, \ldots, $\dot x_{d-1}=x_d$, $\dot x_d=u$,
задачу \eqref{EP} можно записать как задачу Лагранжа
\begin{multline}\label{EP1}
\int_{t_0}^{t_1}L(t,x_1(t),\ldots,x_d(t),u(t))\,dt\to\min,\\
\dot x_1=x_2,\ \ldots,\ \dot x_{d-1}=x_d,\ \dot x_d=u,\\ x_k(t_j)=x^{(k-1)}_j,\ k=1,\ldots,d,\ j=0,1.
\end{multline}
Простая проверка показывает, что если $\wx$ --- локальный минимум в задаче \eqref{EP}, то вектор-функция $(\wx_1,\ldots,\wx_d,\wu)^T$ --- локальный минимум в данной задаче. Согласно общей теореме~\ref{Lag} найдутся такие множители Лагранжа $\lambda_0$ и $p=(p_1,\ldots,p_d)\in C^1([t_0,t_1],(\mathbb R^d)^*)$, не равные одновременно нулю, что имеют место равенства
\begin{gather*}
-\dot p(t)=p(t)\wv_x(t)-\lambda_0\wL_x(t),\\
p(t)\wv_u(t)=\lambda_0\wL_u(t).
\end{gather*}
Поскольку $\varphi(t,x,u)=(x_2,\ldots,x_d,u)^T$, то эти равенства имеют вид
\begin{equation}\label{EPP}
\arraycolsep=0.08em
\begin{array}{rcl}
-\dot p_1(t)&=&-\lambda_0\wL_{x_1}(t),\\
-\dot p_2(t)&=&p_1(t)-\lambda_0\wL_{x_2}(t),\\
\hdotsfor{3}\\
-\dot p_d(t)&=&p_{d-1}(t)-\lambda_0\wL_{x_d}(t),\\
p_d(t)&=&\lambda_0\wL_u(t).
\end{array}
\end{equation}

Если $\lambda_0=0$, то сразу видно, что и $p=0$. Будем считать, что $\lambda_0=1$. Из второго равенства следует, что $p_2\in C^2([t_0,t_1])$, из третьего --- $p_3\in C^3([t_0,t_1])$, наконец, из предпоследнего --- $p_d\in C^d([t_0,t_1])$. Тогда из последнего равенства следует, что $\wL_{x^{(d)}}\in C^d([t_0,t_1])$.

Из соотношений \eqref{EPP} выводим (учитывая условия теоремы и переходя к прежним обозначениям: $x_1=x$, $x_2=\dot x$, \ldots, $x_d=x^{(d-1)}$, $u=x^{(d)}$), что
\begin{multline*}
\wL_x(t)=\dot p_1(t)=-\ddot p_2(t)+\frac d{dt}\wL_{\dot x}(t)=\ldots=(-1)^{d-1}p_d^{(d)}(t)\\
+\sum_{k=1}^{d-1}(-1)^{k-1}\frac{d^k}{dt^k}\wL_{x^{(k)}}(t)=
(-1)^{d-1}\frac{d^d}{dt^d}\wL_{x^{(d)}}(t)\\
+\sum_{k=1}^{d-1}(-1)^{k-1}\frac{d^k}{dt^k}\wL_{x^{(k)}}(t).
\end{multline*}
Это, очевидно, равносильно уравнению Эйлера--Пуассона.
\end{proof}

Пусть $[t_0,t_1]$ --- отрезок числовой прямой,  $G$ --- открытое
подмножество $\mathbb R^{2d+1}$, функции $f_j\colon G\to\mathbb R$,
$j=0,1,\ldots,m$ (переменных $t\in\mathbb R$, $x\in\mathbb R^d$ и
$\dot x\in\mathbb R^d$) непрерывны на $G$, $\alpha_j\in\mathbb R$,
$j=1,\ldots,m$, и $x_j\in\mathbb R^d$, $j=0,1$. Задача
\begin{multline}\label{Iz}
J(x)=\int_{t_0}^{t_1}f_0(t,x(t),\dot x(t))\,dt\to\min,\\
\int_{t_0}^{t_1}f_j(t,x(t),\dot x(t))\,dt=\alpha_j,\
1\le j\le m,\quad x(t_0)=x_0,\quad x(t_1)=x_1
\end{multline}
называется {\it изопериметрической задачей}. Ясно, что это частный
случай задачи \eqref{Lag} (дифференциальная связь: $\dot x=u$).

Функция $x$ называется {\it допустимой в задаче \eqref{Iz}}, если  $x\in C^1([t_0,t_1],\mathbb R^d)$,
\begin{gather*}
\Gamma(x)=\{(t,x(t),\dot x(t))^T:t\in[t_0,t_1]\}\subset G,\\
\int_{t_0}^{t_1}f_j(t,x(t),\dot x(t))\,dt=\alpha_j,\ 1\le j\le
m,\quad x(t_j)=x_j,\ j=0,1.
\end{gather*}
Допустимая функция $\wx$  называется {\it локальным минимумом} в задаче \eqref{Iz}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$, для которой $\|x-\wx\|_{C^1([t_0,t_1],\mathbb
R^d)}<\varepsilon$ выполняется неравенство $J(x)\ge J(\wx)$.

Положим
$$L(t,x,\dot x,\ov\lambda)=\sum_{j=0}^m\lambda_jf_j(t,x,\dot x),\quad\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m).$$

\begin{theorem}[Необходимые условия минимума в задаче \eqref{Iz}]
Пусть $\wx$ доставляет слабый локальный минимум в задаче \eqref{Iz}. Тогда, если  функции $f_j$, $j=0,1,\ldots,m$, непрерывны вместе со своими частными производными по $x$ и $\dot x$ в окрестности $\Gamma(\wx)$, то найдется такой ненулевой набор множителей Лагранжа
$\ov\lambda=(\lambda_0,\lambda_1,\ldots,\lambda_m)$, что $\wL_{\dot x}\in C^1([t_0,t_1],\mathbb R^d)$ и для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлеpа
\begin{equation}\label{IzE}
-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0.
\end{equation}
\end{theorem}

\begin{proof}
Рассмотрим следующую задачу Лагранжа
\begin{multline}\label{Iz1}
\int_{t_0}^{t_1}f_0(t,x(t),u(t))\,dt\to\min,\quad \dot x=u,\\
\int_{t_0}^{t_1}f_j(t,x(t),u(t))\,dt=\alpha_j,\
1\le j\le m,\quad x(t_0)=x_0,\quad x(t_1)=x_1.
\end{multline}
Несложная проверка показывает, что если $\wx$ --- локальный экстремум в задаче \eqref{Iz}, то $(\wx,\wu)$, где $\wu=\dot{\wx}$, --- локальный экстремум в данной задаче.

Согласно теореме о необходимых условиях минимума в задаче \eqref{Lag} найдутся такие множители Лагранжа $(\lambda_0,\lambda_1,\ldots,\lambda_m)$ и $p\in C^1([t_0,t_1],(\mathbb R^d)^*)$, не все равные нулю, что
\begin{gather*}
-\dot p=p\wv_x(t)-\sum_{j=0}^m\lambda_jf_{jx}(t,\wx,\wu),\\
p(t)\wv_u(t)=\sum_{j=0}^m\lambda_jf_{ju}(t,\wx,\wu).
\end{gather*}
Поскольку $\varphi(t,x,u)=u$, то получаем равенства
\begin{gather*}
-\dot p=-\sum_{j=0}^m\lambda_jf_{jx}(t,\wx,\wu),\\
p(t)=\sum_{j=0}^m\lambda_jf_{ju}(t,\wx,\wu).
\end{gather*}
Подставляя в эти равенства $\dot\wx$ вместо $\wu$ убеждаемся, что
$\wL_{\dot x}\in C^1([t_0,t_1],\mathbb R^d)$ и имеет место равенство \eqref{IzE}.
\end{proof}

\section{Задачи оптимального управления. Принцип максимума}

Вариационное исчисление, как уже говорилось, интенсивно развивалось в 18 веке (в основном усилиями Эйлера, Лагранжа и Лежандра). В 19 веке в его развитии приняли участие такие математики как Пуассон, Вейерштрасс, Гильберт и Пуанкаре. К началу 20 века предмет, в существенном, оказался исчерпанным. Построение теории экстремума (как она представлялась в те времена), казалось, завершено. Но впоследствии появились выпуклые задачи, а затем, в начале 50-х годов прошлого века родилось оптимальное управление --- новое направление в теории экстремума, охватывающее вариационное исчисление. Необходимые условия экстремума в задачах оптимального управления были получены в школе Л.~С.~Понтрягина. Основной результат называется принципом максимума Понтрягина. В этом разделе рассматривается задача оптимального управления и доказываются для нее необходимые условия минимума.

Пусть $[t_0,t_1]$ --- конечный отрезок, $G$ --- открытое подмножество $\mathbb R\times\mathbb R^{d_1}$, $U$ --- непустое подмножество $\mathbb R^{d_2}$, функция $f\colon G\times U\to\mathbb R$ и отображение $\varphi\colon G\times U\to\mathbb R^{d_1}$ (переменных $t\in\mathbb R$, $x=(x_1,\ldots,x_{d_1})^T\in\mathbb R^{d_1}$ и $u=(u_1,\ldots,u_{d_2})^T\in\mathbb R^{d_2}$) непрерывны на $G\times U$ и $x_0,x_1\in\mathbb R^{d_1}$. Задача
\begin{multline}\label{OU}
J(x,u)=\int_{t_0}^{t_1} f(t,x(t),u(t))\,dt\to\min,\quad\dot
x=\varphi(t,x,u),\\
u(t)\in U,\quad x(t_0)=x_0,\quad x(t_1)=x_1
\end{multline}
называется {\it задачей оптимального управления}. Переменную $x$ часто называют фазовой переменной, а $u$ --- управлением.

Уточним постановку. Пусть $PC^1([t_0,t_1],\mathbb R^{d_1})$ --- совокупность всех кусочно-непрерывно дифференцируемых, а $PC([t_0,t_1],\mathbb R^{d_2})$ --- кусочно-непрерывных функций на $[t_0,t_1]$ со значениями соответственно в $\mathbb R^{d_1}$ и $\mathbb R^{d_2}$. Пара $(x,u)\in PC^1([t_0,t_1],\mathbb R^{d_1})\times
PC([t_0,t_1],\mathbb R^{d_2})$ называется {\it допустимой в задаче \eqref{OU}}, если
$$\Gamma(x)=\{\,(t,x(t)):t\in[t_0,t_1]\,\}\subset G,$$
включение $u(t)\in U$ и равенство $\dot x(t)=\varphi(t,x(t),u(t))$ выполняются для всех $t\in [t_0,t_1]$, где функция $u$ непрерывна и $x(t_0)=x_0$, $x(t_1)=x_1$.

Допустимая пара $(\wx,\wu)$ называется {\it сильным локальным минимумом в задаче \eqref{OU}}, если существует такое $\varepsilon>0$, что для любой допустимой пары $(x,u)$, для которой $\|x-\wx\|_{C([t_0,t_1],\mathbb R^{d_1})}<\varepsilon$ выполнено неравенство $J(x,u)\ge J(\wx,\wu)$.

Функцией Лагранжа для задачи \eqref{OU} будем называть функцию
$$\LL(x,u,\ov\lambda)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t),u(t),\lambda_0,p(t))\,dt,$$
где
$$L(t,x,\dot x,u,\lambda_0,p)=\lambda_0f(t,x,u)+p(\dot
x-\varphi(t,x,u)).$$

Функцию
$$H(t,x,u,\lambda_0,p)=p\varphi(t,x,u)-\lambda_0f(t,x,u)$$
называют {\it функцией  Понтрягина задачи \eqref{OU}}.

\begin{theorem}[Необходимые условия минимума в задаче \eqref{OU}. Принцип максимума Понтрягина]\label{PPM}
Пусть $(\wx,\wu)$ доставляет сильный минимум в задаче \eqref{OU}. Тогда, если функция $f$ и отображение $\varphi$ непрерывны вместе со своими частными производными по $x$ в $G\times U$, то найдется ненулевой набор множителей Лагранжа $\ov\lambda=(\lambda_0,p)\in \mathbb R\times PC^1([t_0,t_1],(\mathbb R^{d_1})^*)$ такой, что выполнено условие стационарности по $x$
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0\ \Leftrightarrow\ -\dot p=p\wv_x(t)-\lambda_0\wf_{x}(t)$$
и в точках непрерывности $\wu$ условие минимума по $u$
\begin{equation}\label{PM}
\min_{u\in U}L(t,\wx(t),\dot {\wx}(t),u,\lambda_0,p(t))=L(t,\wx(t),\dot{\wx}(t),\wu(t),
\lambda_0,p(t)).
\end{equation}
\end{theorem}

Условие \eqref{PM} может быть записано в виде условия максимума по $u$
$$\max_{u\in U}H(t,\wx(t),u,\lambda_0,p(t))=H(t,\wx(t),\wu(t),\lambda_0,p(t)).$$
В силу этого соотношения необходимые условия в задаче
оптимального управления и называют ``Принципом максимума Понтрягина''.

Сформулированная задача оптимального управления не самая общая, но достаточно представительная. Мы получим необходимые условия для более простого варианта, когда правый конец свободен, т.~е. получим необходимые условия минимума в задаче
\begin{multline}\label{PM1}
J(x,u)=\int_{t_0}^{t_1} f(t,x(t),u(t))\,dt\to\min,\quad\dot
x=\varphi(t,x,u),\\ u(t)\in U,\quad x(t_0)=x_0.
\end{multline}
Эти условия минимума те же, что и в задаче \eqref{OU}, но добавляется еще условие трансверсальности $p(t_1)=0$.


Перед доказательством сформулируем две леммы (считаем, что функции $f$ и $\varphi$ удовлетворяют условиям теоремы~\ref{PPM}).

\begin{lemma}[об игольчатой вариации]
Пусть $(\wx,\wu)$ --- допустимая пара в задаче \eqref{OU} $($или \eqref{PM1}$)$, $\tau\in (t_0,t_1)$ --- точка непрерывности $\wu$, $\alpha>0$ столь мало, что функция $\wu$ непрерывна на $[\tau-\alpha,\tau]$ и $v\in U$. Положим
$$u_\alpha(t,\tau,v)=\begin{cases}
\wu(t),&t\notin[\tau-\alpha,\tau),\\
v,&t\in[\tau-\alpha,\tau).\end{cases}$$
Тогда найдется такое $\alpha_0>0$, что для любого $0\le\alpha<\alpha_0$ существует единственное решение $x_\alpha(t,\tau,v)$ задачи Коши
$$\dot x=\varphi(t,x,u_\alpha(t,\tau,v)),\quad  x(t_0)=x_0,$$
определенное на всем отрезке $[t_0,t_1]$. Кроме того, при $\alpha\to0$ \begin{itemize}
\item[1)] функция $x_\alpha(t,\tau,v)\to\wx(t)$ в метрике пространства $C([t_0,t_1],\mathbb R^{d_1})$;
\item[2)] функция
$$\frac{x_\alpha(t,\tau,v)-\wx(t)}\alpha\to y_{\tau v}(t)$$
в метрике пространства $C([\tau,t_1],\mathbb R^{d_1})$, где функция $y_{\tau v}$ в точках непрерывности $\wu$, лежащих на отрезке $[\tau,t_1]$, удовлетворяет уравнению
\begin{equation}\label{eIg}
\dot y_{\tau v}=\wv_x(t)y_{\tau v}
\end{equation}
с начальным условием
\begin{equation}\label{eIgg}
y_{\tau v}(\tau)=\varphi(\tau,\wx(\tau),v)-\varphi(\tau,\wx(\tau),
\wu(\tau)).
\end{equation}
\end{itemize}
\end{lemma}

Функцию $u_\alpha(t,\tau,v)$ называют {\it игольчатой вариацией} $\wu$, а пару $(\tau,v)$ --- {\it иголкой}.

\begin{lemma}[о производной функционала]
Пусть $(\wx,\wu)$ --- допустимая пара в задаче \eqref{OU} $($или \eqref{PM1}$)$. Тогда для функции $$J(\alpha)=J(x_\alpha(t,\tau,v),u_\alpha(t,\tau,v))$$
имеет место равенство
\begin{equation}\label{eIg1}
J'(0)=\Delta_{\tau v}f+\int_{\tau}^{t_1}\wf_x(t)y_{\tau v}(t)\,dt,
\end{equation}
где $\Delta_{\tau v}f=f(\tau,\wx(\tau),v)- f(\tau,\wx(\tau),\wu(\tau))$ и $y_{\tau v}$ --- решение задачи \eqref{eIg}--\eqref{eIgg}.
\end{lemma}

\begin{proof}
Имеем
\begin{multline*}
J'(0+0)=\lim_{\alpha\to0+0}\frac{J(\alpha)-J(0)}\alpha\\
=\lim_{\alpha\to0+0}\frac1\alpha\int_{\tau-\alpha}^\tau(f(t,
x_\alpha(t,\tau,v),v)-f(t,\wx(t),\wu(t)))\,dt\\
+\lim_{\alpha\to0+0}\frac1\alpha\int_\tau^{t_1}(f(t,
x_\alpha(t,\tau,v),\wu(t))-f(t,\wx(t),\wu(t)))\,dt.
\end{multline*}
Имеем в силу дифференцируемости $f$ по $x$
\begin{multline*}
f(t,x_\alpha(t,\tau,v),\wu(t))-f(t,\wx(t),\wu(t))\\
=\wf_x(t)[x_\alpha
(t,\tau,v)-\wx(t)]+o(x_\alpha(t,\tau,v)-\wx(t)).
\end{multline*}
Поэтому
\begin{multline*}
\lim_{\alpha\to0+0}\frac1\alpha\int_\tau^{t_1}(f(t,
x_\alpha(t,\tau,v),\wu(t))-f(t,\wx(t),\wu(t)))\,dt\\
=\int_\tau^{t_1}\wf_x(t)y_{\tau v}(t)\,dt.
\end{multline*}
К первому интегралу применим теорему о среднем для интегралов и тогда в итоге получим
\begin{multline*}
J'(0+0)=\lim_{\alpha\to0+0}(f(\xi,x_\alpha(\xi,\tau,v),v)-f(\xi,
\wx(\xi),\wu(\xi)))\\+\int_{\tau}^{t_1}\wf_x(t)y_{\tau v}(t)\,dt,
\end{multline*}
где $\xi\in[\tau-\alpha,\tau]$. Когда $\alpha\to0+0$, то, очевидно, $\xi\to\tau$, $x_\alpha(\xi,\tau,v)\to\wx(\tau)$ согласно лемме об игольчатой вариации, а $\wu(\xi)\to\wu(\tau)$, так как $\wu$ непрерывна в точке $\tau$. Формула \eqref{eIg1} доказана.
\end{proof}

\begin{proof}[Доказательство принципа максимума]
Пусть $(\wx,\wu)$ --- сильный минимум в задаче \eqref{OU}. Обозначая через $p$ --- решение линейного уравнения
\begin{equation}\label{Piii}
-\dot p=p\wv_x(t)-\wf_x(t),\quad p(t_1)=0,
\end{equation}
получаем условие стационарности по $x$ и условие трансверсальности.

Так как пара $(\wx,\wu)$ доставляет минимум, то необходимо $J'(0+0)\ge0$, или согласно \eqref{eIg1}
$$\Delta_{\tau v}f+\int_\tau^{t_1}\wf_x(t)y_{\tau v}(t)\,dt\ge0.$$
Подставим сюда вместо функции $\wf_x$ ее выражение из \eqref{Piii}, а затем вместо функции $\wv_xy_{\tau v}$ ее выражение из \eqref{eIg} и, учитывая, что $p(t_1)=0$, а $y_{\tau v}(\tau)=\varphi(\tau,\wx(\tau),v)-\varphi(\tau,\wx(\tau), \wu(\tau))$, будем иметь
\begin{multline*}
0\le\Delta_{\tau v}f+\int_{\tau}^{t_1}(\dot p(t)y_{\tau v}(t)+p(t)\dot
y_{\tau v}(t))\,dt=\Delta_{\tau v}f+p(t)y_{\tau v}(t)|_\tau^{t_1}\\=f(\tau,\wx(\tau),v)- f(\tau,\wx(\tau),\wu(\tau))\\
-p(\tau)(\varphi(\tau,\wx(\tau),v)-\varphi(\tau,\wx(\tau),\wu(\tau))),
\end{multline*}
или
\begin{multline*}
p(\tau)\varphi(\tau,\wx(\tau),v)-f(\tau,\wx(\tau),v)\\
\le p(\tau)\varphi(\tau,\wx(\tau),\wu(\tau))-f(\tau,\wx(\tau),\wu(\tau))
\end{multline*}
Таким образом, для любой точки $\tau$, где функция $\wu$ непрерывна, максимум выражения слева по всем $v\in U$ достигается в точке $\wu(\tau)$. Это и есть условие максимума из теоремы.
\end{proof}

\section{Необходимые условия сильного экстремума
в простейшей задаче вариационного исчисления. Условие Вейрштрасса и Лежандра}

Чтобы не усложнять выкладки, всюду далее будем иметь дело с классическим (скалярным) вариантом простейшей задачи вариационного исчисления, хотя все доказываемые утверждения справедливы и для векторного варианта. Для определенности будем рассматривать задачу на минимум
\begin{equation}\label{WW}
J(x)=\int_{t_0}^{t_1}L(t,x(t),\dot x(t))\,dt\to\min,\quad x(t_j)=x_j,\ j=0,1.
\end{equation}

Здесь $[t_0,t_1]$ --- отрезок числовой прямой, непрерывная функция $L$ переменных $t\in\mathbb R$, $x\in\mathbb R$ и $\dot x\in\mathbb R$ определена на открытом подмножестве $G\subset\mathbb R^3$ и $x_j\in\mathbb R$, $j=0,1$.

Напомним также, что функция $x\in C^1([t_0,t_1])$ называется {\it
допустимой в задаче \eqref{WW}}, если
$$\Gamma(x)=\{\,(t,x(t),\dot x(t)):t\in[t_0,t_1]\,\}\subset G$$
и $x(t_j)=x_j$, $j=0,1$, и допустимая функция $\wx$  называется {\it слабым локальным минимумом} в задаче \eqref{WW}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$,
для которой $\|x-\wx\|_{C^1([t_0,t_1]}<\varepsilon$ выполняется неравенство $J(x)\ge J(\wx)$.

В вариационном исчислении, наряду со слабым экстремумом, рассматривают еще и сильный
локальный экстремум, где близость функций измеряется в пространстве $C([t_0,t_1])$.
Точнее говоря, обозначим через $PC^1([t_0,t_1])$ пространство кусочно-непрерывно-дифференцируемых функций на $[t_0,t_1]$. Функция $x\in PC^1([t_0,t_1])$ называется допустимой в задаче \eqref{WW}, если для всех точек непрерывности функции $\dot x$ выполнено условие $(t,x(t),\dot x(t))\in G$ и, кроме того, $x(t_j)=x_j$, $j=0,1$. Скажем, что допустимая функция $\wx$ доставляет {\it сильный локальный минимум} в задаче \eqref{WW}, если существует такое $\varepsilon>0$, что для любой допустимой функции $x$, для которой $\|x-\wx\|_{C([t_0,t_1])}<\varepsilon$ выполняется неравенство $J(x)\ge J(\wx)$.

Заметим, что если функция $\wx$ доставляет сильный минимум в задаче \eqref{WW} и при этом $\wx\in C^1([t_0,t_1])$, то $\wx$ является и слабым минимумом в этой задаче. Действительно, пусть $\varepsilon>0$ такое, что как только $x\in PC^1([t_0,t_1])$ и $\|x-\wx\|_{C([t_0,t_1])}<\varepsilon$, то $J(x)\ge J(\wx)$. Если теперь $x\in C^1([t_0,t_1])$ и $\|x-\wx\|_{C^1([t_0,t_1])}<\varepsilon$, то так как, в частности, $x\in PC^1([t_0,t_1])$ и $\|x-\wx\|_{C([t_0,t_1])}\le\|x-\wx\|_{C^1([t_0,t_1])}<\varepsilon$,
получаем, что $J(x)\ge J(\wx)$.

Таким образом, необходимые условия слабого минимума для $x\in C^1([t_0,t_1])$ являются необходимыми условиями и сильного минимума.

Функция, для которой выполнено уравнение Эйлера называется {\it экстремалью} (или {\it стационарной точкой}) задачи.

Пусть $\wx$ --- экстремаль в задаче \eqref{WW} и существует
$$\wL_{\dot x\dot x}(t)=L_{\dot x\dot x}(t,\wx(t),\dot {\wx}(t)).$$
Говорят, что на функции $\wx$ выполнено {\it условие Лежандра}, если
$\wL_{\dot x\dot x}(t)\ge0$ для всех $t\in[t_0,t_1]$  и {\it усиленное условие Лежандра}, если $\wL_{\dot x\dot x}(t)>0$ для всех $t\in[t_0,t_1]$.




Пусть $f\colon\mathbb R\to\mathbb R$ --- дифференцируемая функция. Функция
$$\mathcal E(x,x')= f(x')-f(x)-f'(x)(x'-x)$$
называется {\it функцией Вейерштрасса} (соответствующей функции $f$). Геометрически, $\mathcal E(x,x')$ --- разность между значением функции $f$ и функции $g(y)=f(x)+f'(x)(y-x)$ (график которой есть касательная к графику функции $f$ в точке $x$) в точке $x'$.

Если $f$ --- выпуклая функция, то ${\mathcal E}(x,x')\ge0$ для всех $x,x'\in\mathbb R$. Действительно, пусть $x,x'\in\mathbb R$ и $0<\alpha<1$. По неравенству Йенссена
$$f((1-\alpha)x+\alpha x')\le(1-\alpha)f(x)+\alpha f(x'),$$
откуда
$$\alpha^{-1}(f(x+\alpha(x'-x))-f(x))\le f(x')-f(x).$$
Переходя к пределу при $\alpha\to0$, получаем, что $f(x')-f(x)\ge f'(x)(x'-x)$.

Пусть $L$ --- интегрант в задаче \eqref{WW}. Если $L$ --- дифференцируемая функция по $\dot x$ на некотором открытом множестве $G\times\mathbb R$, где $G$ --- открытое подмножество $\mathbb R\times\mathbb R$, то
функция
$${\mathcal E}(t,x,\dot x,u)= L(t,x,u)-L(t,x,\dot x)-L_{\dot x}(t,x,\dot x)(u-\dot x),$$
определенная на $G\times\mathbb R\times\mathbb R$, называется {\it функцией Вейерштрасса функционала $J$}. Ясно, что при каждых $t$ и $x$
--- это функция Вейерштрасса, соответствующая функции $G(\dot x)=L(t,x,\dot x)$.

Говорят, что на экстремали $\wx$ выполнено {\it условие Вейрштрасса}, если ${\mathcal E}(t,\wx(t),\dot{\wx}(t),u)\ge0$ для всех $u\in\mathbb R$ и $t\in[t_0,t_1]$.

\begin{theorem}[Необходимые условия сильного минимума в задаче \eqref{WW}]
Пусть функция $\wx\in C^1([t_0,t_1])$ доставляет сильный локальный минимум в задаче \eqref{WW}. Тогда, если интегрант $L$ непрерывен вместе с частными производными по $x$ и $\dot x$ в $G\times\mathbb R$,
то
\begin{itemize}
\item[$(a)$] для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлера
$$-\frac d{dt}\wL_{\dot x}(t)+\wL_x(t)=0;$$
\item[$(b)$] выполнено условие Вейерштрасса, т.~е. для всех $t\in[t_0,t_1]$ и $u\in\mathbb R$ справедливо неравенство
$${\mathcal E}(t,\wx(t),\dot{\wx}(t),u)\ge0;$$
\item[$(c)$] если существует $\wL_{\dot x\dot x}$, то выполнено условие Лежандра, т.~е. $\wL_{\dot x\dot x}(t)\ge0$ для всех
$t\in [t_0,t_1]$.
\end{itemize}
\end{theorem}

\begin{proof}
Запишем задачу \eqref{WW} как задачу оптимального управления
\begin{equation}\label{WW2}
\int_{t_0}^{t_1}L(t,x(t),u(t))\,dt\to\min,\quad\dot x=u,\quad
x(t_0)=x_0,\ x(t_1)=x_1.
\end{equation}
Легко видеть, что $\wx$ доставляет сильный минимум в \eqref{WW} тогда и
только тогда, когда пара $(\wx,\wu)$, где $\wu=\dot\wx$ является сильным минимумом в \eqref{WW2}.

Согласно принципу максимума (теорема~\ref{PPM}) найдутся такой ненулевой набор множителей Лагранжа $\ov\lambda=(\lambda_0,p)\in\mathbb R\times PC^1([t_0,t_1])$, что для всех $t\in[t_0,t_1]$ выполнено условие стационарности по $x$
\begin{equation}\label{WWS}
-\dot p(t)+\lambda_0\wL_x(t)=0
\end{equation}
и условие минимума по $u$
\begin{equation}\label{WWSU}
\min_{u\in\mathbb R}\left(\lambda_0L(t,\wx(t),u)-p(t)u\right)=
\lambda_0L(t,\wx(t),\dot{\wx}(t))-p(t)\dot{\wx}(t).
\end{equation}

Если $\lambda_0=0$, то $p=\const$ вследствие \eqref{WWS}. Тогда из \eqref{WWSU} следует, что эта константа обязана быть нулевой и тем самым все множители Лагранжа нулевые. Итак, $\lambda_0\ne0$ и можно считать, что $\lambda_0=1$.

Условие \eqref{WWSU} означает, что для всех $t\in[t_0,t_1]$ функция $f(u)=L(t,\wx(t),u)-p(t)u$ на $\mathbb R$ достигает минимума в точке $\dot{\wx}(t)$ и, следовательно, по теореме Ферма производная этой функции в данной точке равна нулю, т.~е. $p(t)=\wL_{\dot x}(t)$. Вместе с \eqref{WWS} это дает уравнение Эйлера.

Необходимое условия минимума второго порядка  функции $f$ заключаются в том, что
$\widehat L_{\dot x\dot x}(t)\ge0$, т.~е. выполнено условие Лежандра.

Из соотношения \eqref{WWSU} и доказанного равенства $p(t)=\wL_{\dot x}(t)$ следует, что
$$L(t,\wx(t),u)-L_{\dot x}(t,\wx(t),\dot{\wx}(t))u\ge L(t,\wx(t),\dot{\wx}(t))- L_{\dot x}(t,\wx(t),\dot{\wx}(t))\dot {\wx}(t)$$
для всех $u\in\mathbb R$ и $t\in[t_0,t_1]$ или, что
то же
$$L(t,\wx(t),u)-L(t,\wx(t),\dot{\wx}(t))-L_{\dot x}(t,\wx(t),\dot{\wx}(t))(u-\dot{\wx}(t))\ge0,$$
т.~е. выполнено условие Вейерштрасса.
\end{proof}

\section{Необходимые условия слабого экстремума
в простейшей задаче вариационного исчисления. Условие Якоби}

Предположим, что $\wx$ --- экстремаль задачи \eqref{WW} и выполнено условие:
\begin{multline}\label{E*}
L\mbox{ \ непрерывна вместе с \ }L_x,\ L_{\dot x},\ L_{xx},\ L_{x\dot x},\ L_{\dot x\dot x}\\
\mbox{в некоторой окрестности \ }\Gamma(\wx).
\end{multline}
Пусть $h\in C^1([t_0,t_1])$, $h(t_0)=h(t_1)=0$. Рассмотрим функцию (одного переменного)
\begin{equation}\label{WW*}
\varphi(\lambda)=\int_{t_0}^{t_1}L(t,\wx(t)+\lambda h(t),\dot{\wx}(t)+\lambda\dot h(t))\,dt.
\end{equation}
Тогда для достаточно малых по модулю $\lambda$
\begin{multline*}
\varphi'(\lambda)=\int_{t_0}^{t_1}(L_x(t,\wx(t)+\lambda h(t),\dot\wx(t)+\lambda\dot h(t))h(t)\\
+L_{\dot x}(t,\wx(t)+\lambda h(t),\dot\wx(t)+\lambda\dot h(t))\dot h(t))\,dt
\end{multline*}
и дифференцируя еще раз, получаем, что
\begin{multline*}
\varphi''(0)=\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+\wL_{x \dot
x}(t)h(t)\dot h(t)+\wL_{\dot x x}(t)\dot h(t)h(t)\right.\\
\left.+\wL_{\dot x \dot x}(t)\dot h^2(t)\right)dt=\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+2\wL_{x\dot x}(t)h(t)\dot h(t)\right.\\
\left.+\wL_{\dot x\dot x} (t)\dot h^2(t)\right)dt.
\end{multline*}
Функционал $\varphi''(0)$ (как функцию от $h$) обозначим через $Q(h)$
и рассмотрим задачу
$$Q(h)\to\min,\quad h(t_0)=h(t_1)=0.$$
Уравнение Эйлера для данной задачи имеет вид
$$-\frac d{dt}\left(\wL_{\dot xx}(t)h(t)+\wL_{\dot x\dot x}(t)\dot
h(t)\right)+\wL_{xx}(t)h(t)+\wL_{x\dot x}(t)\dot h(t)=0$$
и называется {\it уравнением Якоби} исходной задачи \eqref{WW}.

Пусть на $\wx$ выполнено усиленное условие Лежандра. Точка $\tau\in(t_0,t_1]$ называется {\it сопряженной точкой к $t_0$}, если
существует нетривиальное решение $h$ уравнения Якоби, для которого
$h(t_0)=h(\tau)=0$.

Говорят, что на $\wx$ выполнено {\it условие Якоби}, если в интервале
$(t_0,t_1)$ нет точек сопряженных к $t_0$ и {\it усиленное условие Якоби}, если полуинтервал $(t_0,t_1]$ не содержит точек сопряженных к $t_0$.

При доказательстве необходимых условий слабого минимума в задаче \eqref{WW} нам понадобится один несложный технический результат, который приводим без доказательства (см. \cite[стр. 69]{ATF}).

\begin{lemma}[о скруглении углов]
Пусть в задаче \eqref{WW} интегрант $L$ непрерывен по совокупности переменных. Тогда
\begin{multline*}
\inf\{\,J(x):x\in PC^1([t_0,t_1])\ x(t_0)=x_0,\ x(t_1)=x_1\,\}\\=\inf\{\,J(x):x\in C^1([t_0,t_1]),\ x(t_0)=x_0,\ x(t_1)=x_1\,\}.
\end{multline*}
\end{lemma}

\begin{theorem}[Необходимые условия слабого минимума в задаче \eqref{WW}]
Пусть $\wx\in C^1([t_0,t_1])$ доставляет слабый локальный минимум в задаче \eqref{WW}. Тогда, если выполнено условие \eqref{E*}, то для всех $t\in[t_0,t_1]$ выполнено уравнение Эйлера, условие Лежандра и условие Якоби.
\end{theorem}

\begin{proof}
Уравнение Эйлера, как необходимое условие слабого экстремума, уже было доказано раньше. Доказательство, заключается в том, что если $\wx$
--- локальный минимум, то ноль есть локальный минимум для функции $\varphi$, определенной соотношением \eqref{WW*} и тогда необходимо $\varphi'(0)=0$. Расшифровка этого условия и приводит к уравнению Эйлера.

Докажем условие Лежандра, расшифровывая необходимое условие минимума второго порядка $\varphi''(0)\ge0$. Согласно формуле для $\varphi''(0)$, выписанной выше, данное условие равносильно тому, что $Q(h)\ge0$ для всех $h\in C^1([t_0,t_1])$ таких, что $h(t_0)=h(t_1)=0$. Это означает, что функция $\wh=0$ есть слабый абсолютный минимум в задаче
\begin{multline}\label{QQi}
Q(h)=\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+2\wL_{x \dot
x}(t)h(t)\dot h(t)\right.\\
\left.+\wL_{\dot x\dot x}(t)\dot h^2(t)\right)\,dt \to\min,\quad
h(t_0)=h(t_1)=0.
\end{multline}
По лемме о скруглении углов $\wh=0$ доставляет и сильный абсолютный минимум в этой задаче. Тогда, по уже доказанному, на $\wh$ должно выполняться условие Лежандра, которое в данном случае имеет тот же вид $\wL_{\dot x\dot x}(t)\ge0$.

Докажем условие Якоби. Предположим противное, что существует точка $\tau\in(t_0,t_1)$ и нетривиальное решение $\ov h$ уравнения Якоби такое, что $\ov h(t_0)=\ov h(\tau)=0$. Пусть функция $\widetilde h$ такова, что $\widetilde h(t)=\ov h(t)$, если $t_0\le t\le\tau$ и $\widetilde h(t)=0$, если $\tau\le t\le t_1$. Заметим, что $\dot{\ov h}(\tau)\ne0$, так как в противном случае, по теореме единственности, функция $\ov h$ была бы тождественным нулем. Далее, интегрируя по частям ($\ov h(t_0)=\ov h(\tau)=0$), получим
\begin{multline*}
Q(\widetilde h)=\int_{t_0}^{\tau}\left(\wL_{xx}(t)\ov h^2(t)+2\wL_{\dot x x}(t)\ov h(t)\dot {\ov h}(t)+\widehat L_{\dot x
\dot x}(t)\dot{\ov h}^2(t)\right)\,dt\\
=\int_{t_0}^{\tau}\left(\wL_{xx}(t)\ov h(t)+\wL_{x\dot x}(t)\dot
{\ov h}(t)\right)\ov h(t)\,dt+\int_{t_0}^{\tau}\left(\wL_{\dot x x}(t)\ov h(t)\right.\\
\left.+\wL_{\dot x\dot x}(t)\dot{\ov h}(t)\right)\dot{\ov h}(t)\,dt
=\int_{t_0}^{\tau}\left(-\frac d{dt}\left(\wL_{\dot xx}(t)\ov h(t)+\wL_{\dot x\dot x}(t)\dot{\ov h}(t)\right)\right.\\
\left.+\wL_{xx}(t)\ov h(t)+\wL_{x\dot x}(t)\dot {\ov h}(t)\right)\ov h(t)\,dt.
\end{multline*}
Поскольку $\ov h$ удовлетворяет уравнению Якоби, то отсюда следует, что
$Q(\widetilde h)=0$. Это означает, что наряду с $\widehat h=0$, функция
$\widetilde h$ также доставляет сильный минимум в задаче \eqref{QQi}. Запишем эту задачу как задачу оптимального управления
\begin{multline*}
\int_{t_0}^{t_1}\left(\wL_{xx}(t)h^2(t)+2\wL_{\dot x
x}(t)h(t)u(t)+\wL_{\dot x\dot x}(t)u^2(t)\right)\,dt \to\min,\\
\dot h=u,\quad h(t_0)=h(t_1)=0.
\end{multline*}
Согласно принципу максимума найдутся такие множители Лагранжа $\lambda_0$ и $p\in PC^1([t_0,t_1])$, не равные одновременно нулю, что
выполнено условие стационарности по $h$
$$-\dot p(t)+2\lambda_0\wL_{xx}(t)\widetilde h(t)+2\lambda_0\wL_{\dot x
x}(t)\dot {\widetilde h}(t)=0$$
и условие минимума по $u$
\begin{multline}\label{QQii}
\min_{u\in\mathbb R}(2\lambda_0\wL_{\dot xx}(t)\widetilde h(t)u+\lambda_0\wL_{\dot x\dot x}(t)u^2-p(t)u)\\
=2\lambda_0\wL_{\dot xx}(t)\widetilde h(t)\dot{\widetilde h}(t)+\lambda_0\wL_{\dot x\dot x}(t)\dot{\widetilde h}^2(t)-p(t)\dot{\widetilde h}(t).
\end{multline}
Как и раньше проверяется, что $\lambda_0\ne0$. Пусть $\lambda_0=1/2$.

Из \eqref{QQii} следует, что для каждого $t\in[t_0,t_1]$ дифференцируемая на $\mathbb R$ функция
$$f(u)=\wL_{\dot xx}(t)\widetilde h(t)u+(1/2)\wL_{\dot x\dot x}(t)u^2-p(t)u$$
достигает минимума в точке $\dot{\widetilde h}$. Следовательно, по теореме Ферма, ее производная в этой точке равна нулю
\begin{equation}\label{QQiii}
p(t)=\wL_{\dot xx}(t){\widetilde h}(t)+\wL_{\dot x\dot x}(t)\dot{\widetilde h}(t).
\end{equation}
По определению $\widetilde h(t)=0$, если $t\ge\tau$  и поэтому из \eqref{QQii} вытекает, что $p(\tau+0)=0$. Но функция $p$ непрерывна и поэтому (снова из \eqref{QQii}) получаем $0=p(\tau-0)=\wL_{\dot x\dot x}(\tau)\dot{\widetilde h}(\tau-0)=\wL_{\dot x\dot x}(\tau)\dot{\ov h}(\tau)\ne0$, так как $\dot{\ov h}(\tau)\ne0$ (как уже было отмечено) и $\wL_{\dot x\dot x}(\tau)>0$ в силу того, что выполнено усиленное условие Лежандра. Пришли к противоречию и тем самым условие Якоби доказано.
\end{proof}

\begin{thebibliography}{11}

\bibitem{IP} Ильин В.~А., Позняк Э.~Г. Основы математического анализа:
В 2-х ч. Часть I. М: Физматлит, 2005.

\bibitem{KF} Колмогоров А.~Н., Фомин С.~В. Элементы теории функций и
фукционального анализа. М.: ФИЗМАТЛИТ, 2004.

\bibitem{ATF} Алексеев~В.~М., Тихомиров~В.~М., Фомин~С.~В. Оптимальное
управление. М.: Наука, 1979.
\end{thebibliography}
\end{document}