Оптимизация методом неопределенных множителей лагранжа. Условная оптимизация. Метод множителей Лагранжа

17.05.2019

Для начала рассмотрим случай функции двух переменных. Условным экстремумом функции $z=f(x,y)$ в точке $M_0(x_0;y_0)$ называется экстремум этой функции, достигнутый при условии, что переменные $x$ и $y$ в окрестности данной точки удовлетворяют уравнению связи $\varphi (x,y)=0$.

Название «условный» экстремум связано с тем, что на переменные наложено дополнительное условие $\varphi(x,y)=0$. Если из уравнения связи можно выразить одну переменную через другую, то задача определения условного экстремума сводится к задаче на обычный экстремум функции одной переменной. Например, если из уравнения связи следует $y=\psi(x)$, то подставив $y=\psi(x)$ в $z=f(x,y)$, получим функцию одной переменной $z=f\left(x,\psi(x)\right)$. В общем случае, однако, такой метод малопригоден, поэтому требуется введение нового алгоритма.

Метод множителей Лагранжа для функций двух переменных.

Метод множителей Лагранжа состоит в том, что для отыскания условного экстремума составляют функцию Лагранжа: $F(x,y)=f(x,y)+\lambda\varphi(x,y)$ (параметр $\lambda$ называют множителем Лагранжа). Необходимые условия экстремума задаются системой уравнений, из которой определяются стационарные точки:

$$ \left \{ \begin{aligned} & \frac{\partial F}{\partial x}=0;\\ & \frac{\partial F}{\partial y}=0;\\ & \varphi (x,y)=0. \end{aligned} \right. $$

Достаточным условием, из которого можно выяснить характер экстремума, служит знак $d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2$. Если в стационарной точке $d^2F > 0$, то функция $z=f(x,y)$ имеет в данной точке условный минимум, если же $d^2F < 0$, то условный максимум.

Есть и другой способ для определения характера экстремума. Из уравнения связи получаем: $\varphi_{x}^{"}dx+\varphi_{y}^{"}dy=0$, $dy=-\frac{\varphi_{x}^{"}}{\varphi_{y}^{"}}dx$, поэтому в любой стационарной точке имеем:

$$d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=F_{xx}^{""}dx^2+2F_{xy}^{""}dx\left(-\frac{\varphi_{x}^{"}}{\varphi_{y}^{"}}dx\right)+F_{yy}^{""}\left(-\frac{\varphi_{x}^{"}}{\varphi_{y}^{"}}dx\right)^2=\\ =-\frac{dx^2}{\left(\varphi_{y}^{"} \right)^2}\cdot\left(-(\varphi_{y}^{"})^2 F_{xx}^{""}+2\varphi_{x}^{"}\varphi_{y}^{"}F_{xy}^{""}-(\varphi_{x}^{"})^2 F_{yy}^{""} \right)$$

Второй сомножитель (расположенный в скобке) можно представить в такой форме:

Красным цветом выделены элементы определителя $\left| \begin{array} {cc} F_{xx}^{""} & F_{xy}^{""} \\ F_{xy}^{""} & F_{yy}^{""} \end{array} \right|$, который является гессианом функции Лагранжа. Если $H > 0$, то $d^2F < 0$, что указывает на условный максимум. Аналогично, при $H < 0$ имеем $d^2F > 0$, т.е. имеем условный минимум функции $z=f(x,y)$.

Примечание относительно формы записи определителя $H$. показать\скрыть

$$ H=-\left|\begin{array} {ccc} 0 & \varphi_{x}^{"} & \varphi_{y}^{"}\\ \varphi_{x}^{"} & F_{xx}^{""} & F_{xy}^{""} \\ \varphi_{y}^{"} & F_{xy}^{""} & F_{yy}^{""} \end{array} \right| $$

В этой ситуации сформулированное выше правило изменится следующим образом: если $H > 0$, то функция имеет условный минимум, а при $H < 0$ получим условный максимум функции $z=f(x,y)$. При решении задач следует учитывать такие нюансы.

Алгоритм исследования функции двух переменных на условный экстремум

Составить функцию Лагранжа $F(x,y)=f(x,y)+\lambda\varphi(x,y)$
Решить систему $ \left \{ \begin{aligned} & \frac{\partial F}{\partial x}=0;\\ & \frac{\partial F}{\partial y}=0;\\ & \varphi (x,y)=0. \end{aligned} \right.$
Определить характер экстремума в каждой из найденных в предыдущем пункте стационарных точек. Для этого применить любой из указанных способов:
- Составить определитель $H$ и выяснить его знак
- С учетом уравнения связи вычислить знак $d^2F$

Метод множителей Лагранжа для функций n переменных

Допустим, мы имеем функцию $n$ переменных $z=f(x_1,x_2,\ldots,x_n)$ и $m$ уравнений связи ($n > m$):

$$\varphi_1(x_1,x_2,\ldots,x_n)=0; \; \varphi_2(x_1,x_2,\ldots,x_n)=0,\ldots,\varphi_m(x_1,x_2,\ldots,x_n)=0.$$

Обозначив множители Лагранжа как $\lambda_1,\lambda_2,\ldots,\lambda_m$, составим функцию Лагранжа:

$$F(x_1,x_2,\ldots,x_n,\lambda_1,\lambda_2,\ldots,\lambda_m)=f+\lambda_1\varphi_1+\lambda_2\varphi_2+\ldots+\lambda_m\varphi_m$$

Необходимые условия наличия условного экстремума задаются системой уравнений, из которой находятся координаты стационарных точек и значения множителей Лагранжа:

$$\left\{\begin{aligned} & \frac{\partial F}{\partial x_i}=0; (i=\overline{1,n})\\ & \varphi_j=0; (j=\overline{1,m}) \end{aligned} \right.$$

Выяснить, условный минимум или условный максимум имеет функция в найденной точке, можно, как и ранее, посредством знака $d^2F$. Если в найденной точке $d^2F > 0$, то функция имеет условный минимум, если же $d^2F < 0$, - то условный максимум. Можно пойти иным путем, рассмотрев следующую матрицу:

Определитель матрицы $\left| \begin{array} {ccccc} \frac{\partial^2F}{\partial x_{1}^{2}} & \frac{\partial^2F}{\partial x_{1}\partial x_{2}} & \frac{\partial^2F}{\partial x_{1}\partial x_{3}} &\ldots & \frac{\partial^2F}{\partial x_{1}\partial x_{n}}\\ \frac{\partial^2F}{\partial x_{2}\partial x_1} & \frac{\partial^2F}{\partial x_{2}^{2}} & \frac{\partial^2F}{\partial x_{2}\partial x_{3}} &\ldots & \frac{\partial^2F}{\partial x_{2}\partial x_{n}}\\ \frac{\partial^2F}{\partial x_{3} \partial x_{1}} & \frac{\partial^2F}{\partial x_{3}\partial x_{2}} & \frac{\partial^2F}{\partial x_{3}^{2}} &\ldots & \frac{\partial^2F}{\partial x_{3}\partial x_{n}}\\ \ldots & \ldots & \ldots &\ldots & \ldots\\ \frac{\partial^2F}{\partial x_{n}\partial x_{1}} & \frac{\partial^2F}{\partial x_{n}\partial x_{2}} & \frac{\partial^2F}{\partial x_{n}\partial x_{3}} &\ldots & \frac{\partial^2F}{\partial x_{n}^{2}}\\ \end{array} \right|$, выделенной в матрице $L$ красным цветом, есть гессиан функции Лагранжа. Используем следующее правило:

Если знаки угловых миноров $H_{2m+1},\; H_{2m+2},\ldots,H_{m+n}$ матрицы $L$ совпадают с знаком $(-1)^m$, то исследуемая стационарная точка является точкой условного минимума функции $z=f(x_1,x_2,x_3,\ldots,x_n)$.
Если знаки угловых миноров $H_{2m+1},\; H_{2m+2},\ldots,H_{m+n}$ чередуются, причём знак минора $H_{2m+1}$ совпадает с знаком числа $(-1)^{m+1}$, то исследуемая стационарная точка является точкой условного максимума функции $z=f(x_1,x_2,x_3,\ldots,x_n)$.

Пример №1

Найти условный экстремум функции $z(x,y)=x+3y$ при условии $x^2+y^2=10$.

Геометрическая интерпретация данной задачи такова: требуется найти наибольшее и наименьшее значение аппликаты плоскости $z=x+3y$ для точек ее пересечения с цилиндром $x^2+y^2=10$.

Выразить одну переменную через другую из уравнения связи и подставить ее в функцию $z(x,y)=x+3y$ несколько затруднительно, поэтому будем использовать метод Лагранжа.

Обозначив $\varphi(x,y)=x^2+y^2-10$, составим функцию Лагранжа:

$$ F(x,y)=z(x,y)+\lambda \varphi(x,y)=x+3y+\lambda(x^2+y^2-10);\\ \frac{\partial F}{\partial x}=1+2\lambda x; \frac{\partial F}{\partial y}=3+2\lambda y. $$

Запишем систему уравнений для определения стационарных точек функции Лагранжа:

$$ \left \{ \begin{aligned} & 1+2\lambda x=0;\\ & 3+2\lambda y=0;\\ & x^2+y^2-10=0. \end{aligned} \right. $$

Если предположить $\lambda=0$, то первое уравнение станет таким: $1=0$. Полученное противоречие говорит о том, что $\lambda\neq 0$. При условии $\lambda\neq 0$ из первого и второго уравнений имеем: $x=-\frac{1}{2\lambda}$, $y=-\frac{3}{2\lambda}$. Подставляя полученные значения в третье уравнение, получим:

$$ \left(-\frac{1}{2\lambda} \right)^2+\left(-\frac{3}{2\lambda} \right)^2-10=0;\\ \frac{1}{4\lambda^2}+\frac{9}{4\lambda^2}=10; \lambda^2=\frac{1}{4}; \left[ \begin{aligned} & \lambda_1=-\frac{1}{2};\\ & \lambda_2=\frac{1}{2}. \end{aligned} \right.\\ \begin{aligned} & \lambda_1=-\frac{1}{2}; \; x_1=-\frac{1}{2\lambda_1}=1; \; y_1=-\frac{3}{2\lambda_1}=3;\\ & \lambda_2=\frac{1}{2}; \; x_2=-\frac{1}{2\lambda_2}=-1; \; y_2=-\frac{3}{2\lambda_2}=-3.\end{aligned} $$

Итак, система имеет два решения: $x_1=1;\; y_1=3;\; \lambda_1=-\frac{1}{2}$ и $x_2=-1;\; y_2=-3;\; \lambda_2=\frac{1}{2}$. Выясним характер экстремума в каждой стационарной точке: $M_1(1;3)$ и $M_2(-1;-3)$. Для этого вычислим определитель $H$ в каждой из точек.

$$ \varphi_{x}^{"}=2x;\; \varphi_{y}^{"}=2y;\; F_{xx}^{""}=2\lambda;\; F_{xy}^{""}=0;\; F_{yy}^{""}=2\lambda.\\ H=\left| \begin{array} {ccc} 0 & \varphi_{x}^{"} & \varphi_{y}^{"}\\ \varphi_{x}^{"} & F_{xx}^{""} & F_{xy}^{""} \\ \varphi_{y}^{"} & F_{xy}^{""} & F_{yy}^{""} \end{array} \right|= \left| \begin{array} {ccc} 0 & 2x & 2y\\ 2x & 2\lambda & 0 \\ 2y & 0 & 2\lambda \end{array} \right|= 8\cdot\left| \begin{array} {ccc} 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end{array} \right| $$

В точке $M_1(1;3)$ получим: $H=8\cdot\left| \begin{array} {ccc} 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end{array} \right|= 8\cdot\left| \begin{array} {ccc} 0 & 1 & 3\\ 1 & -1/2 & 0 \\ 3 & 0 & -1/2 \end{array} \right|=40 > 0$, поэтому в точке $M_1(1;3)$ функция $z(x,y)=x+3y$ имеет условный максимум, $z_{\max}=z(1;3)=10$.

Аналогично, в точке $M_2(-1;-3)$ найдем: $H=8\cdot\left| \begin{array} {ccc} 0 & x & y\\ x & \lambda & 0 \\ y & 0 & \lambda \end{array} \right|= 8\cdot\left| \begin{array} {ccc} 0 & -1 & -3\\ -1 & 1/2 & 0 \\ -3 & 0 & 1/2 \end{array} \right|=-40$. Так как $H < 0$, то в точке $M_2(-1;-3)$ имеем условный минимум функции $z(x,y)=x+3y$, а именно: $z_{\min}=z(-1;-3)=-10$.

Отмечу, что вместо вычисления значения определителя $H$ в каждой точке, гораздо удобнее раскрыть его в общем виде. Дабы не загромождать текст подробностями, этот способ скрою под примечание.

Запись определителя $H$ в общем виде. показать\скрыть

$$ H=8\cdot\left|\begin{array}{ccc}0&x&y\\x&\lambda&0\\y&0&\lambda\end{array}\right| =8\cdot\left(-\lambda{y^2}-\lambda{x^2}\right) =-8\lambda\cdot\left(y^2+x^2\right). $$

В принципе, уже очевидно, какой знак имеет $H$. Так как ни одна из точек $M_1$ или $M_2$ не совпадает с началом координат, то $y^2+x^2>0$. Следовательно, знак $H$ противоположен знаку $\lambda$. Можно и довести вычисления до конца:

$$ \begin{aligned} &H(M_1)=-8\cdot\left(-\frac{1}{2}\right)\cdot\left(3^2+1^2\right)=40;\\ &H(M_2)=-8\cdot\frac{1}{2}\cdot\left((-3)^2+(-1)^2\right)=-40. \end{aligned} $$

Вопрос о характере экстремума в стационарных точках $M_1(1;3)$ и $M_2(-1;-3)$ можно решить и без использования определителя $H$. Найдем знак $d^2F$ в каждой стационарной точке:

$$ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=2\lambda \left(dx^2+dy^2\right) $$

Отмечу, что запись $dx^2$ означает именно $dx$, возведённый в вторую степень, т.е. $\left(dx \right)^2$. Отсюда имеем: $dx^2+dy^2>0$, посему при $\lambda_1=-\frac{1}{2}$ получим $d^2F < 0$. Следовательно, функция имеет в точке $M_1(1;3)$ условный максимум. Аналогично, в точке $M_2(-1;-3)$ получим условный минимум функции $z(x,y)=x+3y$. Отметим, что для определения знака $d^2F$ не пришлось учитывать связь между $dx$ и $dy$, ибо знак $d^2F$ очевиден без дополнительных преобразований. В следующем примере для определения знака $d^2F$ уже будет необходимо учесть связь между $dx$ и $dy$.

Ответ : в точке $(-1;-3)$ функция имеет условный минимум, $z_{\min}=-10$. В точке $(1;3)$ функция имеет условный максимум, $z_{\max}=10$

Пример №2

Найти условный экстремум функции $z(x,y)=3y^3+4x^2-xy$ при условии $x+y=0$.

Первый способ (метод множителей Лагранжа)

Обозначив $\varphi(x,y)=x+y$ составим функцию Лагранжа: $F(x,y)=z(x,y)+\lambda \varphi(x,y)=3y^3+4x^2-xy+\lambda(x+y)$.

$$ \frac{\partial F}{\partial x}=8x-y+\lambda; \; \frac{\partial F}{\partial y}=9y^2-x+\lambda.\\ \left \{ \begin{aligned} & 8x-y+\lambda=0;\\ & 9y^2-x+\lambda=0; \\ & x+y=0. \end{aligned} \right. $$

Решив систему, получим: $x_1=0$, $y_1=0$, $\lambda_1=0$ и $x_2=\frac{10}{9}$, $y_2=-\frac{10}{9}$, $\lambda_2=-10$. Имеем две стационарные точки: $M_1(0;0)$ и $M_2 \left(\frac{10}{9};-\frac{10}{9} \right)$. Выясним характер экстремума в каждой стационарной точке с использованием определителя $H$.

$$ H=\left| \begin{array} {ccc} 0 & \varphi_{x}^{"} & \varphi_{y}^{"}\\ \varphi_{x}^{"} & F_{xx}^{""} & F_{xy}^{""} \\ \varphi_{y}^{"} & F_{xy}^{""} & F_{yy}^{""} \end{array} \right|= \left| \begin{array} {ccc} 0 & 1 & 1\\ 1 & 8 & -1 \\ 1 & -1 & 18y \end{array} \right|=-10-18y $$

В точке $M_1(0;0)$ $H=-10-18\cdot 0=-10 < 0$, поэтому $M_1(0;0)$ есть точка условного минимума функции $z(x,y)=3y^3+4x^2-xy$, $z_{\min}=0$. В точке $M_2\left(\frac{10}{9};-\frac{10}{9}\right)$ $H=10 > 0$, посему в данной точке функция имеет условный максимум, $z_{\max}=\frac{500}{243}$.

Исследуем характер экстремума в каждой из точек иным методом, основываясь на знаке $d^2F$:

$$ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=8dx^2-2dxdy+18ydy^2 $$

Из уравнения связи $x+y=0$ имеем: $d(x+y)=0$, $dx+dy=0$, $dy=-dx$.

$$ d^2 F=8dx^2-2dxdy+18ydy^2=8dx^2-2dx(-dx)+18y(-dx)^2=(10+18y)dx^2 $$

Так как $ d^2F \Bigr|_{M_1}=10 dx^2 > 0$, то $M_1(0;0)$ является точкой условного минимума функции $z(x,y)=3y^3+4x^2-xy$. Аналогично, $d^2F \Bigr|_{M_2}=-10 dx^2 < 0$, т.е. $M_2\left(\frac{10}{9}; -\frac{10}{9} \right)$ - точка условного максимума.

Второй способ

Из уравнения связи $x+y=0$ получим: $y=-x$. Подставив $y=-x$ в функцию $z(x,y)=3y^3+4x^2-xy$, получим некоторую функцию переменной $x$. Обозначим эту функцию как $u(x)$:

$$ u(x)=z(x,-x)=3\cdot(-x)^3+4x^2-x\cdot(-x)=-3x^3+5x^2. $$

Таким образом задачу о нахождении условного экстремума функции двух переменных мы свели к задаче определения экстремума функции одной переменной.

$$ u_{x}^{"}=-9x^2+10x;\\ -9x^2+10x=0; \; x\cdot(-9x+10)=0;\\ x_1=0; \; y_1=-x_1=0;\\ x_2=\frac{10}{9}; \; y_2=-x_2=-\frac{10}{9}. $$

Получили точки $M_1(0;0)$ и $M_2\left(\frac{10}{9}; -\frac{10}{9}\right)$. Дальнейшее исследование известно из курса дифференциального исчисления функций одной переменой. Исследуя знак $u_{xx}^{""}$ в каждой стационарной точке или проверяя смену знака $u_{x}^{"}$ в найденных точках, получим те же выводы, что и при решении первым способом. Например, проверим знак $u_{xx}^{""}$:

$$u_{xx}^{""}=-18x+10;\\ u_{xx}^{""}(M_1)=10;\;u_{xx}^{""}(M_2)=-10.$$

Так как $u_{xx}^{""}(M_1)>0$, то $M_1$ - точка минимума функции $u(x)$, при этом $u_{\min}=u(0)=0$. Так как $u_{xx}^{""}(M_2)<0$, то $M_2$ - точка максимума функции $u(x)$, причём $u_{\max}=u\left(\frac{10}{9}\right)=\frac{500}{243}$.

Значения функции $u(x)$ при заданном условии связи совпадают с значениями функции $z(x,y)$, т.е. найденные экстремумы функции $u(x)$ и есть искомые условные экстремумы функции $z(x,y)$.

Ответ : в точке $(0;0)$ функция имеет условный минимум, $z_{\min}=0$. В точке $\left(\frac{10}{9}; -\frac{10}{9} \right)$ функция имеет условный максимум, $z_{\max}=\frac{500}{243}$.

Рассмотрим еще один пример, в котором характер экстремума выясним посредством определения знака $d^2F$.

Пример №3

Найти наибольшее и наименьшее значения функции $z=5xy-4$, если переменные $x$ и $y$ положительны и удовлетворяют уравнению связи $\frac{x^2}{8}+\frac{y^2}{2}-1=0$.

Составим функцию Лагранжа: $F=5xy-4+\lambda \left(\frac{x^2}{8}+\frac{y^2}{2}-1 \right)$. Найдем стационарные точки функции Лагранжа:

$$ F_{x}^{"}=5y+\frac{\lambda x}{4}; \; F_{y}^{"}=5x+\lambda y.\\ \left \{ \begin{aligned} & 5y+\frac{\lambda x}{4}=0;\\ & 5x+\lambda y=0;\\ & \frac{x^2}{8}+\frac{y^2}{2}-1=0;\\ & x > 0; \; y > 0. \end{aligned} \right. $$

Все дальнейшие преобразования осуществляются с учетом $x > 0; \; y > 0$ (это оговорено в условии задачи). Из второго уравнения выразим $\lambda=-\frac{5x}{y}$ и подставим найденное значение в первое уравнение: $5y-\frac{5x}{y}\cdot \frac{x}{4}=0$, $4y^2-x^2=0$, $x=2y$. Подставляя $x=2y$ в третье уравнение, получим: $\frac{4y^2}{8}+\frac{y^2}{2}-1=0$, $y^2=1$, $y=1$.

Так как $y=1$, то $x=2$, $\lambda=-10$. Характер экстремума в точке $(2;1)$ определим, исходя из знака $d^2F$.

$$ F_{xx}^{""}=\frac{\lambda}{4}; \; F_{xy}^{""}=5; \; F_{yy}^{""}=\lambda. $$

Так как $\frac{x^2}{8}+\frac{y^2}{2}-1=0$, то:

$$ d\left(\frac{x^2}{8}+\frac{y^2}{2}-1\right)=0; \; d\left(\frac{x^2}{8} \right)+d\left(\frac{y^2}{2} \right)=0; \; \frac{x}{4}dx+ydy=0; \; dy=-\frac{xdx}{4y}. $$

В принципе, здесь можно сразу подставить координаты стационарной точки $x=2$, $y=1$ и параметра $\lambda=-10$, получив при этом:

$$ F_{xx}^{""}=\frac{-5}{2}; \; F_{xy}^{""}=-10; \; dy=-\frac{dx}{2}.\\ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=-\frac{5}{2}dx^2+10dx\cdot \left(-\frac{dx}{2} \right)-10\cdot \left(-\frac{dx}{2} \right)^2=\\ =-\frac{5}{2}dx^2-5dx^2-\frac{5}{2}dx^2=-10dx^2. $$

Однако в других задачах на условный экстремум стационарных точек может быть несколько. В таких случаях лучше $d^2F$ представить в общем виде, а потом подставлять в полученное выражение координаты каждой из найденных стационарных точек:

$$ d^2 F=F_{xx}^{""}dx^2+2F_{xy}^{""}dxdy+F_{yy}^{""}dy^2=\frac{\lambda}{4}dx^2+10\cdot dx\cdot \frac{-xdx}{4y} +\lambda\cdot \left(-\frac{xdx}{4y} \right)^2=\\ =\frac{\lambda}{4}dx^2-\frac{5x}{2y}dx^2+\lambda \cdot \frac{x^2dx^2}{16y^2}=\left(\frac{\lambda}{4}-\frac{5x}{2y}+\frac{\lambda \cdot x^2}{16y^2} \right)\cdot dx^2 $$

Подставляя $x=2$, $y=1$, $\lambda=-10$, получим:

$$ d^2 F=\left(\frac{-10}{4}-\frac{10}{2}-\frac{10 \cdot 4}{16} \right)\cdot dx^2=-10dx^2. $$

Так как $d^2F=-10\cdot dx^2 < 0$, то точка $(2;1)$ есть точкой условного максимума функции $z=5xy-4$, причём $z_{\max}=10-4=6$.

Ответ : в точке $(2;1)$ функция имеет условный максимум, $z_{\max}=6$.

В следующей части рассмотрим применение метода Лагранжа для функций большего количества переменных.

Метод множителей Лагранжа (в англ. литературе «LaGrange"s method of undetermined multipliers») ˗ это численный метод решения оптимизационных задач, который позволяет определить «условный» экстремум целевой функции (минимальное или максимальное значение)

при наличии заданных ограничений на ее переменные в виде равенств (т.е. определена область допустимых значений)

˗ это значения аргумента функции (управляемые параметры) на вещественной области при котором значение функции стремится к экстремуму. Применение названия «условный» экстремум связано с тем, что на переменные наложено дополнительное условие, которое ограничивает область допустимых значений при поиске экстремума функции.

Метод множителей Лагранжа позволяет задачу поиска условного экстремума целевой функции на множестве допустимых значений преобразовать к задаче безусловной оптимизации функции.

В случае если функции и непрерывны вместе со своими частными производными, то существуют такие переменные λ не равные одновременно нулю, при которых выполняется следующее условие:

Таким образом, в соответствии с методом множителей Лагранжа для поиска экстремума целевой функции на множестве допустимых значений составляю функцию Лагранжа L(х, λ), которую в дальнейшем оптимизируют:

где λ ˗ вектор дополнительных переменных, называемых неопределенными множителями Лагранжа.

Таким образом, задача нахождения условного экстремума функции f(x) свелась к задаче поиска безусловного экстремума функции L(x, λ).

Необходимое условие экстремума функции Лагранжа задается системой уравнений (система состоит из «n + m» уравнений):

Решение данной системы уравнений позволяет определить аргументы функции (Х), при которых значение функции L(x, λ), а также значение целевой функции f(x) соответствуют экстремуму.

Величина множителей Лагранжа (λ) имеет практический интерес в случае, если ограничения представлены в форме со свободным членом уравнения (константой). В этом случае можно рассматривать дальнейшее (увеличение/уменьшение) значения целевой функции за счет изменения значения константы в системе уравнения . Таким образом, множитель Лагранжа характеризует скорость изменения максимума целевой функции при изменении ограничивающей константы.

Существует несколько способов определения характера экстремума полученной функции:

Первый способ: Пусть – координаты точки экстремума, а - соответствующее значение целевой функции. Берется точка , близкая к точке , и вычисляется значение целевой функции :

Если , то в точке имеет место максимум.

Если , то в точке имеет место минимум.

Второй способ: Достаточным условием, из которого можно выяснить характер экстремума, является знак второго дифференциала функции Лагранжа. Второй дифференциал функции Лагранжа определяется следующим образом:

Если в заданной точке минимум , если же , то целевая функция f(x) имеет в данной точке условный максимум.

Третий способ: Также характер экстремума функции можно выяснить рассмотрев гессиан функции Лагранжа. Матрица Гессе представляет собой симметричную квадратную матрицу вторых частных производных функции в точке , в которой элементы матрицы симметричны относительно главной диагонали.

Для определения типа экстремума (максимум или минимум функции) можно воспользоваться правилом Сильвестра:

1. Для того, чтобы второй дифференциал функции Лагранжа был знакоположителен необходимо, чтобы угловые миноры функции были положительными . При таких условиях функция в этой точке имеет минимум.

2. Для того, чтобы второй дифференциал функции Лагранжа был знакоотрицателен , необходимо, чтобы угловые миноры функции чередовались, причем первый элемент матрицы должен быть отрицательнsv . При таких условиях функция в этой точке имеет максимум.

Под угловым минором понимаем минор, расположенный в первых k строках и k столбцах исходной матрицы.

Основное практическое значение метода Лагранжа заключается в том, что он позволяет перейти от условной оптимизации к безусловной и, соответственно, расширить арсенал доступных методов решения задачи. Однако задача решения системы уравнений, к которой сводится данный метод, в общем случае не проще исходной задачи поиска экстремума. Такие методы называются непрямыми. Их применение объясняется необходимостью получить решение экстремальной задачи в аналитической форме (допустим, для тех или иных теоретических выкладок). При решении конкретных практических задач обычно используются прямые методы, основанные на итеративных процессах вычисления и сравнения значений оптимизируемых функций.

Методика расчета

1 шаг : Определяем функцию Лагранжа из заданной целевой функции и системы ограничений:

Вперёд

Для того, чтобы добавить Ваш комментарий к статье, пожалуйста, зарегистрируйтесь на сайте.

1.9 Метод неопределенных множителей Лагранжа

Естественно, что решение задач условной оптимизации значительно сложнее решения задач безусловной оптимизации . Естественно стремление сведения задачи условной оптимизации (поиска относительного экстремума) к более простой задаче безусловной оптимизации (поиска абсолютного экстремума). Такая процедура осуществляется в методе Лагранжа. Рассмотрим сущность этого метода.

Необходимо найти условный экстремум нелинейной функции

n переменных, при m ограничениях

(1.56)

Ограничения-неравенства преобразуются в равенства, а свободные члены переносятся в левые части ограничений, т.е. система (1.56) приводится к виду

(1.57)

В соответствии с методом Лагранжа вместо относительного экстремума функции (1.55) при ограничениях (1.57) ищется абсолютный экстремум функции Лагранжа, которая имеет следующий вид:

где - неопределенные множители Лагранжа, являющиеся, как и переменные искомыми переменными.

Видно, что в функцию Лагранжа входит целевая функция плюс каждое ограничение, умноженное на множитель Лагранжа.

Доказано, что относительный экстремум целевой функции (1.55) при ограничениях (1.57) совпадает с абсолютным экстремумом функции Лагранжа (1.58).

Поиск абсолютного экстремума функции (1.58) выполняется известными методами. В частности, определяются и приравниваются к нулю частные производные функции Лагранжа:

(1.59)

Последние m уравнений представляют собой ограничения (1.57) оптимизационной задачи.

Система (1.59) содержит (m+n) уравнений и такое же количество неизвестных.

Решение системы (1.59) даст координаты абсолютного минимума функции Лагранжа (1.58) или относительного минимума целевой функции (1.55) при ограничениях (1.57).

Решение системы (1.59) выполняется известными методами вычислительной математики. Если система (1.59) линейная, используется, как правило, метод Гаусса. Если система (1.59) нелинейная – метод Ньютона.

1.10 Выбор метода оптимизации

Перед выбором метода оптимизации, проведем краткий анализ задач, которые должно решать разрабатываемое программное обеспечение:

программа должна решать задачу условной минимизации, т.е. находить относительный экстремум, так как в математической модели кроме линейных ограничений будут иметь место и нелинейные;

так как целевая функция – функция нескольких переменных, то она может иметь несколько экстремумов, и в этом случае программа должна осуществлять поиск локального минимума.

Проведя анализ наиболее часто использующихся методов оптимизации, для реализации поставленной цели был выбран градиентный метод квадратичного программирования, который представляет собой наиболее эффективный из вышеперечисленных градиентных методов, модифицированный с методами полиномиальной аппроксимации.

Предполагается, что целевая функция и граничные условия аппроксимируются квадратичными зависимостями или полиномами второго порядка. Более подробно этот метод будет рассмотрен далее в разделе "Разработка программного обеспечения метода оптимизации".

Данный метод позволяет создать надежную программу, соответствующую всем вышеперечисленным требованиям.

2. Разработка метода оптимизации по реактивной мощности

Требуемая в электроэнергетической системе (ЭЭС) суммарная мощность компенсирующих устройств определяется из уравнения баланса реактивной мощности (6.1). Эту мощность необходимо разместить в узлах электрической сети с минимальными затратами.

где - суммарная реактивная мощность, генерируемая в ЭЭС, включая реактивную мощность, поступающую из соседних ЭЭС;

Суммарная реактивная мощность потребителей ЭЭС, включая реактивную мощность, отдавая в соседние ЭЭС;

Суммарная реактивная мощность собственных нужд электростанций;

Суммарные потери реактивной мощности;

Суммарное потребление реактивной мощности в ЭЭС.

Рассмотрим простейшую схему существующей сети (рис.2.1). от источника питания с напряжением U через сопротивление сети R получает питание нагрузка мощностью S=P+jQ . На шинах нагрузки установлено компенсирующее устройство мощностью Qк.

Рисунок 2.1 – Простейшая схема компенсации реактивной мощности

Потери активной мощности в линии при отсутствии у потребителя компенсирующего устройства () составляют

. (2.2)

При установке у потребителя компенсирующего устройства () эти потери уменьшатся до величины

. (2.3)

Таким образом, компенсация реактивной мощности позволяет уменьшить потери активной мощности в схеме электроснабжения и, следовательно, улучшить технико-экономические показатели этой схемы.

Оценим влияние КУ на затраты в сети.

Выражение для суммарных затрат на передачу мощности к нагрузке при установке КУ будет иметь вид:

(2.4)

где ЗК – затраты на КУ;

соΔР – затраты на покрытие потерь активной мощности в сети;

со – стоимость единицы потерянной активной мощности;

зк – удельные затраты на КУ.

Для определения минимума функции З приравняем к нулю ее производную от переменной QK:

(2.5)

Из (2.5) определяется экономически целесообразная реактивная мощность, передача которой от источника к потребителю отвечает минимуму затрат З

(2.6)

Величина QЭ не зависит от активной мощности Р, а зависит лишь от соотношения стоимостных показателей зк и со и параметров сети U и R, по которой передается мощность.

Вопрос о размещении компенсирующих устройств в электрической сети реальной ЭЭС представляет собой сложную оптимизационную задачу. Сложность заключается в том, что электроэнергетические системы являются большими системами, состоящими из взаимосвязанных подсистем. Рассматривать изолированно каждую отдельную подсистему нельзя, поскольку свойства больших систем определяются характером взаимосвязей отдельных подсистем.

При анализе больших систем используется системный подход , согласно которому анализ большой системы выполняется при разделении ее на подсистемы, непосредственно не связанные между собой, но влияющие друг на друга через систему более высокого уровня.

Применительно к рассматриваемому вопросу электрическая сеть представляется разными уровнями, как это показано на рис. 2.2. верхний уровень – это электрическая сеть напряжением 110 кВ и выше. Эта сложнозамкнутая электрическая сеть, представляемая полной схемой замещения, показана на рис.2.2 условно, как ЭС1. Реактивные мощности, вырабатываемые генераторами электростанций QЭС, компенсирующими устройствами QК, линиями электропередачи QС, а также реактивные мощности, протекающие по связям с соседними ЭС2 и ЭС3 (Q12, Q21, Q13, Q31) обеспечивают в ЭС1 располагаемую реактивную мощность Qр1.

Рисунок 2.2 – Схема размещения КУ в электрической сети

Второй уровень – это множество n разомкнутых местных распределительных сетей напряжением 35 кВ и ниже, присоединенных к n узлам электрической сети верхнего уровня через трансформаторы Т. Эти местные распределительные сети непосредственно не связаны между собой, но влияют друг на друга через сеть верхнего уровня. Синхронные генераторы, компенсаторы и двигатели в каждой такой распределительной сети представлены одной эквивалентной синхронной машиной G. От местных электрических сетей через распределительные трансформаторы Т1 питаются низковольтные потребители P+jQ.

Компенсирующие устройства могут устанавливаться на шинах высшего (jQкв) и низшего (jQкс) напряжения трансформаторов Т, а также на шинах 0,4 кВ распределительных трансформаторов Т1 и в самой сети 0,4 кВ (jQкн). Значение мощностей этих КУ и подлежит определению.

В общем виде задача оптимизации размещения КУ формулируется следующим образом: определить реактивные мощности имеющихся в узлах 6…35 кВ синхронных машин G, мощности КУ в сетях всех напряжений Qкв, Qкс, Qкн, а также значения реактивных мощностей Qэi (i=1, 2, …n), передаваемых в сети потребителей, при которых обеспечивается минимум суммарных затрат.

Расчеты компенсации реактивной мощности для сетей всех видов выполняются как при проектировании развития электрических сетей, так и в условиях их эксплуатации. При проектировании определяются мощности КУ и решается задача их распределения в электрической сети. В условиях эксплуатации определяют оптимальные режимы имеющихся КУ в течение суток. Критериями оптимальности в этом случае служат минимум потерь мощности и энергии и соответствие отклонений напряжений допустимым значениям.

При проектировании схемы электроснабжения, как правило, минимизируются денежные затраты на эту схему. Снижение потерь мощности за счет установки КУ уменьшает затраты на схему, по следующим причинам:

каждый потерянный кВт мощности необходимо выработать на электростанциях и, следовательно, затратить на это денежные средства;

генерация недополученной реактивной мощности на электростанциях обходится гораздо дороже, чем потребление (в 3 раза!).

Однако и компенсирующие устройства требуют денежных затрат.

В связи с этим возникает задача определения оптимальной мощности компенсирующих устройств, отвечающей минимуму суммарных затрат. Такая задача относится к задаче безусловной оптимизации и может быть решена, например, градиентными методами.

Рассмотрим такую задачу для магистральной схемы электроснабжения (рис. 2.3). Необходимо определить мощности компенсирующих устройств QК1 и QК2 в узлах 1 и 2 исходя из условия минимума суммарных затрат на установку этих устройств и покрытие потерь активной мощности в схеме.

Рисунок 2.3 – Схема электроснабжения

Исходные данные:

напряжение схемы U;

сопротивления линий R1 и R2;

реактивные нагрузки узлов 1 и 2 Q1 и Q2;

удельные затраты на установку компенсирующих устройств zo;

удельные затраты на покрытие потерь активной мощности со.

Целевая функция, представляющая собой суммарные затраты на установку компенсирующих устройств и покрытие потерь активной мощности в схеме, имеет следующий вид

где а1=R1∙co∙10-3/U2=0,0006;

а2=R2∙co∙10-3/U2=0,0004.

Введение числового коэффициента 10-3 необходимо для приведения всех составляющих целевой функции к одной размерности (у.е.).

Для решения задачи выберем метод покоординатного спуска. Определим частные производные целевой функции Z по переменным Q1 и Q2:

(2.8)

Примем исходное приближение:

Для этих значений вычислим значения целевой функции и ее частных производных.

Примем, что в направлении переменной Qk2 целевая функция Z убывает сильнее, чем в направлении переменной Qk1, т.е.

(2.10)

В направлении переменной Qk2 и начнем спуск.

Примем величину шага =400 квар. Первое приближение (первый шаг) будет Qk11=0, Qk21=400 квар. Рассчитываем значение целевой функции Z1.

Второй шаг: Qk12=0, Qk22=400 квар. Рассчитываем значение целевой функции Z2.

Спуск по координате Qk2 следует продолжать до тех пор, пока Zn

Выполним новый шаг в направлении другой переменной Qk1. Находится новое значение целевой функции Z. Спуск по этой переменной продолжается так же, как и в направлении Qk2 – до тех пор, пока Zm

Точка с полученными координатами Qk1m-1, Qk2n-1 находится в окрестности минимума целевой функции Z. При принятой длине шага =400квар более точное решение получено быть не может. Для получения более точного решения необходимо уменьшить шаг и продолжить спуск. Абсолютно точно что, чем меньше шаг, тем точнее будет результат. Посредством ручного расчета мы не можем добиться такой точности. Для решения этой задачи целесообразно будет использовать программное обеспечение, предназначенное для решения задачи нелинейного программирования с нелинейными ограничениями. Одним из таких языков программирования является язык С++.

Это была рассмотрена задача безусловной оптимизации, т.е. нахождения абсолютного минимума. При решении поставленной задачи для нахождения оптимального режима работы сети ОАО "ММК им. Ильича" требуется найти относительный минимум, так как система ограничений будет иметь нелинейный вид (см. далее "Разработка программного обеспечения"). Таким образом, перед нами ставится задача условной оптимизации по реактивной мощности, для которой мы применяем выбранный ранее градиентный метод квадратичного программирования.

Информация о работе «Анализ режимов работы электрических сетей ОАО "ММК им. Ильича" и разработка адаптивной системы управления режимами электропотребления»

Пусть и - дважды непрерывно дифференцируемые скалярные функции векторного аргумента . Требуется найти экстремум функции при условии, что аргумент удовлетворяет системе ограничений:

(последнее условие называют также условием связи).

Наиболее простым методом нахождения условного экстремума является сведение задачи к нахождению безусловного экстремума путем разрешения уравнения связи относительно m переменных и последующей их подстановки в целевую функцию.

Пример 3. Найти экстремум функции при условии .

Решение . Из уравнения связи выразим х 2 через х 1 и подставим полученное выражение в функцию у :

Эта функция имеет единственный экстремум (минимум) при х 1 =2. Соответственно, х 2 =1. Таким образом, точкой условного экстремума (минимума) заданной функции является точка .

В рассмотренном примере уравнение связи легко разрешимо относительно одной из переменных. Однако в более сложных случаях выразить переменные удается не всегда. Соответственно, описанный выше подход применим не ко всем задачам.

Более универсальным методом решения задач отыскания условного экстремума является метод множителей Лагранжа . Он основан на применении следующей теоремы. Если точка является точкой экстремума функции в области, определяемой уравнениями , то (при некоторых дополнительных условиях) существует такой m -мерный вектор , что точка является стационарной точкой функции

Алгоритм метода множителей Лагранжа

Шаг 1 . Составить функцию Лагранжа:

где - множитель Лагранжа, соответствующий i -му ограничению.

Шаг 2 . Найти частные производные функции Лагранжа и приравнять их к нулю

Шаг 3. Решив получившуюся систему из n +m уравнений, найти стационарные точки.

Заметим, что в стационарных точках выполняется необходимое, но не достаточное условие экстремума функции. Анализ стационарной точки на наличие в ней экстремума в данном случае достаточно сложен. Поэтому метод множителей Лагранжа в основном используют в тех случаях, когда о существовании минимума или максимума исследуемой функции заранее известно из геометрических или содержательных соображений.

При решении некоторых экономических задач множители Лагранжа имеют определенное смысловое содержание. Так, если - прибыль предприятия при плане производства n товаров , - издержки i -го ресурса, то l i - оценка этого ресурса, характеризующая скорость изменения оптимума целевой функции в зависимости от изменения i -го ресурса.

Пример 4. Найти экстремумы функции при условии .

Решение . Функции и непрерывны и имеют непрерывные частные производные. Составим функцию Лагранжа:

Найдем частные производные и приравняем их к нулю.

Получаем две стационарные точки:

Принимая во внимание характер целевой функции, линиями уровня которой являются плоскости, и функции (эллипс) заключаем, что в точке , функция принимает минимальное значение, а в точке максимальное.

Пример 5. В области решений системы

найти максимальное и минимальное значение функции при условии .

Решение . Пересечением области допустимых решений и прямой является отрезок MN : М (0,6), N (6,0). Поэтому экстремальные значения функция может принимать либо в стационарных точках, либо в точках M и N . Для нахождения стационарной точки применим метод Лагранжа. Составим функцию Лагранжа

Найдем частные производные функции Лагранжа и приравняем их к нулю

Решая систему, получаем стационарную точку K (2,2;3,8). Сравним значения целевой функции в точках K , M , N :

Следовательно,

Пример 6. Известен рыночный спрос на определенное изделие в количестве 180 штук. Это изделие может быть изготовлено двумя предприятиями одного концерна по различным технологиям. При производстве х 1 изделий первым предприятием его затраты составят руб., а при изготовлении х 2 изделий вторым предприятием они составляют руб.

Определить, сколько изделий, изготовленных по каждой технологии, может предложить концерн, чтобы общие издержки его производства были минимальны.

Решение . Математическая модель задачи:

Для нахождения минимального значения целевой функции при условии х 1 + х 2 =180, т.е. без учета требования неотрицательности переменных, составим функцию Лагранжа:

Найдем первые производные функции Лагранжа по х 1 , х 2 , l , и приравняем их к 0. Получим систему уравнений:

Решая эту систему, найдем следующие корни: , т.е. получаем координаты точки, подозрительной на экстремум.

Чтобы определить, является ли точка ( ) локальным минимумом, исследуем определитель Гессе, для чего вычислим вторые частные производные целевой функции:

Так как

то определитель Гессе положительно определен; следовательно, целевая функция является выпуклой и в точке ( ) имеем локальный минимум:

Метод Множителей Лагранжа является классическим методом решения задач математического программирования (в частности выпуклого). К сожалению, при практическом применении метода могут встретиться значительные вычислительные трудности, сужающие область его использования. Мы рассматриваем здесь метод Лагранжа главным образом потому, что он является аппаратом, активно используемым для обоснования различных современных численных методов, широко применяемых на практике. Что же касается функции Лагранжа и множителей Лагранжа, то они играют самостоятельную и исключительно важную роль в теории и приложениях не только математического программирования.

Рассмотрим классическую задачу оптимизации

max (min) z=f(x) (7.20)

Эта задача выделяется из задачи (7.18), (7.19) тем, что среди ограничений (7.21) нет неравенств, нет условий неотрицательности переменных, их дискретности, и функции f(x) и непрерывны и имеют частные производные по крайней мере второго порядка.

Классический подход к решению задачи (7.20), (7.21) дает систему уравнений (необходимые условия), которым должна удовлетворять точка х*,доставляющая функции f(x)локальный экстремум на множестве точек, удовлетворяющих ограничениям (7.21) (для задачи выпуклого программирования найденная точка х*в соответствии с теоремой 7.6 будет одновременно и точкой глобального экстремума).

Предположим, что в точке х* функция (7.20) имеет локальный условный экстремум и ранг матрицы равен . Тогда необходимые условия запишутся в виде:

(7.22)

есть функция Лагранжа; - множители Лагранжа.

Существуют также и достаточные условия, при выполнении которых решение системы уравнений (7.22) определяет точку экстремума функции f(x). Этот вопрос решается на основании исследования знака второго дифференциала функции Лагранжа. Однако достаточные условия представляют главным образом теоретический интерес.

Можно указать следующий порядок решения задачи (7.20), (7.21) методом множителей Лагранжа:

1) составить функцию Лагранжа (7.23);

2) найти частные производные функции Лагранжа по всем переменным и приравнять их нулю. Тем самым будет получена система (7.22), состоящая из уравнений. Решить полученную систему (если это окажется возможным!) и найти таким образом все стационарные точки функции Лагранжа;

3) из стационарных точек, взятых без координат , выбрать точки, в которых функция f(x) имеет условные локальные экстремумы при наличии ограничений (7.21). Этот выбор осуществляется, например, с применением достаточных условий локального экстремума. Часто исследование упрощается, если использовать конкретные условия задачи.

Пример 7.3 . Найти оптимальное распределение ограниченного ресурса в a ед. между n потребителями, если прибыль, получаемая при выделении j-му потребителю x j единиц ресурса, вычисляется по формуле .

Решение. Математическая модель задачи имеет следующий вид:

Составляем функцию Лагранжа:

Находим частные производные функции Лагранжа и приравниваем их нулю:

Решая эту систему уравнений, получаем:

Таким образом, если j-му потребителю будет выделено ед. ресурса, то суммарная прибыль достигнет максимальной величины и составит ден. ед.

Мы рассмотрелиметод Лагранжа применительно к классической задаче оптимизации. Можно обобщить этот метод на случай, когда переменные неотрицательны и некоторые ограничения заданы в форме неравенств. Однако это обобщение имеет преимущественно теоретическое значение и не приводит к конкретным вычислительным алгоритмам.

В заключение дадим множителям Лагранжа экономическую интерпретацию. Для этого обратимся к простейшей классической задаче оптимизации

max (min) z =f (x 1 , х 2); (7.24)

𝜑(x 1 , х 2)=b. (7.25)

Предположим, что условный экстремум достигается в точке . Соответствующее экстремальное значение функции f (x )

Допустим, что в ограничениях (7.25) величина b может меняться, тогда координаты точки экстремума, а следовательно, и экстремальное значение f* функции f (x ) станут величинами, зависящими от b , т. е. ,, а поэтому производная функции (7.24)

Оптимизация методом неопределенных множителей лагранжа. Условная оптимизация. Метод множителей Лагранжа

Метод множителей Лагранжа для функций двух переменных.

Алгоритм исследования функции двух переменных на условный экстремум

Метод множителей Лагранжа для функций n переменных

Первый способ (метод множителей Лагранжа)

Второй способ

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Ваш комментарий (необязательно):