Знайти x і y , що максимізують f (x , y ) за умови, що g (x , y ) = c (показана червоним).
Метод невизначених множників або метод невизначених множників Лагранжа — метод знаходження умовного локального екстремуму , запропонований італійським математиком Жозефом-Луї Лагранжем . Метод дозволяє звести задачу з пошуку умовного екстремуму до задачі на знаходження безумовного екстремуму.
Нехай потрібно знайти екстремум функції n змінних
F
(
x
1
,
x
2
,
…
,
x
n
)
{\displaystyle F(x_{1},x_{2},\ldots ,x_{n})}
за s умов
g
i
(
x
1
,
x
2
,
…
,
x
n
)
=
0
{\displaystyle g_{i}(x_{1},x_{2},\ldots ,x_{n})=0}
, де
i
=
1
,
2
,
…
,
s
{\displaystyle i=1,2,\ldots ,s}
.
Вводячи s невизначених множників Лагранжа
λ
i
{\displaystyle \lambda _{i}}
, побудуємо функцію Лагранжа
Φ
(
x
1
,
x
2
,
…
,
x
n
,
λ
1
,
λ
2
,
…
,
λ
s
)
=
F
(
x
1
,
x
2
,
…
,
x
n
)
−
∑
i
=
1
s
λ
i
g
i
(
x
1
,
x
2
,
…
,
x
n
)
{\displaystyle \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})=F(x_{1},x_{2},\ldots ,x_{n})-\sum _{i=1}^{s}\lambda _{i}g_{i}(x_{1},x_{2},\ldots ,x_{n})}
.
Задача знаходження умовного оптимуму зводиться до розв'язування системи n+s рівнянь із n+s змінними:
∂
Φ
(
x
1
,
x
2
,
…
,
x
n
,
λ
1
,
λ
2
,
…
,
λ
s
)
∂
x
i
=
0
,
i
=
1
,
2
,
…
,
n
{\displaystyle {\frac {\partial \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})}{\partial x_{i}}}=0,\qquad i=1,2,\ldots ,n}
,
∂
Φ
(
x
1
,
x
2
,
…
,
x
n
,
λ
1
,
λ
2
,
…
,
λ
s
)
∂
λ
j
=
g
j
(
x
1
,
x
2
,
…
,
x
n
)
=
0
,
j
=
1
,
2
,
…
,
s
{\displaystyle {\frac {\partial \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})}{\partial \lambda _{j}}}=g_{j}(x_{1},x_{2},\ldots ,x_{n})=0,\qquad j=1,2,\ldots ,s}
.
Метод невизначених множників Лагранжа широко використовується в математичній і теоретичній фізиці . За допомогою цього методу отримані рівняння Лагранжа першого роду , які дозволяють формально ввести сили реакції в фізичні задачі із в'язями . Невизначені множники Лагранжа використовує також варіаційний метод в квантовій механіці .
Знайти прямокутник із найбільшою площею за заданого периметра p.
Позначимо сторони прямокутника x та y. Потрібно знайти максимум функції
S
=
x
y
{\displaystyle S=xy}
за умови
2
x
+
2
y
=
p
{\displaystyle 2x+2y=p}
.
Вводимо множник Лагранжа
λ
{\displaystyle \lambda }
і шукаємо безумовний екстремум функції
F
(
x
,
y
,
λ
)
=
x
y
−
λ
(
2
x
+
2
y
−
p
)
{\displaystyle F(x,y,\lambda )=xy-\lambda (2x+2y-p)}
Беручи похідні отримуємо систему рівнянь
∂
F
(
x
,
y
,
λ
)
∂
x
=
y
−
2
λ
=
0
{\displaystyle {\frac {\partial F(x,y,\lambda )}{\partial x}}=y-2\lambda =0}
∂
F
(
x
,
y
,
λ
)
∂
y
=
x
−
2
λ
=
0
{\displaystyle {\frac {\partial F(x,y,\lambda )}{\partial y}}=x-2\lambda =0}
∂
F
(
x
,
y
,
λ
)
∂
λ
=
2
x
+
2
y
−
p
=
0
{\displaystyle {\frac {\partial F(x,y,\lambda )}{\partial \lambda }}=2x+2y-p=0}
Підставляючи значення
y
=
2
λ
{\displaystyle y=2\lambda }
та
x
=
2
λ
{\displaystyle x=2\lambda }
в останнє рівняння, отримуємо
λ
=
p
8
{\displaystyle \lambda ={\frac {p}{8}}}
x
=
y
=
p
4
{\displaystyle x=y={\frac {p}{4}}}
.
S
m
a
x
=
p
2
16
{\displaystyle S_{max}={\frac {p^{2}}{16}}}
Отже, найбільшу площу серед прямокутників із заданим периметром має квадрат .
Ілюстрація задачі оптимізації з обмеженнями
Цей приклад вимагає складніших обчислень, але це все ще задача з одним обмеженням.
Припустимо, що потрібно знайти найбільші значення
f
(
x
,
y
)
=
x
2
y
{\displaystyle f(x,y)=x^{2}y}
за умови, що
x
{\displaystyle x}
- і
y
{\displaystyle y}
-координати лежать на колі з центром в початку координат з радіусом
3
{\displaystyle {\sqrt {3}}}
. Тобто з таким обмеженням
g
(
x
,
y
)
=
x
2
+
y
2
−
3
=
0.
{\displaystyle g(x,y)=x^{2}+y^{2}-3=0.}
Через те, що маємо лише одне обмеження, то маємо і лише один множник, скажімо
λ
{\displaystyle \lambda }
.
Обмеження
g
(
x
,
y
)
{\displaystyle g(x,y)}
тотожна нулю на колі радіуса
3
{\displaystyle {\sqrt {3}}}
. Будь-яке кратне
g
(
x
,
y
)
{\displaystyle g(x,y)}
можна додати до
g
(
x
,
y
)
{\displaystyle g(x,y)}
не змінивши при цьому
g
(
x
,
y
)
{\displaystyle g(x,y)}
у цікавій нам області (на колі, що задовольняє наше обмеження).
L
(
x
,
y
,
λ
)
=
f
(
x
,
y
)
+
λ
⋅
g
(
x
,
y
)
=
x
2
y
+
λ
(
x
2
+
y
2
−
3
)
.
{\displaystyle {\begin{aligned}{\mathcal {L}}(x,y,\lambda )&=f(x,y)+\lambda \cdot g(x,y)\\&=x^{2}y+\lambda (x^{2}+y^{2}-3).\end{aligned}}}
звідки ми можемо порахувати градієнт :
∇
x
,
y
,
λ
L
(
x
,
y
,
λ
)
=
(
∂
L
∂
x
,
∂
L
∂
y
,
∂
L
∂
λ
)
=
(
2
x
y
+
2
λ
x
,
x
2
+
2
λ
y
,
x
2
+
y
2
−
3
)
.
{\displaystyle {\begin{aligned}\nabla _{x,y,\lambda }{\mathcal {L}}(x,y,\lambda )&=\left({\frac {\partial {\mathcal {L}}}{\partial x}},{\frac {\partial {\mathcal {L}}}{\partial y}},{\frac {\partial {\mathcal {L}}}{\partial \lambda }}\right)\\&=\left(2xy+2\lambda x,x^{2}+2\lambda y,x^{2}+y^{2}-3\right).\end{aligned}}}
І отже:
∇
x
,
y
,
λ
L
(
x
,
y
,
λ
)
=
0
⟺
{
2
x
y
+
2
λ
x
=
0
x
2
+
2
λ
y
=
0
x
2
+
y
2
−
3
=
0
⟺
{
x
(
y
+
λ
)
=
0
(i)
x
2
=
−
2
λ
y
(ii)
x
2
+
y
2
=
3
(iii)
{\displaystyle \nabla _{x,y,\lambda }{\mathcal {L}}(x,y,\lambda )=0\quad \iff \quad {\begin{cases}2xy+2\lambda x=0\\x^{2}+2\lambda y=0\\x^{2}+y^{2}-3=0\end{cases}}\quad \iff \quad {\begin{cases}x(y+\lambda )=0&{\text{(i)}}\\x^{2}=-2\lambda y&{\text{(ii)}}\\x^{2}+y^{2}=3&{\text{(iii)}}\end{cases}}}
(iii) це наше вихідне обмеження. (i) означає, що
x
=
0
{\displaystyle x=0}
або
λ
=
−
y
{\displaystyle \lambda =-y}
. Якщо
x
=
0
{\displaystyle x=0}
тоді з (iii)
y
=
±
3
{\displaystyle y=\pm {\sqrt {3}}}
і далі
λ
=
0
{\displaystyle \lambda =0}
з (ii). Якщо ж
λ
=
−
y
{\displaystyle \lambda =-y}
, підставляючи у (ii) маємо
x
2
=
2
y
2
{\displaystyle x^{2}=2y^{2}}
. Підставляючи у (iii) і розв'язуючи щодо
y
{\displaystyle y}
маємо
y
=
±
1
{\displaystyle y=\pm 1}
. Отже існує шість критичних точок
L
{\displaystyle {\mathcal {L}}}
:
(
2
,
1
,
−
1
)
;
(
−
2
,
1
,
−
1
)
;
(
2
,
−
1
,
1
)
;
(
−
2
,
−
1
,
1
)
;
(
0
,
3
,
0
)
;
(
0
,
−
3
,
0
)
.
{\displaystyle ({\sqrt {2}},1,-1);\quad (-{\sqrt {2}},1,-1);\quad ({\sqrt {2}},-1,1);\quad (-{\sqrt {2}},-1,1);\quad (0,{\sqrt {3}},0);\quad (0,-{\sqrt {3}},0).}
Обчислюючи функцію мети в цих точках знаходимо, що
f
(
±
2
,
1
)
=
2
;
f
(
±
2
,
−
1
)
=
−
2
;
f
(
0
,
±
3
)
=
0.
{\displaystyle f(\pm {\sqrt {2}},1)=2;\quad f(\pm {\sqrt {2}},-1)=-2;\quad f(0,\pm {\sqrt {3}})=0.}
Отже, функція мети досягає глобального максимуму (за умови обмеження) у
(
±
2
,
1
)
{\displaystyle (\pm {\sqrt {2}},1)}
і глобального мінімуму в
(
±
2
,
−
1
)
.
{\displaystyle (\pm {\sqrt {2}},-1).}
Точка
(
0
,
3
)
{\displaystyle (0,{\sqrt {3}})}
це локальний мінімум
f
,
{\displaystyle f,}
а
(
0
,
−
3
)
{\displaystyle (0,-{\sqrt {3}})}
це локальний максимум
f
,
{\displaystyle f,}
що можна побачити використавши обрамлену матрицю Гесе для
L
(
x
,
y
,
0
)
{\displaystyle {\mathcal {L}}(x,y,0)}
.
Зауважте, що хоча
(
2
,
1
,
−
1
)
{\displaystyle ({\sqrt {2}},1,-1)}
це критична точка
L
{\displaystyle {\mathcal {L}}}
, це не локальний екстремум
L
.
{\displaystyle {\mathcal {L}}.}
Маємо, що
L
(
2
+
ε
,
1
,
−
1
+
δ
)
=
2
+
δ
(
ε
2
+
(
2
2
)
ε
)
.
{\displaystyle {\mathcal {L}}\left({\sqrt {2}}+\varepsilon ,1,-1+\delta \right)=2+\delta \left(\varepsilon ^{2}+\left(2{\sqrt {2}}\right)\varepsilon \right).}
Маючи будь-який окіл
(
2
,
1
,
−
1
)
{\displaystyle ({\sqrt {2}},1,-1)}
, можна вибрати мале додатне
ε
{\displaystyle \varepsilon }
і мале
δ
{\displaystyle \delta }
будь-якого знаку, щоб отримати значення
L
{\displaystyle {\mathcal {L}}}
як більше так і менше ніж
2
{\displaystyle 2}
. Це можна також побачити з того, що матриця Гесе для
L
{\displaystyle {\mathcal {L}}}
обчислена в цій точці (та й в будь-якій іншій знайденій критичній точці) являє собою невизначену матрицю . Кожна з критичних точок
L
{\displaystyle {\mathcal {L}}}
це сідлова точка
L
{\displaystyle {\mathcal {L}}}
.