Квазіопукла функція, що не є опуклою
Функція, що не є квазіопуклою: множина точок, значення функції в яких не перевищує червоної пунктирної лінії не є опуклою.
Квазіопукла функція — узагальнення поняття опуклої функції , що знайшло широке використання в нелінійній оптимізації , зокрема при застосуванні оптимізації до питань економіки .
Нехай X — опукла підмножина
R
n
{\displaystyle \mathbb {R} ^{n}}
. Функція
f
:
X
→
R
{\displaystyle f:X\to \mathbb {R} }
називається квазіопуклою або унімодальною, якщо для довільних елементів
x
,
y
∈
X
{\displaystyle x,y\in X}
і
λ
∈
[
0
,
1
]
{\displaystyle \lambda \in [0,1]}
виконується нерівність :
f
(
λ
x
+
(
1
−
λ
)
y
)
≤
max
(
f
(
x
)
,
f
(
y
)
)
.
{\displaystyle f(\lambda x+(1-\lambda )y)\leq \max {\big (}f(x),f(y){\big )}.}
Якщо також:
f
(
λ
x
+
(
1
−
λ
)
y
)
<
max
(
f
(
x
)
,
f
(
y
)
)
{\displaystyle f(\lambda x+(1-\lambda )y)<\max {\big (}f(x),f(y){\big )}}
для
x
≠
y
{\displaystyle x\neq y}
і
λ
∈
(
0
,
1
)
{\displaystyle \lambda \in (0,1)}
то функція називається строго квазіопуклою .
Функція
f
:
X
→
R
{\displaystyle f:X\to \mathbb {R} }
називається квазіувігнутою (строго квазіувігнутою), якщо
−
f
{\displaystyle -f}
є квазіопуклою (строго квазіопуклою).
Еквівалентно, функція є квазіувігнутою, якщо
f
(
λ
x
+
(
1
−
λ
)
y
)
≥
min
(
f
(
x
)
,
f
(
y
)
)
.
{\displaystyle f(\lambda x+(1-\lambda )y)\geq \min {\big (}f(x),f(y){\big )}.}
і строго квазіувігнутою якщо
f
(
λ
x
+
(
1
−
λ
)
y
)
>
min
(
f
(
x
)
,
f
(
y
)
)
.
{\displaystyle f(\lambda x+(1-\lambda )y)>\min {\big (}f(x),f(y){\big )}.}
Функція, яка одночасно є квазіопуклою та квазіувігнутою називається квазілінійною .
Довільна опукла функція є квазіопуклою, довільна увігнута функція є квазіувігнутою.
Функція
f
(
x
)
=
ln
x
{\displaystyle f(x)=\ln x}
є квазілінійною на множині додатних дійсних чисел .
Функція
f
(
x
1
,
x
2
)
=
x
1
x
2
{\displaystyle f(x_{1},x_{2})=x_{1}x_{2}}
є квазувігнутою на множині
R
+
2
,
{\displaystyle \mathbb {R} _{+}^{2},}
(множина пар невід'ємних чисел) але не є ні опуклою, ні увігнутою.
Функція
x
↦
⌊
x
⌋
{\displaystyle x\mapsto \lfloor x\rfloor }
є квазіопуклою і не є ні опуклою, ні неперервною .
Функція
f
:
X
→
R
{\displaystyle f:X\to \mathbb {R} }
, де
X
⊂
R
n
{\displaystyle X\subset \mathbb {R} ^{n}}
— опукла множина , квазіопукла тоді і тільки тоді, коли для всіх
β
∈
R
,
{\displaystyle \beta \in \mathbb {R} ,}
множина
X
β
=
{
x
∈
X
|
f
(
x
)
⩽
β
}
{\displaystyle X_{\beta }=\{x\in X|f(x)\leqslant \beta \}}
Доведення. Нехай множина
X
β
{\displaystyle X_{\beta }}
опукла для будь-якого β. Зафіксуємо дві довільні точки
x
1
,
x
2
∈
X
{\displaystyle x_{1},x_{2}\in X}
та розглянемо точку
x
=
λ
x
1
+
(
1
−
λ
)
x
2
,
λ
∈
(
0
,
1
)
.
{\displaystyle x=\lambda x_{1}+(1-\lambda )x_{2},\quad \lambda \in (0,1).}
Точки
x
1
,
x
2
∈
X
β
{\displaystyle x_{1},x_{2}\in X_{\beta }}
при
β
max
{
f
(
x
1
)
,
f
(
x
2
)
}
{\displaystyle \beta \max\{f(x_{1}),f(x_{2})\}}
. Оскільки множина
X
β
{\displaystyle X_{\beta }}
опукла, то
x
∈
X
β
{\displaystyle x\in X_{\beta }}
, а, отже,
f
(
x
)
⩽
β
=
m
a
x
{
f
(
x
1
)
,
f
(
x
2
)
}
,
{\displaystyle f(x)\leqslant \beta =max\{f(x_{1}),f(x_{2})\},}
тобто виконується нерівність у визначенні і функція є квазіопуклою.
Нехай функція f квазіопукла. Для деякого
β
∈
R
{\displaystyle \beta \in \mathbb {R} }
зафіксуємо довільні точки
x
1
,
x
2
∈
X
β
.
{\displaystyle x_{1},x_{2}\in X_{\beta }.}
Тоді
max
{
f
(
x
1
)
,
f
(
x
2
)
}
⩽
β
{\displaystyle \max\{f(x_{1}),f(x_{2})\}\leqslant \beta }
. Оскільки X — опукла множина, то для будь-якого
λ
∈
(
0
,
1
)
{\displaystyle \lambda \in (0,1)}
точка
x
=
λ
x
1
+
(
1
−
λ
)
x
2
∈
X
{\displaystyle x=\lambda x_{1}+(1-\lambda )x_{2}\in X}
. З означення квазіопуклості випливає, що
f
(
x
)
⩽
m
a
x
{
f
(
x
1
)
,
f
(
x
2
)
}
⩽
β
{\displaystyle f(x)\leqslant max\{f(x_{1}),f(x_{2})\}\leqslant \beta }
, тобто
x
∈
X
β
{\displaystyle x\in X_{\beta }}
. Отже,
X
β
{\displaystyle X_{\beta }}
— опукла множина.
Неперервна функція
f
:
X
→
R
{\displaystyle f:X\to \mathbb {R} }
, де X — опукла множина в
R
{\displaystyle \mathbb {R} }
, квазіопукла тоді і тільки тоді, коли виконується одна з таких умов:
f — неспадна;
f — незростаюча;
існує така точка
c
∈
X
{\displaystyle c\in X}
, що для всіх
t
∈
X
,
t
⩽
c
,
{\displaystyle t\in X,t\leqslant c,}
функція f незростаюча, і для всіх
t
∈
X
,
t
⩾
c
,
{\displaystyle t\in X,t\geqslant c,}
функція f неспадна.
Нехай
f
:
X
→
R
{\displaystyle f:X\to \mathbb {R} }
— диференційована функція на X , де
X
⊂
R
n
{\displaystyle X\subset \mathbb {R} ^{n}}
— відкрита опукла множина. Тоді f квазіопукла на X тоді і тільки тоді, коли справджується співвідношення:
f
(
y
)
⩽
f
(
x
)
⇒
⟨
f
′
(
x
)
,
y
−
x
⟩
⩽
0
{\displaystyle f(y)\leqslant f(x)\Rightarrow \left\langle f^{'}(x),y-x\right\rangle \leqslant 0}
для всіх
x
,
y
∈
X
{\displaystyle x,y\in X}
.
Нехай f — двічі диференційовна функція. Якщо f квазіопукла на X, то виконується умова:
⟨
f
′
(
x
)
,
y
⟩
=
0
⇒
⟨
f
″
(
x
)
y
,
y
⟩
⩾
0
,
{\displaystyle \left\langle f^{'}(x),y\right\rangle =0\Rightarrow \left\langle f^{''}(x)y,y\right\rangle \geqslant 0,}
для всіх
x
∈
X
,
y
∈
R
n
{\displaystyle x\in X,y\in \mathbb {R} ^{n}}
.
Необхідні і достатні умови квазіопуклості і квазіувігнутості можна також дати через так звану обрамлену матрицю Гессе . Для функції
f
(
x
1
,
…
,
x
m
)
{\displaystyle f(x_{1},\ldots ,x_{m})}
визначимо для
1
⩽
n
⩽
m
{\displaystyle 1\leqslant n\leqslant m}
визначники :
D
n
=
|
0
∂
f
∂
x
1
∂
f
∂
x
2
⋯
∂
f
∂
x
n
∂
f
∂
x
1
∂
2
f
∂
x
1
2
∂
2
f
∂
x
1
∂
x
2
⋯
∂
2
f
∂
x
1
∂
x
n
∂
f
∂
x
2
∂
2
f
∂
x
2
∂
x
1
∂
2
f
∂
x
2
2
⋯
∂
2
f
∂
x
2
∂
x
n
⋮
⋮
⋮
⋱
⋮
∂
f
∂
x
n
∂
2
f
∂
x
n
∂
x
1
∂
2
f
∂
x
n
∂
x
2
⋯
∂
2
f
∂
x
n
2
|
{\displaystyle D_{n}={\begin{vmatrix}0&{\frac {\partial f}{\partial x_{1}}}&{\frac {\partial f}{\partial x_{2}}}&\cdots &{\frac {\partial f}{\partial x_{n}}}\\\\{\frac {\partial f}{\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{1}^{2}}}&{\frac {\partial ^{2}f}{\partial x_{1}\,\partial x_{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{1}\,\partial x_{n}}}\\\\{\frac {\partial f}{\partial x_{2}}}&{\frac {\partial ^{2}f}{\partial x_{2}\,\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{2}\,\partial x_{n}}}\\\\\vdots &\vdots &\vdots &\ddots &\vdots \\\\{\frac {\partial f}{\partial x_{n}}}&{\frac {\partial ^{2}f}{\partial x_{n}\,\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{n}\,\partial x_{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{n}^{2}}}\end{vmatrix}}}
Тоді справедливі твердження:
Якщо функція f квазіопукла на множині X , тоді Dn (x) ≤ 0 для всіх n і всіх x з X .
Якщо функція f квазіувігнута на множині X , тоді D1 (x) ≤ 0, D2 (x) ≥ 0, ..., (-1)m Dm (x) ≤ 0 для всіх x з X .
Якщо Dn (x) ≤ 0 для всіх n і всіх x з X , то функція f квазіопукла на множині X .
Якщо D1 (x) ≤ 0, D2 (x) ≥ 0, ..., (-1)m Dm (x) ≤ 0 для всіх x з X , функція f квазіувігнута на множині X .
Максимум зважених квазіопуклих функцій з невід'ємними вагами, тобто
f
=
max
{
w
1
f
1
,
…
,
w
n
f
n
}
{\displaystyle f=\max \left\lbrace w_{1}f_{1},\ldots ,w_{n}f_{n}\right\rbrace }
де
w
i
⩾
0
{\displaystyle w_{i}\geqslant 0}
композиція з неспадною функцією (якщо
g
:
R
n
→
R
{\displaystyle g:\mathbb {R} ^{n}\rightarrow \mathbb {R} }
— квазіопукла,
h
:
R
→
R
{\displaystyle h:\mathbb {R} \rightarrow \mathbb {R} }
— неспадна, тоді
f
=
h
∘
g
{\displaystyle f=h\circ g}
є квазіопуклою).
мінімізація (якщо f(x,y) є квазіопуклою, C — опукла множина, тоді
h
(
x
)
=
inf
y
∈
C
f
(
x
,
y
)
{\displaystyle h(x)=\inf _{y\in C}f(x,y)}
є квазіопуклою).
Alpha C Chiang, "Fundamental Methods of Mathematical Economics, Third Edition", McGraw Hill Book Company, 1984.