Опукле спряження

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Опукле спряження функції — це узагальнення перетворення Лежандра, яке застосовується до неопуклих функцій. Воно відоме також як перетворення Лежандра — Фенхеля або перетворення Фенхеля (за іменами Адрієна-Марі Лежандра та Вернера Фенхеля[en]). Спряження використовується для перетворення задачі оптимізації у відповідну двоїсту задачу, яку, можливо, простіше розв'язати.

Визначення

[ред. | ред. код]

Нехай  — дійсний топологічний векторний простір і нехай  — двоїстий простір для . Позначимо двоїсту пару[en] через

Для функції

,

яка набуває значень на розширеній числовій прямій, опукле спряження

визначено в термінах супремуму за формулою

або, еквівалентно, в термінах інфімуму за формулою

Це визначення можна інтерпретувати як кодування опуклої оболонки надграфіка функції в термінах її опорних гіперплощин [1] [2] .

Приклади

[ред. | ред. код]

Випукло спряження афінної функції

дорівнює

Випукло спряження степеневої функції

дорівнює

де

Опукле спряження функції абсолютної величини

дорівнює

Опукле поєднання показникової функції дорівнює

Опукле спряження і перетворення Лежандра показникової функції збігаються крім того, що область визначення опуклого спряження строго ширша, оскільки перетворення Лежандра визначено лише для додатних дійсних чисел.

Зв'язок із очікуваними втратами (середня ціна ризику)

[ред. | ред. код]

Нехай F означає інтегральну функцію розподілу випадкової величини X. Тоді (інтегруючи частинами),

має опукле спряження

Впорядкування

[ред. | ред. код]

Конкретна інтерпретація має перетворення

як неспадне перегрупування початкової функції f. Зокрема, для не спадає.

Властивості

[ред. | ред. код]

Опукле спряження замкнутої опуклої функції також є замкнутою опуклою функцією. Опукле спряження поліедральної опуклої функції (опуклої функції з многогранним надграфіком) також є поліедральною опуклою функцією.

Обернення порядку

[ред. | ред. код]

Опукле спряження обертає порядок — якщо , то . Тут

Для сімейства функцій це випливає з факту, що супремуми можна переставляти місцями

та з max–min нерівність[en]

Подвійне спряження

[ред. | ред. код]

Опукле спряження функції завжди напівнеперервне знизу. Подвійне спряження (опукле спряження опуклого спряження) є також замкненою опуклою оболонкою, тобто найбільшою напівнеперервною знизу опуклою функцією з . Для опуклих власних функцій[en] тоді й лише тоді, коли f опукла і напівнеперервна знизу за теоремою Фенхеля ― Моро.

Нерівність Фенхеля

[ред. | ред. код]

Для будь-якої функції f та її опуклого спряження нерівність Фенхеля (відома також як нерівність Фенхеля — Моро) виконується для будь-якого і  :

Доведення випливає негайно з визначення опуклого спряження: .

Опуклість

[ред. | ред. код]

Для двох функцій і та числа виконується

.

Тут операція  — це опукле відображення в себе.

Інфімальна конволюція

[ред. | ред. код]

Інфімальна конволюція двох функцій f і g визначається як

Нехай f1, …, fm — правильні опуклі напівнеперервні знизу функції на . Тоді інфімальна конволюція опукла і напівнеперервна знизу (але не обов'язково буде правильною функцією) [3] і задовольняє рівність

Інфімальна конволюція двох функцій має геометричну інтерпретацію — (строгий) надграфік інфімальної конволюції двох функцій дорівнює сумі Мінковського (строгих) надграфіків цих функцій[4].

Максимізувальний аргумент

[ред. | ред. код]

Якщо функція диференційовна, то її похідна є максимізувальним аргументом при обчисленні опуклого спряження:

і

звідки

і більш того,

Масштабувальні властивості

[ред. | ред. код]

Якщо для деякого , то

У разі додаткового параметра (скажімо, ), більш того,

де вибирається максимізувальним аргументом.

Поведінка за лінійних перетворень

[ред. | ред. код]

Нехай A — обмежений лінійний оператор з X у Y. Для будь-якої опуклої функції f на X маємо

де

є прообразом f для A, а A* — спряженим оператором для A[5].

Замкнута опукла функція f симетрична для заданої множини G ортогональних лінійних перетворень

тоді й лише тоді, коли опукле спряження f* симетричне для G.


Таблиця деяких опуклих спряжень

[ред. | ред. код]

У таблиці наведено перетворення Лежандра для багатьох поширених функцій, а також для декількох корисних властивостей[6].

(где )
(где )
(где ) (где )
(где ) (где )

Див. також

[ред. | ред. код]

Примітки

[ред. | ред. код]
  1. Legendre Transform. Процитовано 14 квітня 2019.
  2. Frank Nielsen. Legendre transformation and information geometry (PDF).
  3. Phelps, 1991, с. 42.
  4. Bauschke, Goebel, Lucet, Wang, 2008, с. 766.
  5. Иоффе, Тихомиров, 1974, с. утверждение 3.4.3.
  6. Borwein, Lewis, 2006, с. 50–51.

Література

[ред. | ред. код]
  • Robert R. Phelps. Convex Functions, Monotone Operators and Differentiability. — Springer, 1991. — ISBN 0-387-56715-1.
  • Heinz H. Bauschke, Rafal Goebel, Yves Lucet, Xianfu Wang. The Proximal Average: Basic Theory // SIAM Journal on Optimization. — 2008. — Т. 19, вип. 2. — DOI:10.1137/070687542.
  • Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. — М. : «Наука», 1974.
  • Jonathan Borwein, Adrian Lewis. Convex Analysis and Nonlinear Optimization: Theory and Examples. — Springer, 2006. — ISBN 978-0-387-29570-1.
  • Владимир Игоревич Арнольд. Математические методы классической механики. — М. : «Наука», 1989.
  • R. Tyrrell Rockafellar. Convex Analysis. — Princeton : Princeton University Press, 1970. — ISBN 0-691-01586-4.

Посилання

[ред. | ред. код]