Матриця Гессе — квадратна матриця елементами якої є часткові похідні деякої функції. Це поняття запровадив Людвіг Отто Гессе (1844), використовуючи іншу назву. Термін «матриця Гессе» належить Джеймсу Джозефу Сильвестрові.
Формально, нехай дано дійсну функцію від n змінних:
![{\displaystyle f(x_{1},x_{2},\dots ,x_{n}),\,\!}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f9e917690b1c8d2818655826dc178252d0217aed)
якщо у функції f існують всі похідні другого порядку, то можна визначити матрицю Гессе для цієї функції:
![{\displaystyle H(f)_{ij}(x)={\frac {\partial ^{2}f}{\partial x_{i}\,\partial x_{j}}}\,\!}](https://wikimedia.org/api/rest_v1/media/math/render/svg/18b304b9599e14405345b2abaea3660b943585a2)
де
тобто
Визначник цієї матриці називається визначником Гессе, або гесіаном.
Значення матриці Гессе пояснюється її появою у формулі Тейлора:
![{\displaystyle y=f(\mathbf {x} +\Delta \mathbf {x} )\approx f(\mathbf {x} )+J(\mathbf {x} )\Delta \mathbf {x} +{\frac {1}{2}}\Delta \mathbf {x} ^{\mathrm {T} }H(\mathbf {x} )\Delta \mathbf {x} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/de8b04caf22f0b228637c09ee03ac2fe9b7cff5f)
Матриці Гессе використовуються в задачах оптимізації методом Ньютона.
Повне обчислення матриці Гессе може бути досить складним, тому були розроблені квазіньютонові алгоритми, засновані на наближених виразах для матриці Гессе. Найвідоміший з них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.
Мішані похідні функції f — це елементи матриці Гессе, що стоять не на головній діагоналі. Якщо вони неперервні, то порядок диференціювання не важливий:
![{\displaystyle {\frac {\partial }{\partial x}}\left({\frac {\partial f}{\partial y}}\right)={\frac {\partial }{\partial y}}\left({\frac {\partial f}{\partial x}}\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a403600682f019376833a3fbada121b511f9f61d)
Це можна також записати як
![{\displaystyle f_{yx}=f_{xy}.\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3d90fc7008df01284f0499a1e443604dacd7efdb)
В цьому випадку матриця Гессе є симетричною.
Якщо градієнт
(її векторна похідна) рівний нулю в деякій точці
, то ця точка називається критичною.
- Якщо матриця Гессе є додатно визначеною в точці
, то
— точка локального мінімуму функції
.
- Якщо матриця Гессе є від'ємно визначеною в точці
, то
— точка локального максимуму функції
.
- Якщо матриця Гессе не є ні додатно визначеною, ні від'ємно визначеною, причому є невиродженою (тобто
), то
— сідлова точка функції
.
У випадку оптимізації з додатковими умовами виникає також поняття обрамленої матриці Гессе. Нехай знову маємо функцію:
але тепер також розглянемо умови:
При оптимізації функції f з додатковими умовами обрамлена матриця Гессе має вигляд:
Для даної матриці можна сформувати різні головні мінори. Позначимо
— головний мінор матриці, для якого останнім елементом на головній діагоналі є
Тоді можна сформувати достатні умови екстремуму для функції при виконанні обмежень.
Функція буде мати максимум при виконанні умов, якщо знаки послідовних n - m мінорів
будуть чергуватися, при чому знак
буде рівний
Функція буде мати мінімум при виконанні умов, всі послідовні n - m мінорів
мають один знак, а саме
Якщо f — векторзначна функція, тобто
![{\displaystyle f=(f_{1},f_{2},\dots f_{n}),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fa92e9f308380ad2fb78b9329b59715c172a976c)
то її другі часткові похідні утворюють не матрицю, а тензор рангу n+1.
- Кудрявцев Л.Д. «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с.
- Chiang, Alpha C., Fundamental Methods of Mathematical Economics, third edition, McGraw-Hill, 1984.
- Nocedal, Jorge; Wright, Stephen J. (2006), Numerical Optimization (2nd ed.), Berlin, New York: Springer-Verlag, ISBN 978-0-387-30303-1