У математиці для даної комплексної ермітової матриці
і ненульового вектора
відношення Релея[1]
визначають так[2][3]:
![{\displaystyle R(M,x)={x^{*}Mx \over x^{*}x}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/50c6f0656cf02c152ae9a877912aa83c7ee10a85)
Для дійсних матриць умова ермітовості матриці зводиться до її симетричності, а ермітове спряження векторів
перетворюється на звичайне транспонування
. Зауважте, що
для будь-якої дійсної константи
. Нагадаємо, що ермітова (як і симетрична дійсна) матриця має дійсні власні значення. Можна показати, що для матриці відношення Релея досягає мінімального значення
(найменше власне число матриці
) коли
дорівнює
(відповідний власний вектор). Так само можна показати, що
і
. Відношення Релея використано в теоремі Куранта — Фішера про мінімакс для отримання всіх значень власних чисел. Використовується воно і в алгоритмах знаходження власних значень матриці для отримання наближення власного значення з наближення власного вектора. А саме, відношення є базою для ітерацій з відношенням Релея.
Множину значень відношення Релея називають числовим образом матриці[en].
Коваріаційну матрицю
для багатовимірної статистичної вибірки
(матриці спостережень) можна подати у вигляді добутку
. Як симетрична дійсна матриця,
має невід'ємні власні значення і ортогональні (або звідні до ортогональних) власні вектори.
По-перше, оскільки власні значення
не від'ємні:
![{\displaystyle Mv_{i}=A'Av_{i}=\lambda _{i}v_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee7dd86cf47054352c50da7f50d564fffe68ce57)
![{\displaystyle \Rightarrow v_{i}'A'Av_{i}=v_{i}'\lambda _{i}v_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40279c3afe822a68255aeff272ad60dec681a6e1)
![{\displaystyle \Rightarrow \left\|Av_{i}\right\|^{2}=\lambda _{i}\left\|v_{i}\right\|^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/883f25dbceaa1daa64f53c29a091500259fafd4b)
![{\displaystyle \Rightarrow \lambda _{i}={\frac {\left\|Av_{i}\right\|^{2}}{\left\|v_{i}\right\|^{2}}}\geq 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/46c3f3e6dfe776e6f67bcb0c87454586b1ac02fd)
і, по-друге, оскільки власні вектори
ортогональні один з одним:
![{\displaystyle Mv_{i}=\lambda _{i}v_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5c50764b54f59cacc713336abda323033ae0034d)
![{\displaystyle \Rightarrow v_{j}'Mv_{i}=\lambda _{i}v_{j}'v_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6749cb4f7b9d62e22558ed50d958e8b699bcccf4)
![{\displaystyle \Rightarrow (Mv_{j})'v_{i}=\lambda _{i}v_{j}'v_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/df60c71337d3b65c89dff05317728f70e7e11cef)
![{\displaystyle \Rightarrow \lambda _{j}v_{j}'v_{i}=\lambda _{i}v_{j}'v_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee1557bc1531ff7aa79b93c5fabc04559be7793d)
![{\displaystyle \Rightarrow (\lambda _{j}-\lambda _{i})v_{j}'v_{i}=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/aac3abfd628b01da6e857303f66f024e079d9d56)
, якщо власні значення різні; в разі однакових значень можна знайти ортогональний базис.
Тепер покажемо, що відношення Релея набуває найбільшого значення на векторі, відповідному найбільшому власному значенню. Розкладемо довільний вектор
за базисом власних векторів
:
, де
є проєкцією
на ![{\displaystyle v_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7dffe5726650f6daac54829972a94f38eb8ec127)
Отже, рівність
![{\displaystyle R(M,x)={\frac {x'A'Ax}{x'x}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/743fb967ae0693b807a3584e452f0e0ff667b25d)
можна переписати так:
![{\displaystyle R(M,x)={\frac {(\sum _{j=1}^{n}\alpha _{j}v_{j})'A'A(\sum _{i=1}^{n}\alpha _{i}v_{i})}{(\sum _{j=1}^{n}\alpha _{j}v_{j})'(\sum _{i=1}^{n}\alpha _{i}v_{i})}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d66a93e9fcea2076b9d4f3a5e7eb06ee06ea29f9)
Оскільки власні вектори ортогональні, остання рівність перетворюється на
![{\displaystyle R(M,x)={\frac {\sum _{i=1}^{n}\alpha _{i}^{2}\lambda _{i}}{\sum _{i=1}^{n}\alpha _{i}^{2}}}=\sum _{i=1}^{n}\lambda _{i}{\frac {(x'v_{i})^{2}}{(x'x)(v_{i}'v_{i})}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0cbdf58297c400547be0d08e305014a7985392ae)
Остання рівність показує, що відношення Релея є сумою квадратів косинусів кутів між вектором
і кожним з власних векторів
, помножених на відповідне власне значення.
Якщо вектор
максимізує
, то всі вектори, отримані з
множенням на скаляр (
для
) також максимізують
. Таким чином, задачу можна звести до знаходження максимуму
за умови
.
Оскільки всі власні числа не від'ємні, задача зводиться до знаходження максимуму опуклої функція і можна показати, що він досягається при
і
(власні значення впорядковані за спаданням).
Таким чином, відношення Релея досягає максимуму на власному векторі, відповідному найбільшому власному значенню.
Той самий результат з використанням множників Лагранжа
[ред. | ред. код]
Той самий результат можна отримати за допомогою множників Лагранжа. Задача полягає в знаходженні критичних точок функції
,
за сталої величини
Тобто, потрібно знайти критичні точки функції
![{\displaystyle {\mathcal {L}}(x)=x^{T}Mx-\lambda (x^{T}x-1),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/154f1959f31e8db1baf2327a18db40089be40009)
де
— множник Лагранжа.
Для стаціонарних точок функції
виконується рівність
![{\displaystyle {\frac {d{\mathcal {L}}(x)}{dx}}=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c98dce5b82321942deee71c83252d2969e4e975a)
![{\displaystyle \therefore 2x^{T}M^{T}-2\lambda x^{T}=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0b069574ac160244fad3eddb34414ad3bbbe9b82)
![{\displaystyle \therefore Mx=\lambda x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d784a134003dc151f6c9be50232128e2fa5cc338)
і
Таким чином, власні вектори
матриці
є критичними точками відношення Релея і їхні власні значення
— відповідними стаціонарними значеннями.
Ця властивість є базисом методу головних компонент і канонічної кореляції.
Теорія Штурма — Ліувілля полягає в дослідженні лінійного оператора
![{\displaystyle L(y)={\frac {1}{w(x)}}\left(-{\frac {d}{dx}}\left[p(x){\frac {dy}{dx}}\right]+q(x)y\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/371147c6e1ef449ffd33e67888014e4866665d32)
зі скалярним добутком
,
де функції задовольняють деяким специфічним граничним умовам у точках
і
. Відношення Релея тут набуває вигляду
![{\displaystyle {\frac {\langle {y,Ly}\rangle }{\langle {y,y}\rangle }}={\frac {\int _{a}^{b}{y(x)\left(-{\frac {d}{dx}}\left[p(x){\frac {dy}{dx}}\right]+q(x)y(x)\right)}dx}{\int _{a}^{b}{w(x)y(x)^{2}}dx}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e5f2d8b104320e364d15f3863e08434f92ba1015)
Іноді це відношення подають в еквівалентному вигляді, скориставшись інтегруванням частинами:
![{\displaystyle {\frac {\langle {y,Ly}\rangle }{\langle {y,y}\rangle }}={\frac {\int _{a}^{b}{y(x)\left(-{\frac {d}{dx}}\left[p(x)y'(x)\right]\right)}dx+\int _{a}^{b}{q(x)y(x)^{2}}\,dx}{\int _{a}^{b}{w(x)y(x)^{2}}\,dx}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ed0d8d34fdd179dff34c6376ee2e90d81524e627)
![{\displaystyle ={\frac {-y(x)\left[p(x)y'(x)\right]|_{a}^{b}+\int _{a}^{b}{y'(x)\left[p(x)y'(x)\right]}\,dx+\int _{a}^{b}{q(x)y(x)^{2}}\,dx}{\int _{a}^{b}{w(x)y(x)^{2}}\,dx}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1f72c17873203ef837577d8d1ce10af282434eeb)
![{\displaystyle ={\frac {-p(x)y(x)y'(x)|_{a}^{b}+\int _{a}^{b}\left[p(x)y'(x)^{2}+q(x)y(x)^{2}\right]\,dx}{\int _{a}^{b}{w(x)y(x)^{2}}\,dx}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/580e27b2083d13d2627b3b575cc0db2aa0f1054f)
Для будь-якої пари
дійсних симетричних додатноозначених матриць і ненульового вектора
, узагальнене відношення Релея визначається як
![{\displaystyle R(A,B;x):={\frac {x^{T}Ax}{x^{T}Bx}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b906c0dfe3d5eb8b30e87dfd81ef856adbf5ba4a)
Узагальнене відношення Релея можна звести до відношення Релея
перетворенням
, де
— розклад Холецького матриці
.
- ↑ також відоме під назвою відношення Релея — Рітца, названого на честь Вальтера Рітца і лорда Релея.
- ↑ Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176—180.
- ↑ Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998
- Б. Парлетт. Симметричная проблема собственных значений. Численные методы. — 1983.
- Э. Беккенббах, Р. Беллман. Неравенства. — М. : «Мир», 1965.
- Richard Haberman. Elementary applied partial differential equations. — Prentice Hall, Englewood, New Jersey, 1987.
- В. М. Вержбицкий. Численные методы (Линейная алгебра и нелинейные уравнения). — М. : «Высшая школа», 2000.
- В. В. Прасолов. Задачи и теоремы линейной алгебры. — М, 2008.
- Геворгян Л. З. Некоторые геометрические характеристики числового образа оператора. — Государственный Инженерный Университет Армении. Архівовано з джерела 31 серпня 2006.
- Zdzisław Burda, Jerzy Jurkiewicz, Bartłomiej Wacław. Eigenvalue density of empirical covariance matrix for correlated samples // Acta physica polonica B. — 2005. — Т. 36, вип. 9 (25 січня). — С. 2642.
- Коршунов Ю. М. Получение многомерной статистической выборки с заданными корреляционными свойствами // Вестник РГРТУ. — 2008. — Вип. 23 (25 січня). Архівовано з джерела 11 вересня 2021. Процитовано 11 вересня 2021.
- Shi Yu, Léon-Charles Tranchevent, Bart Moor, Yves Moreau. Ch. 2 // Kernel-based Data Fusion for Machine Learning: Methods and Applications in Bioinformatics and Text Mining. — Springer, 2011. Архівовано з джерела 11 вересня 2021