Графік розподілу Марченка-Пастура для різних значень лямбда
У математичній теорії випадкових матриць розподіл Марченка–Пастура , або закон Марченка–Пастура , описує асимптотичну поведінку сингулярних значень великих прямокутних випадкових матриць . Теорема названа на честь українських математиків Володимира Марченка та Леоніда Пастура , які довели цей результат у 1967 році.
Якщо
X
{\displaystyle X}
позначає a
m
×
n
{\displaystyle m\times n}
випадкова матриця, елементи якої є незалежними однаково розподіленими випадковими величинами із середнім 0 і дисперсією
σ
2
<
∞
{\displaystyle \sigma ^{2}<\infty }
, дозволяє
Y
n
=
1
n
X
X
T
{\displaystyle Y_{n}={\frac {1}{n}}XX^{T}}
і нехай
λ
1
,
λ
2
,
…
,
λ
m
{\displaystyle \lambda _{1},\,\lambda _{2},\,\dots ,\,\lambda _{m}}
бути власними значеннями
Y
n
{\displaystyle Y_{n}}
(розглядаються як випадкові змінні ). Нарешті, розглянемо випадкову міру
μ
m
(
A
)
=
1
m
#
{
λ
j
∈
A
}
,
A
⊂
R
.
{\displaystyle \mu _{m}(A)={\frac {1}{m}}\#\left\{\lambda _{j}\in A\right\},\quad A\subset \mathbb {R} .}
підрахунок кількості власних значень у підмножині
A
{\displaystyle A}
включені в
R
{\displaystyle \mathbb {R} }
.
Теорема . Припустимо, що
m
,
n
→
∞
{\displaystyle m,\,n\,\to \,\infty }
так що співвідношення
m
/
n
→
λ
∈
(
0
,
+
∞
)
{\displaystyle m/n\,\to \,\lambda \in (0,+\infty )}
. Потім
μ
m
→
μ
{\displaystyle \mu _{m}\,\to \,\mu }
(у слабкій* топології в розподілі ), де
μ
(
A
)
=
{
(
1
−
1
λ
)
1
0
∈
A
+
ν
(
A
)
,
if
λ
>
1
ν
(
A
)
,
if
0
≤
λ
≤
1
,
{\displaystyle \mu (A)={\begin{cases}(1-{\frac {1}{\lambda }})\mathbf {1} _{0\in A}+\nu (A),&{\text{if }}\lambda >1\\\nu (A),&{\text{if }}0\leq \lambda \leq 1,\end{cases}}}
і
d
ν
(
x
)
=
1
2
π
σ
2
(
λ
+
−
x
)
(
x
−
λ
−
)
λ
x
1
x
∈
[
λ
−
,
λ
+
]
d
x
{\displaystyle d\nu (x)={\frac {1}{2\pi \sigma ^{2}}}{\frac {\sqrt {(\lambda _{+}-x)(x-\lambda _{-})}}{\lambda x}}\,\mathbf {1} _{x\in [\lambda _{-},\lambda _{+}]}\,dx}
з
λ
±
=
σ
2
(
1
±
λ
)
2
.
{\displaystyle \lambda _{\pm }=\sigma ^{2}(1\pm {\sqrt {\lambda }})^{2}.}
Закон Марченка–Пастура також виникає як вільний закон Пуассона у вільній теорії ймовірностей, маючи швидкість
1
/
λ
{\displaystyle 1/\lambda }
і величину стрибка
σ
2
{\displaystyle \sigma ^{2}}
.
Використовуючи ті самі позначення, кумулятивна функція розподілу читається
F
λ
(
x
)
=
{
λ
−
1
λ
1
x
∈
[
0
,
λ
−
)
+
(
λ
−
1
2
λ
+
F
(
x
)
)
1
x
∈
[
λ
−
,
λ
+
)
+
1
x
∈
[
λ
+
,
∞
)
,
if
λ
>
1
F
(
x
)
1
x
∈
[
λ
−
,
λ
+
)
+
1
x
∈
[
λ
+
,
∞
)
,
if
0
≤
λ
≤
1
,
{\displaystyle F_{\lambda }(x)={\begin{cases}{\frac {\lambda -1}{\lambda }}\mathbf {1} _{x\in [0,\lambda _{-})}+\left({\frac {\lambda -1}{2\lambda }}+F(x)\right)\mathbf {1} _{x\in [\lambda _{-},\lambda _{+})}+\mathbf {1} _{x\in [\lambda _{+},\infty )},&{\text{if }}\lambda >1\\F(x)\mathbf {1} _{x\in [\lambda _{-},\lambda _{+})}+\mathbf {1} _{x\in [\lambda _{+},\infty )},&{\text{if }}0\leq \lambda \leq 1,\end{cases}}}
де
F
(
x
)
=
1
2
π
λ
(
π
λ
+
σ
−
2
(
λ
+
−
x
)
(
x
−
λ
−
)
−
(
1
+
λ
)
arctan
r
(
x
)
2
−
1
2
r
(
x
)
+
(
1
−
λ
)
arctan
λ
−
r
(
x
)
2
−
λ
+
2
σ
2
(
1
−
λ
)
r
(
x
)
)
{\textstyle F(x)={\frac {1}{2\pi \lambda }}\left(\pi \lambda +\sigma ^{-2}{\sqrt {(\lambda _{+}-x)(x-\lambda _{-})}}-(1+\lambda )\arctan {\frac {r(x)^{2}-1}{2r(x)}}+(1-\lambda )\arctan {\frac {\lambda _{-}r(x)^{2}-\lambda _{+}}{2\sigma ^{2}(1-\lambda )r(x)}}\right)}
і
r
(
x
)
=
λ
+
−
x
x
−
λ
−
{\displaystyle r(x)={\sqrt {\frac {\lambda _{+}-x}{x-\lambda _{-}}}}}
.
Перетворення Коші (яке є негативним перетворенням Стілтьєса ), коли
σ
2
=
1
{\displaystyle \sigma ^{2}=1}
, задається
G
μ
(
z
)
=
z
+
λ
−
1
−
(
z
−
λ
−
1
)
2
−
4
λ
2
λ
z
{\displaystyle G_{\mu }(z)={\frac {z+\lambda -1-{\sqrt {(z-\lambda -1)^{2}-4\lambda }}}{2\lambda z}}}
Це дає
R
{\displaystyle R}
-перетворення:
R
μ
(
z
)
=
1
1
−
λ
z
{\displaystyle R_{\mu }(z)={\frac {1}{1-\lambda z}}}
При застосуванні до кореляційних матриць
σ
2
=
1
{\displaystyle \sigma ^{2}=1}
і
λ
=
m
/
n
{\displaystyle \lambda =m/n}
маємо границі
λ
±
=
(
1
±
m
n
)
2
.
{\displaystyle \lambda _{\pm }=\left(1\pm {\sqrt {\frac {m}{n}}}\right)^{2}.}
Тому часто припускають, що власні значення кореляційних матриць нижчі за
λ
+
{\displaystyle \lambda _{+}}
є випадкові, а значення вищі за
λ
+
{\displaystyle \lambda _{+}}
є значущими загальними факторами. Наприклад, отримання кореляційної матриці річного ряду (тобто 252 торгових днів) 10 прибутковостей акцій відобразить
λ
+
=
(
1
+
10
252
)
2
≈
1.43
{\displaystyle \lambda _{+}=\left(1+{\sqrt {\frac {10}{252}}}\right)^{2}\approx 1.43}
. З 10 власних значень кореляційної матриці лише значення вище 1,43 будуть вважатися значущими.
Götze, F.; Tikhomirov, A. (2004). Rate of convergence in probability to the Marchenko–Pastur law . Bernoulli . 10 (3): 503—548. doi :10.3150/bj/1089206408 .
Marchenko, V. A.; Pastur, L. A. (1967). Распределение собственных значений в некоторых ансамблях случайных матриц [Distribution of eigenvalues for some sets of random matrices]. Mat. Sb. N.S. (рос.) . 72 (114:4): 507—536. Bibcode :1967SbMat...1..457M . doi :10.1070/SM1967v001n04ABEH001994 . Link to free-access pdf of Russian version
Nica, A.; Speicher, R. (2006). Lectures on the Combinatorics of Free probability theory . Cambridge Univ. Press. с. 204 , 368. ISBN 0-521-85852-6 . Link to free download Another free access site
Zhang, W.; Abreu, G.; Inamori, M.; Sanada, Y. (2011). Spectrum sensing algorithms via finite random matrices. IEEE Transactions on Communications . 60 (1): 164—175. doi :10.1109/TCOMM.2011.112311.100721 .
Epps, Brenden; Krivitzky, Eric M. (2019). Singular value decomposition of noisy data: mode corruption. Experiments in Fluids . 60 (8): 1—30. Bibcode :2019ExFl...60..121E . doi :10.1007/s00348-019-2761-y .
Дискретні одновимірні зі скінченним носієм Дискретні одновимірні з нескінченним носієм Неперервні одновимірні з носієм на обмеженому проміжку Неперервні одновимірні з носієм на напів-нескінченному проміжку Неперервні одновимірні з носієм на всій дійсній прямій Неперервні одновимірні з носієм змінного типу Змішані неперервно-дискретні одновимірні Багатовимірні (спільні) Напрямкові Вироджені та сингулярні [en] Сімейства