Ядрова оцінка густини розподілу

В статистиці, я́дрова оці́нка густини́ розпо́ділу (англ. Kernel density estimation) — це непараметричний метод оцінки функції густини випадкової величини за вибіркою. Ядрова оцінка густини є важливою задачею згладжування даних; при застосуванні методу судження щодо статистичних властивостей популяції здійснюється на базі скінченної вибірки. В деяких галузях (таких як обробка сигналів, економетрика) поряд з ядровою оцінкою густини використовують назву вікно Парцель-Розенблата, на честь Емануеля Парцена^[en] та Мюрея Розенблата^[en], котрі незалежно один від одного створили метод в теперішньому його вигляді.^[1]^[2]

Визначення

Нехай (x₁, x₂, …, x_n) — вибірка н.о.р.в.в., отримана з деякого розподілу з невідомою густиною ƒ. Потрібно оцінити форму цієї функції ƒ. Ядрова оцінка цієї густини ƒ задається формулою

{\hat {f}}_{h}(x)={\frac {1}{n}}\sum _{i=1}^{n}K_{h}(x-x_{i})\quad ={\frac {1}{nh}}\sum _{i=1}^{n}K{\Big (}{\frac {x-x_{i}}{h}}{\Big )},

де K(·) — статистичне ядро — симетрична, але не обов'язково додатня функція з інтегралом рівним одиниці, h > 0 — параметр згладжування, який ще називають пропускно́ю зда́тністю.

Практичне обчислення параметра згладжування

Якщо використовується гаусівські ядрові функції для оцінки одновимірних даних і оцінювана базова густина є стандартною нормальною, тоді можна показати, що оптимальним значенням параметра згладжування, h, є

h=\left({\frac {4{\hat {\sigma }}^{5}}{3n}}\right)^{\frac {1}{5}}\approx 1.06{\hat {\sigma }}n^{-1/5}

, де

{\hat {\sigma }}

— стандартне відхилення вибірки, що оцінюється.

Таке наближення називається нормально розподілене наближення (або гаусівське наближення).

Див. також

Простір масштабів: трійці {(x, h, ядрова оцінка густини з пропускною здатністю h, оціненою в x: для всіх x, h > 0} утворюють масштабопросторове подання даних.
Ядро

Джерела

↑ Rosenblatt, M. (1956). Remarks on some nonparametric estimates of a density function. Annals of Mathematical Statistics. 27: 832—837. doi:10.1214/aoms/1177728190. (англ.)
↑ Parzen, E. (1962). On estimation of a probability density function and mode. Annals of Mathematical Statistics. 33: 1065—1076. doi:10.1214/aoms/1177704472. (англ.)

Це незавершена стаття зі статистики.
Ви можете допомогти проєкту, виправивши або дописавши її.

[Ros1956-1] Rosenblatt, M. (1956). Remarks on some nonparametric estimates of a density function. Annals of Mathematical Statistics. 27: 832—837. doi:10.1214/aoms/1177728190. (англ.)

[Par1962-2] Parzen, E. (1962). On estimation of a probability density function and mode. Annals of Mathematical Statistics. 33: 1065—1076. doi:10.1214/aoms/1177704472. (англ.)

[1]

[2]