Критерій узгодженості Пірсона
Критерій узгодженості Пірсона — один з найвідоміших критеріїв , тому його часто і називають просто «критерій хі-квадрат». Використовується для перевірки гіпотези про закон розподілу.
Ґрунтується на групованих даних. Область значень передбачуваного розподілу ділять на деяке число інтервалів.
Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей потрапляння в інтервали групування й емпіричних частот.
Нехай X=(X1,…, Xn) — вибірка з розподілу . Перевіряється проста гіпотеза проти складної альтернативи .
Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом .
Позначимо для j=1,…,k через число елементів вибірки, що потрапили в інтервал :
,
і через — теоретичну ймовірність попадання в інтервал випадкової величини з розподілом .
З необхідністю, .
Як правило, довжини інтервалів вибирають так, щоб .
Нехай (1).
Якщо розподіл вибірки має такі ж, як в , імовірності попадання в кожний з інтервалів , то по даній функції ці розподіли розрізнити неможливо.
Тому насправді критерій, який ми побудуємо по функції з (1), вирішує зовсім інше завдання. А саме, нехай заданий набір імовірностей такий, що . Критерій призначений для перевірки складної гіпотези H2'={розподіл Х1 має властивість: Р(Х1 ∈ Аj)=pj для всіх j=1,…,k} проти складної альтернативи H2'={H1' невірна}, тобто H2'={хоча б для одного з інтервалів ймовірність P(X1 ∈ Аj) відізняється від pj}
Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область.
Правило. Якщо отримана статистика перевищує квантиль розподілу заданого рівня значимості з або з ступенями вільності, де k — число спостережень або число інтервалів (для випадку інтервального варіаційного ряду), а p — число оцінюваних параметрів закону розподілу, то гіпотеза відкидається. А якщо ні, то гіпотеза приймається на заданому рівні значимості . |
Якщо вірна гіпотеза H1', то при фіксованому k й при :
де, нагадаємо, є -розподіл зі ступенем вільності.
Насправді критерій застосовують і для розв'язку первісного завдання про перевірку гіпотези . Необхідно тільки пам'ятати, що цей критерій недостатній для альтернатив з тими ж імовірностями попадання в інтервали розбиття, що й в . Тому беруть велику кількість інтервалів розбиття — чим більше, тим краще, щоб «зменшити» число альтернатив, нерозрізнених з передбачуваним розподілом.
Критерій часто застосовують для перевірки гіпотези про вид розподілу, тобто про приналежність розподілу вибірки деякому параметричному сімейству. Є вибірка з невідомого розподілу .
Перевіряється складна гіпотеза: ,
де — невідомий параметр (скалярний або векторний), l- його розмірність.
Нехай розбите на k>lінтервалів , і — число елементів вибірки, що потрапили в. Але ймовірність тепер залежить від невідомого параметра .
Функція відхилення (1) також залежить від невідомого параметра, і використовувати її в критерії Пірсона не можна — ми не можемо обчислити її значення:
(2.)
Нехай - значення параметра , що доставляє мінімум функції при даній вибірці X .
Підставивши замість дійсних імовірностей pjїх оцінки , одержимо функцію відхилення:.
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Гнеденко Б. В. Курс теории вероятностей. — 6-е изд. — Москва : Наука, 1988. — 446 с.(рос.)
- Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)
- Кендалл М., Стюарт А. Статистические выводы и связи. — М.: Наука, Физматлит. — 1973. — 899 с. (рос.)