Довірча та прогнозна смуги
Дові́рчу сму́гу[1] (англ. confidence band) використовують у статистичнім аналізі, щоби подавати невизначеність в оцінці кривої або функції, яка ґрунтується на обмежених або зашумлених даних. Подібним чином, прогно́зну сму́гу (англ. prediction band) використовують, щоби подавати невизначеність стосовно нової точки даних на кривій з урахуванням шуму. Довірчі та передбачувані смуги часто використовують як частину графічного подання результатів регресійного аналізу.
Довірчі смуги є тісно пов'язаними з довірчими інтервалами, які представляють невизначеність в оцінці єдиного чисельного значення. «Оскільки довірчі інтервали, за своєю побудовою, стосуються лише єдиної точки, вони є вужчими (в цій точці), аніж довірча смуга, яка повинна витримуватися одночасно в багатьох точках.»[2]
Припустімо, що ми маємо на меті оцінити функцію f(x). Наприклад, f(x) може бути часткою людей певного віку x, які підтримують заданого кандидата на виборах. Якщо x вимірюють із точністю до одного року, ми можемо побудувати окремий 95 %-вий довірчий інтервал для кожного віку. Кожен із цих довірчих інтервалів покриває відповідне істинне значення f(x) із рівнем довіри 0,95. Узяті разом, ці довірчі інтервали складають поточково 95 %-ву довірчу смугу (англ. 95% pointwise confidence band) для f(x).
Мовою математики, поточкова довірча смуга з імовірністю покриття 1 − α задовольняє наступну умову окремо для кожного значення x:
де є точковою оцінкою f(x).
Імовірністю одночасного покриття (англ. simultaneous coverage probability) набору довірчих інтервалів є ймовірність того, що вони всі покривають свої відповідні істинні значення одночасно. В наведенім вище прикладі ймовірність одночасного покриття є ймовірністю того, що всі інтервали для x = 18, 19, … покривають свої істинні значення (виходячи з того, що 18 є наймолодшим віком, з якого особа може голосувати). Якщо кожен з інтервалів окремо має ймовірність покриття 0,95, то ймовірність одночасного покриття є загалом меншою за 0,95. Одночасно 95 %-ва довірча смуга (англ. 95% simultaneous confidence band) є набором довірчих інтервалів для всіх значень x в області визначення f(x), побудованим таким чином, щоби мати ймовірність одночасного покриття 0,95.
Мовою математики, одночасна довірча смуга з імовірністю покриття 1 − α задовольняє наступну умову:
Майже в усіх випадках одночасна довірча смуга буде ширшою за поточкову довірчу смугу з такою ж імовірністю покриття. У визначенні поточкової довірчої смуги цей квантор загальності пересувається назовні функції ймовірності.
Довірчі смуги зазвичай виникають в регресійнім аналізі.[3] У випадку простої регресії, що включає єдину незалежну змінну, результати може бути подано у вигляді графіку, що показує оцінену лінію регресії разом із або поточковою, або одночасною довірчою смугою. Широко вживаними методами побудови одночасних довірчих смуг у регресії є методи Бонферроні[en] та Шеффе[en], докладніше див. процедури контролю групової ймовірності помилки першого роду[en].
Детальніші відомості з цієї теми ви можете знайти в статті Непараметричний довірчий інтервал на основі ФРІ[en].
Довірчі смуги можливо будувати навколо оцінок емпіричної функції розподілу. Проста теорія дозволяє будувати поточкові довірчі інтервали, але можливо також будувати й одночасну довірчу смугу для функції розподілу ймовірності як цілого, обертаючи критерій Колмогорова — Смирнова[en], або використовуючи непараметричні правдоподібнісні методи.[4]
Довірчі смуги виникають, коли статистичний аналіз зосереджується на оцінюванні функції.
Було також розроблено довірчі смуги для оцінок функцій густини, функцій спектральної густини,[5] функцій квантилів[en], згладжувань розсіювань[en], функцій виживаності[en] та характеристичних функцій.[джерело?]
Цей розділ потребує додаткових посилань на джерела для поліпшення його перевірності. (Березень 2021) |
Прогнозні смуги пов'язано з прогнозними інтервалами[en][6] так само, як довірчі смуги пов'язано з довірчими інтервалами. Прогнозні смуги зазвичай виникають у регресійнім аналізі. Метою прогнозної смуги є покрити з приписаною ймовірністю значення одного або більше майбутніх спостережень з тієї ж генеральної сукупності, з якої було вибрано задані дані. Як і прогнозні інтервали є ширшими за довірчі інтервали, так і прогнозні смуги будуть ширшими за довірчі смуги.
Мовою математики, прогнозна смуга з імовірністю покриття 1 − α задовольняє наступну умову для кожного значення x:
де y* є спостереженням, узятим із процесу породжування даних у заданій точці x, що не залежить від даних, використаних для побудови точкової оцінки та довірчого[прояснити: ком.] інтервалу w(x). Це — поточковий прогнозний інтервал.[прояснити: ком.] Можливо було би побудувати й одночасний інтервал[прояснити: ком.] для скінченного числа незалежних спостережень, застосовуючи, наприклад, метод Бонферроні для розширювання інтервалу[прояснити: ком.] на відповідну величину.
- ↑ Загородна, Н.; Фриз, М. (2011). Оцінка точності методу короткотермінового прогнозу добового газоспоживання в опалювальний період (PDF). Тернопільський національний технічний університет імені Івана Пулюя. Архів оригіналу (PDF) за 14 травня 2018. Процитовано 8 березня 2021.
- ↑ p.65 in W. Härdle, M. Müller, S. Sperlich, A. Werwatz (2004), Nonparametric and Semiparametric Models, Springer, ISBN 3540207228 Archived copy. Архів оригіналу за 12 квітня 2013. Процитовано 6 лютого 2013.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання),[1] (англ.) - ↑ Liu, W; Lin S.; Piegorsch W.W. (2008). Construction of Exact Simultaneous Confidence Bands for a Simple Linear Regression Model. International Statistical Review. 1: 39—57. doi:10.1111/j.1751-5823.2007.00027.x. (англ.)
- ↑ Owen, A. B. (1995). Nonparametric likelihood confidence bands for a distribution function. Journal of the American Statistical Association. American Statistical Association. 90 (430): 516—521. doi:10.2307/2291062. JSTOR 2291062. (англ.)
- ↑ Neumann, M.H.; Paparoditis, E. (2008). Simultaneous confidence bands in spectral density estimation. Biometrika. 95 (2): 381. CiteSeerX 10.1.1.569.3978. doi:10.1093/biomet/asn005. (англ.)
- ↑ Михайлов, В. С.; Полтавець, Л. Л. (2014). Підходи до статистичного прогнозування споживання енергетичних ресурсів. Статистика України. НДІ статистичних досліджень (1).