Перейти до вмісту

Лоґіт-нормальний розподіл

Матеріал з Вікіпедії — вільної енциклопедії.
Лоґіт-нормальний
Plot of the Logitnormal PDF
Функція розподілу ймовірностей
Plot of the Logitnormal PDF
Параметриσ2 > 0 — квадрат параметра шкали (дійсне),
μR — параметр локації
Носій функціїx ∈ (0, 1)
Розподіл імовірностей
Функція розподілу ймовірностей (cdf)
Середнєнемає аналітичного вираження
Медіана
Моданемає аналітичного вираження
Дисперсіянемає аналітичного вираження
Твірна функція моментів (mgf)немає аналітичного вираження

У теорії ймовірностей лоґіт-нормальний розподіл — це розподіл ймовірностей випадкової величини, лоґіт якого має нормальний розподіл. Якщо Y — випадкова величина з нормальним розподілом, а t — стандартна логістична функція, то X=t (Y) має лоґіт-нормальний розподіл; так само, якщо X має лоґіт-нормальний розподіл, то має нормальний розподіл. Він також відомий як лоґістичний нормальний розподіл[1], який часто відноситься до поліноміальної лоґіт-версії (наприклад див. [2][3]).

Змінну можна змоделювати як лоґіт-нормальною випадковою величиною, якщо це пропорція, яка обмежена нулем і одиницею, і де значення нуль і одиниця ніколи не зустрічаються.

Характеристика

[ред. | ред. код]

Щільність ймовірності

[ред. | ред. код]

Функція щільності ймовірності (PDF) лоґіт-нормального розподілу для 0 < x < 1:

де μ і σ є середнім і стандартним відхиленням лоґіту змінної (за визначенням, лоґіт змінної є нормально розподіленим).

Щільність, отримана шляхом зміни знака μ, є симетричною, оскільки вона дорівнює f(1-x;- μ, σ), зсуваючи моду в інший бік 0,5 (середина інтервалу (0,1)).

Моменти

[ред. | ред. код]

Моменти лоґіт-нормального розподілу не мають аналітичного розв’язку. Моменти можна оцінити чисельним інтегруванням, однак числове інтегрування може бути непомірним, коли значення такі, що функція густини розбіжна до нескінченності в кінцевих точках нуль і один. Альтернативою є використання спостереження, що лоґіт-нормаль є перетворенням нормальної випадкової змінної. Це дозволяє нам наблизити -й момент через наступну квазіоцінку Монте-Карло

де стандартна логістична функція, і є оберненою кумулятивною функцією розподілу нормального розподілу із середнім і дисперсією .

Графік логітнормальної щільности для різних комбінацій μ (граней) і σ (кольорів)

Мода або моди

[ред. | ред. код]

Коли похідна густини дорівнює 0, то положення моди x задовольняє таке рівняння:

Для деяких значень параметрів існує два розвʼязки, тобто розподіл є бімодальним.

Багатовимірне узагальнення

[ред. | ред. код]

Логістичний нормальний розподіл є узагальненням лоґіт-нормального розподілу у D-вимірні вектори ймовірностей шляхом логістичного перетворення багатовимірного нормального розподілу[1][4][5].

Щільність

[ред. | ред. код]

Густина ймовірності:

де позначає вектор перших (D-1) компонентів і позначає симплекс D-вимірних векторів ймовірностей. Застосування адитивного логістичного перетворення для відображення багатовимірної нормальної випадкової змінної до симплексу дає:

Ґаусові функції густини та відповідні логістичні нормальні функції густини після логістичного перетворення.

Унікальне обернене відображення задається:

.

Це випадок вектора x, сума компонентів якого дорівнює одиниці. У випадку х із сигмоїдальними елементами, тобто коли

отримаємо

де логарифмування і ділення аргументів здійснюється поелементно. Це забезпечується тим, що матриця Якобі перетворення є діагональною з елементами .

Використання в статистичному аналізі

[ред. | ред. код]

Логістичний нормальний розподіл є більш гнучкою альтернативою розподілу Діріхле, оскільки він може фіксувати кореляції між компонентами векторів ймовірностей. Він також має потенціал для спрощення статистичного аналізу композиційних даних, дозволяючи відповідати на запитання про логарифмічні співвідношення компонентів векторів даних. Часто цікавлять в практичних задачах досліджують співвідношення, а не абсолютні значення компонентів.

Симплекс ймовірностей є обмеженим простором, що робить стандартні методи, які зазвичай застосовуються до векторів у менш значущими. Ейтчісон описав проблему несправжніх відʼємних кореляцій при застосуванні таких методів безпосередньо до симплексних векторів[4]. Однак відображення композиційних даних в шляхом зворотного адитивного логістичного перетворення дає дійснозначні дані в . До цього представлення даних можна застосувати стандартні методи. Цей підхід виправдовує використання лоґіт-нормального розподілу, який, отже, можна розглядати як «Ґаусівський симплекс».

Зв'язок з розподілом Діріхле

[ред. | ред. код]
Логіт-нормальне наближення розподілу Діріхле

Розподіл Діріхле та логіт-нормальний розподіл ніколи не є абсолютно рівними для будь-якого вибору параметрів. Однак Ейчісон описав метод апроксимації Діріхле з логістичною нормаллю, щоб їх розбіжність Кульбака–Лейблера (KL) була мінімімальна:

Мінімум набувається при:

Використовуючи властивості моментів розподілу Діріхле, розв’язок можна записати через дигамму і тригамма функції:

Це наближення особливо точне для великих . Фактично, можна показати, що для , маємо.

Див. також

[ред. | ред. код]
  • Бета-розподіл і розподіл Кумарасвамі, інші двопараметричні розподіли на обмеженому інтервалі з подібними формами

Примітки

[ред. | ред. код]
  1. а б Aitchison, J.; Shen, S. M. (1980). Logistic-normal distributions: Some properties and uses. Biometrika. 67 (2): 261. doi:10.2307/2335470. ISSN 0006-3444. JSTOR 2335470.
  2. Peter Hoff, 2003. Link
  3. Log-normal and logistic-normal terminology - AI and Social Science – Brendan O'Connor. brenocon.com. Процитовано 18 квітня 2018.
  4. а б J. Atchison. "The Statistical Analysis of Compositional Data." Monographs on Statistics and Applied Probability, Chapman and Hall, 1986. Book
  5. Hinde, John (2011). Logistic Normal Distribution. У Lovric, Miodrag (ред.). International Encyclopedia of Statistical Sciences. Springer. с. 754—755. doi:10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5.

Посилання

[ред. | ред. код]