Біноміальний розподіл

Біноміальний розподіл
Біноміальний розподіл
	Функція ймовірностей
	Функція розподілу ймовірностей Кольори збігаються з попереднім малюнком
Параметри	кількість випробувань (ціле); ймовірність успіху (дійсне)
Носій функції
Розподіл імовірностей
Функція розподілу ймовірностей (cdf)
Середнє
Медіана	одне із
Мода
Дисперсія
Коефіцієнт асиметрії
Коефіцієнт ексцесу
Ентропія
Твірна функція моментів (mgf)
Характеристична функція
Інформація за Фішером	; (для незмінного )

Дискретна випадкова величина ξ називається такою, що має біноміальний розподіл, якщо ймовірність набуття нею конкретних значень має вигляд: $P(\xi =k)=C_{n}^{k}p^{k}q^{n-k},k=0,1,...n$ , де $p,n$ — параметри, що визначають розподіл, $p\in [0,1],q=1-p,n\in \mathbb {N}$ .

Позначається ${\mathcal {L}}(\xi )=Bi(n,p)$ .

Біноміальний розподіл є дискретним розподілом імовірностей із параметрами n і p для кількості успішних результатів, що мають двійкове значення у послідовності із n незалежних експериментів, для кожного з яких ставиться питання "так або ні". Імовірність виникнення успішного результату для кожного випробування задається параметром p, а імовірність виникнення не успішного результату відповідно дорівнюватиме q = 1 − p.

Єдиний успішний чи не успішний експеримент також називають випробуванням Бернуллі або експериментом Бернуллі, а послідовність результатів таких експериментів називаються процесом Бернуллі^[en]; для однократного випробування, тобто, при n = 1, біноміальний розподіл є розподілом Бернуллі. Біноміальний розподіл є основою загальновживаної біноміальної перевірки^[en] статистичної значущості.

Біноміальний розподіл часто використовують для моделювання кількості успішних експериментів у вибірці розміром в n, де експерименти виконуються із поповненням із сукупності розміром N. Якщо відбір вибірки відбуватиметься без поповнення, тоді такі експерименти не будуть незалежними і їх результатний розподіл буде гіпергеометричним, а не біноміальним. Однак, для випадку, коли N набагато більше за n, біноміальний розподіл використовують, оскільки він залишається добрим наближенням.

Пояснення

В теорії ймовірностей та математичній статистиці, біноміальний розподіл є дискретним ймовірнісним розподілом, що характеризує кількість успіхів в послідовності експериментів, значення яких змінюється за принципом так/ні, кожен з яких набуває успіху з ймовірністю p. Такі так/ні експерименти також називаються експериментами Бернуллі, або схемою Бернуллі, зокрема, якщо n=1 (кількість випробувань), то отримаємо Розподіл Бернуллі.

Означення

Функція імовірностей

У загальному випадку, якщо випадкова величина X відповідає біноміальному розподілу із параметрами n ∈ ℕ і p ∈ [0,1], записують X ~ B(n, p). Імовірність випадання точно k успішних випадків при n випробуваннях задається наступною функцією маси імовірності:

f(k,n,p)=\Pr(k;n,p)=\Pr(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}

для k = 0, 1, 2, ..., n, де

{\binom {n}{k}}={\frac {n!}{k!(n-k)!}}

це біноміальний коефіцієнт, названий так само як і сам розподіл. Цю формулу можна розуміти таким чином. k успішних випадків виникають із імовірністю p^k і n − k не успішних результатів випадають із імовірністю (1 − p)^n − k. Однак, k успішних результатів можуть виникнути в будь-який момент серед даних n випробувань, тому існує ${\binom {n}{k}}$ різних способів розподілення k успішних випадків у послідовності з n спроб.

При створенні довідникових таблиць для біноміального розподілу, як правило таблицю заповнюють значеннями до n/2. Це тому що для k > n/2, можна розрахувати як імовірність для її доповнення, таким чином

f(k,n,p)=f(n-k,n,1-p).

Якщо розглядати вираз f(k, n, p) як функцію від k, повинно існувати таке значення k, яке максимізує її. Це значення k можна знайти, якщо розрахувати:

{\frac {f(k+1,n,p)}{f(k,n,p)}}={\frac {(n-k)p}{(k+1)(1-p)}}

і прирівняти до 1. Завжди існуватиме ціле число M яке задовольняє умові

(n+1)p-1\leq M<(n+1)p.

f(k, n, p) є монотонно зростаючою при k < M і монотонно спадною для k > M, за винятком випадку де (n + 1)p є цілим. В даному випадку, існує два значення в яких f є максимальною: (n + 1)p і (n + 1)p − 1. M є найбільш імовірним результатом із усіх випробувань Бернуллі і називається модою.

Функція розподілу

Кумулятивна функція розподілу можна задати таким чином:

F(k;n,p)=\Pr(X\leq k)=\sum _{i=0}^{\lfloor k\rfloor }{n \choose i}p^{i}(1-p)^{n-i}

де $\lfloor k\rfloor \,$ — найбільше ціле число, яке менше або дорівнює k.

Її також можна задати за допомогою регуляризованої неповної бета-функції, таким чином:^[2]

{\begin{aligned}F(k;n,p)&=\Pr(X\leq k)\\&=I_{1-p}(n-k,k+1)\\&=(n-k){n \choose k}\int _{0}^{1-p}t^{n-k-1}(1-t)^{k}\,dt.\end{aligned}}

Числові характеристики

Зважаючи на співвідношення між біноміальним розподілом і розподілом Бернуллі, наведені нижче, а також на властивості математичного сподівання і дисперсії, можна отримати числові характеристики для біноміального розподілу без громіздких обчислень.

Математичне сподівання

Якщо X ~ B(n, p), така що, X є біноміально-розподіленою випадковою величиною для якої, n - загальна кількість експериментів, а p це імовірність що кожен експеримент призведе до успішного результату, тоді математичне сподівання для X дорівнюватиме:^[3]

\operatorname {E} [X]=np.

Наприклад, якщо n = 100, а p = 1/4, тоді середньою кількістю успішних випробувань буде 25.

Доведення: Розрахуємо середнє, μ, прямим способом виходячи із його визначення

\mu =\sum _{i=0}^{n}x_{i}p_{i},

і з теореми про біном Ньютона:

{\begin{aligned}\mu &=\sum _{k=0}^{n}k{\binom {n}{k}}p^{k}(1-p)^{n-k}\\&=np\sum _{k=0}^{n}k{\frac {(n-1)!}{(n-k)!k!}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{k=1}^{n}{\frac {(n-1)!}{((n-1)-(k-1))!(k-1)!}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{k=1}^{n}{\binom {n-1}{k-1}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{\ell =0}^{n-1}{\binom {n-1}{\ell }}p^{\ell }(1-p)^{(n-1)-\ell }&&{\text{із }}\ell :=k-1\\&=np\sum _{\ell =0}^{m}{\binom {m}{\ell }}p^{\ell }(1-p)^{m-\ell }&&{\text{із }}m:=n-1\\&=np(p+(1-p))^{m}\\&=np\end{aligned}}

Середнє також можна вивести із рівняння $X=X_{1}+\cdots +X_{n}$ де всі $X_{i}$ є випадковими величинами із розподілом Бернуллі із $E[X_{i}]=p$ ( $X_{i}=1$ якщо i-ий експеримент є успішним і $X_{i}=0$ навпаки). Отримаємо: $E[X]=E[X_{1}+\cdots +X_{n}]=E[X_{1}]+\cdots +E[X_{n}]=\underbrace {p+\cdots +p} _{n{\text{ times}}}=np$

Дисперсія

дисперсія біноміально-розподіленої випадкової величини:

\operatorname {D} (X)=np(1-p).

Доведення: Нехай $X=X_{1}+\cdots +X_{n}$ де всі $X_{i}$ є незалежними випадковими величинами із розподілом Бернуллі. Оскільки $\operatorname {D} (X_{i})=p(1-p)$ , отримаємо:

\operatorname {D} (X)=\operatorname {D} (X_{1}+\cdots +X_{n})=\operatorname {D} (X_{1})+\cdots +\operatorname {D} (X_{n})=n\operatorname {D} (X_{1})=np(1-p).

Мода

Як правило мода біноміального розподілу B(n, p) дорівнює $\lfloor (n+1)p\rfloor$ , де $\lfloor \cdot \rfloor$ позначає функцію округлення до найбільшого цілого числа, яке менше або дорівнює (тобто найближчого цілого числа, яке менше або дорівнює заданому числу. Однак, коли (n + 1)p є цілим, а p не є не 0 ні 1, тоді розподіл має дві моди: (n + 1)p і (n + 1)p − 1. Коли p дорівнює 0 або 1, тоді мода дорівнюватиме 0 і n відповідно. Ці випадки можна узагальнити таким чином:

{\text{Мода}}={\begin{cases}\lfloor (n+1)\,p\rfloor &{\text{, якщо }}(n+1)p{\text{ дорівнює 0 або не є цілим}},\\(n+1)\,p\ {\text{ і }}\ (n+1)\,p-1&{\text{, якщо }}(n+1)p\in \{1,\dots ,n\},\\n&{\text{, якщо }}(n+1)p=n+1.\end{cases}}

Доведення: Нехай

f(k)={\binom {n}{k}}p^{k}q^{n-k}.

Для $p=0$ лише $f(0)$ матиме не нульове значення $f(0)=1$ . Для $p=1$ маємо, що $f(n)=1$ і $f(k)=0$ для $k\neq n$ . Це доводить, що мода дорівнює 0 для $p=0$ і $n$ для $p=1$ .

Нехай $0<p<1$ . Знайдемо, що

{\frac {f(k+1)}{f(k)}}={\frac {(n-k)p}{(k+1)(1-p)}}

.

З цього випливає

{\begin{aligned}k>(n+1)p-1\Rightarrow f(k+1)<f(k)\\k=(n+1)p-1\Rightarrow f(k+1)=f(k)\\k<(n+1)p-1\Rightarrow f(k+1)>f(k)\end{aligned}}

Тож коли $(n+1)p-1$ є цілим, тоді $(n+1)p-1$ і $(n+1)p$ є модою. У випадку, коли $(n+1)p-1\notin \mathbb {Z}$ , тоді модою буде лише $\lfloor (n+1)p-1\rfloor +1=\lfloor (n+1)p\rfloor$ .^[4]

Медіана

Загалом, не існує єдиної формули для знаходження медіани біноміального розподілу, крім того вона може бути не унікальною. Однак існує декілька результатів для особливих випадків:

Якщо np ціле число, тоді середнє, медіана і мода збігаються між собою і дорівнюють np.^[5]^[6]
Будь-яка медіана m обов'язково знаходиться в середині інтервалу ⌊np⌋ ≤ m ≤ ⌈np⌉.^[7]
Медіана m не може знаходитися далеко від середнього: |m − np| ≤ min{ ln 2, max{p, 1 − p} }.^[8]
Медіана буде єдиною і дорівнюватиме m = округлене(np) якщо |m − np| ≤ min{p, 1 − p} (крім випадку, коли p = 1/2 та n є непарними).^[7]
Якщо p = 1/2 та n непарні, будь-яке число m у інтервалі 1/2(n − 1) ≤ m ≤ 1/2(n + 1) є медіаною біноміального розподілу. Якщо p = 1/2 і n парні, тоді m = n/2 є єдиною медіаною.

Коваріація між двома біноміальними розподілами

Якщо одночасно спостерігалися дві біноміально розподілені випадкові величини X і Y, може бути корисним визначити їх коваріацію. Коваріація це

\operatorname {Cov} (X,Y)=\operatorname {E} (XY)-\mu _{X}\mu _{Y}.

У випадку коли n = 1 (у випадку із схемою випробувань Бернуллі) XY не нульове лише коли обидві X і Y є одиницею, а μ_X і μ_Y дорівнюють двом імовірностям. Якщо визначити p_B як імовірність виникнення обох подій одночасно, отримаємо

\operatorname {Cov} (X,Y)=p_{B}-p_{X}p_{Y},

і для n незалежних попарних випробувань

\operatorname {Cov} (X,Y)_{n}=n(p_{B}-p_{X}p_{Y}).

Якщо X і Y є однією і тією ж випадковою величиною, цей вираз спрощується до виразу визначення дисперсії, який наведено вище в цій статті.

Зв'язок з іншими розподілами

Нехай незалежні випадкові величини $\xi _{1},\xi _{2},...,\xi _{n}$ мають розподіл Бернуллі з параметром p, тобто ${\mathcal {L}}(\xi _{i})=B(p),i={\overline {1,n}}$ , тоді випадкова величина $\xi =\sum _{i=1}^{n}\xi _{i}$ має біноміальний розподіл з параметрами p, n, тобто ${\mathcal {L}}(\xi )=Bi(n,p)$ .

Сума біноміально-розподілених величин

Якщо X ~ B(n, p) і Y ~ B(m, p) є незалежними випадковими величинами із біноміальним розподілом із однаковою ймовірністю p, тоді X + Y також буде біноміально-розподіленою величиною, і її розподілом буде Z=X+Y ~ B(n+m, p):

{\begin{aligned}\operatorname {P} (Z=k)&=\sum _{i=0}^{k}\left[{\binom {n}{i}}p^{i}(1-p)^{n-i}\right]\left[{\binom {m}{k-i}}p^{k-i}(1-p)^{m-k+i}\right]\\&={\binom {n+m}{k}}p^{k}(1-p)^{n+m-k}\end{aligned}}

Однак, якщо X і Y не мають однакової імовірності p, тоді дисперсія суми величин буде меншою за дисперсію випадкової величини із біноміальним розподілом вигляду $B(n+m,{\bar {p}}).\,$

Відношення двох біноміальних розподілів

Нехай p₁ і p₂ це імовірності успішного випробування у біноміальних розподілах B(X,n) і B(Y,m) відповідно. Нехай T = (X/n)/(Y/m).

Тоді log(T) є наближено нормально розподіленою величиною із середнім log(p₁/p₂) і дисперсією ((1/p₁) - 1)/n + ((1/p₂) - 1)/m.^[9]

Умовні біноміальні величини

Якщо є X ~ B(n, p) і, при X існує деяка умовна величина Y ~ B(X, q), тоді Y є простою біноміальною величиною із розподілом Y ~ B(n, pq).

Наприклад, уявімо, що хтось кидає n м'ячів у кошик U_X і виймає ті м'ячі, які успішно потрапили у кошик та кладе їх у інший кошик U_Y. Якщо p означає імовірність влучити в U_X тоді X ~ B(n, p) це кількість м'ячів, які влучили у U_X. Якщо q це імовірність потрапити у U_Y тоді кількістю м'ячів, які потраплять у U_Y буде Y ~ B(X, q) і таким чином Y ~ B(n, pq).

[Доведення]

Оскільки $X\sim B(n,p)$ і $Y\sim B(X,q)$ , за формулою повної імовірності,

{\begin{aligned}\Pr[Y=m]&=\sum _{k=m}^{n}\Pr[Y=m\mid X=k]\Pr[X=k]\\[2pt]&=\sum _{k=m}^{n}{\binom {n}{k}}{\binom {k}{m}}p^{k}q^{m}(1-p)^{n-k}(1-q)^{k-m}\\\end{aligned}}

Оскільки ${\tbinom {n}{k}}{\tbinom {k}{m}}={\tbinom {n}{m}}{\tbinom {n-m}{k-m}},$ , то вищенаведене рівняння можна записати в такій формі

\Pr[Y=m]=\sum _{k=m}^{n}{\binom {n}{m}}{\binom {n-m}{k-m}}p^{k}q^{m}(1-p)^{n-k}(1-q)^{k-m}

Розбивши на множники $p^{k}=p^{m}p^{k-m}$ і виділивши всі множники, які не залежать від $k$ суму можна звести до такого:

{\begin{aligned}\Pr[Y=m]&={\binom {n}{m}}p^{m}q^{m}\left(\sum _{k=m}^{n}{\binom {n-m}{k-m}}p^{k-m}(1-p)^{n-k}(1-q)^{k-m}\right)\\[2pt]&={\binom {n}{m}}(pq)^{m}\left(\sum _{k=m}^{n}{\binom {n-m}{k-m}}\left(p(1-q)\right)^{k-m}(1-p)^{n-k}\right)\end{aligned}}

Замінивши $i=k-m$ у вищенаведеному виразі, отримаємо

\Pr[Y=m]={\binom {n}{m}}(pq)^{m}\left(\sum _{i=0}^{n-m}{\binom {n-m}{i}}(p-pq)^{i}(1-p)^{n-m-i}\right)

Помітимо, що вищенаведена сума (у дужках) дорівнює $(p-pq+1-p)^{n-m}$ відповідно до теореми про біном Ньютона. Підставивши це у вираз, зрештою отримаємо

{\begin{aligned}\Pr[Y=m]&={\binom {n}{m}}(pq)^{m}(p-pq+1-p)^{n-m}\\[4pt]&={\binom {n}{m}}(pq)^{m}(1-pq)^{n-m}\end{aligned}}

і таким чином $Y\sim B(n,pq)$ , що і треба було довести.

Розподіл Бернуллі

Розподіл Бернуллі є особливим випадком біноміального розподілу, де n = 1. Символічно, X ~ B(1, p) має однакове середнє як і X ~ B(p). І навпаки, будь-який біноміальний розподіл, B(n, p), є розподілом суми із n випробувань Бернуллі, B(p), кожне з яких має однакову імовірність p.^[10]

Нормальне наближення

Якщо n є досить великим, тоді зсув біноміального розподілу не буде дуже великим. В такому випадку нормальний розподіл може бути виправданим наближенням для B(n, p).

{\mathcal {N}}(np,\,np(1-p)),

а це базове наближення можна покращити використавши вдалу поправку для неперервності^[en]. Базове наближення значно стає кращим при збільшенні n (принаймні більше ніж 20) і буде кращим, коли p не є близькою до 0 або 1.^[11] Можуть використовуватися різні емпіричні правила, які визначають чи є n достатньо великою, а значення p є досить далеким від крайніх значень нуля або одиниці:

Одне із правил^[11] говорить, що для n > 5 нормальне наближення буде адекватним, якщо абсолютне значення зсуву є строго меншим ніж 1/3; тобто, якщо

{\frac {|1-2p|}{\sqrt {np(1-p)}}}={\frac {1}{\sqrt {n}}}\left|{\sqrt {\frac {1-p}{p}}}-{\sqrt {\frac {p}{1-p}}}\,\right|<{\frac {1}{3}}.

Більш посилене правило говорить, що нормальна апроксимація буде прийнятною лише якщо всі можливі значення знаходяться в межах 3 стандартних відхилень від середнього значення; тобто, лише якщо

\mu \pm 3\sigma =np\pm 3{\sqrt {np(1-p)}}\in (0,n).

Це правило про 3-стандартні відхилення буде еквівалентне наступним наведеним умовам, які також зумовлюють виконання і першого правила, описаного вище.

n>9\,{\frac {1-p}{p}}\quad {\hbox{і}}\quad n>9\,{\frac {p}{1-p}}.

[Доведення]

Правило $np\pm 3{\sqrt {np(1-p)}}\in (0,n)$ є повністю еквівалентним вимозі, що

np-3{\sqrt {np(1-p)}}>0\quad {\hbox{і}}\quad np+3{\sqrt {np(1-p)}}<n.

Якщо переставити множники отримаємо:

np>3{\sqrt {np(1-p)}}\quad {\hbox{і}}\quad n(1-p)>3{\sqrt {np(1-p)}}.

Оскільки $0<p<1$ , ми можемо піднести вирази у квадрат і поділити на відповідні множники $np^{2}$ та $n(1-p)^{2}$ , і отримаємо бажані умови:

n>9\,{\frac {1-p}{p}}\quad {\hbox{і}}\quad n>9\,{\frac {p}{1-p}}.

Зауважимо, що ці умови автоматично означають, що $n>9$ . З іншого боку, знову застосувавши квадратний корінь до нерівностей і поділивши на 3,

{\frac {\sqrt {n}}{3}}>{\sqrt {\frac {1-p}{p}}}>0\quad {\hbox{і}}\quad {\frac {\sqrt {n}}{3}}>{\sqrt {\frac {p}{1-p}}}>0.

Віднявши другий набір нерівностей із першого, отримаємо:

{\frac {\sqrt {n}}{3}}>{\sqrt {\frac {1-p}{p}}}-{\sqrt {\frac {p}{1-p}}}>-{\frac {\sqrt {n}}{3}};

тож, необхідне перше правило буде виконуватися,

\left|{\sqrt {\frac {1-p}{p}}}-{\sqrt {\frac {p}{1-p}}}\,\right|<{\frac {\sqrt {n}}{3}}.

Іншим загальновживаним правилом є те, що обидва значення $np$ і $n(1-p)$ мають бути більшими або дорівнювати 5. Однак, конкретне значення цього числа зустрічається різним в різних джерелах, і залежить від того наскільки хорошим має бути наближення. Зокрема, якщо використати значення 9 замість наведеного 5, правило призводить до результатів, що отримані в попередній частині розділу.

[Доведення]

Припустимо, що обидва значення $np$ і $n(1-p)$ є більшими за число 9. Оскільки $0<p<1$ , ми можемо стверджувати, що

np\geq 9>9(1-p)\quad {\hbox{і}}\quad n(1-p)\geq 9>9p.

Тепер необхідно лише поділити це на відповідні множники $p$ і $1-p$ , аби вивести альтернативну форму правила про 3-стандартні відхилення:

n>9\,{\frac {1-p}{p}}\quad {\hbox{і}}\quad n>9\,{\frac {p}{1-p}}.

Наведемо приклад застосування поправку неперервності^[en]. Припустимо, що необхідно розрахувати Pr(X ≤ 8) для біноміально-розподіленої випадкової величини X. Якщо Y має розподіл заданий у вигляді нормального наближення, тоді Pr(X ≤ 8) можна наблизити за допомогою Pr(Y ≤ 8.5). Додавання 0.5 є поправкою неперервності; нормальне наближення без поправки дає менш точний результат.

Це наближення відоме як Локальна теорема Муавра — Лапласа, вона дозволяє значно зекономити час, якщо розрахунки виконуються вручну (точний розрахунок при великих n є дуже обтяжливим); історично, це було першим застосуванням нормального розподілу, яке було представлено у книзі Абрахама де Муавра Доктрина шансів^[en] в 1738. Сьогодні, її можна розглядати як наслідок із центральної граничної теореми оскільки B(n, p) є сумою із n незалежних, однаково розподілених випадкових величин із розподілом Бернуллі із параметром p. Цей факт є основою для перевірки статистичних гіпотез, "пропорційного z-тесту", для значення p використовуючи розрахунок x/n, що є пропорцією вибірки і оцінкою для p у загальних статистичних перевірках.^[12]

Наприклад, припустимо, що хтось зробив вибірку по n людям із усієї популяції людей і запитав їх чи погоджуються вони з певним твердженням. Частка людей, яка погодиться з висловлюванням очевидно буде залежати від вибірки. Якщо групи із n людей були обрані повторно і дійсно випадковим чином, ця пропорція буде відповідати наближеному нормальному розподілу із середнім, що дорівнює істинному співвідношенню p того що люди погоджуються із твердженням в цій сукупності і матиме стандартне відхилення $\sigma ={\sqrt {\frac {p(1-p)}{n}}}$

Наближення Пуассона

Біноміальний розподіл наближається до Розподілу Пуассона якщо кількість спроб зростає до нескінченності в той час як добуток np залишається незмінним або p прямує до нуля. Тому, розподіл Пуассона із параметром λ = np може використовуватися для наближення біноміального розподілу B(n, p) якщо n має досить велике значення і p значно мала. Відповідно до двох правил, це наближення є добрим, якщо n ≥ 20 і p ≤ 0.05, або якщо n ≥ 100 і np ≤ 10.^[13]^[14]

Граничні розподіли

Теорема Пуассона: З тим як n наближається до ∞ і p наближається до 0 при сталому добутку np, Біноміальний розподіл B(n, p) наближається до розподілу Пуассона із математичним сподіванням λ = np.^[13]
Локальна теорема Муавра — Лапласа: З тим як n наближається до ∞ поки p залишається сталим, розподіл величини

{\frac {X-np}{\sqrt {np(1-p)}}}

наближається до нормального розподілу із математичним сподіванням 0 і дисперсією 1. Цей результат в не суворій формі іноді формулюють як те, що розподіл величини X буде асимптотично нормальним^[en] із математичним сподіванням np і дисперсією np(1 − p). Цей результат є особливим випадком центральної граничної теореми.

Бета-розподіл

Бета-розподіли дозволяють мати сімейство апріорних розподілів імовірностей для біноміальних розподілів при Баєсовому виведенні:^[15]

P(p;\alpha ,\beta )={\frac {p^{\alpha -1}(1-p)^{\beta -1}}{\mathrm {B} (\alpha ,\beta )}}

.

Див. також

Джерела

Гнєденко Б. В. Курс теорії ймовірностей. — Київ : ВПЦ Київський університет, 2010. — 464 с.
Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)

Примітки

↑ Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statist. Probab. Lett. 23 21–25.
↑ Wadsworth, G. P. (1960). Introduction to Probability and Random Variables. New York: McGraw-Hill. с. 52. Архів оригіналу за 4 травня 2019. Процитовано 7 березня 2019.
↑ See Proof Wiki [Архівовано 4 травня 2019 у Wayback Machine.]
↑ See also the answer to the question "finding mode in Binomial distribution"
↑ Neumann, P. (1966). Über den Median der Binomial- and Poissonverteilung. Wissenschaftliche Zeitschrift der Technischen Universität Dresden (German) . 19: 29—33.
↑ Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", The Mathematical Gazette 94, 331-332.
↑ ^а ^б Kaas, R.; Buhrman, J.M. (1980). Mean, Median and Mode in Binomial Distributions. Statistica Neerlandica. 34 (1): 13—18. doi:10.1111/j.1467-9574.1980.tb00681.x.
↑ Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statistics & Probability Letters. 23: 21—25. doi:10.1016/0167-7152(94)00090-U.
↑ Katz D. et al.(1978) Obtaining confidence intervals for the risk ratio in cohort studies. Biometrics 34:469–474
↑ Taboga, Marco. Lectures on Probability Theory and Mathematical Statistics. statlect.com. Архів оригіналу за 22 грудня 2017. Процитовано 18 грудня 2017.
↑ ^а ^б Box, Hunter and Hunter (1978). Statistics for experimenters. Wiley. с. 130.
↑ NIST/SEMATECH, "7.2.4. Does the proportion of defectives meet requirements?" [Архівовано 30 листопада 2018 у Wayback Machine.] e-Handbook of Statistical Methods.
↑ ^а ^б NIST/SEMATECH, "6.3.3.1. Counts Control Charts" [Архівовано 11 березня 2008 у Wayback Machine.], e-Handbook of Statistical Methods.
↑ Що стосується точності наближення Пуассона, див Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746 ch. 4, and references therein.
↑ MacKay, David (2003). Information Theory, Inference and Learning Algorithms. Cambridge University Press; First Edition. ISBN 978-0521642989.

[1] Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statist. Probab. Lett. 23 21–25.

[2] Wadsworth, G. P. (1960). Introduction to Probability and Random Variables. New York: McGraw-Hill. с. 52. Архів оригіналу за 4 травня 2019. Процитовано 7 березня 2019.

[3] See Proof Wiki [Архівовано 4 травня 2019 у Wayback Machine.]

[4] See also the answer to the question "finding mode in Binomial distribution"

[5] Neumann, P. (1966). Über den Median der Binomial- and Poissonverteilung. Wissenschaftliche Zeitschrift der Technischen Universität Dresden (German) . 19: 29—33.

[6] Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", The Mathematical Gazette 94, 331-332.

[KaasBuhrman-7] а ^б Kaas, R.; Buhrman, J.M. (1980). Mean, Median and Mode in Binomial Distributions. Statistica Neerlandica. 34 (1): 13—18. doi:10.1111/j.1467-9574.1980.tb00681.x.

[Hamza-8] Hamza, K. (1995). The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statistics & Probability Letters. 23: 21—25. doi:10.1016/0167-7152(94)00090-U.

[Katz1978-9] Katz D. et al.(1978) Obtaining confidence intervals for the risk ratio in cohort studies. Biometrics 34:469–474

[10] Taboga, Marco. Lectures on Probability Theory and Mathematical Statistics. statlect.com. Архів оригіналу за 22 грудня 2017. Процитовано 18 грудня 2017.

[bhh-11] а ^б Box, Hunter and Hunter (1978). Statistics for experimenters. Wiley. с. 130.

[12] NIST/SEMATECH, "7.2.4. Does the proportion of defectives meet requirements?" [Архівовано 30 листопада 2018 у Wayback Machine.] e-Handbook of Statistical Methods.

[nist-13] а ^б NIST/SEMATECH, "6.3.3.1. Counts Control Charts" [Архівовано 11 березня 2008 у Wayback Machine.], e-Handbook of Statistical Methods.

[14] Що стосується точності наближення Пуассона, див Novak S.Y. (2011) Extreme value methods with applications to finance. London: CRC/ Chapman & Hall/Taylor & Francis. ISBN 9781-43983-5746 ch. 4, and references therein.

[MacKay-15] MacKay, David (2003). Information Theory, Inference and Learning Algorithms. Cambridge University Press; First Edition. ISBN 978-0521642989.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

п о р Розподіли ймовірності
Перелік розподілів імовірності
Дискретні одновимірні зі скінченним носієм	Бенфорда Бернуллі бета-біноміальний біноміальний біноміальний Пуассона^[en] гіпергеометричний дискретний рівномірний категорійний Радемахера^[en] Ципфа Ципфа — Мандельброта^[en]
Дискретні одновимірні з нескінченним носієм	Бореля^[en] бета-негативний біноміальний від'ємний біноміальний геометричний Ґауса — Кузьмина Делапорта^[en] Дзета-розподіл дискретний фазовий^[en] Конвея — Максвелла — Пуассона^[en] логарифмічний параболічний фрактальний^[en] Пуассона розширений від'ємний біноміальний^[en] Скелама^[en] Юла — Саймона^[en]
Неперервні одновимірні з носієм на обмеженому проміжку	ARGUS^[en] арксинусний^[en] Бейтса бета Болдінґа — Ніколса Ірвіна — Гола^[en] квантилі^[en] Кумарасвамі^[en] логістично-нормальний нецентральний бета^[en] півколо Вігнера^[en] піднятий косинусний^[en] прямокутний бета^[en] рівномірний трикутний^[en] У-квадратичний^[en]
Неперервні одновимірні з носієм на напів-нескінченному проміжку	Беніні Бенктандера I типу^[en] Бенктандера II типу^[en] Берра^[en] бета-простий^[en] Вейбула гамма (обернений) ґамма/Ґомперца гіперекспоненційний^[en] гіперерлангів^[en] гіпоекспоненційний^[en] Готелінґа^[en] Ґомперца^[en] Ґумбеля II типу^[en] Дагума^[en] Девіса^[en] експоненційний експоненційно-логарифмічний^[en] Ерланга згорнений нормальний^[en] зсунений Ґомперца^[en] Колмогорова Леві логарифмічний Коші^[en] логарифмічно-лапласів^[en] логарифмічно-логістичний^[en] логарифмічно-нормальний Ломакса лямбда Уїлкса^[en] Максвелла — Больцмана Максвелла — Ютнера^[en] матрично-експоненційний^[en] Міттага-Лефлера^[en] Накаґамі напівлогістичний^[en] напівнормальний^[en] нецентрований хі-квадрат обернений нормальний^[en] обернений хі-квадрат^[en] масштабований обернений хі-квадрат^[en] Парето полівейбулів^[en] присічений нормальний^[en] Райса Рейлі релятивістський Брейта — Вігнера^[en] узагальнений обернений нормальний^[en] фазовий^[en] Фішера Флорі—Шульца Фреше хі хі-квадрат
Неперервні одновимірні з носієм на всій дійсній прямій	асиметричний нормальний^[en] геометричний стійкий^[en] гіперболічний секансний^[en] Гольцмарка^[en] Ґумбеля^[en] Ґумбеля I типу^[en] дисперсійний гамма^[en] експоненційний ступеневий^[en] z Фішера Скісний Коші Ландау^[en] Лапласа асиметричний Лапласа^[en] логістичний нецентральний t^[en] нормальний (Ґауса) нормально-обернений ґаусів^[en] стійкий S_U Джонсона^[en] t Стьюдента Трейсі — Відома^[en] узагальнений гіперболічний^[en] узагальнений нормальний^[en] Фойґта
Неперервні одновимірні з носієм змінного типу	зсунений логарифмічно-логістичний^[en] q-вейбулів^[en] q-гауссів q-експоненційний^[en] лямбда Тьюкі^[en] узагальнений екстремальних значень^[en] узагальнений Парето
Змішані неперервно-дискретні одновимірні	спрямлений ґаусів^[en]
Багатовимірні (спільні)	Дискретні від'ємний поліноміальний^[en] Еванса^[en] поліноміальний поліноміальний Діріхле^[en] Неперервні багатовимірний нормальний багатовимірний t^[en] багатовимірний стійкий^[en] Діріхле нормальний гамма^[en] нормально-обернений гамма^[en] узагальнений Діріхле^[en] Матричнозначні Вішарта^[en] матричний гамма^[en] матричний нормальний^[en] матричний t^[en] нормальний Вішарта^[en] нормально-обернений Вішарта^[en] обернений Вішарта^[en] обернений матричний гамма^[en]
Напрямкові	Одновимірні (кругові) напрямкові намотаний асиметричний Лапласа^[en] намотаний експоненційний^[en] намотаний Коші^[en] намотаний Леві^[en] намотаний нормальний^[en] круговий рівномірний^[en] рівномірний фон Мізаса^[en] Двовимірні (сферичні) Кента^[en] Двовимірні (тороїдні) двовимірний фон Мізаса^[en] Багатовимірні Бінгема^[en] фон Мізаса — Фішера^[en]
Вироджені та сингулярні^[en]	Вироджені Дельта-функція Дірака Сингулярні Кантора
Сімейства	експоненційні^[en] еліптичні намотані^[en] зсуву-масштабу^[en] кругові^[en] максимальної ентропії^[en] Пірсона^[en] природні експоненційні^[en] складені Пуассона^[en] сумішеві Твіді^[en]