Закон Ципфа

	Закон Ципфа
Названо на честь	Джордж Ципф
Досліджується в	теорія ймовірностей
Першовідкривач або винахідник	Джордж Ципф
Формула
Підтримується Вікіпроєктом	Вікіпедія:Проєкт:Математика
	Закон Ципфа у Вікісховищі

Зако́н Ци́пфа (Зіпфа) — лінгвостатистичний закон, згідно з яким відношення рангу слова в частотному словнику до частотності слова в мові становить постійну величину (константу).

Інакше кажучи, якщо всі слова мови (або просто достатньо довгого тексту) впорядкувати за спаданням частоти їхнього використання, то частота n-го слова в такому списку виявиться приблизно обернено пропорційною його порядковому номеру n (так званому рангу цього слова)^[2]. Наприклад, друге за вживаністю слово трапляється приблизно вдвічі рідше, ніж перше, третє — втричі рідше, ніж перше, і так далі.

Загальна характеристика

Американський дослідник Джордж Ципф дійшов висновку, що існує залежність між числом різних значень одного слова і його відносною частотою вживання. Кількість значення наближається до квадратного кореня від частоти слова: т = f , де т — число значень, а f — відносна частота. Інша закономірність, встановлена Ципфом, має таке формулювання: відношення рангу слова в частотному словнику до частотності слова в мові становить постійну величину (константу) rf = с, де r — ранг слова в частотному словнику, f — частота слова, с — постійна величина. Тісний зв'язок існує також між частотними характеристиками слова в пам'яті та в словнику.

Застосування

Закон Ципфа може бути застосований до будь-якого тексту, записаного природною або штучною мовою, коду (наприклад, ДНК) або сигналу, при цьому правила викладення інформації можуть лишатись невідомими. Як наслідок, закон дозволяє визначити наявність інформації в повідомленні навіть у випадках, коли саме повідомлення не може бути дешифроване.

В результаті статистичного аналізу Рукопису Войнича, написаного невідомою мовою, було доведено, що цей рукопис містить осмислену інформацію. Аналіз проводився з використанням методу, що лежить в основі закону Ципфа^[3].

Література

Кочерган М. П. Загальне мовознавство: підручник / Михайло Петрович Кочерган. — Київ: Академія, 2003. — С. 398.
Henri Guiter, Michail V. Arapov (Hrsg.): Studies on Zipf's Law (= Quantitative Linguistics. Bd. 16). Studienverlag Brockmeyer, Bochum 1982, ISBN 3-88339-244-8.

Примітки

↑ Крістал Д. The Cambridge Encyclopedia of Language — Видавництво Кембриджського університету, 1987. — С. 87. — ISBN 978-0-521-42443-1
d:Track:Q471550 d:Track:Q912887 d:Track:Q23306977
↑ Fagan, Stephen; Gençay, Ramazan (2010), An introduction to textual econometrics, у Ullah, Aman; Giles, David E. A. (ред.), Handbook of Empirical Economics and Finance, CRC Press, с. 133—153, ISBN 9781420070361. P. 139: «For example, in the Brown Corpus, consisting of over one million words, half of the word volume consists of repeated uses of only 135 words.»
↑ «Слишком много совпадений» [Архівовано 15 липня 2013 у Wayback Machine.](рос.)

Посилання

Портал «Математика» Портал «Мовознавство»

[<span_class="wikidata_cite_citetype_Q3331189"_data-entity-id="Q23306977"><i_class="wef_low_priority_links">[[:Девід_Крістал|Крістал&nbsp;Д.]]</i>_[[:d:Q23306977|The_Cambridge_Encyclopedia_of_Language]]<span_class="wef_low_priority_links">_—_[[:Cambridge_University_Press|Видавництво_Кембриджського_університету]],_1987._—_С.&nbsp;87._—_ISBN_978-0-521-42443-1</span></span><div_style="display:none">[[d:Track:Q471550]][[d:Track:Q912887]][[d:Track:Q23306977]]</div>-1] Крістал Д. The Cambridge Encyclopedia of Language — Видавництво Кембриджського університету, 1987. — С. 87. — ISBN 978-0-521-42443-1
d:Track:Q471550 d:Track:Q912887 d:Track:Q23306977

[2] Fagan, Stephen; Gençay, Ramazan (2010), An introduction to textual econometrics, у Ullah, Aman; Giles, David E. A. (ред.), Handbook of Empirical Economics and Finance, CRC Press, с. 133—153, ISBN 9781420070361. P. 139: «For example, in the Brown Corpus, consisting of over one million words, half of the word volume consists of repeated uses of only 135 words.»

[3] «Слишком много совпадений» [Архівовано 15 липня 2013 у Wayback Machine.](рос.)

[1]

[2]

[3]

Тематичні сайти	Wolfram Language · Quora
Словники та енциклопедії	Велика каталанська енциклопедія · Encyclopædia Britannica
Нормативний контроль	Freebase: /m/0bvkw · GND: 4190937-9

п о р Розподіли ймовірності
Перелік розподілів імовірності
Дискретні одновимірні зі скінченним носієм	Бенфорда Бернуллі бета-біноміальний біноміальний біноміальний Пуассона^[en] гіпергеометричний дискретний рівномірний категорійний Радемахера^[en] Ципфа Ципфа — Мандельброта^[en]
Дискретні одновимірні з нескінченним носієм	Бореля^[en] бета-негативний біноміальний від'ємний біноміальний геометричний Ґауса — Кузьмина Делапорта^[en] Дзета-розподіл дискретний фазовий^[en] Конвея — Максвелла — Пуассона^[en] логарифмічний параболічний фрактальний^[en] Пуассона розширений від'ємний біноміальний^[en] Скелама^[en] Юла — Саймона^[en]
Неперервні одновимірні з носієм на обмеженому проміжку	ARGUS^[en] арксинусний^[en] Бейтса бета Болдінґа — Ніколса Ірвіна — Гола^[en] квантилі^[en] Кумарасвамі^[en] логістично-нормальний нецентральний бета^[en] півколо Вігнера^[en] піднятий косинусний^[en] прямокутний бета^[en] рівномірний трикутний^[en] У-квадратичний^[en]
Неперервні одновимірні з носієм на напів-нескінченному проміжку	Беніні Бенктандера I типу^[en] Бенктандера II типу^[en] Берра^[en] бета-простий^[en] Вейбула гамма (обернений) ґамма/Ґомперца гіперекспоненційний^[en] гіперерлангів^[en] гіпоекспоненційний^[en] Готелінґа^[en] Ґомперца^[en] Ґумбеля II типу^[en] Дагума^[en] Девіса^[en] експоненційний експоненційно-логарифмічний^[en] Ерланга згорнений нормальний^[en] зсунений Ґомперца^[en] Колмогорова Леві логарифмічний Коші^[en] логарифмічно-лапласів^[en] логарифмічно-логістичний^[en] логарифмічно-нормальний Ломакса лямбда Уїлкса^[en] Максвелла — Больцмана Максвелла — Ютнера^[en] матрично-експоненційний^[en] Міттага-Лефлера^[en] Накаґамі напівлогістичний^[en] напівнормальний^[en] нецентрований хі-квадрат обернений нормальний^[en] обернений хі-квадрат^[en] масштабований обернений хі-квадрат^[en] Парето полівейбулів^[en] присічений нормальний^[en] Райса Рейлі релятивістський Брейта — Вігнера^[en] узагальнений обернений нормальний^[en] фазовий^[en] Фішера Флорі—Шульца Фреше хі хі-квадрат
Неперервні одновимірні з носієм на всій дійсній прямій	асиметричний нормальний^[en] геометричний стійкий^[en] гіперболічний секансний^[en] Гольцмарка^[en] Ґумбеля^[en] Ґумбеля I типу^[en] дисперсійний гамма^[en] експоненційний ступеневий^[en] z Фішера Скісний Коші Ландау^[en] Лапласа асиметричний Лапласа^[en] логістичний нецентральний t^[en] нормальний (Ґауса) нормально-обернений ґаусів^[en] стійкий S_U Джонсона^[en] t Стьюдента Трейсі — Відома^[en] узагальнений гіперболічний^[en] узагальнений нормальний^[en] Фойґта
Неперервні одновимірні з носієм змінного типу	зсунений логарифмічно-логістичний^[en] q-вейбулів^[en] q-гауссів q-експоненційний^[en] лямбда Тьюкі^[en] узагальнений екстремальних значень^[en] узагальнений Парето
Змішані неперервно-дискретні одновимірні	спрямлений ґаусів^[en]
Багатовимірні (спільні)	Дискретні від'ємний поліноміальний^[en] Еванса^[en] поліноміальний поліноміальний Діріхле^[en] Неперервні багатовимірний нормальний багатовимірний t^[en] багатовимірний стійкий^[en] Діріхле нормальний гамма^[en] нормально-обернений гамма^[en] узагальнений Діріхле^[en] Матричнозначні Вішарта^[en] матричний гамма^[en] матричний нормальний^[en] матричний t^[en] нормальний Вішарта^[en] нормально-обернений Вішарта^[en] обернений Вішарта^[en] обернений матричний гамма^[en]
Напрямкові	Одновимірні (кругові) напрямкові намотаний асиметричний Лапласа^[en] намотаний експоненційний^[en] намотаний Коші^[en] намотаний Леві^[en] намотаний нормальний^[en] круговий рівномірний^[en] рівномірний фон Мізаса^[en] Двовимірні (сферичні) Кента^[en] Двовимірні (тороїдні) двовимірний фон Мізаса^[en] Багатовимірні Бінгема^[en] фон Мізаса — Фішера^[en]
Вироджені та сингулярні^[en]	Вироджені Дельта-функція Дірака Сингулярні Кантора
Сімейства	експоненційні^[en] еліптичні намотані^[en] зсуву-масштабу^[en] кругові^[en] максимальної ентропії^[en] Пірсона^[en] природні експоненційні^[en] складені Пуассона^[en] сумішеві Твіді^[en]