Стрибкоподібність
У статистиці стрибкоподібність або бурхливість (англ. burstiness) – це періодичне збільшення та зменшення активності або частоти події, тобто зміна частоти випадкової події. [1] [2] Одним із показників стрибкоподібности є фактор Фано — співвідношення між дисперсією та середнім значенням підрахунків.
Стрибкоподібність можна спостерігати в природних явищах, таких як стихійні лиха, або інших явищах, таких як мережевий трафік / трафік даних / електронної пошти [3] [4] або рух транспортних засобів . [5] Стрибкоподібність частково зумовлена змінами в розподілі ймовірностей часу між подіями. [6] Розподіл бурхливих (стрибкоподібних) процесів або подій характеризується важкими або жирними хвостами . [1]
Стрибкоподібність часу взаємодії між вузлами в мережі, що змінюється в часі, може значно уповільнити процеси поширення в мережі. Це становить великий інтерес для вивчення поширення інформації та хвороб. [7]
Одним із відносно простих показників стрибкоподібности є кількість стрибкоподібности (кількість бурхливости). Кількість стрибкоподібности підмножини періоду часу відносно події є мірою того, як часто з'являється в порівняно з його появою в . Це визначається наступним чином:
де – загальна кількість випадків події у підмножині , а – загальна кількість випадків в .
Кількість стрибкоподібности може бути використана для визначення, чи є "бурхливим періодом" відносно . Позитивна кількість говорить про те, що зустрічається частіше на підмножині , ніж за загальний час , що робить бурхливим періодом. Негативна кількість, відповідно, означає протилежне. [8]
Бурхливість та перплексивність використовуються в галузі машинного навчання, а саме в обробці природної мови, для виявлення, чи був текст згенерований мовною моделлю. У такому підході, ми оцінюємо можливість певної мовної моделі згенерувати заданий текст. Тоді перплексивність трактується як міра "здивування" моделі для послідовності слів, тобто наскільки "дивним" (малоймовірним) є для мовної моделі вибір даного слова після всіх попередніх. Відповідно висока перплексивність означає велику ймовірність того, що текст написаний не зданою мовною моделлю (тобто або людиною, або іншою моделлю). Також для більшости мовних моделей характерна низька стрімкоподібність, тобто вони не суть бурхливими (довжина й складність речень суттєво однорідніша, ніж у тексті, який було написано людиною, а вибір слів у моделях задається чіткішим розподілом імовірностей).[9][10]
- ↑ а б Lambiotte, R. (2013.) "Burstiness and Spreading on Temporal Networks", University of Namur.
- ↑ Neuts, M. F. (1993.) "The Burstiness of Point Processes", Commun. Statist.—Stochastic Models, 9(3):445–66.
- ↑ D'Auria, B. and Resnick, S. I. (2006.) "Data network models of burstiness", Adv. in Appl. Probab., 38(2):373–404.
- ↑ Ying, Y.; Mazumdar, R.; Rosenberg, C.; Guillemin, F. (2005.) "The Burstiness Behavior of Regulated Flows in Networks", Proceedings of the 4th IFIP-TC6 International Conference on Networking Technologies, Services, and Protocols, Performance ofo Computer and Communication Networks, Mobile and Wireless Communication Systems, 3462:918–29.
- ↑ Jagerman, D. L. and Melamed, B. (1994.) "Burstiness Descriptors of Traffic Streams: Indices of Dispersion and Peakedness", Proceedings of the 1994 Conference on Information Sciences and Systems, 1:24–8.
- ↑ Goh, K.-I. and Barabasi, A.-L. (2006.) "Burstiness and Memory in Complex Systems", Physics Data.
- ↑ P. Holme, J. Saramäki. Temporal Networks. Phys. Rep. 519, 118–120; 10.1016/j.physrep.2012.03.001 (2012)
- ↑ A. Hoonlor et al. (2013). "An Evolution of Computer Science Research", Communications of the ACM, 56(10):79
- ↑ GPTZero (англійською) .
- ↑ Ofgang, Erik. What is GPTZero? The ChatGPT Detection Tool Explained By Its Creator. Tech & Learning (англійською) .