Різниця гауссіанів

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У науці про зображення[en] різни́ця гауссіа́нів (РГ, англ. difference of Gaussians, DoG) — це алгоритм поліпшування ознак, який полягає у відніманні однієї гауссово розмитої версії первинного зображення від іншої, менш розмитої. У простому випадку зображень у відтінках сірого розмиті зображення отримують згортанням первинних зображень у відтінках сірого з гауссовими ядрами, які мають різну ширину (стандартні відхилення). Розмивання зображення гауссовим ядром пригнічує лише високочастотну просторову[en] інформацію. Віднімання одного зображення від іншого зберігає просторову інформацію, що лежить всередині діапазону частот, які зберігають на двох розмитих зображеннях. Тож РГ — це просторовий смуговий фільтр, який послаблює частоти первинного зображення у відтінках сірого, далекі від центру смуги.[1]

Математика різниці гауссіанів

[ред. | ред. код]
Порівняння різниці гауссіанів із сомбреровим вейвлетом[en]

Дано m-канальне, n-вимірне зображення

Різниця гауссіанів (РГ) зображення  — це функція

отримувана шляхом віднімання зображення , згорнутого з гауссіаном дисперсії , від зображення згорнутого з гауссіаном вужчої дисперсії , де . За одного виміру визначають як

а для центрованого двовимірного випадку як

що формально рівнозначне

що подає зображення, згорнуте з різницею двох гауссіанів, яка наближує функцію сомбреро[en].

Зв'язок між оператором різниці гауссіанів та оператором лапласіана гауссіана (сомбреровим вейвлетом[en]) пояснено в додатку A в Ліндебергу (2015).[2]

Деталі та застосування

[ред. | ред. код]
Приклад перед різницею гауссіанів
Після фільтрування різницею гауссіанів у чорно-білому

Як алгоритм поліпшування ознак, різницю гауссіанів можливо використовувати для збільшування видимості контурів та інших деталей на цифровому зображенні. Широкий спектр альтернативних фільтрів збільшування різкості контурів працюють, посилюючи високочастотну деталізацію, але оскільки випадковий шум також має високу просторову частоту, багато з цих фільтрів збільшування різкості схильні посилювати шум, що може бути небажаним артефактом. Алгоритм різниці гауссіанів вилучає високочастотні деталі, які часто містять випадковий шум, що робить цей підхід одним із найпридатніших для обробки зображень із високим рівнем шуму. Основним недоліком застосування цього алгоритму є невіддільне зменшення загального контрасту зображення, спричинюване цією операцією.[1]

При використання для поліпшування зображення алгоритм різниці гауссіанів зазвичай застосовують зі співвідношенням розмірів ядра (2) до ядра (1) 4:1 або 5:1. У прикладі зображень праворуч розмір гауссових ядер, використаних для згладжування цього прикладу зображення, становив 10 та 5 пікселів.

Цей алгоритм також можливо використовувати для отримання наближення лапласіана гауссіана, коли відношення розміру 2 до розміру 1 приблизно дорівнює 1,6.[3] Лапласіан гауссіана корисний для виявляння контурів, які з'являються в різних масштабах зображення або на різних ступенях його фокусування. Конкретні значення розмірів двох ядер, які використовують для наближення лапласіана гауссіана, визначатимуть масштаб різницевого зображення, яке може в результаті виглядати розмитим.

Різниці гауссіанів також використали для виявляння плям у масштабоінваріантному ознаковому перетворенні. Насправді РГ як різниця двох багатовимірних нормальних розподілів завжди має нульову загальну суму, й згортання її з рівномірним сигналом не породжує відгуку. Вона добре наближує другу похідну гауссіана (лапласіан гауссіана) за K~1,6 та рецептивні поля гангліозних нейронів сітківки за K~5. Її можна легко використовувати в рекурсивних схемах, її використовують як оператор в алгоритмах реального часу для виявлення плям та автоматичного обирання масштабу.

Додаткова інформація

[ред. | ред. код]

Вважають, що в своїй роботі алгоритм різниці гауссіанів імітує те, як нейронна обробка в сітківці ока виділяє із зображень деталі, призначені для передачі до мозку.[4][5][6]

Див. також

[ред. | ред. код]

Примітки

[ред. | ред. код]
  1. а б "Molecular Expressions Microscopy Primer: Digital Image Processing – Difference of Gaussians Edge Enhancement Algorithm", Olympus America Inc., and Florida State University Michael W. Davidson, Mortimer Abramowitz (англ.)
  2. Lindeberg (2015) ``Image matching using generalized scale-space interest points", Journal of Mathematical Imaging and Vision, volume 52, number 1, pages 3-36, 2015. (англ.)
  3. D. Marr; E. Hildreth (29 лютого 1980). Theory of Edge Detection. Proceedings of the Royal Society of London. Series B, Biological Sciences. 207 (1167): 215—217. Bibcode:1980RSPSB.207..187M. doi:10.1098/rspb.1980.0020. JSTOR 35407. PMID 6102765. S2CID 2150419. (англ.) — Різниця гауссіанів будь-якого масштабу це наближення лапласіана гауссіана (див. розділ про різницю гауссіанів у виявлянні плям). Проте Марр та Гілдрет радять відношення 1,6 через конструктивні міркування, які збалансовують смугу пропускання та чутливість. URL цього посилання може давати доступ лише до першої сторінки та анотації статті, залежно від того, чи ви підключаєтесь через академічну установу, чи ні.
  4. C. Enroth-Cugell; J. G. Robson (1966). The Contrast Sensitivity of Retinal Ganglion Cells of the Cat. Journal of Physiology. 187 (3): 517—23. doi:10.1113/jphysiol.1966.sp008107. PMC 1395960. PMID 16783910. (англ.)
  5. Matthew J. McMahon; Orin S. Packer; Dennis M. Dacey (14 квітня 2004). The Classical Receptive Field Surround of Primate Parasol Ganglion Cells Is Mediated Primarily by a Non-GABAergic Pathway (PDF). Journal of Neuroscience. 24 (15): 3736—3745. doi:10.1523/JNEUROSCI.5252-03.2004. PMC 6729348. PMID 15084653. (англ.)
  6. Young, Richard (1987). The Gaussian derivative model for spatial vision: I. Retinal mechanisms. Spatial Vision. 2 (4): 273–293(21). doi:10.1163/156856887X00222. PMID 3154952. (англ.)

Література

[ред. | ред. код]