Перейти до вмісту

Анізотропна дифузія

Матеріал з Вікіпедії — вільної енциклопедії.
(Перенаправлено з Дифузна обробка зображень)

В обробці зображень такомп'ютерному баченні, анізотропна дифузія, яка також називається  дифузією Перона–Маліка, є методом, який спрямований на зменшення шуму зображення, без видалення при цьому важливих частин вмісту зображення, як правило, країв, лінії або інших даних, які важливі для інтерпретації зображення.[1][2][3] Анізотропна дифузія нагадує процес, який створює масштабований простір, де зображення генерує параметризовану сім'ю все більш і більш розмитих зображень, заснованих на дифузійному процесі. Кожне з отриманих зображень в цій сім'ї подане як згортка між зображенням і 2D ізотропним фільтром Гауса, де ширина фільтра збільшується з параметром. Цей дифузійний процес є лінійним і просторово-інваріантним перетворенням вихідного зображення. Анізотропна дифузія є узагальненням цього дифузійного процесу: вона створює сімейство параметризованих зображень, але кожне отримане зображення являє собою поєднання вихідного зображення і фільтру, який залежить від початкового змісту вихідного зображення. Як наслідок, анізотропна дифузія є нелінійною і просторово-варіантною трансформацією вихідного зображення.

У своєму первісному формулюванні, яке представлене Пероном і Маліком[en] в 1987 році,[1] просторово-варіантний фільтр - це ізотропія, яка залежить від змісту зображення, так як вона наближається до імпульсної функції поблизу країв та інших структур, які повинні бути збережені в зображенні на різних рівнях в результаті масштабованого простору. Це формулювання  Перона і Малік називають анізотропною дифузією, а інші автори також неоднорідною і нелінійною дифузією[4] або ж дифузією Перона — Маліка[5]. Більш загальне формулювання дозволяє адаптованому до початкових умов фільтру  бути подібним до анізотропних об'єктів лінійної структури, таких як краї або лінії: його орієнтація задається такою структурою, що він витягнутий вздовж конструкції і вузький поперечному перерізі. Такі методи називаються формами-адаптованого згладжування[6][7]. Як наслідок, отримані зображення зберігають лінійні структури і в той же час проводиться згладжування уздовж цих структур. Обидва випадки можуть бути описані за допомогою узагальнення звичайного рівняння дифузії, де коефіцієнт дифузії, замість того, щоб бути постійним скаляром, є функцією позиції зображення і передбачає  матричне (або тензорне) значення (див. структурний тензор).

Хоч отриману сім'ю знімків можна охарактеризувати як поєднання оригінального зображення і просторово-варіантних фільтрів, адаптований до початкових умов фільтр і його комбінація із зображенням не повинні бути реалізовані на практиці. Анізотропна дифузія зазвичай реалізовується за допомогою апроксимації узагальненого рівняння дифузії: кожне нове зображення в сім'ї обчислюється за допомогою  застосування  цього рівняння до попереднього зображення. Отже, анізотропна дифузія являє собою ітераційний процес, в якому відносно простий набір обчислень використовується для обчислення кожного наступного зображення в сім'ї і цей процес продовжується до отримання достатнього ступеня гладкості.

Формальне визначення

[ред. | ред. код]

Формально, нехай позначає підмножину площини і - сім'я напівтонових зображень. Тоді анізотропна дифузія визначається як

де позначає оператор Лапласа, позначає градієнт, це дивергенція оператора і - коефіцієнт дифузії. контролює швидкість дифузії і зазвичай вибирається як функція градієнта зображення, так як це зберігає краї зображення. П'єтро Перона і Джітендра Малік вперше представили ідею анізотропної дифузії в 1990 році і запропонували дві функції для коефіцієнта дифузії:

і

константа  визначає чутливість до країв і, як правило, визначається експериментально або ж як функція шуму на зображенні.

Мотивація

[ред. | ред. код]

Нехай позначає копію гладких зображень. Тоді дифузійні рівняння, представлені вище, можуть бути інтерпретовані як рівняння градієнтного спуску для мінімізації енергії визначеної як:

де є дійсною функцією і яка тісно пов'язана з коефіцієнтом дифузії. Тоді для будь-якої фінітної, нескінченно диференційовної тестової функції , маємо

де останній рядок випливає з багатовимірного інтегрування частинами. Через  позначимо градієнт щодо прегільбертового простору оцінений в . Це дає

Таким чином, градієнтний спуск рівняння заданий як

Тоді, взявши  ми отримуємо анізотропне рівняння дифузії.

Регуляризація

[ред. | ред. код]

У цьому розділі буде обговорюватись регуляризація Перона-Маліка. При такому підході, невідоме скручується з Гауссіаном всередині нелінійності для отримання модифікованих рівнянь Перона-Маліка.

де .

Коректність цього рівняння може бути досягнута шляхом регуляризації, а також за допомогою введення ефекту розмитості, який є основним недоліком регуляризації. Необхідно також мати попередні знання про рівень шуму, оскільки вибір параметра регуляризації залежить від нього.

Застосування

[ред. | ред. код]

Анізотропна дифузія може бути використана для видалення шуму з цифрових зображень без розмиття країв. З постійним коефіцієнтом дифузії, анізотропне рівняння дифузії зводяться до рівняння теплопровідності, яке еквівалентне Гаусовому розмиттю. Це ідеально підходить для видалення шумів, але і безрозбірно розмиває краї теж. Коли коефіцієнт дифузії є обраний як функція для пошуку границі, як, наприклад, у Перона[8] і Маліка, отримані рівняння підтримують дифузію (і, отже, згладжування) усередині областей, а також забороняти її вздовж границь. Отже, краї зображення можуть бути збережені під час видалення шуму зображення.

Див. також

[ред. | ред. код]

Примітки

[ред. | ред. код]
  1. а б Pietro Perona and Jitendra Malik (November 1987). Scale-space and edge detection using anisotropic diffusion. Proceedings of IEEE Computer Society Workshop on Computer Vision,. с. 16—22.
  2. Pietro Perona and Jitendra Malik (July 1990). Scale-space and edge detection using anisotropic diffusion. IEEE Transactions on Pattern Analysis and Machine Intelligence. 12 (7): 629—639. doi:10.1109/34.56205.
  3. Guillermo Sapiro (2001). Geometric partial differential equations and image analysis. Cambridge University Press. с. 223. ISBN 978-0-521-79075-8.
  4. Joachim Weickert (July 1997). A Review of Nonlinear Diffusion Filtering. Scale-Space Theory in Computer Vision. Springer, LNCS 1252. с. 1—28. doi:10.1007/3-540-63167-4.
  5. Bernd Jähne and Horst Haußecker (2000). Computer Vision and Applications, A Guide for Students and Practitioners. Academic Press. ISBN 0-13-085198-1.
  6. Lindeberg, T., Scale-Space Theory in Computer Vision, Kluwer Academic Publishers, 1994, ISBN 0-7923-9418-6, (chapter 15).
  7. Andres Almansa and Tony Lindeberg (2000). Fingerprint Enhancement by Shape Adaptation of Scale-Space Operators with Automatic Scale-Selection. IEEE Transactions on Image Processing. 9 (12): 2027—2042. doi:10.1109/83.887971. PMID 18262941.
  8. http://www.vision.caltech.edu [Архівовано 18 квітня 2022 у Wayback Machine.]

Посилання

[ред. | ред. код]