Масштабопросторові аксіоми
В обробці зображень та комп'ютерному баченні для подання зображення як сімейства поступово згладжених зображень можуть використовувати систему простору масштабів. Ця система дуже загальна, й існує чимало різних подань просторів масштабів. Типовий підхід до вибору конкретного типу подання простору масштабів полягає у встановленні набору масштабопросторо́вих аксіо́м (англ. scale-space axioms), які описують основні властивості бажаного масштабопросторового подання, й які часто обирають так, щоби зробити це подання корисним у практичних застосуваннях. Щойно їх встановлено, ці аксіоми звужують можливі масштабопросторові подання до меншого класу, зазвичай лише з кількома вільними параметрами.
Набір стандартних аксіом простору масштабів, обговорених нижче, дає лінійний гауссів простір масштабів, що є найпоширенішим типом просторів масштабів, який використовують в обробці зображень та комп'ютерному баченні.
Лінійне подання простору масштабів сигналу , отримуване згладжуванням гауссовим ядром , задовольняє низку властивостей «масштабопросторо́вих аксіо́м» (англ. 'scale-space axioms'), які роблять його особливою формою багатомасштабного подання:
- лінійність
- де та — сигнали, тоді як та — сталі,
- інваріантність щодо зміщення
- де позначує оператор зміщення (паралельного перенесення)
- напівгрупова структура
- з пов'язаною властивістю каскадного згладжування
- існування нескінченно малого породжувача
- нестворення локальних екстремумів (перетинів нуля) в одному вимірі,
- непосилення локальних екстремумів у будь-якій кількості вимірів
- на просторових максимумах, і на просторових мінімумах,
- обертова симетрія
- для деякої функції ,
- масштабоінваріантність
- для деяких функцій та , де позначує перетворення Фур'є ,
- додатність
- ,
- нормування
- .
Насправді, можливо показати, що гауссове ядро є унікальним вибором за декількох різних комбінацій підмножин цих масштабопросторових аксіом:[1][2][3][4][5][6][7][8][9][10][11] більшість цих аксіом (лінійність, інваріантність щодо зміщення, напівгруповість) відповідають масштабуванню як напівгрупі інваріантного щодо зміщення лінійного оператора, якому задовольняє низка сімейств інтегральних перетворень, тоді як «нестворення локальних екстремумів»[4] для одновимірних сигналів та «непосилення локальних екстремумів»[4][7][10] для сигналів вищих вимірностей є вирішальними аксіомами, які пов'язують простори масштабів зі згладжуванням (формально, диференціальними рівняннями параболічного типу в частинних похідних), звідси й обрання гауссіана.
Гауссове ядро також є роздільним у декартових координатах, тобто, . Проте роздільність не рахується як масштабопросторова аксіома, оскільки це властивість, залежна від координат, пов'язана з нюансами втілення. Крім того, вимога роздільності в поєднанні з обертовою симетрією як така закріплює ядро згладжування як гауссове.
Існує узагальнення гауссової масштабопросторової теорії до загальніших афінних та просторово-часових просторів масштабів.[10][11] На додаток до мінливості за масштабом, для обробки якої було розроблено оригінальну масштабопросторову теорію, ця узагальнена масштабопросторова теорія (англ. generalized scale-space theory) містить також й інші типи мінливості, включно з деформаціями зображення, спричинюваними зміною точки огляду, наближуваними локальними афінними перетвореннями, та відносними рухами об'єктів світу та спостерігача, наближуваними локальними перетвореннями Галілея. У цій теорії обертова симетрія не є необхідною масштабопросторовою аксіомою, її натомість замінюють вимоги афінної та/або галілеєвої коваріантності. Узагальнена масштабопросторова теорія дає передбачення профілів рецептивних полів, які добре узгоджуються з профілями рецептивних полів, вимірюваними записуванням нейронів у біологічному зорі.[12][13][14]
У літературі з комп'ютерного бачення, обробки зображень та обробки сигналів існує багато інших багатомасштабних підходів із використанням вейвлетів та різноманітних інших ядер, які не використовують і не висувають таких же вимог, що й описи простору масштабів; див. статтю про пов'язані Багатомасштабні підходи. Була також робота над дискретними масштабопросторовими концепціями, які переносять масштабопросторові властивості в дискретну область; приклади та посилання див. у статті про втілення простору масштабів.
- ↑ Koenderink, Jan "The structure of images", Biological Cybernetics, 50:363–370, 1984 (англ.)
- ↑ J. Babaud, A. P. Witkin, M. Baudin, and R. O. Duda, Uniqueness of the Gaussian kernel for scale-space filtering. IEEE Trans. Pattern Anal. Machine Intell. 8(1), 26–33, 1986. (англ.)
- ↑ A. Yuille, T.A. Poggio: Scaling theorems for zero crossings. IEEE Trans. Pattern Analysis & Machine Intelligence, Vol. PAMI-8, no. 1, pp. 15–25, Jan. 1986. (англ.)
- ↑ а б в Lindeberg, T., "Scale-space for discrete signals," PAMI(12), No. 3, March 1990, pp. 234–254. [Архівовано 28 травня 2022 у Wayback Machine.] (англ.)
- ↑ Lindeberg, Tony, Scale-Space Theory in Computer Vision, Kluwer, 1994 [Архівовано 30 листопада 2020 у Wayback Machine.], (англ.)
- ↑ Pauwels, E., van Gool, L., Fiddelaers, P. and Moons, T.: An extended class of scale-invariant and recursive scale space filters, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 691–701, 1995. (англ.)
- ↑ а б Lindeberg, T.: On the axiomatic foundations of linear scale-space: Combining semi-group structure with causality vs. scale invariance. In: J. Sporring et al. (eds.) Gaussian Scale-Space Theory: Proc. PhD School on Scale-Space Theory, (Copenhagen, Denmark, May 1996), pages 75–98, Kluwer Academic Publishers, 1997. (англ.)
- ↑ Florack, Luc, Image Structure, Kluwer Academic Publishers, 1997. (англ.)
- ↑ Weickert, J. Linear scale space has first been proposed in Japan. Journal of Mathematical Imaging and Vision, 10(3):237–252, 1999. (англ.)
- ↑ а б в Lindeberg, T. Generalized Gaussian scale-space axiomatics comprising linear scale-space, affine scale-space and spatio-temporal scale-space, Journal of Mathematical Imaging and Vision, Volume 40, Number 1, 36-81, 2011. [Архівовано 28 травня 2022 у Wayback Machine.] (англ.)
- ↑ а б Lindeberg, T. Generalized axiomatic scale-space theory, Advances in Imaging and Electron Physics, Elsevier, volume 178, pages 1-96, 2013. (англ.)
- ↑ Lindeberg, T. A computational theory of visual receptive fields, Biological Cybernetics, 107(6): 589-635, 2013. (англ.)
- ↑ Lindeberg, T. Invariance of visual operations at the level of receptive fields, PLoS ONE 8(7):e66990, 2013 (англ.)
- ↑ T. Lindeberg "Normative theory of visual receptive fields", Heliyon 7(1):e05897, 2021. (англ.)