Таблиця сумарних площ
Табли́ця сума́рних пло́щ (англ. summed-area table) — це структура даних та алгоритм для швидкого й ефективного породжування суми значень у прямокутній підмножині ґратки. В галузі обробки зображень вона також відома як інтегра́льне зобра́ження (англ. integral image). Її було запроваджено в комп'ютерній графіці 1984 року Френком Кроу[en] для використання з MIP-текстуруванням. У комп'ютернім баченні її популяризував Льюїс,[1] а потім вона отримала назву «інтегрального зображення» та широке використання в системі Віоли — Джонса виявляння об'єктів 2001 року. Історично цей принцип дуже добре відомий у дослідженні багатовимірних функцій розподілу ймовірності, а саме в обчисленні двовимірних (або N-вимірних) імовірностей (площ під розподілом імовірності) з відповідних кумулятивних функцій розподілу.[2]
Як підказує назва, значення в будь-якій точці (x, y) таблиці сумарних площ — це сума всіх пікселів вище та ліворуч від (x, y), включно:[3][4]
де це значення пікселя в (x, y).
Таблицю сумарних площ можливо ефективно обчислювати за один прохід зображенням, оскільки значення в ній в (x, y) це просто[5]
- (Зверніть увагу, що цю сумарну матрицю обчислюють з верхнього лівого кута)
Щойно таблицю сумарних площ було обчислено, для обчислення суми яскравостей будь-якої прямокутної області потрібно рівно чотири посилання на масив незалежно від розміру області. Тобто, за позначень на рисунку праворуч, маючи A=(x0, y0), B=(x1, y0), C=(x0, y1) та D=(x1, y1), сума i(x, y) у прямокутнику, охопленому A, B, C та D, дорівнює:
Цей метод природно розширюється на неперервні області.[2]
Цей метод також можливо розширити на зображення високої вимірності.[6] Якщо кути прямокутника — з в , то суму значень зображення, які містяться в цьому прямокутнику, обчислюють за формулою
де — інтегральне зображенням в , а — вимірність зображення. Запис відповідає у наведеному вище прикладі , , , та . У нейровізуалізації, наприклад, зображення мають вимірність або , при використанні вокселів або вокселів із часовою міткою.
Цей метод було розширено до інтегрального зображення високого порядку, як у праці Фана зі співавт.,[7] які запропонували два, три або чотири інтегральні зображення для швидкого та ефективного обчислювання стандартного відхилення (дисперсії), коефіцієнту асиметрії та коефіцієнта ексцесу локального блоку зображення. Це описано докладно нижче:
Для обчислювання дисперсії та стандартного відхилення блоку нам потрібні два інтегральні зображення:
Дисперсію визначають як
Нехай та позначують суми блоку з та відповідно. Обчислювати та інтегральними зображеннями швидко. Тепер ми перетворюємо рівняння дисперсії так:
Де , а .
Подібно до оцінювання середнього значення () та дисперсії (), для яких потрібні інтегральні зображення першого та другого степеня зображення відповідно (тобто ), маніпуляції, подібні до згаданих вище, можливо виконати з третім і четвертим степенями зображень (тобто ) для отримання коефіцієнтів асиметрії та ексцесу.[7] Але одна важлива деталь втілення, яку слід мати на увазі для вищевказаних методів, як зазначили Ф. Шафаіт зі співавт.,[8] полягає в переповненні цілих чисел, що виникає для інтегральних зображень вищого порядку у випадку використання 32-розрядних цілих чисел.
- ↑ Lewis, J.P. (1995). Fast template matching. Proc. Vision Interface. с. 120—123. (англ.)
- ↑ а б Finkelstein, Amir; neeratsharma (2010). Double Integrals By Summing Values Of Cumulative Distribution Function. Wolfram Demonstration Project. (англ.)
- ↑ Crow, Franklin (1984). Summed-area tables for texture mapping. SIGGRAPH '84: Proceedings of the 11th annual conference on Computer graphics and interactive techniques. с. 207—212. (англ.)
- ↑ Viola, Paul; Jones, Michael (2002). Robust Real-time Object Detection (PDF). International Journal of Computer Vision. (англ.)
- ↑ BADGERATI (3 вересня 2010). Computer Vision – The Integral Image. computersciencesource.wordpress.com. Процитовано 13 лютого 2017. (англ.)
- ↑ Tapia, Ernesto (January 2011). A note on the computation of high-dimensional integral images. Pattern Recognition Letters. 32 (2): 197—201. doi:10.1016/j.patrec.2010.10.007. (англ.)
- ↑ а б Phan, Thien; Sohoni, Sohum; Larson, Eric C.; Chandler, Damon M. (22 квітня 2012). Performance-analysis-based acceleration of image quality assessment (PDF). с. 81—84. CiteSeerX 10.1.1.666.4791. doi:10.1109/SSIAI.2012.6202458. ISBN 978-1-4673-1830-3. Архів оригіналу (PDF) за 24 травня 2014. Процитовано 1 січня 2023.
{{cite book}}
: Проігноровано|journal=
(довідка) [Архівовано 2014-05-24 у Wayback Machine.] (англ.) - ↑ Shafait, Faisal; Keysers, Daniel; M. Breuel, Thomas (January 2008). Efficient implementation of local adaptive thresholding techniques using integral images (PDF). Electronic Imaging. Document Recognition and Retrieval XV. 6815: 681510–681510–6. CiteSeerX 10.1.1.109.2748. doi:10.1117/12.767755. Архів оригіналу (PDF) за 15 грудня 2014. Процитовано 1 січня 2023. (англ.)
- Відео лекцій