Перейти до вмісту

Алгоритм Текномо — Фернандеса

Матеріал з Вікіпедії — вільної енциклопедії.
Алгоритм Текномо-Фернандеса створює зображення фону з відео вулиці з великою кількістю пішоходів.

Алгоритм Текномо–Фернандеса є ефективним алгоритмом для створення фонового зображення заданої відеопослідовності.

Припускаючи, що фонове зображення відображається на більшій частині відео, алгоритм може створити хороше фонове зображення відео за час , використовуючи лише невелику кількість бінарних операцій і бітових операцій, які потребують невеликої кількості пам’яті та мають вбудовані оператори, які є в багатьох мовах програмування, таких як C, C++ і Java . [1] [2] [3]

Історія

[ред. | ред. код]
Алгоритм Текномо-Фернандеса генерує кольорове фонове зображення та використовує його для віднімання фону.

Відстеження людей на відео зазвичай включає віднімання фону, щоб відокремити передній план від фону. Таким чином, після виділення зображень переднього плану, їх можна використати для необхідних алгоритмів поставленої задачі (наприклад, для відстеження руху, відстеження об’єктів і розпізнавання обличчя ). [1]

Однак для віднімання фону потрібно, щоб фонове зображення вже було доступним, і, на жаль, це не завжди так. Традиційно фонове зображення шукається вручну або автоматично серед зображень з відео, коли на них немає об’єктів. Нещодавно була запропонована автоматична генерація фону за допомогою виявлення об’єктів, медіальної фільтрації, медоїдної фільтрації, апроксимованої медіанної фільтрації, лінійного прогностичного фільтра, непараметричної моделі, фільтра Калмана та адаптивного згладжування ; однак більшість цих методів мають високу обчислювальну складність і ресурсомісткі. [4]

Алгоритм Текномо-Фернандеса також є алгоритмом автоматичного створення фону. Однак його перевагою є лише швидкість обчислення за час , який залежить від роздільної здатності зображення, а його точність досягається в межах керованої кількості кадрів. Щоб створити фонове зображення, потрібно лише принаймні три кадри з відео, якщо припустити, що для кожного пікселя фон є у більшості кадрів. Крім того, це може працювати як для сірих, так і для кольорових відео.

Припущення

[ред. | ред. код]
  • Камера нерухома.
  • Освітленість середовища змінюється лише повільно відносно рухів людей у сцені.
  • Люди не проводять більшу частину часу в одному місці.

Однак, як правило, алгоритм безумовно працюватиме, якщо виконується таке єдине важливе припущення:

Для кожної позиції пікселя більшість значень пікселів у всьому відео містить піксельне значення фактичного фонового зображення у цій позиції. [1]

Поки кожна частина фону відображається в більшій частині відео, фонове зображення повністю не повинно з’являтися в жодному з його кадрів. Очікується, що алгоритм працюватиме точно. [1]

Створення фонового зображення

[ред. | ред. код]

Рівняння

[ред. | ред. код]
Вісім можливових значень трьох бінарних зображень і їх булева функція S
0 0 0 0 1 1 1 1
0 0 1 1 0 0 1 1
0 1 0 1 0 1 0 1
0 0 0 1 0 1 1 1
  1. Для трьох бінарних кадрів з послідовності зображень (відео) , , і , фонове зображення отримують з рівняння
    , де це виключна диз'юнкція (XOR). [1]
  2. Булева функція дорівнює одиниці, коли кількість одиниць перевищує половину кількості зображень, так що [1]
  3. Таким чином, для 3 зображень фонове зображення може бути прийнято як значення 1 у S, або [1]

Алгоритм створення фону

[ред. | ред. код]

На першому рівні три кадри вибираються випадковим чином із послідовності зображень для створення фонового зображення шляхом їх комбінування за допомогою першого рівняння. Це дає краще фонове зображення на другому рівні. Процедуру повторюють до бажаного рівня . [1]

Теоретична точність

[ред. | ред. код]

На рівні , ймовірність , що передбачений модальний біт є фактичним модальним бітом, представлена рівнянням . У таблиці нижче подано обчислені значення ймовірності на кількох рівнях із використанням різних початкових ймовірностей. Можна помітити, що навіть якщо модальний біт у розглянутій позиції знаходиться на 60% кадрів, ймовірність визначення точного модального біта вже перевищує 99% на 6 рівні. [1]

Computed probabilities table
У цій таблиці наведено обчислені значення ймовірностей на кількох рівнях із використанням різних початкових ймовірностей. Можна спостерігати, що навіть якщо модальний біт у розглянутій позиції знаходиться на 60% кадрів, ймовірність точного визначення модального біта вже перевищує 99% на шостому рівні.

Просторова складність

[ред. | ред. код]

Потреба в просторі алгоритма Текномо–Фернандеса визначається функцією , яка залежить від роздільної здатності зображення, числа кадрів у відео та потрібну кількість рівнів. Проте через те, що , ймовірно, не перевищить 6, складність простору зменшується до . [1]

Часова складність

[ред. | ред. код]

Весь алгоритм відпрацбовує за час , який залежить тільки від роздільної здатності зображення.

Обчислення модального біта для кожного біта можна виконати за час , в той час як обчислення для всього фонового зображення з трьох заданих зображень можна виконати за час . Кількість зображень для обробки в рівнів є . Однак, оскільки , то це насправді , таким чином алгоритм виконується за час . [1]

Варіанти

[ред. | ред. код]

Розроблено варіант алгоритму Текномо–Фернандеса, який включає метод Монте-Карло під назвою CRF. Було реалізовано дві різні конфігурації CRF: CRF9,2 і CRF81,1. Експерименти на деяких кольорових відеопослідовностях показали, що конфігурації CRF перевершують алгоритм Текномо–Фернандеса з точки зору точності. Однак алгоритм Текномо–Фернандеса залишається більш ефективним з точки зору часу обробки. [5]

Застосування

[ред. | ред. код]

Див. також

[ред. | ред. код]

Список літератури

[ред. | ред. код]
  1. а б в г д е ж и к л м Teknomo, Kardi; Fernandez, Proceso (2015). Background Image Generation Using Boolean Operations. arXiv:1510.00889 [cs.CV].
  2. Abu, Patricia Angela; Fernandez, Proceso (2014). Performance Comparison of the Teknomo-Fernandez Algorithm on the RGB and HSV Colour Spaces. 2014 International Conference on Humanoid, Nanotechnology, Information Technology, Communication and Control, Environment and Management (HNICEM). с. 1—6. doi:10.1109/HNICEM.2014.7016262. ISBN 978-1-4799-4020-2.
  3. Abu, Patricia Angela (March 2015). Improving the Teknomo–Fernandez Background Image Modeling Algorithm for Foreground Segmentation (Ph.D). Ateneo de Manila University.
  4. Abu, Patricia Angela; Fernandez, Proceso (March 2016). Modifying the Teknomo–Fernandez Algorithm for Accurate Real-Time Background Subtraction. Philippine Computing Science Congress.
  5. Abu, Patricia Angela; Chu, Varian Sherwin; Fernandez, Proceso. A Monte-Carlo-based Algorithm for Background Generation.

Подальше читання

[ред. | ред. код]
  •  Chu, Varian Sherwin B. (2013). Background image reconstruction using random frame sampling and logical bit operations (Дипломна робота). Ateneo de Manila University.
  •  Abu, Patricia Angela R. (2015). Improving the Teknomo-Fernandez Background Image Modeling Algorithm for Foreground Segmentation (Дипломна робота). Ateneo de Manila University.

Зовнішні посилання

[ред. | ред. код]