Задача класифікації

Задача класифіка́ції — формалізована задача, яка містить множину об'єктів (ситуацій), поділених певним чином на класи. Задана скінченна множина об'єктів, для яких відомо, до яких класів вони належать. Ця множина називається вибіркою. До якого класу належать інші об'єкти невідомо. Необхідно побудувати такий алгоритм, який буде здатний класифікувати довільний об'єкт з вихідної множини.

Класифікувати об'єкт — означає, вказати номер (чи назву) класу, до якого належить цей об'єкт.

Класифікація об'єкта — номер або найменування класу, що видається алгоритмом класифікації в результаті його застосування до цього об'єкта.

В математичній статистиці задачі класифікації називаються також задачами дискретного аналізу. В машинному навчанні завдання класифікації вирішується, як правило, за допомогою методів штучної нейронної мережі при постановці експеримента у вигляді навчання з учителем.

Існують також інші способи постановки експерименту — навчання без вчителя, але вони використовуються для вирішення іншого завдання — кластеризації або таксономії. У цих завданнях поділ об'єктів навчальної вибірки на класи не задається, і потрібно класифікувати об'єкти тільки на основі їх подібності. У деяких прикладних областях, і навіть у самій математичній статистиці, через близькість завдань часто не відрізняють завдання кластеризації від завдання класифікації.

Деякі алгоритми для вирішення задач класифікації комбінують навчання з учителем і навчання без вчителя, наприклад, одна з версій нейронних мереж Кохонена — Мережі векторного квантування, яких навчають способом навчання з учителем.

Математичне формулювання завдання

Нехай $X~$ — множина описів об'єктів, $Y~$ —множина номерів (чи назв) класів. Існує невідома цільова залежність- відображення $y^{*}\colon X\to Y$ , значення якої відомі лише на елементах скінченної навчальної вибірки $X^{m}=\{(x_{1},y_{1}),\dots ,(x_{m},y_{m})\}$ . Потрібно побудувати алгоритм $a\colon X\to Y$ , здатний класифікувати довільний об'єкт $x\in X$ .

Імовірнісне формулювання завдання

Загальнішим є імовірнісне формулювання завдання. Припускається, що множина пар «об'єкт, клас» $X\times Y$ є ймовірнісним простором з невідомою ймовірнісною мірою ${\mathsf {P}}$ . Є скінченна навчальна вибірка спостережень $X^{m}=\{(x_{1},y_{1}),\dots ,(x_{m},y_{m})\}$ , згенерована згідно з ймовірнісною мірою ${\mathsf {P}}$ . Необхідно побудувати алгоритм $a\colon X\to Y$ , здатний класифікувати довільний об'єкт $x\in X$ .

Простір характеристик

Характеристикою називається відображення $f\colon X\to D_{f}~$ , де $D_{f}~$ — множина допустимих значень характеристики. Якщо задані характеристики $f_{1},\dots ,f_{n}~$ , то вектор ${\mathbf {x} }=(f_{1}(x),\dots ,f_{n}(x))$ називається характеристичним описом об'єкта $x\in X$ . Характеристики можна ототожнювати із самими об'єктами. При цьому множину $X=D_{f_{1}}\times \dots \times D_{f_{n}}$ називають простором характеристик.

Залежно від множини $D_{f}$ характеристики поділяються на такі типи:

Бінарні характеристики: $D_{f}=\{0,1\}$ ;
Номінальні характеристики: $D_{f}$ — скінченна множина;
Порядкові характеристики: $D_{f}$ — скінченна впорядкована множина;
Кількісні характеристики: $D_{f}$ — множина дійсних чисел.

Часто зустрічаються прикладні задачі з різнотипними характеристиками, для їх вирішення підходять далеко не всі методи.

Типи задач класифікації

Типи вхідних даних

Характеристичний опис — найпоширеніший випадок. Кожен об'єкт описується набором своїх характеристик, які називаються ознаками. Ознаки можуть бути числовими або нечисловими.
Матриця відстаней між об'єктами. Кожен об'єкт описується відстанями до всіх інших об'єктів навчальної вибірки. З цим типом вхідних даних працюють деякі методи, зокрема, метод найближчих сусідів, метод потенційних функцій.
Часовий ряд або сигнал є послідовність вимірів у часі. Кожен вимір може представлятися числом, вектором, а в загальному випадку — характеристичним описом досліджуваного об'єкта в цей час часу.
Зображення або відеоряд.
Зустрічаються і складніші випадки, коли вхідні дані представляються у вигляді графів, текстів, результатів запитів до бази даних, і т. д. Як правило, вони приводяться до першого або другого випадку шляхом попередньої обробки даних та вилучення характеристик.

Класифікацію сигналів та зображень називають також розпізнаванням образів.

Типи класів

Двокласова класифікація. Найпростіший в технічному відношенні випадок, який служить основою для вирішення складніших завдань.
Багатокласова класифікація. Коли число класів досягає багатьох тисяч (наприклад, при розпізнаванні ієрогліфів або злитого мовлення), завдання класифікації стає істотно важчим.
Непересічні класи.
Пересічні класи. Об'єкт може належати одночасно до декількох класів.
Нечіткі класи. Потрібно визначати ступінь належності об'єкта кожному з класів, звичайно це дійсне число від 0 до 1.

Див. також

Посилання

www.MachineLearning.ru — професійний вікі-ресурс, присвячений машинному навчання та інтелектуального аналізу даних
Костянтин Воронцов. Курс лекцій Математичні методи навчання за прецедентами [Архівовано 23 вересня 2015 у Wayback Machine.], МФТІ, 2004–2008
Юрій Ліфшиц. Автоматична класифікація текстів [Архівовано 13 січня 2020 у Wayback Machine.] (Слайди) — лекція № 6 з курсу «Алгоритми для Інтернету» [Архівовано 15 жовтня 2008 у Wayback Machine.]
kNN і Потенційна енергія [Архівовано 19 січня 2012 у Wayback Machine.] (аплет), Е. М. Міркес і університет Лейстера

Література

Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. — М.: Финансы и статистика, 1989.
Вапник В. Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979.
Журавлев Ю. И., Рязанов В. В., Сенько О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: Фазис, 2006. ISBN 5-7036-0108-8.
Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. ISBN 5-86134-060-9.
Паклин Н. Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям (+ CD). [Архівовано 7 грудня 2011 у Wayback Machine.] -СПб: Питер, 2009. ISBN 978-5-49807-257-9
Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. — Киев: Наукова думка, 2004. ISBN 966-00-0341-2.
Шаблон:Книга:The Elements of Statistical Learning
Mitchell T. Machine Learning. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7.

п о р Штучний інтелект
Філософія	Тест Тюрінга • Китайська кімната • Етика ШІ
Напрямки	Агентний підхід • Адаптивне керування • Інженерія знань • Модель життєздатної системи • Машинне навчання • Нейронні мережі • Нечітка логіка • Обробка природної мови • Розпізнавання образів • Ройовий інтелект • Еволюційні алгоритми • Експертна система • Сильний штучний інтелект •
Застосування	Голосове керування • Задача класифікації • Класифікація документів • Кластеризація документів • Кластерний аналіз • Локальний пошук • Машинний переклад • Оптичне розпізнавання символів • Розпізнавання мовлення • Розпізнавання рукописного введення • Комп’ютерні ігри
Дослідники	Джон Маккарті • Аллен Ньюелл • Герберт Саймон • Алан Тюрінг • Клод Шеннон • Артур Семюель • Норберт Вінер • Марвін Мінскі • Едвард Фейгенбаум • Вудро Вілсон Бледсоу • Террі Виноград • Френк Розенблат • Чарлз Беббідж • Ноам Чомскі • Джуда Перл • Сеймур Пейперт • Джозеф Вейценбаум • Патрік Вінстон • Дональд Мікі^[en] • Алан Банді^[en] • В. М. Глушков
Організації	Асоціація з розвитку штучного інтелекту • OpenAI • Інститут Аллена з питань штучного інтелекту^[en] • Міжнародна об'єднана конференція зі штучного інтелекту • Європейська конференція з питань штучного інтелекту • Європейське товариство нейронних мереж^[en] • Інститут інформатики і штучного інтелекту ДонНТУ • Machine Intelligence Research Institute • Artificial Intelligence Applications Institute^[en]