Перейти до вмісту

CuneiForm

Матеріал з Вікіпедії — вільної енциклопедії.
CuneiForm
CuneiForm 12
ТипОРС
АвторCognitive Technologies
РозробникCognitive Technologies
Стабільний випуск12 (12 грудня 2007)
Нестабільний випускджерельні коди (2 квітня 2008)
Операційна системаWindows, Linux[1]
Мова програмуванняC++[2] і C[2]
Українська моваінтерфейс — ні, ОРС — так
Ліцензіявільна (Відкрите програмне забезпечення з березня 2008), Ліцензія BSD
Вебсайтwww.cuneiform.ru, www.openocr.org

CuneiForm — інструмент оптичного розпізнавання символів, розроблений російською компанією Cognitive Technologies. Програма перетворює файли зображень, отримані зі сканера або іншим шляхом на текст. Після декількох років без розвитку, 12 грудня 2007 року анонсовано відкриття джерельних текстів програми, яке відбулося 2 квітня 2008 року [3].

Можливості

[ред. | ред. код]

CuneiForm — шрифтонезалежна (OmniFont) система. Алгоритми, закладені в CuneiForm, ґрунтуються на правилах написання букв, на їхній топології, і не вимагають задавання певних еталонів або навчання. Розпізнаються будь-які друкарські шрифти — книги, газети, журнали, роздруківки з лазерних і матричних принтерів, тексти з друкарських машинок тощо. Не розпізнається рукописний текст і декоративні шрифти (готичний, стилізований під рукописний). В CuneiForm існують спеціальні налаштування для розпізнавання текстів з матричного принтера і факсів 200x100 DPI.

CuneiForm зберігає форматування тексту і розпізнає складні таблиці довільної структури.

Програма розпізнає текст англійською, болгарською, голландською, данською, естонською, іспанською, італійською, латвійською, литовською, німецькою, польською, португальською, російською, румунською, сербською, словенською, турецькою, угорською, українською, французькою, хорватською, чеською, шведською мовами та російсько-англійський двомовний текст.

CuneiForm може зберегти розпізнаний текст у форматах RTF, HTML або текстовому. Також можливо передати текст до текстового процесора Word або електронної таблиці Excel.

Історія

[ред. | ред. код]

Колись лідер програмного забезпечення з розпізнавання символів у Росії, CuneiForm змагався з популярною нині програмою ABBYY FineReader.

Майбутнє

[ред. | ред. код]

Cognitive Technologies розпочали програму «Розпізнавання має бути на кожному комп'ютері», щоб зробити розпізнавання доступним для всіх споживачів. Перший крок програми — випуск CuneiForm як вільно поширюваного ПЗ. Наступним кроком стане запуск вільної on-line служби розпізнавання на сайті www.cuneiform.ru до кінця січня 2008 року.

2 квітня 2008 року компанія Cognitive Technologies оголосила про відкриття джерельного коду програми[3]. В даний час, розробники вибрали для проекту ліцензію BSD[4].

У квітні 2009 випущена перша версія Cuneiform-Qt [Архівовано 12 квітня 2009 у Wayback Machine.] — графічного інтерфейсу до Cuneiform на основі бібліотеки Qt4.

У червні 2009 випущена перша публічна версія YAGF — графічної оболонки до Cuneiform на основі бібліотеки Qt4.

Див. також

[ред. | ред. код]

Посилання

[ред. | ред. код]

Виноски

[ред. | ред. код]
  1. Jussy Pakkanen портував джерельний код Cuneiform під Linux [Архівовано 20 травня 2011 у Wayback Machine.]. Поточний статус --- альфа.
  2. а б https://www.openhub.net/p/cuneiform/analyses/latest/languages_summary
  3. а б Cognitive Technologies відкрила код OCR Cuneiform. Архів оригіналу за 6 листопада 2009. Процитовано 28 квітня 2009. [Архівовано 2009-11-06 у Wayback Machine.]
  4. Ліцензія. Архів оригіналу за 18 грудня 2007. Процитовано 13 грудня 2007.