Конкордансер

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Конкорда́нсер (від англ. concordancer) - це комп'ютерна програма для автоматичного створення конкордансу, списку знайдених прикладів вживання будь-якого слова у мінімальному контексті [1]. Ця спеціальна програма використовується для обробки інформації у корпусі. Конкордансери здійснюють пошук у тексті за принципом, подібним до того, як пошукова система шукає інформацію у Мережі; і формує конкорданс, тобто перелік усіх контекстів, у яких будь-яке слово або словосполучення зустрічається у досліджуваному тексті [2] [Архівовано 18 вересня 2020 у Wayback Machine.].

Вихід конкордансера може служити входом до системи пам'яті перекладу для автоматизованого перекладу або як перший крок до машинного перекладу. Конкордансери також використовуються в корпусній лінгвістиці для сортування інформації в алфавітному порядку або іншим чином відсортованих списків лінгвістичних даних з відповідного корпусу, який потім аналізує мовознавець. Було опубліковано ряд конкордансерів, зокрема Оксфордську програму конкордансів, що вперше була випущена у 1981 році Оксфордським університетом[en], використовується у понад 200 організаціях по всьому світу [3] [Архівовано 17 липня 2020 у Wayback Machine.].

Приклади конкордансів:[ред. | ред. код]

TextSTAT - Simples Text Analyse Tool - конкордансер, що працює з корпусами на різних мовах, з використанням спеціальної мови запитів (мови регулярних виразів) [4] [Архівовано 22 грудня 2020 у Wayback Machine.].

[1]

[2]


[3]

  1. конкордансер — Викисловарь. ru.wiktionary.org. Процитовано 27 листопада 2019.
  2. EnglishZoom. Что такое электронный корпус текстов | EnglishZoom. www.englishzoom.ru. Архів оригіналу за 18 вересня 2020. Процитовано 27 листопада 2019.
  3. Конкорданс - Энциклопедия - Фонд знаний «Ломоносов». www.lomonosov-fund.ru. Архів оригіналу за 22 грудня 2020. Процитовано 27 листопада 2019.