Автоматические определители языков

Полиглот 3000

Главная → Автоматические определители языков

Иногда мы сталкиваемся с текстом на незнакомом нам языке. Стандартные способы определения языка не помогают. Как узнать, на каком языке он написан? В этом вам помогут автоматические определители языков.

Как работает определитель языка (guesser)

Автоматический определитель языка называют иногда guesser. Он позволяет по введенным нескольким словам определить язык, на котором они написаны. Технически, определение языка реализуется при помощи словаря.

Введенный текст разбивается на слова, и они сравниваются со словами из базы определителя. В результате подсчитывается количество совпадений слов разных языков, и выводится отчет в виде названия одного языка или списка языков, которые были признаны наиболее

подходящими.

Однако, работа автоматического определителя языка не так проста. система должна учитывать лексические особенности языков. правила построения предложений. различия в диалектах. и другие особенности. Поэтому, сервисы автоматического определения языка предоставляются обычно разработчиками систем машинного перевода. Результат определения языка не может быть 100% точным. Обычно определитель языка также сообщает, с какой вероятностью ему удалось определить язык. Чем больше символов текста вы укажете, тем более точным будет определение.

Автоматический определитель языка от Xerox

Определитель языка от Xerox основан на экспериментальных разработках компании. Кроме определения языка система также также распознает кодировку. Эффективность определения языка этой системой — высокая.

Определение языка сервисом от Xerox

Источник: mrtranslate.ru

Категория: Программное обеспечение

Похожие статьи: