You are missing some Flash content that should appear here! Perhaps your browser cannot display it, or maybe it did not initialise correctly.
самые оперативные новости IT и телекоммуникаций
16:11 | 27.02.2017

Автор: Веденеева Наталия

Алексей Любимов, 3i Technologies: «Спецслужбы «речевыми» технологиями пользуются давно и активно»

Рынок распознавания речи динамично растет и в России, и в мире. На нем присутствуют как глобальные вендоры, так и небольшие нишевые игроки. Что собой представляет российский рынок, и как себя на нем чувствует отечественный разработчик, TelecomDaily рассказал председатель совета директоров консорциума 3i Technologies Алексей Любимов.

Ред.: Не могли бы в нескольких словах обрисовать специфику рынка? О нем не так много известно массовому потребителю.

АЛ: Аналитики называют распознавание голоса одним из самых динамично развивающихся сегментов ИТ-рынка. И хотя их оценки объемов и, тем более, темпов роста сильно отличаются друг от друга в силу различной методики и непрозрачности самого рынка, эксперты сходятся в том, что голосовой рынок растет быстро. В ближайшие несколько лет эта тенденция сохранится. На нем есть как «гранды», которые за собой застолбили уже целые направления, так и сотни небольших стартапов, которые постоянно возникают и исчезают, пытаясь увести из-под носа неповоротливых технологических гигантов, тот или иной проект, а то и целое направление.

Ред.: У этого сегмента есть основной лидер, по оценкам экспертов?

АЛ: Несомненный лидер мирового рынка - компания Nuance, которая на протяжении уже полутора десятков лет занимается скупкой команд и голосовых технологий по всему свету. На глобальном уровне с ней может посоперничать разве что Google, для которого голосовые технологии тоже одно из ключевых направлений. Ну, и, конечно, Apple, у которой также есть опыт разработок в области распознавания речи. В сегменте продуктов для контакт-центров один из лидеров – израильская компания NiceSystems. Русский язык все еще остается слишком сложным для иностранных разработчиков, а отечественный рынок не такой большой, чтобы акцентироваться на нем, поэтому в России есть свои крупные разработчики. Один из самых заметных отечественных игроков – Центр Речевых Технологий (ЦРТ), другой не менее значимый представитель - «Яндекс», у которого тоже есть широкая линейка продуктов ориентированных, как на разработчиков, так и на конечного потребителя. Кроме того, в России есть еще ряд нишевых игроков, которые работают в узких сегментах.

Ред.: Для каких целей применяется распознавание речи?

АЛ: Условно распознавание речи по типу решаемых задач можно разделить на три больших группы. Первая - распознавание с целью управления и голосового ввода. Такие системы активно используются в мобильных телефонах, умных домах и т. д. Во вторую группу входит, так называемый, голосовой поиск, который применяется для поиска по ключевым словам и выражениям в живой речи и медиа-архивах, для анализа аудио-информации и т. д. Третье направление – это голосовая биометрия. Его можно было бы считать одной из частных задач голосового поиска, однако сейчас это один из самых перспективных сегментов рынка, коммерческий интерес к которому очень велик. Поэтому имеет смысл его обозначить отдельно. О голосовой биометрии говорят достаточно давно, однако масштабных проектов до недавнего времени не было.

Ред: Как чувствуют себя на рынке отечественные разработчики? За счет чего выживают? Способны ли конкурировать с глобальными вендорами?

АЛ: Когда речь идет о распознавании речи, то надо иметь ввиду, что рынок этот крайне динамичный. Постоянно появляются новые ниши, еще недавно голосовые интерфейсы казались фантастикой. Однако сейчас они есть практически в любом телефоне, и даже школьник может запустить набором слов Google или Яндекс-сервисы. Постоянно появляются молодые и амбициозные команды, которые уверяют, что добились 99% точности распознавания речи, или обнаружили очередную нишу, еще не занятую гигантами. Далеко не всегда это правда. Однако при работе с русским языком сервисы, разработанные отечественными компаниями, зачастую показывают более высокое, чем у иностранных продуктов, качество работы. Так что в русскоязычном сегменте «Яндекс» чувствует себя увереннее, чем Google. Кроме того, есть целый ряд специфических задач, куда иностранные сервисы не могут быть допущены в принципе, например, в силовые ведомства и спецслужбы. Более того, ряд отечественных разработчиков умудряются продавать свои технологии на внешнем рынке. Словом, с точки зрения технологий распознавания речи мы практически не уступаем западным вендорам.

Ред.: С какими сложностями в России приходится сталкиваться компаниям, предлагающим решения на базе технологии распознавания речи?

АЛ: В России ощутимо ниже уровень конкуренции, чем в США или Европе, поэтому российские потребители «голосовых» технологий еще не «дозрели» до целого ряда проектов, из числа тех, которые уже начали внедрять их западные коллеги. Например, к голосовой биометрии у нас только начинают присматриваться. Отечественные компании пока только начали оценивать перспективы применения речевых технологий для повышения качества обслуживания. Или другой пример, у нас только появились отраслевые системы голосового ввода. В то время как в США специальные системы ввода текста голосом для юристов и медиков существуют давно. Так что, как я уже сказал выше, основная сложность для российского разработчика - это низкий интерес к технологиям со стороны отечественного заказчика.

Наш бизнес, я имею в виду отечественный, вообще недоинформатизирован. Далеко не везде внедрены CRM или электронный документооборот, даже в сегменте среднего и малого бизнеса, который, казалось бы, должен бороться за предельное снижение текущих расходов и себестоимости. Соответственно, до речевых интерфейсов, ввода голосом и тому подобного пока руки не дошли. Одним из крупнейших заказчиков в последние годы в РФ стало государство, а госкомпании традиционно очень консервативны в вопросах применения новых технологий. Так что и в этом сегменте «голос» не очень востребован.

Ред.: Кому вообще нужен перевод голоса в текст и вообще речевые технологии? Насколько сейчас велик спрос?

АЛ: Это один из самых перспективных сегментов рынка, коммерческий интерес к которому очень велик. Поэтому имеет смысл его обозначить отдельно. О голосовой биометрии говорят достаточно давно, однако масштабных проектов до недавнего времени не было.

Ред.: Что стоит ожидать от голосовых технологий в ближайшее время? Появится ли что-то новое прорывное?

АЛ: Как только качество распознавания речи преодолеет некую критическую черту и станет действительно высоким, то технология будет внедрена повсеместно. Мы уже сейчас отдаем команды своему смартфону на естественном языке. Конечно, короткие реплики и большие массивы слитной речи - это далеко не одно и то же. Со слитной речью работать намного сложнее, в этом случае необходимо учитывать все многообразие диалектов, допускать возможность некорректного использования оборотов и просто ошибок речи.

Сейчас все участники рынка бьются над тем, чтобы снизить влияние «шумов» на качество распознавания. Мы уже научились отделять человеческую речь от музыки или просто акустических помех. Однако, несмотря на заявления отдельных участников рынка, всем существующим на сегодняшний день системам есть куда «расти». В каких-то вопросах наша компания несколько обошла своих коллег, например, у нас есть специализированный продукт для работы с телевизионными и радио эфирами. И помимо высокого качества распознавания наша система способна автоматически расставлять знаки препинания при переводе больших массивов речи в текст. Это упрощает последующую обработку и анализ информации, выделение наиболее значимых фрагментов и т. д.

Ред.: Когда появятся системы, которые будут способны автоматически распознавать контекст?

АЛ: Думаю, уже в ближайшее время. Если брать шире, то они будут обрабатывать естественный язык. Технология эта обозначается термином Natural Language Processing. То есть машина сможет отличать разговор на медицинскую тематику от политической дискуссии, употребление жаргонных слов от вежливого обращения, и, соответственно, использовать терминологию в правильном значении. Как только предыдущие две задачи будут решены, будут созданы портативные устройства автоматического перевода с одного языка на другой, и языковой барьер будет снят раз и навсегда. И полагаю, что ждать всего этого нам осталось недолго, потому что речевые технологии развиваются семимильными шагами.
 

Источник: "TelecomDaily"

Комментировать Комментировать
Средний рейтинг 5
Оценить статью
12:12 | 17.11.2017
Российский рынок MVNO начинает формироваться на наших глазах. На его показатели влияет как эффект «низкой базы», так и сам принцип того, какие проекты отнести к числу MVNO. Мировой рынок у...
: :
09:08 | 24.10.2017
Рынок ЖКХ - один из наиболее перспективных для внедрения широкого спектра ИТ-решений. О том, какие подходы могут способствовать развитию «умного города», TelecomDaily рассказал Валентин Ив...
: :
11:26 | 10.10.2017
 О локальной политике ICANN (Internet Corporation for Assigned Names and Numbers ), международной корпорации по управлению доменными именами и IP-адресами, на территории России и СНГ, которая рас...
: :
Популярные новости