'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №5 (14) том 4
  4. Научная статья № 105

Просмотры  99 просмотров

Карибов А.Ю.

  


АНАЛИЗ АЛГОРИТМОВГОЛОСОВЫХ ПОМОЩНИКОВ *

  


Аннотация:
рассматривается понятие «голосовые помощники», подробно описываются технологии, которые могли бы быть применены в различных сферах. Они могут быть внедрены во множество интеллектуальных систем и улучшать удобство коммуникации человека и ПК. В данной статье описываются принципы функционирования и действия голосового ассистента   

Ключевые слова:
голосовые оповещения, системы мониторинга, информационные технологии, голосовые помощники   


Введение Уже сейчас «голосовые ассистенты» и умные помощники, наглядно показывают нам, на что именно будут способны персональные роботы в ближайшем будущем. Вопервых, голосовой интерфейс будет основным для взаимодействий со множеством функций персонального робота. Во-вторых, ваш персональный робот будет подключен к различным онлайн-сервисам, таким как календарь, новостной портал, интернетмагазин и так далее. Появление интеллектуальных персональных программных агентов, таких как: Siri, Cortana, Google Now во многом связано с тем, что большинство людей вообще не привыкли скачивать и использовать отдельные приложения для решения своих задач , все больше программ станут поддерживать поиск по своему контенту через внешние сервисы и для этого их даже не придется устанавливать. Ключевой фактор роста популярности интеллектуальных помощников возможность искать по контенту приложений. В свою очередь те будут использовать свои поисковые алгоритмы, чтобы забирать контент из приложений так, что пользователю даже не придется устанавливать их на свой телефон. Алгоритм действий голосовых помощников Поскольку рекуррентные сети имеют «память» о прошлых состояниях, стало возможным хранить долговременные связи в распознаваемой речи, то есть, контекст. Теперь нейронная сеть может предсказывать результат на основе целых предложений, что расширило возможности обучения, и позволило в качестве обучающей базы данных использовать обычную человеческую речь. Поскольку нейронные сети достаточно точны, действительно серьёзной проблемой остаётся лишь повышение качества записи в агрессивных шумовых средах. После переработки речи из звукового сигнала в удобный для работы программы формат, голосовой помощник может приступить к алгоритмам обработки запроса. Более простые помощники, которые могут быть настроены практически любым пользователем, при наличии специального программного обеспечения, строятся на довольно простых алгоритмах. Пользователь собирает ключевые фразы и указывает реакцию (действия программы) на них, после чего, в активной фазе, помощник проверяет голосовые команды на соответствие ключам. Выявляется вероятность, с которой команда удовлетворяет каждому из ключей. Если для определённой команды вероятность удовлетворительна и максимальна среди всех остальных, то ключ активирует привязанное к нему действие. Более интересны продвинутые помощники, работающие на нескольких связанных нейронных сетях. Выходные данные для каждой предыдущей сети, являются входными для следующей. Они способны начиная с этапа распознавания речи, так же проанализировать её, определить тематику запроса, выделять ключевые моменты и самостоятельно синтезировать ответ на запрос. Мощные системы, использующие немалое количество технологий. Поскольку, что результатом работы нейронной сети является предсказывание наиболее вероятного результата, а не однозначный ответ, данная система является достаточно гибкой для поддержки и возможного переобучения. Поэтому, подобным помощникам оставляют функцию обучения даже в режиме работы, чтобы их поведение грамотно корректировалось под нужды пользователей. К сожалению, идеалы машинного понимания данные агенты не реализуют. Возможности данных ресурсов довольно сильно ограничены рамками, в которых они были обучены действовать. Чем абстрактнее и больше рамки, тем больший  набор проблем они способны решать, однако, чем рамки конкретнее, тем лучше и полнее будет решение. Поэтому и необходима модульность, при которой запросы анализируются, и решаются отвечающими за конкретную проблему фрагментами системы. Этот принцип характерен для программирования в целом. Пожалуй, единственной преградой на данном этапе, осталась лишь «разумность» ресурса. Для речевых агентов на данном этапе важна лишь поддержка со стороны разработчиков – чем больше модулей будет разработано, тем большими возможностями будет обладать ресурс. Соответственно, на данном этапе единственным возможным кардинальным прорывом будет являться не что иное, как полноценный искусственный интеллект, с возможностью самообучения, что, пока что, невозможно, в виду недостаточного развития технологий и непригодных архитектур, на которых строятся современные ЭВМ. Однако, пожалуй, искусственный интеллект как ассистент человека, скорее всего, и есть финальный этап эволюции речевых агентов. Заключение По мере развития «виртуальных ассистентов» и «умных помощников», - следующим логическим этапом их развития будет интеграция с аппаратной частью. Их базы знаний, будут дополнены элементами естественной речи, позволяя нам искать во все возрастающих объемах информации с меньшей затратой по времени и в более человеческой манере - разговаривая с системой. Во многие гаджеты сегодня уже «поселили» умных голосовых помощников. В будущем именно голос человека станет основой интерфейса большинства приложений.

  


Полная версия статьи PDF

Номер журнала Вестник науки №5 (14) том 4

  


Ссылка для цитирования:

Карибов А.Ю. АНАЛИЗ АЛГОРИТМОВГОЛОСОВЫХ ПОМОЩНИКОВ // Вестник науки №5 (14) том 4. С. 492 - 495. 2019 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/1456 (дата обращения: 23.04.2024 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/1456



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2019.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.