Login
СправкаГлавноеНовоеИзбранное
Комментарии
Приложения
НастройкиВходРегистрация
Avatar
politichka Subscribers14
Технологии
Как правильно разговаривать с ИИ: возможности распознавания речи стремительно растут
Согласно опубликованному компанией Cartesia отчёту, в 2024 году полноценные разговорные системы ИИ серьёзно усовершенствовались, появились модели, которые синтезируют речь и языки в единое целое. К примеру, OpenAI представила голосовой режим в ChatGPT, а такие компании как Kyutai создали системы, способные слушать пользователя во время его собственной речи.

В разы снижается и стоимость использования языковых моделей у разных сервисов: с $45 до $2.75 за миллион токенов. И это при значительном увеличении качества в процессе распознавания и синтеза речи.

В 2024 году голосовые ИИ-технологии активно внедрялись в повседневную жизнь, их применяют:

– В сфере здравоохранения при записи к врачу, напоминании приёма о приёме лекарств, уточнении режима работы и т. д.

– В страховании при обработке претензий от граждан и продлении полисов.

– В логистической сфере для отслеживания грузов и планировании маршрутов.

– В гостиничном бизнесе для регистрации номеров и принятие заказов на обслуживание.

– В разных сферах малого бизнеса при автоматизации телефонных переговоров.

Среди трендов 2025 года в распознавании речи с помощью искусственного интеллекта специалисты Cartesia выделят:

1. Усовершенствование систем преобразования речи с задержкой всего 160 мс (у человека задержка в 230 мс). При этом новые модели будут лучше понимать контекст и человеческие эмоции.

2. Дальнейшее развитие компактных моделей без использования интернета в телефонах, автомобилях и различных гаджетах. Это позволит улучшить мгновенный отклик при обращении к ИИ и обеспечить приватность данных.

3. Улучшение технологий голосовых ассистентов, которые научаться решать комплексные задачи. К примеру, при обращении человека в авиакомпанию ИИ будет одновременно проверять бронирование для поиска вариантов рейсов и вносить изменения в билет – всё это в рамках логичного, задушевного разговора.

Таким образом в 2025 современные разговорные технологии продолжат апгрейд и массовое внедрение в повседневную жизнь человека.

Принимаю заказы на написание текстов на бизнес-темы, про маркетинг и IT (кроме бухгалтерии, финучёта, традиционного инвестирования и классической биржевой торговле, про крипту всё обсуждаемо). По всем вопросам пишите в личку на этом сайте.

Ещё больше интересного контента из жизни общества, политики, бизнеса и технологий читайте в Telegram-канале «Политичка».
26 Дек 2024 18:35
958
6
Комментарии (1)
Светлана   27 Дек
Почему-то меня это не радует. Ощущение, что человечество заменят ИИ и роботы.
Like1
Читайте также
Loading...
Перейти в тему:
ИнвестицииНедвижимостьЭкономикаТехнологииБизнесСтильТуризмСемьяЗдоровьеПриродаИсторияЛитература
Читать в Telegram