|
|
Технологии |
Как правильно разговаривать с ИИ: возможности распознавания речи стремительно растут
Согласно опубликованному компанией Cartesia отчёту, в 2024 году полноценные разговорные системы ИИ серьёзно усовершенствовались, появились модели, которые синтезируют речь и языки в единое целое. К примеру, OpenAI представила голосовой режим в ChatGPT, а такие компании как Kyutai создали системы, способные слушать пользователя во время его собственной речи.

В разы снижается и стоимость использования языковых моделей у разных сервисов: с $45 до $2.75 за миллион токенов. И это при значительном увеличении качества в процессе распознавания и синтеза речи.
В 2024 году голосовые ИИ-технологии активно внедрялись в повседневную жизнь, их применяют:
– В сфере здравоохранения при записи к врачу, напоминании приёма о приёме лекарств, уточнении режима работы и т. д.
– В страховании при обработке претензий от граждан и продлении полисов.
– В логистической сфере для отслеживания грузов и планировании маршрутов.
– В гостиничном бизнесе для регистрации номеров и принятие заказов на обслуживание.
– В разных сферах малого бизнеса при автоматизации телефонных переговоров.

Среди трендов 2025 года в распознавании речи с помощью искусственного интеллекта специалисты Cartesia выделят:
1. Усовершенствование систем преобразования речи с задержкой всего 160 мс (у человека задержка в 230 мс). При этом новые модели будут лучше понимать контекст и человеческие эмоции.
2. Дальнейшее развитие компактных моделей без использования интернета в телефонах, автомобилях и различных гаджетах. Это позволит улучшить мгновенный отклик при обращении к ИИ и обеспечить приватность данных.
3. Улучшение технологий голосовых ассистентов, которые научаться решать комплексные задачи. К примеру, при обращении человека в авиакомпанию ИИ будет одновременно проверять бронирование для поиска вариантов рейсов и вносить изменения в билет – всё это в рамках логичного, задушевного разговора.
Таким образом в 2025 современные разговорные технологии продолжат апгрейд и массовое внедрение в повседневную жизнь человека.
Принимаю заказы на написание текстов на бизнес-темы, про маркетинг и IT (кроме бухгалтерии, финучёта, традиционного инвестирования и классической биржевой торговле, про крипту всё обсуждаемо). По всем вопросам пишите в личку на этом сайте.
Ещё больше интересного контента из жизни общества, политики, бизнеса и технологий читайте в Telegram-канале «Политичка».
В разы снижается и стоимость использования языковых моделей у разных сервисов: с $45 до $2.75 за миллион токенов. И это при значительном увеличении качества в процессе распознавания и синтеза речи.
В 2024 году голосовые ИИ-технологии активно внедрялись в повседневную жизнь, их применяют:
– В сфере здравоохранения при записи к врачу, напоминании приёма о приёме лекарств, уточнении режима работы и т. д.
– В страховании при обработке претензий от граждан и продлении полисов.
– В логистической сфере для отслеживания грузов и планировании маршрутов.
– В гостиничном бизнесе для регистрации номеров и принятие заказов на обслуживание.
– В разных сферах малого бизнеса при автоматизации телефонных переговоров.
Среди трендов 2025 года в распознавании речи с помощью искусственного интеллекта специалисты Cartesia выделят:
1. Усовершенствование систем преобразования речи с задержкой всего 160 мс (у человека задержка в 230 мс). При этом новые модели будут лучше понимать контекст и человеческие эмоции.
2. Дальнейшее развитие компактных моделей без использования интернета в телефонах, автомобилях и различных гаджетах. Это позволит улучшить мгновенный отклик при обращении к ИИ и обеспечить приватность данных.
3. Улучшение технологий голосовых ассистентов, которые научаться решать комплексные задачи. К примеру, при обращении человека в авиакомпанию ИИ будет одновременно проверять бронирование для поиска вариантов рейсов и вносить изменения в билет – всё это в рамках логичного, задушевного разговора.
Таким образом в 2025 современные разговорные технологии продолжат апгрейд и массовое внедрение в повседневную жизнь человека.
Принимаю заказы на написание текстов на бизнес-темы, про маркетинг и IT (кроме бухгалтерии, финучёта, традиционного инвестирования и классической биржевой торговле, про крипту всё обсуждаемо). По всем вопросам пишите в личку на этом сайте.
Ещё больше интересного контента из жизни общества, политики, бизнеса и технологий читайте в Telegram-канале «Политичка».
26 Дек 2024 18:35 |
|
|
+100 ₽ |
|
Комментарии (1)
27 Дек |
Почему-то меня это не радует. Ощущение, что человечество заменят ИИ и роботы.
|
![]() |
![]() |
![]() |
![]() |
![]() |
🙂
😂
🙁
🤬
😮
🙄
🤢
😜
😛
👀
🧡
💋
👍
👎
👉
👈
🙏
👋
🤝
📈
📉
💎
🏆
💰
💥
🚀
⚡
🔥
🎁
🌞
🌼
←
→
Читайте также

Перейти в тему: