Search Login
ГлавноеНовоеИзбранное
Комментарии
Графики
СправкаО проекте
ВходРегистрация
Настройки
Avatar
Global Subscribers13
Технологии
OpenAI презентовала инновационный инструмент для клонирования голоса

OpenAI анонсировала запуск нового революционного инструмента под названием Voice Engine.

Это передовая технология, позволяющая воссоздавать и имитировать голос любого человека на основе всего лишь 15-секундного аудиосемпла. Компания утверждает, что Voice Engine способен генерировать речь, звучащую предельно естественно и реалистично, с передачей эмоциональной окраски и индивидуальных особенностей голоса.

Фундаментом для разработки этого инструмента послужило уже существующее API для преобразования текста в речь, над которым OpenAI трудилась с 2022 года. На сегодняшний день компания задействует его для воспроизведения голосов в текущей версии API и функции озвучивания текста.

На официальном блоге OpenAI представлены многочисленные примеры, демонстрирующие поразительную схожесть сгенерированных голосов с оригинальными. По мнению OpenAI, Voice Engine может стать ценным ресурсом в сферах чтения, языковых переводов и помощи людям с нарушениями речи. В рамках пилотного проекта совместно с Брауновским университетом эта технология была успешно применена для создания клона голоса пациента с речевыми проблемами на основе старых аудиозаписей, сделанных для школьного проекта.

Однако эксперты высказывают опасения относительно потенциального злоупотребления подобной технологией со стороны злоумышленников. По этой причине широкомасштабный запуск Voice Engine пока приостановлен до решения вопросов конфиденциальности и безопасности. В OpenAI признают высокие риски, связанные с выпуском такого инструмента, особенно в преддверии предстоящих выборов.

Компания ведет диалог с американскими и международными партнерами из различных сфер, включая правительство, СМИ, индустрию развлечений, образовательные учреждения и гражданское общество, чтобы выработать эффективные меры по минимизации рисков.

Все участники тестирования прототипа согласились следовать политике OpenAI, запрещающей использование клонированных голосов без прямого разрешения или законных оснований. Кроме того, пользователи Voice Engine обязаны будут уведомлять свою аудиторию о том, что задействованные голоса сгенерированы искусственным интеллектом. OpenAI внедряет комплекс защитных мер, включая отслеживание происхождения звуковых данных и "превентивный мониторинг" для предотвращения нежелательного использования системы.

После официального запуска будет представлен "черный список" голосов, что не позволит ИИ клонировать голоса известных личностей слишком точно. Точная дата выхода Voice Engine пока не объявлена. Судя по предварительной информации о ценах, этот инструмент может стать более доступным по сравнению с аналогами вроде ElevenLabs.

Ожидается, что Voice Engine будет стоить $15 за миллион "символов", что эквивалентно примерно 162 500 слов - объему романа Стивена Кинга "Сияние". Упоминается также HD-версия с вдвое более высокой стоимостью, но преимущества этого варианта не уточняются. На этой неделе OpenAI также объявила о партнерстве с Microsoft по созданию мощнейшего суперкомпьютера для искусственного интеллекта под названием "Звездные врата" с бюджетом в $100 млрд.
31 Мар 2024 12:27
1.6K
3
Комментарии (0)
Читайте так же
Loading...
Перейти на главную
Читать в Telegram