Подробный обзор
Сервис умеет превращать текст в речь, причём звучит максимально естественно — голос не только не роботизированный, но и может шептать, менять интонацию, подстраиваться под эмоции и даже имитировать диалог двух разных людей сразу. Поддержка 24+ языков, переключение между ними на лету — без пауз и смены голоса, что удобно для мультиязычных проектов. Можно управлять стилем речи: задать акцент, попросить говорить драматично или, наоборот, спокойно.
Gemini TTS хорошо подходит для создания аудиоконтента, озвучки материалов, автоматизации колл-центров, генерации персонажей для игр и приложений, а также для любых задач, где важна живая речь от ИИ. Есть поддержка экспорта аудиофайлов, что пригодится для подкастов, видео и презентаций.
💡 Вывод
Хороший инструмент для тех, кому нужна быстрая, качественная и гибкая озвучка текста с поддержкой нескольких языков и эмоций. Подходит для прототипирования, креативных задач, автоматизации и мультиязычных проектов. Не хватает универсальности (нет озвучки любых файлов), но для задач генерации живой речи из текста — отличный вариант.
💰 Цены и тарифы
Бесплатно: через Google AI Studio можно генерировать озвучку для личных задач, тестировать разные голоса и стили, экспортировать аудиофайлы.
Платно: через Gemini API — тарификация по количеству токенов (примерно $1.25 за миллион токенов на вход и $10 за миллион на выход при небольших запросах, для больших — дороже). Коммерческое использование, интеграция в приложения, массовая генерация — только на платных тарифах.