Подробный обзор
Whisk — экспериментальный инструмент от Google для генерации изображений и видео. В отличие от классических генераторов вроде Midjourney или Ideogram, где пользователь задаёт длинные текстовые описания, Whisk позволяет использовать изображения в качестве подсказок. Суть работы проста: вы загружаете три изображения — для объекта (subject), сцены (scene) и стиля (style), а система на их основе генерирует уникальный визуальный результат.
За обработку отвечает связка двух флагманских моделей Google: Gemini (создаёт подробные текстовые описания загруженных изображений) и Imagen 4 (на их основе формирует финальное изображение). Такой подход позволяет быстро комбинировать визуальные идеи, экспериментировать с различными стилями, сценами и объектами. При необходимости пользователь может вручную корректировать автоматически сгенерированные текстовые подсказки, чтобы добиться более точного результата.
Whisk ориентирован, прежде всего, на быстрый креатив и визуальный брейншторминг, а не на профессиональную ретушь. Среди дополнительных возможностей:
🔹 Возможность скачивать понравившиеся варианты
🔹 Итеративное редактирование: можно менять отдельные элементы и получать новые версии
🔹 Поддержка текстовых уточнений для большей детализации (но это опционально)
🔹 Генерация изображений в “развлекательных” форматах — например, плюшевые игрушки, стикеры, значки
🔹 Анимация изображений с помощью встроенной модели Veo2 от Google (бесплатно 10 раз в месяц)
Сервис доступен через Google Labs, с февраля 2025 года — более чем в 100 странах (за исключением ЕС, Великобритании, Индии, России и ряда других регионов).




