Созданная компанией Google нейросеть Imagen, использующая метод диффузии, способна генерировать изображения на основе текстового описания. Этот искусственный интеллект формирует схематичные изображения, которые последующими этапами улучшаются для полного соответствия заданным параметрам.
Какие возможности у платформы
Imagen превращает текстовое описание в творческие работы с высокой точностью и фотореалистичностью. Каждое изображение проходит через множество этапов улучшения.
Где может быть использован ИИ
Алгоритмы этой нейросети могут быть полезны для создания уникальных творческих работ для дизайнеров, маркетологов, специалистов по социальным медиа и вебмастеров.
Как осуществляется процесс
Работа начинается с генерации небольшого изображения размером 64×64 пикселя, после чего оно преобразуется в изображение высокого разрешения 1024×1024 пикселя. В ходе этого процесса алгоритм добавляет новые детали, повышает четкость и соответствие изображения заданным параметрам.
Модель отличается максимальным фотореализмом, глубоким пониманием текстового запроса, точностью выборки и выравниванием изображения и текста.
На данный момент модель представлена только в демонстрационной версии.