Google представила нейросеть Imagen. Она создаёт самые безумные фото из любого текста

Google анонсировала нейросеть Imagen для создания фотографий из текстовых запросов.

Пока компания не дает самостоятельно протестировать возможности нейросети, но опубликовала несколько необычных вариантов. К каждому примеру указан соответствующий запрос.

Несколько примеров:

В основе Imagen лежит метод диффузии — изначально по текстовому запросу создаётся схематичный рисунок разрешением 32×32 пикселя, который впоследствии увеличивается до 256×256 и до 1024×1024 пикселей. При этом нейросеть добавляет новые элементы в рисунок, благодаря чему картинка получается высококачественной.

Разработчики сравнили Imagen с аналогичной нейросетью DALL-E 2 от OpenAI. Тестировщики при сравнении изображений от Imagen и DALL-E 2 чаще выбирали Imagen за более точную и достоверную работу. [The Verge]

Источник: iphones.ru