Google анонсировала нейросеть Imagen для создания фотографий из текстовых запросов.
Пока компания не дает самостоятельно протестировать возможности нейросети, но опубликовала несколько необычных вариантов. К каждому примеру указан соответствующий запрос.
Несколько примеров:
В основе Imagen лежит метод диффузии — изначально по текстовому запросу создаётся схематичный рисунок разрешением 32×32 пикселя, который впоследствии увеличивается до 256×256 и до 1024×1024 пикселей. При этом нейросеть добавляет новые элементы в рисунок, благодаря чему картинка получается высококачественной.
Разработчики сравнили Imagen с аналогичной нейросетью DALL-E 2 от OpenAI. Тестировщики при сравнении изображений от Imagen и DALL-E 2 чаще выбирали Imagen за более точную и достоверную работу. [The Verge]
Источник: