Google заявляет о беспрецедентном фотореализме своего нового ИИ преобразования текста в изображение
Google продемонстрировала новую систему искусственного интеллекта, которая может создавать изображения на основе ввода текста. Его модель распространения изображений, созданная командой Brain из Google Research, предлагает "беспрецедентную степень фотореализма и глубокий уровень понимания языка".

Это не первый раз, когда мы видим подобные модели искусственного интеллекта. DALL·E от OpenAI (и его преемник) творили аналогичное колдовство, превращая текст в визуальные эффекты. Версия Google, однако, пытается создавать более реалистичные изображения. Исследователи создали эталон и попросили людей оценить каждое изображение с помощью ряда ИИ. Они "предпочитают Imagen другим моделям при параллельном сравнении, как с точки зрения качества выборки, так и с точки зрения выравнивания изображения и текста", - говорится в сообщении Google.

Он недоступен для широкой публики, и на это есть причины.
“Наборы данных такого рода часто отражают социальные стереотипы, репрессивные точки зрения и уничижительные или иным образом вредные ассоциации с маргинальными группами идентичности", - пишут исследователи.

Imagen унаследовал "социальные предубеждения и ограничения больших языковых моделей" и может изображать "вредные стереотипы и представления". Команда заявила, что ИИ кодирует социальные предубеждения, в том числе тенденцию создавать образы людей со светлыми тонами кожи и помещать их в определенные стереотипные гендерные роли. Система может быть использована для создания неприятных изображений, чтобы намеренно вызвать оскорбление.

