Google представляет Imagen 2: ИИ-генерация изображений с потрясающим фотореализмом

Imagen 2: ИИ-генерация изображений

После 15 месяцев ожидания Google выпустил обновление своего генератора изображений с искусственным интеллектом, Imagen. Этот прорыв демонстрирует значительные улучшения в технологии генерации изображений, предоставляя заметные улучшения по сравнению с предыдущей версией.

Анонс Imagen 2.0
Дискретное объявление о Imagen 2.0 произошло в ходе конференции Google I/O в мае 2023 года, и платформа теперь доступна исключительно для клиентов Google Cloud, использующих Vertex AI.

Технический обзор
Работая на искусственном интеллекте, Google Imagen генерирует фотореалистичные изображения на основе текстовых описаний. Imagen 2.0 использует модель диффузии, конкретный тип нейронной сети, для итеративного улучшения изображений на основе предоставленных подсказок.

Обучение и возможности
Imagen обучается на обширных наборах данных, включающих текст и изображения, что позволяет ему генерировать точные и высокодетализированные изображения. Условная модель диффузии изначально отображает текстовые вложения на изображения размером 64×64, а затем происходит увеличение разрешения до 256×256 и 1024×1024.

Основные улучшения в Imagen 2.0:
  1. Улучшенные описания изображений: Imagen 2.0 включает более детализированные описания изображений, улучшая понимание связи между текстовыми подсказками и визуальным результатом.
  2. Лучшая обработка рук: Преодолевая распространенные трудности, с которыми сталкиваются генераторы изображений с искусственным интеллектом, Imagen 2.0 отличается в создании реалистичных и детализированных изображений рук.
  3. Эстетика генерации изображений: Обученный на модели эстетики изображений, Imagen 2.0 оценивает изображения по параметрам освещения, композиции и резкости, отдавая предпочтение тем, которые соответствуют человеческим эстетическим предпочтениям.
  4. Возможности редактирования изображений: Imagen 2.0 поддерживает инпейтинг и аутпейтинг для редактирования изображений.
Примеры и приложения
Возможности Imagen демонстрируются на различных примерах, включая генерацию реалистичных сцен по литературным подсказкам и точное добавление текста к изображениям. Заметна его способность создавать логотипы и названия брендов.

Imagen 2 примеры

Доступность и ценообразование
На данный момент Imagen доступен через Google Vertex AI для выбранных пользователей. Сведения о ценообразовании доступны на странице цен Google Cloud.

Поднятая фотореалистичность Imagen 2.0 вносит определенные заботы о безопасности, вызывая вопросы о наборе данных, использованных для обучения модели. Преданность Google развитию искусственного интеллекта очевидна, однако остаются вопросы о доступности и удобстве использования их инструментов искусственного интеллекта.

Оригинальная статья на английском языке доступна здесь.
 

Пользователи онлайн

Сейчас на форуме нет ни одного пользователя.
Назад
Сверху