#image-generation
- Ideogram 4.0 выходит как открытая модель text-to-image с 9,3B параметров и нативным разрешением 2K Ideogram image
- Midjourney V8.1 вышла в GA: HD-режим ускорен в 3 раза, восстановлены image prompts Midjourney image
- Flow-OPD: on-policy дистилляция даёт +29 пунктов по GenEval на Stable Diffusion 3.5 research
- Qwen-Image-2.0: унифицированная генерация и редактирование изображений в разрешении 2K, первое место на AI Arena Alibaba research
- Asymmetric Flow Models: SOTA FID 1,57 на ImageNet через ранг-асимметричную параметризацию скоростей Stanford University research
- Lance: 3B Unified Multimodal Model for Understanding, Generation, and Editing (314 HF upvotes) ByteDance Research research
- Midjourney V8.1 стал моделью по умолчанию: нативный вывод 2K и ускорение в 4–5 раз Midjourney image
- Black Forest Labs выпускает FLUX.2 с мультиреференсным кондиционированием и выходом 4 МП Black Forest Labs image
- Krea публикует открытые веса Krea 2 Raw и Turbo: 12B DiT-модель генерации изображений за 2 секунды Krea image
- ByteDance анонсирует Seedream 5.0 Pro: генерация изображений со встроенным онлайн-поиском и глубоким рассуждением ByteDance image
- InterleaveThinker: RL-пайплайн «планировщик+критик» для перемежающейся генерации текста и изображений CUHK Multimedia Lab research
- Midjourney V8.1 становится моделью по умолчанию, заменяя V7 с нативным разрешением 2K Midjourney image
- OpenAI выводит из эксплуатации API DALL-E 2 и DALL-E 3 12 мая OpenAI image
- API OpenAI DALL-E 2 и DALL-E 3 отключены 12 мая OpenAI image
- Yandex Improves Alice AI ART: Russian Text in Generated Images 3x More Accurate Yandex image
- InterleaveThinker: RL-фреймворк для агентной генерации чередующегося текста и изображений research
- DanceOPD: дистилляция генеративных полей на основе онлайн-выборки для унифицированной генерации изображений ByteDance Seed research
- Qwen-Image-Agent: агентное построение контекста для преодоления разрыва в неполноте промптов в T2I Qwen (Alibaba) research
- Сбер представил Kandinsky 6.0 Image — флагманскую модель генерации изображений Sber image
- Midjourney запускает Draft mode для V8.1 с сеткой исследования из 24 изображений Midjourney image
- Сбер запускает AI-фестиваль Гига-Арт на базе Kandinsky 6.0 Sber industry