12 пунктов
модели/LLM
офиц. + СМИ
4 ист.
~1 мин
OpenAI запустила ограниченный предварительный показ GPT-5.6 26 июня, включающий три уровня: Sol (флагман, $5/$30 за 1M токенов, с мультиагентной оркестровкой в «ultra mode»), Terra (сбалансированный, $2.50/$15) и Luna (быстрый, $1/$6). Доступ ограничен примерно 20 предварительно одобренными организациями по запросу правительства США для оценки перед широким выпуском. Sol занимает первое место в Terminal-Bench 2.1 по агентному программированию и ~53.5% в SecureBio Virology Capabilities Test. Пользователи ChatGPT остаются на GPT-5.5; общая доступность ожидается в течение нескольких недель. GPT-4.5 был выведен из ChatGPT в тот же день.
Почему это важно
Принудительное правительственное ограничение на предвыпуск GPT-5.6 создаёт прецедент для развёртывания фронтирных моделей: правительство США теперь активно контролирует, кто получает ранний доступ к наиболее мощным системам ИИ. Трёхуровневая структура ценообразования также сигнализирует о том, что ИИ топового уровня по умолчанию становится всё более агентным.
индустрия
офиц. + СМИ
4 ист.
~1 мин
27 июня Министерство торговли США уведомило Anthropic о том, что Claude Mythos 5 может быть повторно развёрнут примерно для 100 американских организаций, эксплуатирующих и защищающих критическую инфраструктуру — энергетику, здравоохранение, финансовые услуги и телекоммуникации. Claude Fable 5 (публичная модель) остаётся под запретом. Anthropic продолжает переговоры о расширении доступа к Mythos 5 и возврате Fable 5. Первоначальное предписание об экспортном контроле было введено 12 июня после того, как исследователи Amazon выявили векторы взлома защиты в системе кибербезопасности Fable 5.
Почему это важно
Это первая частичная отмена экспортного контроля правительства США, применённого к коммерческой модели ИИ, формирующая отраслевую систему доверенного доступа. Фронтирные модели с возможностями автономного обнаружения уязвимостей теперь подпадают под режимы экспортного контроля, ранее применявшиеся к вооружениям и полупроводниковым технологиям.
исследования
офиц. + СМИ
2 ист.
~1 мин
ViQ представляет фреймворк дискретного визуального представления, построенный на визуальной башне SigLIP2 с позиционно-осведомлённой, пошаговой конечной скалярной квантизацией (FSQ). Он преобразует изображения произвольного нативного разрешения в компактные дискретные коды, пригодные как для мультимодальных LLM (для понимания), так и для декодеров (для высококачественной реконструкции). Обучение проходит в два этапа: семантическое предобучение с выравниванием по тексту и дискретизация признаков через проксимальное обучение представлениям. ViQ соответствует непрерывным кодировщикам признаков на мультимодальных бенчмарках, обеспечивая при этом ускорение инференса на 20–70%. Принят на ECCV 2026.
Почему это важно
Дискретные визуальные токены являются ключевым узким местом для унифицированных моделей изображение-язык: предыдущие методы жертвовали либо качеством реконструкции ради семантики, либо наоборот. Агностичная к разрешению, текстово-выровненная квантизация ViQ устраняет этот разрыв. 80 голосов на HF Daily Papers.
Полный выпуск →
22 пункта
модели/LLM
офиц. + СМИ
4 ист.
~1 мин
ByteDance представила Doubao-Seed-2.1 Pro на конференции Volcano Engine FORCE 2026 23 июня — флагманскую MoE LLM, ориентированную на корпоративное программирование, длинноцепочечные агентные задачи и мультимодальное понимание с контекстными окнами до миллиона токенов. Модель демонстрирует конкурентоспособные показатели в сравнении с GPT-5.5 и Gemini 3.1 Pro, цена — 6 юаней за миллион входных токенов. На том же мероприятии ByteDance анонсировала Seedance 2.5 (генерация видео) и Seedream 5.0 Pro (генерация изображений), завершив формирование полного стека медиа-AI.
Почему это важно
Doubao теперь обслуживает 180 триллионов токенов в день — рост в 1500 раз с момента запуска, — что делает этот продукт наиболее широко развёрнутым китайским AI-продуктом; выпуск 2.1 Pro означает ставку ByteDance на монетизацию корпоративного сегмента.
видео
офиц. + СМИ
4 ист.
~1 мин
ByteDance анонсировала Seedance 2.5 на конференции Volcano Engine FORCE 23 июня — модель генерирует 30-секундные клипы нативно в 4K с глубиной цвета 10 бит. Модель принимает до 50 одновременных мультимодальных входов (изображения, аудио, 3D white-модели, стилевые референсы) и обрабатывает аудио в том же латентном пространстве, что и видео, для нативной синхронизации звука. Корпоративная бета уже доступна; публичный запуск запланирован на начало июля.
Почему это важно
Seedance 2.5 более чем вчетверо увеличивает ёмкость входных референсов по сравнению с ближайшим конкурентом, а нативная генерация 30-секундных роликов без склейки устраняет ключевое ограничение современных видеомоделей — повышая планку для длинноформатной AI-видеогенерации.
индустрия
офиц. + СМИ
4 ист.
~1 мин
22 июня 2026 года Google инвестировала $75 млн в A24 — первая доля в капитале киностудии — в рамках многолетнего исследовательского партнёрства по совместной разработке AI-инструментов для кинопроизводства с использованием Veo. Исследователи DeepMind будут встроены в активные производства A24 для создания новых творческих рабочих процессов и техник. Google не получает доступа к существующей фильмотеке A24.
Почему это важно
Это первый случай, когда крупная AI-исследовательская лаборатория приобрела долю в кинопроизводственной компании для формирования своих моделей видеогенерации через профессиональную творческую обратную связь, создавая прецедент для того, как AI-лаборатории могут добиваться принятия в творческих индустриях.
Полный выпуск →
14 пунктов
индустрия
офиц. + СМИ
3 ист.
~1 мин
24 июня OpenAI и Broadcom совместно анонсировали Jalapeño — первый ASIC OpenAI, разработанный исключительно для инференса LLM. Чип создавался от начального дизайна до tape-out девять месяцев; часть процесса проектирования была ускорена с помощью ИИ. OpenAI заявляет о примерно 50% снижении стоимости токена по сравнению с GPU текущего поколения. Прототипные развёртывания запланированы на конец 2026 года, массовое производство — на 2027–2028 годы. Чип не будет продаваться внешним заказчикам.
Почему это важно
Первый шаг OpenAI к вертикальной аппаратной интеграции снижает зависимость от Nvidia и уменьшает стоимость токена при обслуживании ChatGPT и API-продуктов в масштабе. Девятимесячный цикл разработки — частично обеспеченный самим ИИ — сигнализирует об ускорении петли разработки аппаратного обеспечения. Это ставит OpenAI в один ряд с Google (TPU), Amazon (Trainium) и Microsoft (Maia) в клубе производителей кастомного кремния.
индустрия
офиц. + СМИ
3 ист.
~1 мин
24 июня на Investor Day Qualcomm объявила о поглощении Modular — стартапа, стоящего за языком программирования Mojo и инференс-движком MAX, — в сделке полностью на акциях стоимостью около $3,92 млрд. Закрытие сделки ожидается во второй половине 2026 года при условии одобрения регуляторами. Стек Modular позволяет запускать модели ИИ на Nvidia, AMD, Intel и Apple Silicon без аппаратно-специфических правок, напрямую устраняя привязку разработчиков, которая делает CUDA незаменимой.
Почему это важно
Если Qualcomm сможет вывести кросс-аппаратную абстракцию Modular в мейнстрим, это подорвёт один из самых глубоких рвов Nvidia. Для ML-инженеров зрелый аппаратно-независимый стек инференса существенно расширит возможности деплоя и снизит зависимость от вендоров GPU. Цена в $3,92 млрд демонстрирует корпоративную убеждённость в экосистеме Mojo / MAX.
инструменты
офиц. + СМИ
2 ист.
~1 мин
24 июня Google объявила, что computer use теперь является нативным встроенным инструментом в Gemini 3.5 Flash, доступным через Gemini API и Gemini Enterprise Agent Platform. Прежде доступная только в виде отдельной специализированной модели, возможность теперь позволяет агентам видеть, кликать, печатать и прокручивать интерфейсы в браузере, на мобильных и десктопных средах. Целевое adversarial-обучение снижает риски prompt injection. Улучшены результаты на бенчмарке OSWorld по сравнению с предыдущими реализациями.
Почему это важно
Интеграция computer use непосредственно в основную модель Flash снижает порог для создания агентных рабочих процессов над реальными UI. В сочетании со скоростным и экономичным профилем Flash это делает автоматизацию на основе реальных интерфейсов доступнее для корпоративных развёртываний — и напрямую конкурирует с предложением Anthropic по computer use.
Полный выпуск →
18 пунктов
инструменты
офиц. + СМИ
4 ист.
~1 мин
Anthropic запустила Claude Tag в бета-версии 23 июня 2026 года для клиентов Claude Enterprise и Team. Функция добавляет Claude в Slack как постоянного мультипользовательского участника команды, которого можно вызывать через @-упоминание для делегирования задач. Claude со временем обучается на истории каналов, может работать асинхронно, а при включении ambient mode — проактивно сообщает о релевантной информации без явных запросов. Функция работает на базе Claude Opus 4.8 и заменяет существующее приложение Claude for Slack. По данным Anthropic, внутренняя версия уже генерирует 65% кода продуктовой команды компании.
Почему это важно
Claude Tag — наиболее прямой выход Anthropic на рынок корпоративного коллаборационного ПО: Claude превращается из чат-бота в постоянно доступного автономного агента, встроенного в рабочий слой, где реально работают команды. Мультипользовательский дизайн — один общий Claude на Slack-канал — представляет новую парадигму взаимодействия, обеспечивающую коллективное делегирование вместо индивидуальных промптов.
инструменты
офиц. + СМИ
4 ист.
~1 мин
22 июня 2026 года OpenAI расширила свою платформу кибербезопасности Daybreak: выпустила GPT-5.5-Cyber в полном релизе (85,6% на CyberGym — наивысший результат среди одиночных моделей на сегодняшний день), плагин Codex Security для поиска и устранения уязвимостей в рамках разработческих воркфлоу, а также «Patch the Planet» — open-source-инициативу, основанную совместно с Trail of Bits. Доступ к GPT-5.5-Cyber по-прежнему ограничен верифицированными специалистами по защите. В партнёрской программе Cyber Partner Program теперь более 20 вендоров, включая Cisco, CrowdStrike, Palo Alto Networks и Cloudflare; более 30 open-source-проектов — cURL, Go, Python и другие — присоединились к Patch the Planet.
Почему это важно
Расширение Daybreak — наиболее конкретный шаг OpenAI в сторону корпоративной инфраструктуры кибербезопасности: сочетание специализированной дообученной модели, инструментария для разработчиков и скоординированной программы патчинга open-source позиционирует AI как системный защитный слой, а не точечный инструмент.
модели/LLM
офиц. + СМИ
4 ист.
~1 мин
ByteDance представила Doubao-Seed-2.1-Pro 23 июня на конференции Volcano Engine FORCE в Пекине — производственную frontier-LLM для задач кодирования, долгосрочных агентных задач и мультимодального понимания. Также выпущена Doubao-Seed-2.1-Turbo вдвое дешевле (6 юаней за миллион входных токенов / 30 юаней за миллион выходных у Pro). ByteDance заявляет о паритете с GPT-5.5 на бенчмарках по кодированию и агентным задачам, занимая первые места на OSWorld, MobileWorld и MMMU-Pro. Семейство Doubao теперь превышает 180 триллионов токенов в сутки — рост в 10 раз год к году.
Почему это важно
ByteDance напрямую конкурирует с frontier-закрытыми моделями по ценам китайского рынка, используя потребительский продукт Doubao как канал дистрибуции и внутренний стенд для оценки. 180 триллионов токенов в сутки свидетельствуют о гиперпроизводственном масштабе Seed-моделей — это уже не исследовательский уровень.
Полный выпуск →
5 пунктов
индустрия
офиц. + СМИ
3 ист.
~1 мин
С 23 июня 2026 года Claude Fable 5 исключён из лимитов планов Pro, Max, Team и Enterprise с посадочной оплатой; дальнейший доступ требует кредитов использования по тарифу $10/млн входных и $50/млн выходных токенов — вдвое дороже Opus 4.8. Anthropic объяснила изменение ограничениями мощностей и сообщила, что модель может вернуться в подписочные планы после их расширения.
Почему это важно
Fable 5 — ведущая coding-модель Anthropic (лидер на SWE-bench и FrontierCode), поэтому смена ценообразования напрямую затрагивает разработчиков и команды, использующие её в агентных pipeline.
индустрия
офиц. + СМИ
4 ист.
~1 мин
Акции Zhipu AI взлетели внутри дня 22 июня 2026 года на 42%, впервые подняв рыночную капитализацию гонконгской компании выше HK$1 трлн (около US$128 млрд). Ралли обусловлено сохраняющимся интересом инвесторов к GLM-5.2 — модели с 753B параметрами, открытыми весами под лицензией MIT — а также апгрейдом от JPMorgan, повысившего прогноз выручки Zhipu на 2026–2030 годы на 7–16%. GLM-5.2 занял второе место в мировом рейтинге Code Arena по фронтенд-бенчмарку, уступив лишь Claude Fable 5 от Anthropic.
Почему это важно
То, что Zhipu AI стала первой китайской open-source AI-лабораторией с капитализацией выше HK$1 трлн, свидетельствует: открытые фронтирные модели китайских лабораторий теперь пользуются рыночным доверием уровня западных фронтирных компаний.
исследования
офиц. + СМИ
2 ист.
~1 мин
Всесторонний обзор World Action Models (WAMs) — воплощённых предиктивно-действенных моделей, предсказывающих будущие состояния для управления роботами. Авторы систематизируют 109 методов по трём философиям проектирования (Render-and-Decode, Latent-Only, Video-Generation-Free) и четырём архитектурным осям, делая вывод о том, что область движется к генерации меньшего объёма будущего при сохранении необходимого для управления.
Почему это важно
217 голосов на HuggingFace Daily Papers (лучшая статья 23 июня); представляет первую строгую таксономию, разграничивающую истинные WAMs и видеогенераторы по мере того, как компромисс между вычислениями и действием становится ключевым в проектировании воплощённого ИИ.
Полный выпуск →