AI Digest

28 июня 2026

12 пунктов

модели/LLM офиц. + СМИ 4 ист. ~1 мин

OpenAI запустила ограниченный предварительный показ GPT-5.6 26 июня, включающий три уровня: Sol (флагман, $5/$30 за 1M токенов, с мультиагентной оркестровкой в «ultra mode»), Terra (сбалансированный, $2.50/$15) и Luna (быстрый, $1/$6). Доступ ограничен примерно 20 предварительно одобренными организациями по запросу правительства США для оценки перед широким выпуском. Sol занимает первое место в Terminal-Bench 2.1 по агентному программированию и ~53.5% в SecureBio Virology Capabilities Test. Пользователи ChatGPT остаются на GPT-5.5; общая доступность ожидается в течение нескольких недель. GPT-4.5 был выведен из ChatGPT в тот же день.

Почему это важно

Принудительное правительственное ограничение на предвыпуск GPT-5.6 создаёт прецедент для развёртывания фронтирных моделей: правительство США теперь активно контролирует, кто получает ранний доступ к наиболее мощным системам ИИ. Трёхуровневая структура ценообразования также сигнализирует о том, что ИИ топового уровня по умолчанию становится всё более агентным.

#gpt-5.6 #reasoning #agentic #api #us-policy #safety

индустрия офиц. + СМИ 4 ист. ~1 мин

27 июня Министерство торговли США уведомило Anthropic о том, что Claude Mythos 5 может быть повторно развёрнут примерно для 100 американских организаций, эксплуатирующих и защищающих критическую инфраструктуру — энергетику, здравоохранение, финансовые услуги и телекоммуникации. Claude Fable 5 (публичная модель) остаётся под запретом. Anthropic продолжает переговоры о расширении доступа к Mythos 5 и возврате Fable 5. Первоначальное предписание об экспортном контроле было введено 12 июня после того, как исследователи Amazon выявили векторы взлома защиты в системе кибербезопасности Fable 5.

Почему это важно

Это первая частичная отмена экспортного контроля правительства США, применённого к коммерческой модели ИИ, формирующая отраслевую систему доверенного доступа. Фронтирные модели с возможностями автономного обнаружения уязвимостей теперь подпадают под режимы экспортного контроля, ранее применявшиеся к вооружениям и полупроводниковым технологиям.

#mythos-5 #fable-5 #export-controls #us-policy #cybersecurity #national-security

исследования офиц. + СМИ 2 ист. ~1 мин

ViQ представляет фреймворк дискретного визуального представления, построенный на визуальной башне SigLIP2 с позиционно-осведомлённой, пошаговой конечной скалярной квантизацией (FSQ). Он преобразует изображения произвольного нативного разрешения в компактные дискретные коды, пригодные как для мультимодальных LLM (для понимания), так и для декодеров (для высококачественной реконструкции). Обучение проходит в два этапа: семантическое предобучение с выравниванием по тексту и дискретизация признаков через проксимальное обучение представлениям. ViQ соответствует непрерывным кодировщикам признаков на мультимодальных бенчмарках, обеспечивая при этом ускорение инференса на 20–70%. Принят на ECCV 2026.

Почему это важно

Дискретные визуальные токены являются ключевым узким местом для унифицированных моделей изображение-язык: предыдущие методы жертвовали либо качеством реконструкции ради семантики, либо наоборот. Агностичная к разрешению, текстово-выровненная квантизация ViQ устраняет этот разрыв. 80 голосов на HF Daily Papers.

#multimodal #visual-tokenization #quantization #representation-learning #eccv-2026

Полный выпуск →

26 июня 2026

22 пункта

модели/LLM офиц. + СМИ 4 ист. ~1 мин

ByteDance представила Doubao-Seed-2.1 Pro на конференции Volcano Engine FORCE 2026 23 июня — флагманскую MoE LLM, ориентированную на корпоративное программирование, длинноцепочечные агентные задачи и мультимодальное понимание с контекстными окнами до миллиона токенов. Модель демонстрирует конкурентоспособные показатели в сравнении с GPT-5.5 и Gemini 3.1 Pro, цена — 6 юаней за миллион входных токенов. На том же мероприятии ByteDance анонсировала Seedance 2.5 (генерация видео) и Seedream 5.0 Pro (генерация изображений), завершив формирование полного стека медиа-AI.

Почему это важно

Doubao теперь обслуживает 180 триллионов токенов в день — рост в 1500 раз с момента запуска, — что делает этот продукт наиболее широко развёрнутым китайским AI-продуктом; выпуск 2.1 Pro означает ставку ByteDance на монетизацию корпоративного сегмента.

#doubao #bytedance #moe #agents #coding #multimodal #chinese-lab #release

видео офиц. + СМИ 4 ист. ~1 мин

ByteDance анонсировала Seedance 2.5 на конференции Volcano Engine FORCE 23 июня — модель генерирует 30-секундные клипы нативно в 4K с глубиной цвета 10 бит. Модель принимает до 50 одновременных мультимодальных входов (изображения, аудио, 3D white-модели, стилевые референсы) и обрабатывает аудио в том же латентном пространстве, что и видео, для нативной синхронизации звука. Корпоративная бета уже доступна; публичный запуск запланирован на начало июля.

Почему это важно

Seedance 2.5 более чем вчетверо увеличивает ёмкость входных референсов по сравнению с ближайшим конкурентом, а нативная генерация 30-секундных роликов без склейки устраняет ключевое ограничение современных видеомоделей — повышая планку для длинноформатной AI-видеогенерации.

#text-to-video #image-to-video #video-generation #bytedance #chinese-lab #4k #release

индустрия офиц. + СМИ 4 ист. ~1 мин

22 июня 2026 года Google инвестировала $75 млн в A24 — первая доля в капитале киностудии — в рамках многолетнего исследовательского партнёрства по совместной разработке AI-инструментов для кинопроизводства с использованием Veo. Исследователи DeepMind будут встроены в активные производства A24 для создания новых творческих рабочих процессов и техник. Google не получает доступа к существующей фильмотеке A24.

Почему это важно

Это первый случай, когда крупная AI-исследовательская лаборатория приобрела долю в кинопроизводственной компании для формирования своих моделей видеогенерации через профессиональную творческую обратную связь, создавая прецедент для того, как AI-лаборатории могут добиваться принятия в творческих индустриях.

#deepmind #funding #partnership #hollywood #video-generation #research

Полный выпуск →

25 июня 2026

14 пунктов

индустрия офиц. + СМИ 3 ист. ~1 мин

24 июня OpenAI и Broadcom совместно анонсировали Jalapeño — первый ASIC OpenAI, разработанный исключительно для инференса LLM. Чип создавался от начального дизайна до tape-out девять месяцев; часть процесса проектирования была ускорена с помощью ИИ. OpenAI заявляет о примерно 50% снижении стоимости токена по сравнению с GPU текущего поколения. Прототипные развёртывания запланированы на конец 2026 года, массовое производство — на 2027–2028 годы. Чип не будет продаваться внешним заказчикам.

Почему это важно

Первый шаг OpenAI к вертикальной аппаратной интеграции снижает зависимость от Nvidia и уменьшает стоимость токена при обслуживании ChatGPT и API-продуктов в масштабе. Девятимесячный цикл разработки — частично обеспеченный самим ИИ — сигнализирует об ускорении петли разработки аппаратного обеспечения. Это ставит OpenAI в один ряд с Google (TPU), Amazon (Trainium) и Microsoft (Maia) в клубе производителей кастомного кремния.

#openai #hardware #inference #asic #broadcom #chip #compute

индустрия офиц. + СМИ 3 ист. ~1 мин

24 июня на Investor Day Qualcomm объявила о поглощении Modular — стартапа, стоящего за языком программирования Mojo и инференс-движком MAX, — в сделке полностью на акциях стоимостью около $3,92 млрд. Закрытие сделки ожидается во второй половине 2026 года при условии одобрения регуляторами. Стек Modular позволяет запускать модели ИИ на Nvidia, AMD, Intel и Apple Silicon без аппаратно-специфических правок, напрямую устраняя привязку разработчиков, которая делает CUDA незаменимой.

Почему это важно

Если Qualcomm сможет вывести кросс-аппаратную абстракцию Modular в мейнстрим, это подорвёт один из самых глубоких рвов Nvidia. Для ML-инженеров зрелый аппаратно-независимый стек инференса существенно расширит возможности деплоя и снизит зависимость от вендоров GPU. Цена в $3,92 млрд демонстрирует корпоративную убеждённость в экосистеме Mojo / MAX.

#hardware #inference #acquisition #cuda #compiler #compute

инструменты офиц. + СМИ 2 ист. ~1 мин

24 июня Google объявила, что computer use теперь является нативным встроенным инструментом в Gemini 3.5 Flash, доступным через Gemini API и Gemini Enterprise Agent Platform. Прежде доступная только в виде отдельной специализированной модели, возможность теперь позволяет агентам видеть, кликать, печатать и прокручивать интерфейсы в браузере, на мобильных и десктопных средах. Целевое adversarial-обучение снижает риски prompt injection. Улучшены результаты на бенчмарке OSWorld по сравнению с предыдущими реализациями.

Почему это важно

Интеграция computer use непосредственно в основную модель Flash снижает порог для создания агентных рабочих процессов над реальными UI. В сочетании со скоростным и экономичным профилем Flash это делает автоматизацию на основе реальных интерфейсов доступнее для корпоративных развёртываний — и напрямую конкурирует с предложением Anthropic по computer use.

#gemini #computer-use #agents #enterprise #automation #agentic

Полный выпуск →

24 июня 2026

18 пунктов

инструменты офиц. + СМИ 4 ист. ~1 мин

Anthropic запустила Claude Tag в бета-версии 23 июня 2026 года для клиентов Claude Enterprise и Team. Функция добавляет Claude в Slack как постоянного мультипользовательского участника команды, которого можно вызывать через @-упоминание для делегирования задач. Claude со временем обучается на истории каналов, может работать асинхронно, а при включении ambient mode — проактивно сообщает о релевантной информации без явных запросов. Функция работает на базе Claude Opus 4.8 и заменяет существующее приложение Claude for Slack. По данным Anthropic, внутренняя версия уже генерирует 65% кода продуктовой команды компании.

Почему это важно

Claude Tag — наиболее прямой выход Anthropic на рынок корпоративного коллаборационного ПО: Claude превращается из чат-бота в постоянно доступного автономного агента, встроенного в рабочий слой, где реально работают команды. Мультипользовательский дизайн — один общий Claude на Slack-канал — представляет новую парадигму взаимодействия, обеспечивающую коллективное делегирование вместо индивидуальных промптов.

#claude-code #enterprise #agents #agentic-ai #anthropic

инструменты офиц. + СМИ 4 ист. ~1 мин

22 июня 2026 года OpenAI расширила свою платформу кибербезопасности Daybreak: выпустила GPT-5.5-Cyber в полном релизе (85,6% на CyberGym — наивысший результат среди одиночных моделей на сегодняшний день), плагин Codex Security для поиска и устранения уязвимостей в рамках разработческих воркфлоу, а также «Patch the Planet» — open-source-инициативу, основанную совместно с Trail of Bits. Доступ к GPT-5.5-Cyber по-прежнему ограничен верифицированными специалистами по защите. В партнёрской программе Cyber Partner Program теперь более 20 вендоров, включая Cisco, CrowdStrike, Palo Alto Networks и Cloudflare; более 30 open-source-проектов — cURL, Go, Python и другие — присоединились к Patch the Planet.

Почему это важно

Расширение Daybreak — наиболее конкретный шаг OpenAI в сторону корпоративной инфраструктуры кибербезопасности: сочетание специализированной дообученной модели, инструментария для разработчиков и скоординированной программы патчинга open-source позиционирует AI как системный защитный слой, а не точечный инструмент.

#cybersecurity #openai #codex #open-source #enterprise

модели/LLM офиц. + СМИ 4 ист. ~1 мин

ByteDance представила Doubao-Seed-2.1-Pro 23 июня на конференции Volcano Engine FORCE в Пекине — производственную frontier-LLM для задач кодирования, долгосрочных агентных задач и мультимодального понимания. Также выпущена Doubao-Seed-2.1-Turbo вдвое дешевле (6 юаней за миллион входных токенов / 30 юаней за миллион выходных у Pro). ByteDance заявляет о паритете с GPT-5.5 на бенчмарках по кодированию и агентным задачам, занимая первые места на OSWorld, MobileWorld и MMMU-Pro. Семейство Doubao теперь превышает 180 триллионов токенов в сутки — рост в 10 раз год к году.

Почему это важно

ByteDance напрямую конкурирует с frontier-закрытыми моделями по ценам китайского рынка, используя потребительский продукт Doubao как канал дистрибуции и внутренний стенд для оценки. 180 триллионов токенов в сутки свидетельствуют о гиперпроизводственном масштабе Seed-моделей — это уже не исследовательский уровень.

#doubao #seed #coding #agents #multimodal #china

Полный выпуск →

23 июня 2026

5 пунктов

индустрия офиц. + СМИ 3 ист. ~1 мин

С 23 июня 2026 года Claude Fable 5 исключён из лимитов планов Pro, Max, Team и Enterprise с посадочной оплатой; дальнейший доступ требует кредитов использования по тарифу $10/млн входных и $50/млн выходных токенов — вдвое дороже Opus 4.8. Anthropic объяснила изменение ограничениями мощностей и сообщила, что модель может вернуться в подписочные планы после их расширения.

Почему это важно

Fable 5 — ведущая coding-модель Anthropic (лидер на SWE-bench и FrontierCode), поэтому смена ценообразования напрямую затрагивает разработчиков и команды, использующие её в агентных pipeline.

#claude-fable-5 #anthropic #pricing #billing #api #subscription

индустрия офиц. + СМИ 4 ист. ~1 мин

Акции Zhipu AI взлетели внутри дня 22 июня 2026 года на 42%, впервые подняв рыночную капитализацию гонконгской компании выше HK$1 трлн (около US$128 млрд). Ралли обусловлено сохраняющимся интересом инвесторов к GLM-5.2 — модели с 753B параметрами, открытыми весами под лицензией MIT — а также апгрейдом от JPMorgan, повысившего прогноз выручки Zhipu на 2026–2030 годы на 7–16%. GLM-5.2 занял второе место в мировом рейтинге Code Arena по фронтенд-бенчмарку, уступив лишь Claude Fable 5 от Anthropic.

Почему это важно

То, что Zhipu AI стала первой китайской open-source AI-лабораторией с капитализацией выше HK$1 трлн, свидетельствует: открытые фронтирные модели китайских лабораторий теперь пользуются рыночным доверием уровня западных фронтирных компаний.

#zai-org #glm #open-weights #china #market-cap #stock

исследования офиц. + СМИ 2 ист. ~1 мин

Всесторонний обзор World Action Models (WAMs) — воплощённых предиктивно-действенных моделей, предсказывающих будущие состояния для управления роботами. Авторы систематизируют 109 методов по трём философиям проектирования (Render-and-Decode, Latent-Only, Video-Generation-Free) и четырём архитектурным осям, делая вывод о том, что область движется к генерации меньшего объёма будущего при сохранении необходимого для управления.

Почему это важно

217 голосов на HuggingFace Daily Papers (лучшая статья 23 июня); представляет первую строгую таксономию, разграничивающую истинные WAMs и видеогенераторы по мере того, как компромисс между вычислениями и действием становится ключевым в проектировании воплощённого ИИ.

#embodied-ai #world-models #survey #robotics #multimodal #vla

Полный выпуск →

28 июня 2026

OpenAI представляет семейство GPT-5.6: Sol, Terra и Luna — ограниченный выпуск только для одобренных правительством организаций

Правительство США частично восстановило доступ к Anthropic Mythos 5 примерно для 100 организаций критической инфраструктуры

ViQ: текстово-выровненные дискретные визуальные представления с поддержкой произвольного разрешения (ECCV 2026)

26 июня 2026

ByteDance представляет флагманскую LLM Doubao-Seed-2.1 Pro на конференции FORCE

ByteDance представляет Seedance 2.5: нативная генерация 30-секундного 4K-видео с 50 мультимодальными входами

Google DeepMind инвестирует $75 млн в A24 и формирует первое AI-исследовательское партнёрство с киностудией

25 июня 2026

OpenAI и Broadcom представили Jalapeño — первый собственный чип OpenAI для инференса

Qualcomm приобретает Modular за $3,92 млрд для противостояния привязке к CUDA

Gemini 3.5 Flash получает встроенный инструмент управления компьютером

24 июня 2026

Anthropic запускает Claude Tag — постоянного AI-участника команды в Slack

OpenAI расширяет Daybreak: полный релиз GPT-5.5-Cyber, плагин Codex Security и Patch the Planet

ByteDance представляет Doubao-Seed-2.1-Pro на конференции Volcano Engine FORCE

23 июня 2026

Claude Fable 5 выходит из подписочных планов и переходит на кредиты использования

Рыночная капитализация Zhipu AI превысила HK$1 трлн на волне GLM-5.2

World Action Models: обзор