30 апреля 2026
🔥 Must-read (2)
models-llm
DeepSeek V4: официальный open-source релиз с Day-0 адаптацией под Huawei Ascend
DeepSeekDeepSeek 29 апреля официально выпустила линейку V4 в open-source под лицензией MIT. В неё входят DeepSeek-V4-Pro на 1.6 трлн параметров (49 млрд активных) и DeepSeek-V4 на 284 млрд (13 млрд активных) — обе модели MoE с нативным контекстом 1 млн токенов. Заявлено снижение требований к памяти примерно в 9.5 раза против V3.2 и почти ликвидированный разрыв с фронтирными закрытыми моделями на бенчмарках рассуждений. Особенность релиза — оптимизация под китайские ускорители: Huawei Ascend, Cambricon, Hygon и Moore Threads завершили Day-0 адаптацию в день релиза, мультидеплой Ascend 950 ожидается во втором полугодии.
Почему это важно
Первый крупный фронтирный open-weights релиз, изначально заточенный под Ascend, а не Nvidia — это инфраструктурный сдвиг для китайского AI-стека и сигнал, что экспортные ограничения США ускорили формирование самостоятельной экосистемы инференса.
research
GLM-5V-Turbo: нативная foundation-модель для мультимодальных агентов
Z.aiZ.ai представила GLM-5V-Turbo — мультимодальную foundation-модель, в которой визуальное восприятие встроено как первоклассный компонент reasoning, планирования и tool use, а не подключено постфактум. Модель работает с изображениями, видео, веб-страницами и документами; авторы рапортуют рост на multimodal coding, visual tool use и агентских задачах при сохранении text-only качества. Подчёркивается роль end-to-end верификации агентских траекторий в обучении.
Почему это важно
Один из самых хайповых релизов недели на HF Daily — 2.28k upvotes. Заявка на нативно-мультимодального агента (а не VLM с прикрученным tool use) — направление, в котором Z.ai системно конкурирует с GPT-5 и Gemini.
📘 Worth-knowing (5)
audio
ElevenLabs запускает ElevenMusic — лицензированную платформу генерации, ремикса и стриминга музыки
ElevenLabsElevenLabs представила обновлённую ElevenMusic — продукт объединяет открытие музыки, ремикс существующих треков (смена жанра, темпа, переинтерпретация) и создание оригинальных композиций из текста, мелодии или настроения. Платформа построена на полностью лицензированной музыкальной модели; на старте — более 4000 независимых артистов и кураторский релиз Eleven Album Vol. 2. Позиционируется не как пассивный листенинг, а как fan-engagement слой с возможностью публикации и монетизации для креаторов.
Почему это важно
Первый крупный игрок генеративной музыки, выходящий на рынок с лицензионной моделью с самого начала, — в отличие от Suno и Udio, которые уже урегулировали иски с UMG/WMG. Объединение генерации, ремикса и стриминга в одном продукте — заявка на новую категорию между Spotify и Suno.
industry
Yandex Commerce Protocol: первые ретейлеры запускают продажи через Алису AI
YandexЯндекс раскрыл первых партнёров Yandex Commerce Protocol (YCP) — стандарта интеграции интернет-магазинов с ИИ-сценариями Алисы AI, Поиска и Яндекс Ритма. К запуску продаж напрямую из чата с Алисой AI подключаются «Стокманн», restore:, аптечные сети «Горздрав» и «36,6», оператор Билайн, бренд The Act и ряд других ритейлеров; интеграцию по YCP начали более 200 крупных онлайн-ритейлеров и брендов, ещё свыше 1600 магазинов подали заявки. Технология позволяет покупателю переходить к оплате прямо из диалога с ассистентом, без перехода на сайт магазина — Алиса AI выступает в роли торгового ИИ-агента поверх каталогов партнёров.
Почему это важно
YCP — заявка Яндекса на роль AI-commerce-стандарта в Рунете и один из первых масштабных запусков LLM-ассистента как канала прямых продаж в России. Если протокол приживётся, это меняет роль голосовых и чат-ассистентов с информационной на транзакционную.
Anthropic ведёт переговоры о раунде при оценке свыше $900 млрд
AnthropicAnthropic получила преэмптивные предложения о привлечении около $50 млрд при оценке в диапазоне $850–900 млрд, что более чем удвоит текущую капитализацию и потенциально выведет компанию вперёд OpenAI как самого дорогого AI-стартапа. Переговоры на ранней стадии, term sheet не подписан. Параллельно сообщается о выручке run-rate >$30 млрд против ~$9 млрд на конец 2025.
Почему это важно
Если раунд закроется в этом диапазоне, расстановка сил в гонке frontier-лабораторий формально меняется в пользу Anthropic — впервые с 2023 года.
research
Recursive Multi-Agent Systems: общение агентов в latent space
Stanford UniversityRecursiveMAS заменяет текстовый обмен между агентами на коммуникацию через latent-представления, связанные лёгким модулем RecursiveLink, и обучает всю систему совместно с помощью специального оптимизационного алгоритма. На 9 бенчмарках (математика, наука, медицина, search, код) авторы получают +8.3% средней точности, ускорение end-to-end инференса в 1.2–2.4× и сокращение расхода токенов на 34.6–75.6% относительно текстовых multi-agent baseline'ов.
Почему это важно
176 upvotes на HF Daily. Текстовый интерфейс между агентами — узкое место и по latency, и по токенам; latent communication + совместное обучение — попытка вывести MAS из режима «несколько LLM, склеенных промптами» в режим единой системы.
tools
Mistral Workflows: public preview Temporal-движка для enterprise AI-оркестрации
MistralMistral AI 29 апреля анонсировала Workflows в public preview — durable, observable AI-оркестрацию в Studio и Le Chat. Архитектура построена на Temporal с AI-расширениями: streaming, payload handling, расширенная observability. Control plane крутится на Mistral-managed инфраструктуре, execution workers и data processing — внутри окружения клиента. Воркфлоу пишутся на Python, могут публиковаться в Le Chat для триггеринга нетехническими пользователями, каждый шаг трассируем в Studio. По данным VentureBeat, движок уже обрабатывает миллионы daily executions у ранних клиентов: ASML, ABANCA, CMA-CGM, France Travail, La Banque Postale.
Почему это важно
Прямой ответ на LangGraph/CrewAI/Temporal-самосборки для production-агентов. Hybrid-deployment (control plane managed, data plane on-prem) снимает основное возражение enterprise — data residency.
📎 Reference (3)
research
TIDE: кросс-архитектурная дистилляция для диффузионных LLM
Peking UniversityTIDE — фреймворк дистилляции, переносящий знания между разными архитектурами для diffusion-LLM. Включает три компонента: TIDAL (адаптивная сила дистилляции по timestep'ам), CompDemo (контекст через mask splitting) и Reverse CALM (cross-tokenizer objective). Учители — плотный 8B и MoE на 16B, ученик — 0.6B диффузионная модель; HumanEval ученика 48.78 против 32.3 у AR baseline того же размера.
Почему это важно
Diffusion-LLM остаются маргинальной, но активно растущей альтернативой autoregressive-моделям. Кросс-архитектурный distillation от плотного teacher → MoE → диффузионный student — редкое сочетание, и заметный прыжок на code-бенчмарках при 0.6B параметрах делает идею практически интересной для on-device.
Programming with Data: test-driven data engineering для самоулучшающихся LLM
OpenDataLabАвторы переосмысляют data engineering для LLM как software engineering: training-данные = исходный код спецификации поведения модели, обучение = компиляция, бенчмарки = unit-тесты. Если структурированные знания извлекать из исходного корпуса и использовать одновременно для обучения и оценки, провалы модели трассируются до конкретных дефектов в данных и точечно чинятся. Метод применён к 16 дисциплинам; релизнуты knowledge base, бенчмарки и training-корпуса.
Почему это важно
77 upvotes на HF Daily. Подход формализует то, что и так делают на frontier-лабах вручную: traceability от метрики обратно к конкретному gap'у в данных. Релиз корпусов делает это воспроизводимым.
tools
OpenCode v1.14.30: Mistral Medium 3.5 с reasoning и фиксы Desktop-сессий
SSTSST выпустила opencode v1.14.30 (29 апреля 2026). Добавлена поддержка Mistral Medium 3.5 с режимом reasoning, улучшена обработка ответов Azure, починены проблемы с сессиями в Desktop-приложении и контекст редактора при работе через несколько директорий. Линейка релизов в апреле шла плотно: v1.14.27 ввёл настраиваемый default shell, v1.14.25 — Roslyn LSP для C#/Razor, v1.14.21 — улучшенную compaction для длинных диалогов.
Почему это важно
Opencode — один из главных open-source конкурентов Claude Code и Codex, мульти-провайдерный по архитектуре. Поддержка Mistral Medium 3.5 с reasoning расширяет выбор моделей для офлайн/edge-сценариев.