30 апреля 2026

10 пунктов · ⏱ ~10 мин · неделя 2026-W18

🔥 Must-read (2)

models-llm

DeepSeek V4: официальный open-source релиз с Day-0 адаптацией под Huawei Ascend

DeepSeek
✓ verified 5 src ⏱ 1 мин models-llm

DeepSeek 29 апреля официально выпустила линейку V4 в open-source под лицензией MIT. В неё входят DeepSeek-V4-Pro на 1.6 трлн параметров (49 млрд активных) и DeepSeek-V4 на 284 млрд (13 млрд активных) — обе модели MoE с нативным контекстом 1 млн токенов. Заявлено снижение требований к памяти примерно в 9.5 раза против V3.2 и почти ликвидированный разрыв с фронтирными закрытыми моделями на бенчмарках рассуждений. Особенность релиза — оптимизация под китайские ускорители: Huawei Ascend, Cambricon, Hygon и Moore Threads завершили Day-0 адаптацию в день релиза, мультидеплой Ascend 950 ожидается во втором полугодии.

Почему это важно

Первый крупный фронтирный open-weights релиз, изначально заточенный под Ascend, а не Nvidia — это инфраструктурный сдвиг для китайского AI-стека и сигнал, что экспортные ограничения США ускорили формирование самостоятельной экосистемы инференса.

research

GLM-5V-Turbo: нативная foundation-модель для мультимодальных агентов

Z.ai
✓ verified 2 src ⏱ 1 мин research

Z.ai представила GLM-5V-Turbo — мультимодальную foundation-модель, в которой визуальное восприятие встроено как первоклассный компонент reasoning, планирования и tool use, а не подключено постфактум. Модель работает с изображениями, видео, веб-страницами и документами; авторы рапортуют рост на multimodal coding, visual tool use и агентских задачах при сохранении text-only качества. Подчёркивается роль end-to-end верификации агентских траекторий в обучении.

Почему это важно

Один из самых хайповых релизов недели на HF Daily — 2.28k upvotes. Заявка на нативно-мультимодального агента (а не VLM с прикрученным tool use) — направление, в котором Z.ai системно конкурирует с GPT-5 и Gemini.

📘 Worth-knowing (5)

audio

ElevenLabs запускает ElevenMusic — лицензированную платформу генерации, ремикса и стриминга музыки

ElevenLabs
✓ verified 3 src ⏱ 1 мин audio

ElevenLabs представила обновлённую ElevenMusic — продукт объединяет открытие музыки, ремикс существующих треков (смена жанра, темпа, переинтерпретация) и создание оригинальных композиций из текста, мелодии или настроения. Платформа построена на полностью лицензированной музыкальной модели; на старте — более 4000 независимых артистов и кураторский релиз Eleven Album Vol. 2. Позиционируется не как пассивный листенинг, а как fan-engagement слой с возможностью публикации и монетизации для креаторов.

Почему это важно

Первый крупный игрок генеративной музыки, выходящий на рынок с лицензионной моделью с самого начала, — в отличие от Suno и Udio, которые уже урегулировали иски с UMG/WMG. Объединение генерации, ремикса и стриминга в одном продукте — заявка на новую категорию между Spotify и Suno.

industry

Yandex Commerce Protocol: первые ретейлеры запускают продажи через Алису AI

Yandex
✓ verified 5 src ⏱ 1 мин industry

Яндекс раскрыл первых партнёров Yandex Commerce Protocol (YCP) — стандарта интеграции интернет-магазинов с ИИ-сценариями Алисы AI, Поиска и Яндекс Ритма. К запуску продаж напрямую из чата с Алисой AI подключаются «Стокманн», restore:, аптечные сети «Горздрав» и «36,6», оператор Билайн, бренд The Act и ряд других ритейлеров; интеграцию по YCP начали более 200 крупных онлайн-ритейлеров и брендов, ещё свыше 1600 магазинов подали заявки. Технология позволяет покупателю переходить к оплате прямо из диалога с ассистентом, без перехода на сайт магазина — Алиса AI выступает в роли торгового ИИ-агента поверх каталогов партнёров.

Почему это важно

YCP — заявка Яндекса на роль AI-commerce-стандарта в Рунете и один из первых масштабных запусков LLM-ассистента как канала прямых продаж в России. Если протокол приживётся, это меняет роль голосовых и чат-ассистентов с информационной на транзакционную.

Anthropic ведёт переговоры о раунде при оценке свыше $900 млрд

Anthropic
△ media-only 3 src ⏱ 1 мин industry

Anthropic получила преэмптивные предложения о привлечении около $50 млрд при оценке в диапазоне $850–900 млрд, что более чем удвоит текущую капитализацию и потенциально выведет компанию вперёд OpenAI как самого дорогого AI-стартапа. Переговоры на ранней стадии, term sheet не подписан. Параллельно сообщается о выручке run-rate >$30 млрд против ~$9 млрд на конец 2025.

Почему это важно

Если раунд закроется в этом диапазоне, расстановка сил в гонке frontier-лабораторий формально меняется в пользу Anthropic — впервые с 2023 года.

research

Recursive Multi-Agent Systems: общение агентов в latent space

Stanford University
✓ verified 2 src ⏱ 1 мин research

RecursiveMAS заменяет текстовый обмен между агентами на коммуникацию через latent-представления, связанные лёгким модулем RecursiveLink, и обучает всю систему совместно с помощью специального оптимизационного алгоритма. На 9 бенчмарках (математика, наука, медицина, search, код) авторы получают +8.3% средней точности, ускорение end-to-end инференса в 1.2–2.4× и сокращение расхода токенов на 34.6–75.6% относительно текстовых multi-agent baseline'ов.

Почему это важно

176 upvotes на HF Daily. Текстовый интерфейс между агентами — узкое место и по latency, и по токенам; latent communication + совместное обучение — попытка вывести MAS из режима «несколько LLM, склеенных промптами» в режим единой системы.

tools

Mistral Workflows: public preview Temporal-движка для enterprise AI-оркестрации

Mistral
✓ verified 3 src ⏱ 1 мин tools

Mistral AI 29 апреля анонсировала Workflows в public preview — durable, observable AI-оркестрацию в Studio и Le Chat. Архитектура построена на Temporal с AI-расширениями: streaming, payload handling, расширенная observability. Control plane крутится на Mistral-managed инфраструктуре, execution workers и data processing — внутри окружения клиента. Воркфлоу пишутся на Python, могут публиковаться в Le Chat для триггеринга нетехническими пользователями, каждый шаг трассируем в Studio. По данным VentureBeat, движок уже обрабатывает миллионы daily executions у ранних клиентов: ASML, ABANCA, CMA-CGM, France Travail, La Banque Postale.

Почему это важно

Прямой ответ на LangGraph/CrewAI/Temporal-самосборки для production-агентов. Hybrid-deployment (control plane managed, data plane on-prem) снимает основное возражение enterprise — data residency.

📎 Reference (3)

research

TIDE: кросс-архитектурная дистилляция для диффузионных LLM

Peking University
✓ verified 2 src ⏱ 1 мин research

TIDE — фреймворк дистилляции, переносящий знания между разными архитектурами для diffusion-LLM. Включает три компонента: TIDAL (адаптивная сила дистилляции по timestep'ам), CompDemo (контекст через mask splitting) и Reverse CALM (cross-tokenizer objective). Учители — плотный 8B и MoE на 16B, ученик — 0.6B диффузионная модель; HumanEval ученика 48.78 против 32.3 у AR baseline того же размера.

Почему это важно

Diffusion-LLM остаются маргинальной, но активно растущей альтернативой autoregressive-моделям. Кросс-архитектурный distillation от плотного teacher → MoE → диффузионный student — редкое сочетание, и заметный прыжок на code-бенчмарках при 0.6B параметрах делает идею практически интересной для on-device.

Programming with Data: test-driven data engineering для самоулучшающихся LLM

OpenDataLab
✓ verified 2 src ⏱ 1 мин research

Авторы переосмысляют data engineering для LLM как software engineering: training-данные = исходный код спецификации поведения модели, обучение = компиляция, бенчмарки = unit-тесты. Если структурированные знания извлекать из исходного корпуса и использовать одновременно для обучения и оценки, провалы модели трассируются до конкретных дефектов в данных и точечно чинятся. Метод применён к 16 дисциплинам; релизнуты knowledge base, бенчмарки и training-корпуса.

Почему это важно

77 upvotes на HF Daily. Подход формализует то, что и так делают на frontier-лабах вручную: traceability от метрики обратно к конкретному gap'у в данных. Релиз корпусов делает это воспроизводимым.

tools

OpenCode v1.14.30: Mistral Medium 3.5 с reasoning и фиксы Desktop-сессий

SST
✓ official 1 src ⏱ 1 мин tools

SST выпустила opencode v1.14.30 (29 апреля 2026). Добавлена поддержка Mistral Medium 3.5 с режимом reasoning, улучшена обработка ответов Azure, починены проблемы с сессиями в Desktop-приложении и контекст редактора при работе через несколько директорий. Линейка релизов в апреле шла плотно: v1.14.27 ввёл настраиваемый default shell, v1.14.25 — Roslyn LSP для C#/Razor, v1.14.21 — улучшенную compaction для длинных диалогов.

Почему это важно

Opencode — один из главных open-source конкурентов Claude Code и Codex, мульти-провайдерный по архитектуре. Поддержка Mistral Medium 3.5 с reasoning расширяет выбор моделей для офлайн/edge-сценариев.