research — AI Digest

26 июн Google DeepMind инвестирует $75 млн в A24 и формирует первое AI-исследовательское партнёрство с киностудией Google DeepMind industry
18 мая RoPE доказуемо не справляется с длинными контекстами: locality bias и согласованность токенов нарушаются research
14 июн MiniMax Sparse Attention: сокращение вычислений в 28 раз при контексте 1M токенов без потери качества MiniMax research
14 июн MaxProof: модель MiniMax превышает пороги золотых медалей IMO и USAMO в формальной математике MiniMax research
8 мая Google DeepMind публикует годовой отчёт о результатах AlphaEvolve Google DeepMind research
2 июн Crafter: мультиагентный фреймворк для генерации редактируемых научных иллюстраций — +16 пунктов над базовыми моделями (103 апвоута на HF) Tsinghua University research
2 июн GrepSeek: обучение поисковых агентов для прямого взаимодействия с корпусом через команды оболочки (93 апвоута на HF) University of Massachusetts Amherst research
14 июн EvoArena: LLM-агенты набирают лишь 40% в динамически изменяющихся средах MIT / NUS / Salesforce research
14 июн WeaveBench: агенты компьютерного использования проваливаются на гибридных задачах GUI+CLI — 41% успешных выполнений Microsoft Research research
14 июн InterleaveThinker: RL-пайплайн «планировщик+критик» для перемежающейся генерации текста и изображений CUHK Multimedia Lab research
10 июн OpenAI запускает Economic Research Exchange для изучения влияния ИИ OpenAI industry
18 мая BetaPRM: process rewards с учётом неопределённости сокращают расход reasoning-токенов на 33% research
12 июн Google DeepMind и партнёры запускают исследовательский фонд по безопасности мульти-агентных AI на $10 млн Google DeepMind industry
14 июн Anthropic публикует первый Public Record: опрос 52 000 американцев об отношении к AI Anthropic research
7 мая Google DeepMind приобрела миноритарную долю в CCP Games для исследований мультиагентных систем в EVE Online Google DeepMind industry