#research
- Google DeepMind инвестирует $75 млн в A24 и формирует первое AI-исследовательское партнёрство с киностудией Google DeepMind industry
- RoPE доказуемо не справляется с длинными контекстами: locality bias и согласованность токенов нарушаются research
- MiniMax Sparse Attention: сокращение вычислений в 28 раз при контексте 1M токенов без потери качества MiniMax research
- MaxProof: модель MiniMax превышает пороги золотых медалей IMO и USAMO в формальной математике MiniMax research
- Google DeepMind публикует годовой отчёт о результатах AlphaEvolve Google DeepMind research
- Crafter: мультиагентный фреймворк для генерации редактируемых научных иллюстраций — +16 пунктов над базовыми моделями (103 апвоута на HF) Tsinghua University research
- GrepSeek: обучение поисковых агентов для прямого взаимодействия с корпусом через команды оболочки (93 апвоута на HF) University of Massachusetts Amherst research
- EvoArena: LLM-агенты набирают лишь 40% в динамически изменяющихся средах MIT / NUS / Salesforce research
- WeaveBench: агенты компьютерного использования проваливаются на гибридных задачах GUI+CLI — 41% успешных выполнений Microsoft Research research
- InterleaveThinker: RL-пайплайн «планировщик+критик» для перемежающейся генерации текста и изображений CUHK Multimedia Lab research
- OpenAI запускает Economic Research Exchange для изучения влияния ИИ OpenAI industry
- BetaPRM: process rewards с учётом неопределённости сокращают расход reasoning-токенов на 33% research
- Google DeepMind и партнёры запускают исследовательский фонд по безопасности мульти-агентных AI на $10 млн Google DeepMind industry
- Anthropic публикует первый Public Record: опрос 52 000 американцев об отношении к AI Anthropic research
- Google DeepMind приобрела миноритарную долю в CCP Games для исследований мультиагентных систем в EVE Online Google DeepMind industry