#swe-bench
- Microsoft Build 2026: запуск семейства моделей MAI для GitHub Copilot без зависимости от OpenAI Microsoft models-llm
- Mistral выпустила Medium 3.5 — 128B dense, 256k контекста, открытые веса Mistral models-llm
- Mistral выпускает Medium 3.5 — открытый флагман и удалённые агенты для программирования в Vibe Mistral AI models-llm
- Poolside открывает исходники Laguna XS.2 и M.1: первые open-weight агентские модели для кодинга от американского стартапа Poolside models-llm
- DeepReinforce выпускает Ornith-1.0: открытые модели для программирования, самостоятельно обучающие свои RL-каркасы DeepReinforce tools
- SHERLOC: структурированная диагностическая локализация сокращает потребление токенов при ремонте кода на 36,7% research