#computer-use
- Gemini 3.5 Flash получает встроенный инструмент управления компьютером Google DeepMind tools
- WeaveBench: агенты компьютерного использования проваливаются на гибридных задачах GUI+CLI — 41% успешных выполнений Microsoft Research research
- OpenAI Codex получает Record and Replay для создания повторно используемых навыков OpenAI tools