software-engineering — AI Digest

24 июн Sakana AI Releases Fugu: Multi-LLM Orchestrator Achieving SoTA on SWE-Bench Pro Sakana AI research
11 июн Arbor: Generalist Autonomous ML Research via Hypothesis-Tree Refinement NLPIR Lab research
11 июн DeNovoSWE: Full Repository Generation Jumps from 5.8% to 47.2% with Synthetic Training Data AweAI Team research
16 июн FastContext: Specialized Exploration Subagent Cuts Coding Agent Token Usage by 60% Microsoft / Shanghai Jiao Tong University research
17 июн Anthropic Study: Domain Expertise Drives Agentic Coding Success, Not Programming Background Anthropic research
9 июн SWE-Explore: Benchmarking Repository Exploration as the Binding Constraint in Coding Agents Shanghai Jiao Tong University research
24 июн SHERLOC: Structured Diagnostic Localization Cuts Code Repair Token Usage by 36.7% research