#local-ai
- Ollama v0.23.1: MTP-спекулятивное декодирование Gemma 4 даёт ускорение в 2× на Apple Silicon tools
- llama.cpp b9085: flash attention для MiMo-V2.5 и поддержка Vertex AI Server tools
- Ollama v0.30.10: модели Cohere Command A и North на Apple Silicon через MLX Ollama tools
- llama.cpp b9716: мультимодальный батчинг InternVL, CUDA col2im и исправление SSE для Nginx tools
- llama.cpp добавляет поддержку gpt-oss-20b в сборке от 12 мая tools
- Ollama v0.23.3: исправления MLX runner и совместимость с Metal в macOS 26 Ollama tools