local-ai — AI Digest

6 мая Ollama v0.23.1: MTP-спекулятивное декодирование Gemma 4 даёт ускорение в 2× на Apple Silicon tools
9 мая llama.cpp b9085: flash attention для MiMo-V2.5 и поддержка Vertex AI Server tools
19 июн Ollama v0.30.10: модели Cohere Command A и North на Apple Silicon через MLX Ollama tools
19 июн llama.cpp b9716: мультимодальный батчинг InternVL, CUDA col2im и исправление SSE для Nginx tools
12 мая llama.cpp добавляет поддержку gpt-oss-20b в сборке от 12 мая tools
13 мая Ollama v0.23.3: исправления MLX runner и совместимость с Metal в macOS 26 Ollama tools