#local-inference 2 пункта 11 июн Google выпускает DiffusionGemma: открытая модель на 26B с генерацией текста в 4× быстрее Google DeepMind models-llm 22 июн llama.cpp b9754: прогресс загрузки модели в реальном времени через SSE и PEG-парсер грамматик tools