local-inference — AI Digest

11 июн Google выпускает DiffusionGemma: открытая модель на 26B с генерацией текста в 4× быстрее Google DeepMind models-llm
22 июн llama.cpp b9754: прогресс загрузки модели в реальном времени через SSE и PEG-парсер грамматик tools