#llama-cpp 2 пункта 17 июн llama.cpp, сборки от 16 июня: спекулятивное декодирование Eagle3, память Vulkan UMA, исправления NVFP4 tools 22 июн llama.cpp b9754: прогресс загрузки модели в реальном времени через SSE и PEG-парсер грамматик tools