#cuda
- Qualcomm приобретает Modular за $3,92 млрд для противостояния привязке к CUDA Qualcomm industry
- Hugging Face Transformers: асинхронный continuous batching даёт прирост скорости инференса на 22% Hugging Face tools
- llama.cpp b9589–b9592: исправление синхронизации CUDA SSM и оптимизация памяти Mamba tools