#multimodal
- GLM-5V-Turbo: нативная foundation-модель для мультимодальных агентов Z.ai research
- DeepSeek запустил режим распознавания изображений в gray-scale тесте DeepSeek models-llm
- Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond HKUST/NUS/Oxford/NTU research