AI
AI Digest
EN RU
Главная Архив О проекте RSS

#training-dynamics

2 пункта

  • 9 июн О геометрии on-policy дистилляции: парадигма обучения, отличная от SFT и RLVR Hong Kong University of Science and Technology research
  • 26 июн Плотного надзора недостаточно: слепое пятно считывания в зациклённых языковых моделях research

ai-digest.kerby.pro

© 2026 Алексей Лукин · CC BY 4.0

RSS · JSON Feed · О проекте