chain-of-thought — AI Digest

9 мая OpenAI раскрывает случайное использование оценки цепочки рассуждений при RL-обучении шести моделей OpenAI research
6 июн Детерминированный горизонт: теоретико-информационное доказательство ограничений расширенного CoT и необходимости использования инструментов research
25 июн Квантизированные модели рассуждения думают, что им нужно думать дольше, — но это не так Meta research