architecture — AI Digest

11 мая Mean Mode Screaming: Training Pathology Fix Enables 1000-Layer Diffusion Transformers research
20 мая Lance: 3B Unified Multimodal Model for Understanding, Generation, and Editing (314 HF upvotes) ByteDance Research research
4 июн Echo-Infinity: Real-Time Infinite Video Generation via Learnable Memory Query research
3 июн Do Language Models Need Sleep? Offline Recurrence as Memory Consolidation for Improved Inference Google / CMU research
25 июн Wan-Streamer v0.1: End-to-End Real-Time Interactive Foundation Model Under 550ms Latency Wan-AI research
8 мая Structural Origin of Attention Sink: Variance Discrepancy, Super Neurons, and a Fix research
9 мая Cola DLM: Continuous Latent Diffusion Language Model with Competitive Scaling research