腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
近期,AI4S领域先锋企业「深度原理」领衔麻省理工、哈佛、普林斯顿、斯坦福、剑桥、牛津等全球24所科研院校机构共同发布了一篇评测LLMs for Science能力高低的论文。 研究发现,当前大语言模型在推动科学发现方面的表现,还不如一个普通的本科生 ...
这项由上海交通大学邓志杰教授团队领导的研究发表于2025年1月,论文题为《Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete ...
RLVR(基于可验证奖励的强化学习)简单而粗暴:别听人的,听结果的。成为LLM的AlphaZero时刻,探索→验证→强化,还引入了全新Scaling Law 测试时计算。 (2)Vibe Coding(氛围编码)的流行:Vibe Coding(氛围编码)是前端开发者的彻底解放。人类负责审美和验收,AI负责逻辑和实现。2025是AI编程工具的「战国时代」Cursor(守旧IDE派) vs.