在科技迅猛发展的今天,小米再次引领潮流,推出了全球首个融合自动驾驶与具身智能的开源模型——MiMo-Embodied。这一创新成果由小米MiMo团队的核心成员罗福莉主导,标志着小米在智能科技领域的又一次突破,尤其是在自动驾驶和人工智能(AI)技术的结合上。
近年来,自动驾驶技术飞速发展,正从传统的模块化流程(Modular ...
今天和大家分享一篇很有意思的新工作,来自中国电信、西北工业大学、华为和香港大学的研究者们共同探索了这个问题。他们提出了 GRPO-RM ,成功地将GRPO这套强化学习框架应用到了视觉表征模型的后训练(post-training)中。
在现代人工智能的训练过程中,有一个看似微小却影响巨大的技术细节——权重衰减。这项由德克萨斯大学奥斯汀分校的陈理章、乔纳森·李等研究者与谷歌团队共同完成的研究,于2025年10月发表在机器学习顶级期刊上,论文编号为arXiv:2510.12402v1。