近年来,自动驾驶技术飞速发展,正从传统的模块化流程(Modular ...
ICLR\x26#39;25 VLA投稿量暴涨18倍,这八大趋势正在改变机器人未来 ICLR 2026爆火领域VLA(Vision-Language-Action,视觉-语言-动作)全面综述来了! 如果你还不了解VLA是什么,以及这个让机器人学者集体兴奋的领域进展如何,看这一篇就够了。 文章作者Moritz Reuss是2025年 ...
AI处理长文本的尽头,或许是把文本变成图或视频。 DeepSeek-OCR刚发布,马斯克说:从长远来看,人工智能模型的输入和输出中 99% 以上都将是光子。直到不能缩放。 第二天,智谱就发布论文《Glyph: Scaling Context Windows via Visual-Text Compression》(通过可视文本压缩缩放 ...
当今的 AI 智能体(Agent)越来越强大,尤其是像 VLM(视觉-语言模型)这样能「看懂」世界的智能体。但研究者发现一个大问题:相比于只处理文本的 LLM 智能体,VLM 智能体在面对复杂的视觉任务时,常常表现得像一个「莽撞的执行者」,而不是一个「深思熟虑 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果