Modula Vlm - 搜索 News

从“只会看路”到“情境感知”：浪潮信息团队ICCV自动驾驶挑战赛 ...

近年来，自动驾驶技术飞速发展，正从传统的模块化流程（Modular ...

最火VLA，看这一篇综述就够了

ICLR\x26#39;25 VLA投稿量暴涨18倍，这八大趋势正在改变机器人未来 ICLR 2026爆火领域VLA（Vision-Language-Action，视觉-语言-动作）全面综述来了！如果你还不了解VLA是什么，以及这个让机器人学者集体兴奋的领域进展如何，看这一篇就够了。文章作者Moritz Reuss是2025年 ...

搜狐

DeepSeek-OCR刚发布，智谱清华联手再用 VLM 视觉处理长上下文

AI处理长文本的尽头，或许是把文本变成图或视频。 DeepSeek-OCR刚发布，马斯克说：从长远来看，人工智能模型的输入和输出中 99% 以上都将是光子。直到不能缩放。第二天，智谱就发布论文《Glyph: Scaling Context Windows via Visual-Text Compression》（通过可视文本压缩缩放 ...

新浪网

让VLM学会「心中有世界」：VAGEN用多轮RL把视觉智能变成「世界模型」 ...

当今的 AI 智能体（Agent）越来越强大，尤其是像 VLM（视觉-语言模型）这样能「看懂」世界的智能体。但研究者发现一个大问题：相比于只处理文本的 LLM 智能体，VLM 智能体在面对复杂的视觉任务时，常常表现得像一个「莽撞的执行者」，而不是一个「深思熟虑 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果