模态大模型在代码能力上进步惊人,但在基础视觉任务上却频繁失误。UniPat AI 构建了一个极简的视觉智能体框架——SWE-Vision,让模型可以编写并执行 Python 代码来处理和验证自己的视觉判断。在五个主流视觉基准测试中,SWE-Vision 均达到了当前最优水平。
计算机工程师和程序员长期以来依赖逆向工程来实现程序功能,而不直接复制受版权保护的原始代码。简单来说,就是在不侵犯版权的前提下“模仿”软件的行为和功能。过去,这种做法通常遵循所谓的“洁净房间(clean room)”原则:由完全不接触原始代码的人重新实现功能,以确保生成的新代码不会构成原作的衍生作品。
项目维护者 Dan Blanchard 为让 chardet 项目加入 Python 标准库,利用 AI 编程工具 Claude Code,在短短 5 天内彻底重写了该项目,并推出了 7.0 版本。 新版本不仅在性能方面最高可提升 48 倍, Blanchard 还借此将项目原本严格限制复用与分发的 LGPL 协议,更改为了允许在闭源商业项目中使用的宽松 MIT 协议。