格隆汇5月12日|全球权威评测机构Artificial Analysis今日发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中,智谱GLM-5.1(在Cla ...
记者获悉,全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Benchv2和SWE-Atlas-QnA主流基准上的表现。其中,闭源模型Opus4.7(在CursorCL ...
快手研发的 Agentic Coding 模型 KAT-Coder-Pro V1 近日宣布重磅升级,在知名大模型竞技场 Artificial Analysis Intelligence Index 的官方评测中取得了优异成绩。 KAT-Coder-Pro V1以 64分的成绩,成功超越了 Claude4.5Sonnet,综合模型能力强势入围总榜 Top10。更值得关注的是,该模型在 ...