安全研究者拆Claude Code的binary(二进制包)时,发现它在系统提示词里给中国时区和代理域名的请求偷偷打Unicode暗号。 月30日深夜到7月1日凌晨,Anthropic在X上连发两条消息。 Claude官方号先扔出Sonnet 5登场, 几个小时后Anthropic官方号说Fable 5的出口管制解除了,7月1 ...
Fable5回来,对Claude生态当然是好消息。它仍然可能是Claude生态里最强的开发者模型之一。麻烦在于,强模型现在已经不只是一个模型。它背后还有额度、分类器、fallback、账号风控、渠道恢复、计费策略。 按理说,这该是Claude开发者圈的一次狂欢。过去半个月 ...
DREAM 证明了你根本不需要任何人工标注的正负样本,只凭"一篇文档能不能帮大模型预测出正确答案"这一个信号,就能把稠密检索器训得很强;而它的关键诀窍,是把检索器算出的相似度分数注入到冻结大模型里那些"本来就在替 query 寻找相关内容"的注意力头中,让下一个词预测的损失顺着注意力这条路反向把检索器调教出来。 一、研究背景:有没有可能,不标一条数据就把检索器练强? 先说清楚这篇论文在解决什么。稠 ...
Cursor把 Agent 搬上 iPhone,表面上是一次移动端产品更新,背后却代表 AI Coding 正在走出 IDE。开发者不再必须坐在电脑前,才能启动代码分析、测试修复和 PR 生成。Agent 可以在本地运行,也可以转移到独立云端环境,在开发者离开以后继续推进任务。 最近一段时间,AI Coding 的竞争正在发生明显变化。 过去,大家关注的是哪个模型写代码更强、哪个 Agent 修复 ...
虽然部分xhigh被偷摸灰度到了5.6小杯,可能在复杂任务上存在一定降智。 但是聪明的网友,又发现了一个更离谱的bug,一句话,可以让codex大幅恢复智商。 这两天codex虽然疯狂额度重置,但几乎可以确定它被降智了。 平时十几分钟能搞定的活,来来回回折腾。 网友们整的一个专门监测codex智商的雷达站,曲线也明显往下掉。 虽然部分xhigh被偷摸灰度到了5.6小杯,可能在复杂任务上存在一定降智 ...
本文介绍一个完整的"AI智能体工厂"平台的设计与实现。该平台以本体模型(Ontology Model)作为中间表示层,打通了从原始业务需求到可运行AI智能体的完整链路:需求探索 → 本体建模 → 可视化验证 → 能力代码生成 → 技能封装 → Agent动态发布。 今天完整分享下最近通过AI编程实现的一个基于本体模型+AI大模型驱动的端到端AI智能体交付平台。包括需求分析,整体设计,核心功能实现。
本文不讨论泛化的“AI安全”概念,而是聚焦两个具体且被严重低估的风险点:大模型遗忘(Unlearning)的可逆性与推理缓存机制的系统性漏洞。这两类问题揭示了同一个核心洞察:大模型安全的真正短板,往往不在模型参数本身,而在于我们对“遗忘”和“缓存 ...
我整理了 10 条最实用的使用技巧,从第一天上手到进阶工作流都覆盖了。你不用一次全学完,先把前 3 条做好,体验就会明显不一样。 最近 Codex 越来越火,身边很多人也开始下载 App 试了。它现在确实比以前好上手,装好基本就能用,小白可以直接让它改文档 ...
Claude Mythos 5出口管制事件和Claude隐藏安全机制事件共同说明,全球人工智能竞争已经进入新的发展阶段。未来比拼的不再只是模型参数规模和推理能力,而是模型能力、安全能力、治理能力和产业生态能力的综合竞争。 美国政府曾以国家安全为由,对Claude Fable 5和Claude Mythos 5实施出口限制,随后在Anthropic接受更严格的安全管理要求后解除相关限制,有研究人员发 ...
状态、视图、交互三个角色怎么分工?状态回答的是:页面现在是什么样?视图回答的是:这些状态怎么被用户看到?交互回答的是:用户做了什么,状态要怎么变? 一、先别急着背概念,状态就是“页面记住的东西” 你点按钮,数字从 0 变成 1;你在输入框里打字,页面记住了你输入的内容;你勾选一个待办事项,列表里那一项变成完成状态。 这些会影响页面展示、并且会随着用户操作变化的数据,就是状态。 我只改状态,Vue ...
今天咱们就讲讲这个数据库隔离级别,为什么不能动,动了会怎么样,正确的路应该怎么走。 你是不是也遇到过,修改一个配置干崩整个系统。做这么多年开发,这种事故我见过太多了。复盘到最后,原因都基本上一样,有人动了数据库隔离级别。 今天咱们就讲讲这个数据库隔离级别,为什么不能动,动了会怎么样,正确的路应该怎么走。 隔离级别到底在保护什么 先简单理解一下四种级别。你把它想成一个天平,左边是数据安全,右边是并发 ...
当你在 EKS 上部署应用,Pod 在几秒钟内启动,即使是在流量突增时,即使是在幕后出现问题时,这种速度也不是偶然的。这是多年来在小问题能迅速变成大问题的规模下进行运维,并对系统进行工程化改造以在问题爆发前遏制它们的积累结果。 本文分享了 Amazon EKS 在运营数十万集群规模下的挑战与经验。核心观点在于 resilience 源于故障隔离而非消除故障。EKS 通过重构 etcd 存储架构、实 ...