人工智能领域迎来一项突破性进展——Anthropic公司近日发布并开源了名为Natural Language Autoencoders(自然语言自编码器,简称NLA)的技术,首次实现了对大模型内部思维过程的可读化解析。这项技术通过将模型内部复杂的数字激活值转化为自然语言描述,为理解AI决策机制提供了全新视角。
就在刚刚,他们发布并开源了一项新研究—— Natural Language Autoencoders (自然语言自编码器,简称NLA) ,第一次让人类能够读懂大模型的真实想法。 为了搞懂这些数字,过去几年,业界搞出了稀疏自编码器 (SAE) 、归因图等一堆工具来分析它们,但这些工具输出的东西仍然很复杂,需要受过专门训练的研究人员才能解读。
RESEARCH在和 AI 聊天时,他总是很有礼貌,总是能很稳的把你接住但你有没有想过:AI 可能脸上笑嘻嘻,心里 mmpAnthropic 刚刚发了个研究,叫 Natural Language Autoencoders(NLA),把 Claude ...
来自国际团队的研究人员针对生成式人工智能(Generative AI)在医疗数据共享中的隐私隐患,系统评估了无条件潜在扩散模型(latent diffusion models)对患者影像数据的记忆效应。研究发现,68.7%的合成样本存在患者数据复制现象,揭示扩散模型比自编码器 ...
智东西 编译 | 高远瞩 编辑 | 程茜 智东西5月8日报道,Anthropic于5月7日推出了一种名为自然语言自动编码器(Natural Language ...