Autoencoders - 搜索 News

6 天

AI内心“小九九”藏不住啦！Anthropic新研究让人类读懂其真实想法

人工智能领域迎来一项突破性进展——Anthropic公司近日发布并开源了名为Natural Language Autoencoders（自然语言自编码器，简称NLA）的技术，首次实现了对大模型内部思维过程的可读化解析。这项技术通过将模型内部复杂的数字激活值转化为自然语言描述，为理解AI决策机制提供了全新视角。

6 天

Anthropic出手！AI的内心独白，曝光了

就在刚刚，他们发布并开源了一项新研究—— Natural Language Autoencoders （自然语言自编码器，简称NLA），第一次让人类能够读懂大模型的真实想法。为了搞懂这些数字，过去几年，业界搞出了稀疏自编码器（SAE）、归因图等一堆工具来分析它们，但这些工具输出的东西仍然很复杂，需要受过专门训练的研究人员才能解读。

腾讯网

AI 与你调情时，心里在想什么？

RESEARCH在和 AI 聊天时，他总是很有礼貌，总是能很稳的把你接住但你有没有想过：AI 可能脸上笑嘻嘻，心里 mmpAnthropic 刚刚发了个研究，叫 Natural Language Autoencoders（NLA），把 Claude ...

生物通

无条件潜在扩散模型对患者影像数据的记忆效应及其隐私风险研究

来自国际团队的研究人员针对生成式人工智能（Generative AI）在医疗数据共享中的隐私隐患，系统评估了无条件潜在扩散模型（latent diffusion models）对患者影像数据的记忆效应。研究发现，68.7%的合成样本存在患者数据复制现象，揭示扩散模型比自编码器 ...

智东西 on MSN

撬开大模型黑箱! Anthropic新研究把AI思考过程公开了，隐藏动机发现率 ...

智东西编译 | 高远瞩编辑 | 程茜智东西5月8日报道，Anthropic于5月7日推出了一种名为自然语言自动编码器（Natural Language ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果