星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。 即日起可在官网 chat.deepseek.com 或官方 App 体验,API 服务同步上线。 DeepSeek V4 登场,Agent 玩家迎来大狂欢 Agent 能力是此次升级最核心的方向。 V4-Pro 已在 DeepSeek 内部作为 Agentic Coding 工具日 ...
他还假设了一个情况,那就是 DeepSeek 新模型在华为平台上首发,黄仁勋表示这一天对美国来说将是一个可怕的结果,因为这意味着 AI 模型被优化为在中国 AI 硬件上表现最佳,而这些模型扩散到全球之后,就会推动中国技术成为世界标准。
一作:陈紫军,合肥工业大学博士生,研究方向为大模型概率可靠性以及可解释性,曾在 ICLR,AAAI, COLING ...
近日,国家生物信息中心正式发布了面向流感病毒的基因组语言模型Influ-BERT。该模型基于Transformer架构,针对流感病毒基因组特征进行了深度优化,为流感病毒亚型鉴定、致病性预测等应用提供了一种高效、智能的计算解决方案。
第一作者是来自南方科技大学的本科生周圣力,合作者包含北京大学博士生郑明航和南方科技大学副教授、研究员郑锋,通讯作者为北京大学王选计算机研究所研究员、助理教授刘洋。 本文主要介绍来自该团队的最新论文:Scalable Object Relation ...
这项由多伦多大学与加拿大向量研究所联合开展的研究,以预印本形式发布于2026年3月,论文编号为arXiv:2604.08571。研究构建了一套名为"鲁棒推理基准"(Robust Reasoning ...
科罗拉多河晚中新世抵达比达霍奇盆地,支持大峡谷的溢流起源假说 ▲ 作者:JOHN J. Y. HE, RYAN S. CROW, JOHN DOUGLASS, CHRISTOPHER S. HOLM-DENOMA, JORGE A. VAZQUEZ, BRIAN F. GOOTEE, MARSHA I. LIDZBARSKI, LAURA S. PIANOWSKI, HARRISON GRAY, ...
我们可以讨论一些更本质的东西:“世界模型”就是某种新概念的卡尔曼滤波器。或者说把传统滤波器、控制论里人为定义的部分给去掉了。 传统滤波器的过程大概是这样的: 首先假设系统是由某种状态变量来描述的。一般记为 \bm{x} 。通常要求这个 \bm{x} ...