Computerphile Deepseek

DeepSeek连发两篇论文背后，原来藏着一场学术接力

2026 年 1 月过半，我们依然没有等来 DeepSeek V4，但它的模样已经愈发清晰。最近，DeepSeek 连发了两篇论文，一篇解决信息如何稳定流动，另一篇聚焦知识如何高效检索。第一篇论文（mHC）出来的时候，打开论文的人都表示很懵，直呼看不懂，让 AI 助手用各种 ...

腾讯网

R2还是V4？Model1引爆DeepSeek新一代模型猜想

2026年1月20日，恰逢DeepSeek-R1发布一周年，一个代号为Model1的模型，意外出现在DeepSeek的FlashMLA代码更新中，成为这个周年庆里最惊喜的隐藏彩蛋，瞬间引发了大量网友的关注！在梳理FlashMLA的代码更新时发现，Model1的身影贯穿于28处记录中。值得注意的是，在核心 ...

新浪网

DeepSeek最新王炸模型：VLM架构重磅突破，AI像人一样读图

智东西1月27日报道，刚刚，DeepSeek开源了其面向OCR场景的专用模型DeepSeek-OCR 2，技术报告同步发布。这一模型是对去年DeepSeek-OCR模型的升级，其采用的新型解码器让模型看图、读文件的顺序更像人，而不是像机械的扫描仪。简单来说，以前的模型阅读模式是从 ...

新浪网

刚刚，DeepSeek又探索新架构了，开源OCR 2

嘿！刚刚，DeepSeek 又更新了！这次是更新了十月份推出的 DeepSeek-OCR 模型。当时 DeepSeek-OCR 的出世，引起了大家对视觉压缩的关注与讨论，而这一次，DeepSeek 对视觉编码下手了。可以说，刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构，实现了视觉编码从「 ...

36氪

DeepSeek母公司去年进账50亿，够烧2380个R1

R1横空出世一年后，DeepSeek依然没有新融资。在大模型玩家上市的上市、融资的融资的热闹中，DeepSeek还是那么高冷，并且几乎没有任何商业化的动作。即便如此，AGI也没有落下—— 持续产出高水平论文，作者名单也相当稳定，新版R1论文甚至还「回流」了一位。

爱范儿

DeepSeek R1发布一年了，不卷功能、不融资、不着急，凭什么「硬控」硅谷

使用微信扫码将网页分享到微信「服务器繁忙，请稍后再试。」一年前，我也是被这句话硬控的用户之一。 DeepSeek 带着 R1 在一年前的今天（2025.1.20）横空出世，一出场就吸引了全球的目光。那时候为了能顺畅用上 DeepSeek，我翻遍了自部署教程，也下载过不少 ...

电子工程专辑

DeepSeek新架构“MODEL1”代码曝光，最快2月发布

此次曝光源于DeepSeek对其开源推理加速库FlashMLA的更新。在横跨114个文件的代码变动中，出现了28处“MODEL1”标识符，其技术路径与现有的V32（即DeepSeek-V3.2）架构存在显著差异，暗示这是一个经过彻底重构的新设计。近日， DeepSeek在GitHub上的代码库更新中，意外 ...

第一财经

DeepSeek论文上新！下一代大模型实现“记忆分离”，V4不远了？

前述内容由第一财经“星翼大模型”智能生成，相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别，第一财经不承担由此产生的任何责任。如您有疑问或需要更多信息，可以联系我们 [email protected] 业内猜测这或许就是DeepSeek V4的研究路线图。

36氪

DeepSeek又拿第一，首创「因果流」视觉推理，超越Gemini

DeepSeek-OCR2开源，引入因果流视觉编码器，刷新SOTA。【导读】DeepSeek开源DeepSeek-OCR2，引入了全新的DeepEncoder V2视觉编码器。该架构打破了传统模型按固定顺序（从左上到右下）扫描图像的限制，转而模仿人类视觉的「因果流（Causal Flow）」逻辑。 DeepSeek又双叒叕 ...

第一财经