Language Models - 搜索 News

腾讯网

别只拿大模型润色论文了！看这8位顶尖神经科学家如何用AI开挂

在过去几年里，大语言模型（large language ...

1 天

复旦北大联合美团LongCat提出TDAR：用“粗思考，细求证”破解Block ...

如今，Test-Time Scaling（测试时扩展）已成为提升模型推理能力的关键路径。而在这一浪潮中，块扩散语言模型（Block Diffusion Language Models, BDLMs） ...

1 天

复旦北大联合美团提出TDAR：破解Block Diffusion速度精度悖论

传统的动态解码往往依赖固定的置信度阈值，这在长链推理中极易导致 “一步错，步步错”。研究团队提出了有界自适应置信度解码（BACD）算法，该算法利用已生成 token 的平均置信度作为信号，动态调整当前的去噪阈值。同时，为了实现效率和效果的兼顾，增加了双重边界保护机制：上限（Upper Bound）负责在模型自信时激进加速，下限（Lower ...

腾讯网

《Python 机器学习》作者发布新书《Build a Large Language Model From Scratch》

自ChatGPT发布以来，大型语言模型（LLM）成为了推动人工智能发展的关键技术之一。著名机器学习和AI研究员、畅销书《Python 机器学习》的作者Sebastian Raschka近日发布了新书《Build a Large Language Model (From Scratch)》，为广大读者揭示了从零开始构建大型语言模型的全过程 ...

电子工程专辑

【报告】Vision–Language–Action Models for Autonomous Driving

在汽车电子、工业控制、智能设备等场景中，温度、压力、电压、速度这些物理世界的「模拟信号」，如何精准转化为CAN/CAN FD总线上可传输的「数字报文」？这是很多工程技术人员都会遇到的核心问题。本期答疑，我们结合虹科数采模块方案，从原理到实操一 ...

商业新知 on MSN

李飞飞一篇论文，ChatGPT、Claude全部是“智障”

最近一篇论文让我反复观看，那就是李飞飞联合西北大学教授做了一个测试，将ChatGPT、Claude、DEEPSEEK等主流一线模型做了一个基线测试。”“Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall ...

中国日报网

每日一词|多模态地理科学大模型 geographic sciences multi-modal Large Language ...

我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果