11月5日消息,微软宣布,其 Azure ND GB300 v6 虚拟机在 Meta 的 Llama270B 模型上实现了每秒推理速度达110 万 token 的行业新纪录。
微软表示:“单个 NVL72 机架的 Azure ND GB300 v6 虚拟机实现了总计每秒 1,100,000 个 token 的推理吞吐量。 这刷新了 AI 推理领域的新纪录 ,超越了此前在同一 NVIDIA GB200 NVL72 机架上使用 ...
微软近日宣布,其Azure ND GB300v6虚拟机在Meta的Llama2 70B模型上实现了每秒110万tokens的行业新纪录。微软CEO萨提亚·纳德拉(Satya Nadella)在社交媒体上表示:“这一成就源于我们与英伟达(NVIDIA)的长期合作,以及我们在生产规模上运行人工智能的专业知识。” ...
智通财经APP获悉,微软(MSFT.US)宣布,其Azure ND GB300v6虚拟机在Meta的Llama270B模型上实现了每秒推理速度达110万token的行业新纪录。据悉,Azure ND ...
随着AI运算需求不断升温,NVIDIA 正从「晶片供应商」转型为「AI生态系整合者」。近期NVIDIA与南韩多家大型企业包括 Samsung Electronics、Hyundai Motor、SK Group 与 ...
Iren 股价在微软签署了一份为期五年、价值 97 亿美元的云服务协议后飙升至历史新高,该协议确保了对 Nvidia 下一代 GB300 芯片的访问,这再次表明 AI 计算竞争正在加速。该协议包括一笔 20% 的预付款,通过与 Dell 的另外一项 58 亿美元的供应框架加快硬件采购。Iren (IREN) 日内一度上涨至 49.44 美元,较去年同期上涨超过 460%,同时一批从矿业转型为 AI ...
在AI大模型的风潮之下,如今端侧AI已经成为行业的发展主流之一。2025年的CES上,NVIDIA首次推出个人AI超级计算机Project DIGITS,搭载Grace Blackwell的小型化集成版本GB10,最高可提供达1 ...
十轮网科技资讯 on MSN
NVIDIA Vera Rubin Superchip登场,打造超级数据中心数字孪生与物理AI
NVIDIA首席执行官黄仁勋于美国华盛顿特区举行的GTC DC大会中,展示Vera Rubin Superchip以及相关产品,并说明通过数字孪生物科技术规划超级数据中心,以及针对机器人应用的物理AI。 黄仁勋先前已于Computex 2024 ...
据Tweak Town报道,英伟达与诺基亚将携手加速下一代6G通信的开发与部署,将AI原生移动网络与基础设施纳入体系。此次合作将借助NVIDIA的Grace CPU与Blackwell GPU,为全球通信业开启一个以人工智能为核心的新时代。
近日,前OculusVRCTO约翰·卡马克发推文,对NVIDIA新推出的DGXSpark迷你超算提出颇多质疑,其售价高达4000美元的同时,存在性能虚标,过热等问题。而且官方标称的240W功耗释放,实际使用时最高被限制到了100W。同时, ...
去中心化金融(DeFi)充斥着赚取国债收益率的稳定币,而人工智能(AI)行业中的小型企业则在为扩建配备新GPU的数据中心筹集资金时面临困难。 一款名为 USD.AI 的新稳定币协议 希望弥合这一差距通过将加密货币的闲置流动性转化为为训练和运行人工智能的机器 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果