Arm的妙招是将专用的矩阵加速单元直接嵌入CPU。Arm终端事业部产品管理副总裁 James McNiven说, “它使端侧AI推理可以直接在CPU上完成,从而大幅减少数据在 CPU、NPU或GPU之间的传输延迟。” ...