来自Meta AI的华人科学家刘壮团队,联合AI大神何恺明, 图灵奖得主Yann LeCun等大牛搞了个大新闻——他们的最新论文证明了:Transformer 模型,竟然可以不用Normalization(归一化)层也能达到甚至超越现有性能!,论文已经被CVPR 2025接收 Normalization层在现代神经网络 ...