最近Cursor发布了Composer 1.5。 这一版把强化学习规模扩大了20倍,后训练计算量甚至超过了基座模型的预训练投入。还加了thinking tokens和自我摘要机制,让模型能在复杂编程任务里做更深度的推理。 但你去Twitter、Reddit、Hacker News上逛一圈,相较于之前几乎听不到 ...