ME News 消息,4 月 21 日(UTC+8),近日,Berkeley AI 博客发布了一篇由多位研究者共同完成的工作。文中指出,在视觉世界模型中,长时程规划会惩罚朴素的梯度方法。为此,研究者们提出了 GRASP 方法,通过重塑梯度来应对这一挑战。具体技术包括提升虚拟状态、噪声状态迭代以及动作友好下降,从而使规划过程保持稳定。(来源:ME)