我们正在开源 WorldCompass,这是一个专门为交互式世界模型设计的 RL 后训练框架。 🛠️ 开放训练代码:完全可定制,支持使用您自己的数据、奖励或基础模型进行后训练。 ⚡ 开源检查点:对复杂的组合动作输入提供更精确的指令跟随。 WorldCompass 显著改善了在 HY-World 1.5 中的组合动作跟随和长时间交互。 🕹️ 立即玩: ⭐ GitHub: