我們正在開源 WorldCompass,這是一個專為互動世界模型設計的強化學習後訓練框架。 🛠️ 開放訓練代碼:完全可自定義,適用於使用您自己的數據、獎勵或基礎模型進行後訓練。 ⚡ 開源檢查點:對於複雜的組合動作輸入,提供更精確的指令跟隨。 WorldCompass 顯著改善了在 HY-World 1.5 中的組合動作跟隨和長期互動。 🕹️ 現在就來玩: ⭐ GitHub: