Estamos abrindo o WorldCompass, um framework pós-treinamento de RL projetado especificamente para Modelos de Mundos Interativos. 🛠️ Open Training Code: Totalmente personalizável para pós-treinamento com seus próprios dados, recompensas ou modelos base. ⚡ Checkpoint de código aberto: Seguir instruções mais preciso para entradas de ações complexas e composicionais. O WorldCompass melhora significativamente o acompanhamento da ação composicional e a interação de longo prazo em HY-World 1.5. 🕹️ Jogue agora: ⭐ GitHub: