Codex 5.4 是一個非常出色的程式設計師,但在 OpenClaw 中卻搞笑地糟糕。 不知為何,它說「我會做 X」的可能性比 Opus 高出約 4-5 倍,而不是實際去做。 甚至 Kimi 和 MiniMax 在這方面做得更好。