我为什么推荐Droid? 看看它如何分解工作,这就是我认为Droid表现更好的原因。 我从未见过它不使用计划,不勾选任务,不运行验证标准。 即使是质量较低的模型在其中也表现良好,因为它迫使它们按正确的顺序执行指令,而不至于过于复杂。 昨天我看到Claude、GPT等都在制作清单,留下了一半未勾选,紧凑,并且各自高高兴兴地继续。