我们正在为 Pangram 准备一个挑战评估集,以更好地衡量我们的失败案例。 如果您愿意分享一个聊天链接或转录,结果是 Pangram 没有捕捉到的前沿 LLM 的输出,请与我分享。 私信开放!