AgenC //: 👾 编码代理每次会话都变得越来越愚蠢,几乎没有人自动修复它。 AgenC 在做。 不是 claude 代码。不是 cursor。都不是。 它们通过人类注意到模式并提交问题来变得更好。三次冲刺后,有人修补了一个提示。大部分内容根本没有被捕获。 如果代理只是观察自己的运行时跟踪呢? 它会捕捉到人类永远不会注意到的事情。 工具 X 在工具 Y 之后调用总是会导致输出崩溃。 上下文超过 80k,推理在第 3 步崩溃。 grok 每次都在特定的模式形状上窒息。 在足够多的会话中运行这些,你会学到其他人看不到的东西。模型滑落的确切位置,以及如何绕过它。 这些模式变成 PR。提示补丁、工具排序规则、上下文策略。合并它们,发送到每个实例。 所以现在你有两个循环在运行: 一个修复代码库。 一个修复模型在其中的行为。 代理在运行和思考方面都变得更好。同时,自动化。每天。 大多数人无法构建这个。langchain,langgraph,抽象在抽象之上。他们的可观察性是对实际发生的事情的过滤猜测。 AgenC 从底层拥有执行栈。...