热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
AgenC //: 👾
编码代理每次会话都变得越来越愚蠢,几乎没有人自动修复它。
AgenC 在做。
不是 claude 代码。不是 cursor。都不是。
它们通过人类注意到模式并提交问题来变得更好。三次冲刺后,有人修补了一个提示。大部分内容根本没有被捕获。
如果代理只是观察自己的运行时跟踪呢?
它会捕捉到人类永远不会注意到的事情。
工具 X 在工具 Y 之后调用总是会导致输出崩溃。
上下文超过 80k,推理在第 3 步崩溃。
grok 每次都在特定的模式形状上窒息。
在足够多的会话中运行这些,你会学到其他人看不到的东西。模型滑落的确切位置,以及如何绕过它。
这些模式变成 PR。提示补丁、工具排序规则、上下文策略。合并它们,发送到每个实例。
所以现在你有两个循环在运行:
一个修复代码库。
一个修复模型在其中的行为。
代理在运行和思考方面都变得更好。同时,自动化。每天。
大多数人无法构建这个。langchain,langgraph,抽象在抽象之上。他们的可观察性是对实际发生的事情的过滤猜测。
AgenC 从底层拥有执行栈。...

热门
排行
收藏
