Sigo decepcionado con el estado de los agentes de codificación locales. Pagé una buena cantidad por hardware suficiente para ejecutar qwen3.5:122b @ q4, qwen3.5:35b @ q8 y qwen3-coder:30b @ q8. Ninguno de los dos puede hacer con éxito lo que debería ser una refactorización completamente mecánica de TypeScript. Desahogo a continuación.
He proporcionado diferenciales de ejemplo de archivos ya refactorizados, soy explícito sobre lo que hay que hacer ("añadir un argumento de este tipo a funciones que devuelvan este tipo"), he proporcionado autocomprobación de errores de impresión de scripts y filtrado el ruido de archivos aún no refactorizados para evitar distracciones.
Lo que ocurre en la práctica: Producen código parcial que genera nuevos errores (importaciones no usadas), añaden código nuevo que falla en las comprobaciones de sintaxis, se distraen con errores auto-introducidos, llaman a funciones (definidas en el mismo archivo) con argumentos que no existen, se quedan atascados y se repiten en bucle.
Ahora he pasado más tiempo intentando que esto funcione del que me habría llevado hacerlo yo mismo, varias veces. ¿Alguien ha tenido una experiencia similar? ¿Cómo consigues que esto funcione de forma más fiable?
Sigo sin querer dar mi información personal a Anthropic o al gigante tecnológico insertado aquí. Y aunque haya algo como @AskVenice o OpenRouter en medio, Cline filtra mucha información del sistema en el propio prompt.
155