mi opinión simple sobre el tema de los agentes es que todo el rendimiento sobre los modelos proviene del contexto, así que necesitas darle acceso a todos tus datos, los más sensibles de los datos sensibles, más de lo que jamás has pensado que está bien compartir antes y eso significará que querrás autoalojar a gran escala
comenzarás por autoalojar la infraestructura de VM / secretos, para realizar tareas más grandes acabarás yendo a bare metal, y luego eventualmente, cuando empieces a sentirte incómodo con los grandes modelos, comprarás un clúster de GPU y autoalojarás modelos ajustados que son buenos para el 90% de tus tareas
cuando las cosas se pongan feas, querrás registros de auditoría, alertas, limitar el radio de explosión, todo eso.
así que este no es un problema de "ingeniería de IA", ¡este es un problema de infraestructura empresarial / zerotrust muy, muy tradicional!
135