comme je l'ai dit, c'est la prochaine étape de l'informatique nous pouvons aller plus loin et mettre le LLM sur puce et obtenir 10k tokens par seconde, rendant instantanément n'importe quel binaire en une fraction de seconde pour effectuer n'importe quelle tâche