Como he estado diciendo, esta es la siguiente etapa de la computación podemos ir más allá y poner el LLM en chip y obtener 10.000 tokens por segundo, haciendo que cualquier binario en un segundo dividido pueda realizar cualquier tarea