Wie ich schon gesagt habe, ist dies die nächste Stufe des Rechnens. Wir können weiter gehen und das LLM auf den Chip setzen und 10.000 Tokens pro Sekunde erhalten, wodurch jedes Binärformat in einem Bruchteil einer Sekunde erstellt werden kann, um jede Aufgabe zu erledigen.