Presentamos RadixMLP: deduplicación intra-lote de prefijos para un prellenado 1,4–5 veces más rápido. Los tokens con prefijos idénticos (como prompts del sistema o consultas compartidas) producen activaciones idénticas. @feilsystem desarrollado RadixMLP para eliminar esta redundancia, luego lo volvió de código abierto y lo añadió a TEI y BEI.