Apresentando o RadixMLP: deduplicação de prefixos intra-lote para um pré-preenchimento de 1,4 a 5 vezes mais rápido. Tokens com prefixos idênticos (como prompts de sistema ou consultas compartilhadas) produzem ativações idênticas. @feilsystem desenvolveu o RadixMLP para eliminar essa redundância, depois o tornou open-source e o adicionou ao TEI e BEI.