Introductie van RadixMLP: intra-batch prefix deduplicatie voor 1,4–5x snellere prefill. Tokens met identieke prefixes (zoals systeem prompts of gedeelde queries) produceren identieke activaties. @feilsystem heeft RadixMLP ontwikkeld om deze redundantie te elimineren, het vervolgens open-source gemaakt en toegevoegd aan TEI en BEI.