GPT-5.4 洩漏:2M 令牌上下文 + 持久狀態 = KV 快取爆炸 這就是實時的記憶體戰爭 HBM 用於權重。SRAM 用於延遲關鍵的推理。光互連將一切綁在一起 我一直在寫的分岔不再是理論了。