感谢 @GoogleDeepMind 的 TranslateGemma 模型。这是运行非常顺利的 4B 4bit 量化版本,适用于移动设备,使用 MLX Swift。