Cuối cùng cũng có được cái lớn nhất. Qwen3.5-122B-A10B — 122 tỷ tham số. Quá lớn cho bất kỳ GPU tiêu dùng nào. Vì vậy, tôi đã thuê 4 cái mỗi loại... và sau đó một thẻ chuyên nghiệp để xem liệu sức mạnh thô có quan trọng không. - 1x RTX PRO 6000 (96GB): 101.4 tok/s - 4x 5090 (128GB): 87.0 tok/s - 4x 4090 (96GB): 25.1 tok/s - 4x 3090 (96GB): 20.8 tok/s Một thẻ đơn giá $8,500 đã đánh bại bốn RTX 5090.