終於拿到了大貨。 Qwen3.5-122B-A10B — 1220億個參數。對任何單一消費者GPU來說都太大了。 所以我租了四個每種... 然後再加一張專業卡,看看強行計算是否真的有用。 - 1x RTX PRO 6000 (96GB): 101.4 tok/s - 4x 5090 (128GB): 87.0 tok/s - 4x 4090 (96GB): 25.1 tok/s - 4x 3090 (96GB): 20.8 tok/s 一張價值$8,500的卡超過了四張RTX 5090的表現。