ついに大きなものを手に入れた。 Qwen3.5-122B-A10B — 1220億のパラメータ。単一の消費者向けGPUには大きすぎます。 だからそれぞれ4台ずつレンタルしました...そして、力任せが本当に意味があるかどうかを確かめるためにプロのカードを1枚。 - RTX PRO 6000 1台(96GB):101.4 tok/s - 4台の5090(128GB):87.0 tok/s - 4台4090(96GB):25.1 tok/s - 4台の3090(96GB):20.8 tok/s 1枚の8,500ドルのカードが4枚のRTX 5090を上回った