W końcu udało mi się zdobyć ten duży. Qwen3.5-122B-A10B — 122 miliardy parametrów. Zbyt duży dla jakiejkolwiek pojedynczej karty GPU dla konsumentów. Więc wynająłem 4 z każdej... a potem jedną profesjonalną kartę, aby zobaczyć, czy siła bruta ma znaczenie. - 1x RTX PRO 6000 (96GB): 101.4 tok/s - 4x 5090 (128GB): 87.0 tok/s - 4x 4090 (96GB): 25.1 tok/s - 4x 3090 (96GB): 20.8 tok/s Jedna karta za 8,500 dolarów pokonała cztery RTX 5090s