Právě jsme dokončili největší decentralizovaný předškolení LLM v historii: Covenant-72B. Bez povolení, na podsíti Bittensor 3.
Parametry 72B. ~1,1T žetonů. Komoditní internet. Žádný centralizovaný cluster. Žádný whitelist. Kdokoli s GPU mohl volně vstupovat nebo odcházet.
1/n
Tento pátek na TGIF si @DistStateAndMe sedne s @erfan_mhi, hlavním výzkumníkem stojícím za PULSE.
Článek PULSE ukazuje, jak Grail dosahuje 100násobného snížení šířky pásma pro synchronizaci váhy v distribuovaném RL tréninku. To je to, co dělá decentralizované posilované učení praktickým oproti komoditnímu internetu.
Erfan vám vysvětlí, co tento výzkum znamená pro plán Grailu a kam se subnet odtud ubírá.