Otevřené váhy nejsou otevřený trénink. @AddieF38654 z našeho týmu popsala její zkušenost s pokusem o posttrénování modelu MoE s 1T parametry pomocí stávající open source infrastruktury. Zjistíme, kolik opičích patchů je potřeba k posttrénování modelu s otevřenými váhami. Nit🧵