El entrenamiento de pesos abiertos no es un entrenamiento abierto. @AddieF38654 de nuestro equipo escribió sobre su experiencia intentando post-entrenar un modelo MoE de 1T parámetros utilizando la infraestructura de código abierto existente. Descubramos cuántos parches de mono se necesitan para post-entrenar un modelo de pesos abiertos. Un hilo🧵