今週金曜日のTGIFでは、@DistStateAndMe PULSEのリードリサーチャーである@erfan_mhiに対談します。 PULSEの論文は、Grailが分散型強化学習(RL)トレーニングにおけるウェイト同期のために帯域幅を100倍に削減することを示しています。これが、分散型強化学習が一般的なインターネット上で実用的な理由です。 エルファンは、この研究がGrailのロードマップに何を意味するのか、そしてサブネットが今後どこへ向かうのかを解説します。