化。 比如在大模型训练中,VenusCL 会尽可能让“计算”和“通信”重叠执行,减少 GPU 空等时间,从而提升训练效率。 &
当前文章:http://fx3.kuaiiilian.com.cn/qrj/jfk.htm
发布时间:01:13:22