天天報道:微軟推ZeRO++新系統:減少大模型訓練時間和成本
                發布時間:2023-06-26 17:00:45 文章來源:動點科技
                這些通信優化大大減少了通信量。


                (相關資料圖)

                微軟研究人員推出了名為ZeRO++的新系統,用于優化訓練大型AI模型,以應對高數據傳輸開銷和有限帶寬的難題。

                ZeRO++ 建立在現有的 ZeRO 優化的基礎上,并提供增強的通信策略,以提高訓練效率,減少訓練時間和成本。

                像Turing-NLG、ChatGPT和GPT-4這樣的大型模型的訓練需要跨多個GPU設備占用大量內存和計算資源。DeepSpeed開發的ZeRO++引入了通信優化策略,以克服在每個GPU上批量大小較小時或在低帶寬集群上進行訓練時ZeRO的限制。

                ZeRO優化系列包括ZeRO-Inference,它使用GPU的集體內存和計算能力,將模型狀態分割在多個GPU之間。然而,在訓練過程中,ZeRO可能會產生較高的通信開銷。ZeRO++通過整合三組通信優化來解決這個問題:量化權重通信(qwZ)、分層權重分割(hpZ)和量化梯度通信(qgZ)。

                為了減少參數通信量,ZeRO++對權重進行量化,利用基于塊的量化方法來保持訓練精度。這種優化的量化過程比基本量化更快更準確。為了在反向傳播過程中盡量減少通信開銷,ZeRO++通過在每臺機器上保持完整的模型副本,以 GPU 內存換取通信。梯度通信方面,ZeRO++引入了一種新的量化梯度通信范式 qgZ,可以減少跨節點的流量和延遲。

                這些通信優化大大減少了通信量。與ZeRO相比,ZeRO++實現了減少高達4倍的通信量,提高了訓練吞吐量和效率。當在每個GPU上使用小批量大小時,在高帶寬集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%。在低帶寬集群中,與ZeRO-3相比,ZeRO++實現了平均2倍的加速,使得大模型訓練在更多種類的集群上更為可行。

                ZeRO++不僅限于訓練場景,還可應用于對話模型中使用的人類反饋強化學習(RLHF)訓練。通過將ZeRO++與DeepSpeed-Chat集成,RLHF訓練可以獲得更好的生成和訓練吞吐量,生成吞吐量提高了高達2.25倍,訓練吞吐量提高了1.26倍,超過了ZeRO。

                DeepSpeed已經發布了ZeRO++,以使大型模型的訓練在AI社區更加高效和可訪問。該系統旨在加快訓練速度,減少通信開銷,并實現更大的批量大小,從而節省時間和資源。研究人員和實踐者可以利用ZeRO++更有效地訓練像ChatGPT這樣的模型,并在AI領域探索新的可能性。

                來源:站長之家

                標簽:

                資訊播報

                樂活HOT

                娛樂LOVE

                精彩推送

                亚洲AV无码一区二区三区DV| 亚洲成av人在片观看| 亚洲日韩中文字幕| 亚洲成色在线综合网站| 亚洲色偷拍区另类无码专区| 久久精品国产亚洲AV| 亚洲av无码日韩av无码网站冲| 亚洲精品理论电影在线观看| 亚洲精品日韩一区二区小说| 亚洲av无码一区二区三区天堂| 亚洲Aⅴ在线无码播放毛片一线天 亚洲avav天堂av在线网毛片 | 涩涩色中文综合亚洲| 亚洲综合久久一本伊伊区| 亚洲六月丁香婷婷综合| 久久综合久久综合亚洲| 亚洲午夜无码久久久久小说| 亚洲欧洲专线一区| 18禁亚洲深夜福利人口| 亚洲国产成人a精品不卡在线| 亚洲国产主播精品极品网红| 久久久青草青青国产亚洲免观 | 亚洲AV成人无码天堂| 亚洲中文字幕精品久久| 亚洲国产一区二区三区在线观看| 亚洲欧美日韩一区二区三区| 亚洲av无码成人精品国产| mm1313亚洲精品无码又大又粗| 青青青亚洲精品国产| 亚洲第一区精品观看| 91麻豆精品国产自产在线观看亚洲| 亚洲色欲久久久综合网| 久久亚洲AV午夜福利精品一区| 久久精品国产亚洲AV高清热 | 国产精品亚洲w码日韩中文| 亚洲欧洲成人精品香蕉网| 久久亚洲精品成人综合| 亚洲成人福利在线观看| 亚洲人成电影网站色| 亚洲视频人成在线播放| 亚洲AV无码乱码国产麻豆穿越| 亚洲福利电影在线观看|