老鸭窝av在线_午夜视频在线观_婷婷六月国产精品久久不卡_亚洲AV成人无码网站天堂久久_亚洲欧美激情四射在线日_麻豆视频在线播放_亚洲一区美女_一本一本久久a久久综合精品_国产一级久久久_欧美大电影免费观看

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

大模型新趨勢之MoE:現狀、挑戰及研究方向

2024年11月4日 07:19  天翼智庫  

2024年,全球主流企業加快推出MoE大模型,1-5月發布千億以上大模型均采用MoE優化架構,且數量超過近三年總和。MoE大模型架構憑借平衡大模型訓推成本和計算效率等優勢,更適合處理大規模數據和復雜任務,已成谷歌、OpenAI、阿里、騰訊等企業控制成本、提升模型性能、應對大模型“價格戰”的新方向。

MoE的內涵、優勢、發展歷程及主要玩家

MoE(Mixture of Experts,混合專家模型)是一種用于提升深度學習模型性能和效率的技術架構。其主要由一組專家模型和一個門控模型組成,核心思想是在處理任務時只激活部分專家模型,并通過門控模型控制專家模型的選擇和加權混合。簡言之,MoE在訓練過程通過門控模型實現“因材施教”,進而在推理過程實現專家模型之間的“博采眾長”。

圖1 MoE架構原理示意圖1

MoE的特征優勢是專家化、動態化、稀疏化,在模型研發成本、訓練/推理效率和整體性能之間實現最佳平衡。一是采用混合專家方法,各專家模型面向不同數據或任務進行針對性建模和處理,提升模型的準確性和專業能力,更好地適應多模態數據及復雜/特定任務計算。二是根據任務的需求靈活選擇并組合適宜的專家模型,使得模型能夠動態地適應不同的輸入樣本和任務場景,提高模型的靈活性、可解釋性和表達能力。三是只激活或使用部分專家模型,減少不必要的計算,提升模型計算速度并降低算力需求。研究表明,與稠密模型相比,MoE+指令調優僅使用1/3算力就能提升大模型性能約45%,縮短訓練時間2,且參數規模越大,效果越好。

MoE不是一種全新的技術,與Transformer融合邁過發展“拐點”。早期MoE主要作為一種集成學習方法,用于提升模型預測性能,如谷歌將MoE引入自然語言處理領域,提升機器翻譯性能。2020年,谷歌Gshard首次將MoE引入Transformer構建分布式并行計算架構,打開MoE發展新思路。之后,MoE逐漸進入規模發展階段,作為一種底層架構優化方法,與Transformer結合,陸續被用于推薦系統、自然語言處理、計算機視覺、多模態大模型等領域。

圖2 MoE模型發展歷程

基于Transformer的MoE已成大模型主流架構,國內外主流企業差異化推進MoE大模型布局和落地。2024年,全球MoE大模型數量呈爆發增長態勢。據公開統計,2024年1-5月全球發布MoE大模型數量約20個,超2021-2023三年總量(約10個),且以多模態大模型為主(占比約90%)。谷歌、OpenAI、阿里、華為、騰訊等大型企業側重利用MoE提升大模型性能和實用性。而Mistral AI、昆侖萬維、MiniMax、幻方量化等初創企業側重利用MoE低成本優勢搶占AI市場。

表1 部分公司MoE大模型布局及發布情況

MoE發展仍面臨挑戰

 1.訓練和微調面臨穩定性和可靠性挑戰。

訓練階段,MoE通過“條件計算”思想引入稀疏性,其將token分配給固定數量專家的離散特性帶來專家負載均衡問題,容易導致某些專家被過度利用,而其他專家未被充分利用,從而影響專家的專業化,降低模型性能。雖然這一問題,目前可以通過合并輔助損失函數等來緩解,但仍會導致模型訓練不穩定。微調階段,與稠密模型相比,稀疏模型的微調更容易產生過擬合問題,容易導致泛化能力不足,影響模型整體性能,如擁有1.6T參數量的MoE預訓練模型Switch Transformer,在SuperGLUE等常見基準上進行微調時,其整體性能卻落后于較小的模型3。

 2.大規模分布式部署難且通信成本高。

一方面,盡管MoE可以在模型參數總量不變的情況下降低計算需求,但仍需要將所有參數加載到內存中。因此,MoE對內存需求很高,需要將超大規模參數模型的專家層分別部署在不同設備以減少內存消耗,實際部署難度很大。另一方面,隨著MoE模型的參數規模/復雜度不斷提升,模型訓練期間的高效通信越來越重要。而模型復雜度與通信開銷之間的權衡一直是分布式訓練的重大問題4。MoE模型中專家之間的數據交換、并行訓練都需要機間all-to-all通信來實現,增加通信成本,且模型規模越大,通信成本越高。因此,在實際部署過程中,需要仔細設計通信策略和優化網絡拓撲,降低通信延遲和潛在的網絡擁塞。

 3.MoE架構存在原始缺陷、與現有架構集成難,部分關鍵技術仍有待攻關。

一是MoE仍存在知識混合、知識冗余等原始架構缺陷,容易導致專家同質化嚴重、專業化能力不足等問題。同時,根植于MoE的超參數調整、專家模型設計及協作、動態性適應數據變化、對數據噪聲相對敏感等技術難題仍有待解決。二是MoE架構設計很復雜,涉及網絡類型、專家數量選擇等多個方面。目前FFN、LSTM、CNN、Attention和LoRA等多種網絡架構已被用作專家模型,但各種網絡類型專家混合仍屬于新興研究領域。三是將MoE集成到現有模型框架中對于降低現有模型升級成本、推進MoE廣泛應用至關重要,但可能會損害模型性能,需要進一步優化并行預訓練和推理策略。

MoE未來重點研究方向

 1.通過優化MoE架構、改進門控算法等,提高模型性能和穩定性。

一是業界正在加快研發各種新型MoE架構,以提升模型性能或實用性。如清華和微軟聯合提出MH-MoE5,通過多頭機制彌補MoE原始缺陷,實現專家激活率由8.33%提升至90.71% ,提升模型高效擴展能力;華為提出全新LocMoE架構,并將其嵌入盤古大模型,提升模型通用性、可解釋性和易移植性等。二是多項研究表明,通過改進門控算法或調整訓練策略,能有效提升MoE模型穩定性及性能,如AdvMoE通過算法優化將門控模型和專家模型分開訓練,顯著提高MoE模型的對抗魯棒性和整體效率6;普林斯頓大學和Meta AI聯合提出一種Lory方法,引入因果分段路由策略和基于相似性的數據批處理技術,提升了模型的效率和專家專業化能力7。

 2.構建分布式訓練系統/軟件工具,提升MoE模型訓練效率、降低訓練門檻。

清華團隊發布FastMoE、FasterMoE、SmartMoE3等一系列分布式訓練系統,相比直接使用PyTorch,FastMoE可將訓練速度提升47倍;SmartMoE支持一鍵實現MoE模型分布式訓練,并優化模型訓練性能。微軟的DeepSpeed9系統提供端到端MoE訓練和推理解決方案,結合模型壓縮等技術,可提供更快、更便宜的MoE模型推理服務,與同等質量的密集模型相比,可加速4.5倍,成本降低9倍。斯坦福大學、微軟和谷歌聯合推出的MegaBlocks系統,面向單個GPU上運行多個專家的場景,提升MoE訓練效率,與最先進的Tutel庫相比,端到端訓練速度提升40%。

 3.利用模型蒸餾、硬件優化等技術,降低MoE模型部署難度。

一是通過模型蒸餾、任務級別路由等技術,保留模型性能同時降低模型復雜度。谷歌將Switch Transformer蒸餾回其對應的稠密模型,參數規模降低95%,成功保留了約30-40%的由稀疏性帶來的性能提升,加快了預訓練速度,且在推理過程中支持使用更小的模型。此外,通過任務級別路由技術將整個句子或任務直接路由到一個專家上面,或提取出用于特定服務的子網絡,有助于簡化模型結構。二是研究更適合稀疏計算的硬件優化技術,節省內存、加速計算。研究表明,塊稀疏Flash Attention注意力機制可以進一步減少GPU內存訪問次數,加快計算并節省顯存;結合PagedAttention構建vLLM11(一種LLM推理加速系統),可實現KV緩存零浪費且支持各請求間共享KV緩存,從而降低內存使用,并實現高效內存管理。

 4.通過系統性優化、共享專家、通信結構設計等,降低通信成本。

一是通過系統性優化,平衡模型復雜度與通信開銷,如ScMoE12使用一種通信重疊并行策略,克服分布式MoE模型中通信操作的固有依賴性對并行優化的阻礙,實現11%的訓練速度提升、15%的推理速度提升,且通信時間僅為8×A800-NVLink場景中標準MoE的15%。二是利用共享專家方法,減少分布式系統之間的數據傳輸,如DeepSeekMoE13采用共享專家、細顆粒度專家分割等策略,可有效解決MoE中的參數冗余、路由崩潰等問題,且在145B參數下,僅需約28.5%的計算量即可達到DeepSeek 67B的性能水平。三是通過通信結構設計,提升通信效率,如SCoMoE通過結構化全連接通信,鼓勵數據跨設備通信,結合標記聚類方法,提升了模型性能和效率。

結語

MoE為企業帶來平衡算力成本和計算效率、加快萬億/十萬億模型參數規模擴展、提升大模型實用性等機遇,但也帶來關鍵技術攻關、大規模工程部署、網絡拓撲優化等挑戰。未來應持續探索MoE架構設計、相關算法及策略改進、軟硬件協同優化等技術,加快推動MoE模型研發和業務賦能。同時,結合MOE模型分布式部署,探索千億/萬億參數規模大模型跨數據中心分布式訓練試點驗證。

注釋

1.來源:論文《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer》

2.參考論文:《Mixture-of-Experts Meets Instruction Tuning: A Winning Combination for Large Language Models》

3.參考論文:《St-moe: Designing stable and transferable sparse expert models》

4.參考論文:《Gshard: Scaling giant models with conditional computation and automatic sharding》

5.參考論文:《Multi-Head Mixture-of-Experts》

6.參考論文:《Robust Mixture-of-Expert Training for Convolutional Neural Networks》

7.參考論文:《Lory: Fully Differentiable Mixture-of-Experts for Autoregressive Language Model Pre-training》

8.參考論文:《SMARTMoE: Effciently Training Sparsely-Activated Models through Combining Offine and Online Parallelization》

9.參考論文:《DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale》

10.參考論文:《Flashattention: Fast and memory-efficient exact attention with io-awareness》

11.參考論文:《Efficient Memory Management for Large Language Model Serving with PagedAttention》

12.參考論文:《Shortcut-connected Expert Parallelism for Accelerating Mixture-of-Experts.》

13.參考論文:《Deepspeed-moe: Advancing mixture-of-experts inference and training to power next-generation ai scale.》

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
愛立信中國區總裁方迎:新質網絡創造新質價值
精彩專題
2024中國算力大會
2024年國際信息通信展
中國信科亮相2024年國際信息通信展
第25屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
jizz18女人| 成人激情av网| 一级片视频播放| 天天人人精品| 国产欧美视频一区二区| 91短视频在线观看| 性chinese极品按摩| av在线不卡观看| 亚洲午夜久久久久久久久电影院| 欧美日韩国产在线观看网站 | 亚洲成人黄色网| 美女精品自拍一二三四| 欧美freesex黑人又粗又大| 欧美黄色一级生活片| 91精品国自产在线观看| 欧美一二区视频| 老司机午夜精品99久久| 激情小说亚洲| 天天堂资源网在线观看免费视频| 久久久综合久久| 免费的一级黄色片| 高清在线视频日韩欧美| 天天综合网 天天综合色| 在线观看不卡| 无遮挡爽大片在线观看视频| 色先锋资源网| 国产精品第九页| www.玖玖玖| 国产精品人成电影| 欧美精品一二三| 国产麻豆视频一区| av成人综合| 中文视频在线| 日韩一区免费视频| av电影在线不卡| 超碰人人爱人人| 欧美二区在线看| 久久伊人色综合| 色94色欧美sute亚洲线路一ni| 免费观看久久久4p| 久久久久久久久久久久久久| 九色porny丨入口在线| 91久久精品国产性色| 精品无码在线观看| 91福利免费观看| 色综合天天狠天天透天天伊人| 高清不卡一二三区| 免费成人网www| 色综合久久久久综合一本到桃花网| 国产欧美日韩另类| 亚洲一区精品视频在线观看| 成人avav在线| 久久99精品久久久久久国产越南| 国产精品巨作av| 影音先锋男人资源在线| 4虎在线播放1区| 国产性生活网站| 精品少妇一区二区三区免费观| 在线视频一二三区| 国产精品久久久精品| 亚洲网友自拍偷拍| 国产精品久久久久三级| 久久久噜噜噜| 国产精品三级| 校园春色亚洲色图| 亚州色图欧美色图| 国产精品美女视频免费观看软件 | 成人av免费电影| 亚洲影院色无极综合| 中文字幕欧美视频在线| 欧美亚洲一区二区在线| 亚洲少妇在线| 国产一区二区在线视频你懂的| 国产情侣一区二区三区| 香蕉久久一区| 9999精品成人免费毛片在线看 | 国产福利视频导航| 国产探花一区二区三区| 久久精品国产成人精品| 欧美亚洲禁片免费| 欧美日韩免费在线视频| 久久精品视频在线看| 亚洲视屏一区| 人体久久天天| 久久久久久久影视| 很黄很色的网站| 亚洲天堂一区| 中文字幕+乱码+中文| 影音先锋男人看片资源| 在线a免费观看| 国产精品久久国产三级国电话系列| 欧美日韩一区在线观看| 欧美精品高清视频| 亚洲白虎美女被爆操| 91麻豆国产福利精品| 香蕉久久国产| 欧美特黄一级| 欧美成人精品| 无码一区二区三区视频| 色88888久久久久久影院| 国产调教视频在线观看| 亚洲小说区图片区情欲小说| 成人性爱视频在线观看| 青青草免费在线视频| 97午夜影院| 亚洲精品男人| 在线观看黄网| 天天干在线视频论坛| 国产九色在线| 一区二区三区区四区播放视频在线观看| 中文字幕免费在线| 成人福利影视| 97人人爽人人澡人人精品| 欧美日韩国产网站| 97精品国产综合久久久动漫日韩 | 亚洲一级av毛片| 中文人妻熟女乱又乱精品| 国产黄色小视频网站| 国产精品熟妇一区二区三区四区| 免费日韩中文字幕| 成人性视频欧美一区二区三区| 国产日韩一区欧美| 91在线视频导航| 91色在线观看| 国产树林野战在线播放| 天堂av在线8| wwwav国产| 日韩三级一区二区三区| 好吊色一区二区三区| 国产精品2020| 男女免费视频网站| 久久久精品视频免费| 国产成人精品一区二区无码呦| 一区二区自拍偷拍| 国产成人精品实拍在线| 国产精品自拍在线观看| 欧美精品a∨在线观看不卡| 88xx成人免费观看视频库 | 国产成人鲁鲁免费视频a| 国产v综合v亚洲欧美久久| 亚洲一区二区在线看| 亚洲视频在线观看免费| 精品国产一区二区三区av性色| 欧美影院一区二区| 亚洲欧美日韩精品久久| 中文字幕一精品亚洲无线一区| 亚洲一区二区国产| 久久影院模特热| aa日韩免费精品视频一| 日本在线视频www| 亚洲欧美精品aaaaaa片| 亚洲成人中文字幕在线| 新婚的少妇hd中文字幕| 最近中文字幕大全中文字幕免费| 欧美人善交videosg| 色猫咪免费人成网站在线观看| 四虎成人免费在线| 国产精品毛片无码| 亚洲成人一品| 国产精品久久久免费| 中文字幕高清不卡| 欧美日韩一区视频| 欧美中文在线字幕| 欧美大陆一区二区| 欧美色图校园春色| 国产精品怡红院| 欧美黑人ⅹxxx另类猛交| 黄色片在线看| 久久久久久久性潮| 噜噜噜躁狠狠躁狠狠精品视频| 亚洲自拍与偷拍| 亚洲精品一线二线三线| 亚洲一区中文字幕在线观看| 成人午夜激情av| 欧美人妻一区二区三区| 天天av天天翘| 看黄色免费网站| 在线观看免费黄视频| 国产黄色一区| 青青草一区二区三区| 1000精品久久久久久久久| 丁香网亚洲国际| 国产精品久久久久精k8| 91极品视觉盛宴| 日本在线观看天堂男亚洲| 精品日本一区二区| 欧美激情视频免费看| 99国产精品免费视频| 九九热视频在线免费观看| 一本色道久久综合亚洲| 国产高潮av| 蜜桃在线一区| 国产精品永久| 久久综合久久鬼色| 欧美日韩在线视频一区| 日韩精品视频免费专区在线播放| 91tv亚洲精品香蕉国产一区7ujn| 精品高清视频| 日本一区午夜艳熟免费| 国产精品扒开腿做爽爽| 亚洲综合网av| 麻豆影视在线| 91精品国产乱码久久久久久久| 亚洲黄色尤物视频| 精品sm捆绑视频| 欧美资源一区| 在线观看一区二区三区四区| 先锋影音男人站你懂得| 日本电影在线观看| 日本成人在线视频网站| 精品国产三级a在线观看| 欧洲亚洲一区| 欧美三根一起进三p| 色精品一区二区三区| 成人77777| 影音先锋亚洲电影| 麻豆国产91在线播放| 日韩午夜三级在线| 亚洲一区二区三区乱码| 天天插天天操天天干| 伊人色综合久久| 极品av少妇一区二区| 欧美日韩一区二区三区视频| 欧美国产日韩在线| 青青草久久伊人| 欧美一级黄色带| 只有精品亚洲| 99精品国产在热久久下载| 国产色婷婷亚洲99精品小说| 亚洲成人中文字幕| 在线免费一区| 久久嫩草捆绑紧缚| 国产女主播在线观看| 爽成人777777婷婷| 中文字幕制服丝袜成人av | 黄色永久免费网站| 一区二区乱子伦在线播放| av男人的天堂网| 第一会所亚洲原创| 国产精品高潮久久久久无| 国产成人鲁鲁免费视频a| 国产aⅴ激情无码久久久无码| 奇米影视第四狠狠777| 欧美激情欧美| 欧美一卡二卡三卡| 久久久久久久久久久免费| 毛片av在线播放| 亚洲爱爱综合网| 久久不卡日韩美女| 国产精品久久久久久久裸模 | 精品国产一区二区三区av性色 | 成人中文字幕在线观看| 国产一区二区在线观看免费视频| 手机在线理论电影| 福利网站在线观看| 91亚洲永久精品| 中文日韩电影网站| 日本中文字幕精品—区二区| 18欧美乱大交| 国产高清日韩| 亚州成人在线电影| 国产精品久久二区| 美女少妇一区二区| 九色91蝌蚪| 久久精品亚洲欧美日韩精品中文字幕| 欧美色videos| 成人激情免费在线| 国产一级特黄a高潮片| 蜜芽在线视频| 亚洲一区二区三区四区电影| 国产麻豆精品一区| xnxx国产精品| 日本成片免费高清| 亚洲欧美99| 欧美成人女星排行榜| 日本网站在线观看一区二区三区 | 成人在线资源网址| 日本黄xxxxxxxxx100| 国产69精品久久久久久久久久| 美女做a视频| 日韩啪啪网站| 欧美精品在线一区二区三区| 亚洲爆乳无码精品aaa片蜜桃| 免费视频久久久| a4yy在线播放免费观看视频| 日韩综合一区二区| 亚洲成avwww人| 一区二区三区四区视频在线| 好吊视频一区二区三区| 美女视频免费精品| 亚洲不卡一区二区三区| 波多野结衣激情| 成人免费一区二区三区| 激情久久99| 欧美色图一区二区三区| 无码人妻精品一区二区三区66| h视频在线观看免费网站| 日韩mv欧美mv国产网站| 自拍av一区二区三区| 水蜜桃亚洲一二三四在线| 色婷婷中文字幕| 亚洲人成网www| 亚洲丝袜一区在线| 国产精品久久久久9999小说| 污版网站在线观看| 欧美军人男男激情gay| 亚洲精品视频网上网址在线观看 | 亚洲一二三四五| 毛片免费在线观看| 久久噜噜亚洲综合| 亚洲国产日韩综合一区| 国产精彩自拍| 日本中文在线一区| 中文字幕欧美国内| 青娱乐免费在线视频| 欧美日韩大片| 床上的激情91.| 激情视频在线观看免费| 免费高清在线观看电视| 亚洲一区亚洲二区亚洲三区| 私密视频在线观看| 精品国产一二| 中文字幕在线永久| 国产视频第一页在线观看| 国产精品久久影院| 国产精品久久久久久久久久久新郎 | 色吧影院999| 亚洲精品20p| 日本午夜在线视频| 国产精品国产自产拍高清av| 欧美 亚洲 视频| 国产福利电影网| 欧美激情中文字幕| 丰满的少妇愉情hd高清果冻传媒| 黄色成人免费观看| 亚洲一区国产一区| 成人黄色在线免费观看| 国产一起色一起爱| 日产精品一区二区| 欧美一区二区视频在线观看2020| 亚洲少妇一区二区三区| 福利成人导航| 欧美一级二级在线观看| 泷泽萝拉在线播放| 丝袜美腿一区| 日韩国产一区三区| 日韩人妻无码一区二区三区99| 国产毛片久久久| 久久久久久久久久亚洲| 国产精品久久久久久久免费| 欧美黄色aaaa| 99久久伊人精品影院| 99国产牛牛视频在线网站| 国产福利不卡视频| 国产成人免费av电影| 午夜视频在线播放| 欧美日韩激情| 欧美在线观看视频| caoporn国产| 成人激情开心网| 国产日本欧美一区二区三区在线| 99热这里精品| 午夜亚洲精品| 特级西西444www大精品视频| 美女激情网站| 五月激情综合色| 久久中文字幕精品| 日韩欧美中文字幕电影| 国产精品久久久久av| 国产麻豆精品视频一区二区| 91麻豆文化传媒在线观看| 那种视频在线观看| 伊人75在线| 欧美色视频在线观看| 成人免费视频网站入口::| 久久99蜜桃| 51成人做爰www免费看网站| xfplay每日更新av资源在线| 成人免费视频视频在线观看免费| 欧美精品一区二区三区三州| 91高清在线观看视频| 精品福利视频导航| 久久亚洲无码视频| 国产精品乱战久久久| 国产精品久久婷婷六月丁香| 在线观看自拍| 国产 欧美在线| 日本在线视频一区| 亚洲精品国产精品国| 日本亚洲最大的色成网站www| 国产成人三级视频| 成年人网站在线| 欧美视频中文字幕| 青青草原国产视频| 欧美色图首页| ijzzijzzij亚洲大全| 国产写真视频在线观看| 亚洲人a成www在线影院| 亚洲aaa在线观看| 国产精品女主播一区二区三区|