7月7日,在華為開發(fā)者大會 2023 上,華為云盤古大模型3.0亮相。
華為常務董事、華為云CEO張平安介紹道,華為云盤古大模型3.0是一個完全面向行業(yè)的大模型系列,包括“5+N+X”三層架構:L0層的基礎大模型、L1層行業(yè)大模型以及L2層場景模型。
L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五個基礎大模型,提供滿足行業(yè)場景中的多種技能需求。盤古3.0為客戶提供100億參數(shù)、380億參數(shù)、710參數(shù)和1000億參數(shù)的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業(yè)多樣化需求。同時提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業(yè)直接調用。無論多大參數(shù)規(guī)模的大模型,盤古提供一致的能力集。
(資料圖片)
L1層是N個行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據訓練的行業(yè)通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。
L2層為客戶提供了更多細化場景的模型,更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業(yè)應用或特定業(yè)務場景,為客戶提供“開箱即用”的模型服務。
張平安表示盤古大模型3.0“不做詩只做事”,將圍繞“行業(yè)重塑”“技術扎根”“開放同飛”三大創(chuàng)新方向,為行業(yè)客戶、伙伴及開發(fā)者提供更好的服務。據介紹,盤古大模型已在金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路、氣象等諸多行業(yè)發(fā)揮巨大價值。
在政務領域,華為云攜手深圳市福田區(qū)政務服務數(shù)據管理局,上線了基于盤古政務大模型的福田政務智慧助手小福,能夠精準理解民眾咨詢意圖,改變傳統(tǒng)的一網通辦模式,把老百姓的話語轉化為政府辦事的語言。盤古政務大模型對超過20萬條政務數(shù)據進行精調,包括12345熱線、政策文件、政務百科等,掌握了豐富的法律法規(guī)、辦事流程等行業(yè)知識。基于盤古政務大模型的小福,在一網通辦業(yè)務中體現(xiàn)出行業(yè)性、專業(yè)性、領先性和惠民性。
在煤礦領域,盤古礦山大模型已經在全國8個礦井規(guī)模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業(yè),不僅能讓煤礦工人的工作環(huán)境更加舒適,而且可以極大地減少安全事故。
據公開資料,華為盤古系列基礎大模型于2021發(fā)布,包括NLP、CV和科學計算大模三大基礎大模型,后續(xù)發(fā)布了礦山、藥物分子、氣象、海浪等行業(yè)大模型;2022年4月升級到2.0版本,發(fā)布層次化開發(fā)方案 ( LO, L1,L2) ,打造工業(yè)級盤古大模型。
據了解,基于華為的AI根技術,大模型訓練效能可以調優(yōu)到業(yè)界主流GPU的1.1倍。華為在最底層構建了以鯤鵬和昇騰為基礎的AI算力云平臺,以及異構計算架構CANN、全場景AI框架昇思MindSpore,AI開發(fā)生產線ModelArts等,為大模型開發(fā)和運行提供分布式并行加速,算子和編譯優(yōu)化、集群級通信優(yōu)化等關鍵能力。
眾所周知算力是訓練大模型的基礎。在本次大會上,張平安宣布單集群2000PFlops算力的昇騰AI云服務在華為云的烏蘭察布和貴安AI算力中心同時上線。昇騰AI云服務除了支持華為全場景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。同時,這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。
關鍵詞:
版權與免責聲明:
1 本網注明“來源:×××”(非商業(yè)周刊網)的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。
2 在本網的新聞頁面或BBS上進行跟帖或發(fā)表言論者,文責自負。
3 相關信息并未經過本網站證實,不對您構成任何投資建議,據此操作,風險自擔。
4 如涉及作品內容、版權等其它問題,請在30日內同本網聯(lián)系。