華為發(fā)布盤古大模型3.0:“不寫詩,只做事”
日期:2023-07-08 16:02:19 / 人氣:419
編輯|佘陳曉7月7日,華為開發(fā)者大會(云)期間,華為正式發(fā)布盤古大模型3.0。華為云CEO張平安表示,與現(xiàn)在流行的ChatGPT不同,盤古大模型3.0是一系列完全面向行業(yè)的大模型,包括“5+N+X”三層架構:L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五大基礎大模型,提供行業(yè)場景下的多種技能需求;L1層是n個行業(yè)大模型,華為云可以提供利用行業(yè)開放數(shù)據(jù)訓練的通用行業(yè)大模型,包括政務、金融、制造、礦業(yè)、氣象等大模型。也可以根據(jù)自己的行業(yè)客戶數(shù)據(jù),在盤古大模型的L0層和L1層上,為客戶訓練自己專有的大模型。L2層提供更詳細的場景模型,專注于政府熱線、網(wǎng)絡助手、試點藥物篩選、傳送帶異物檢測、臺風路徑預測等特定行業(yè)應用或特定業(yè)務場景,提供“開箱即用”的模型服務。張平安介紹,盤古3.0為客戶提供了100億參數(shù)、380億參數(shù)、710參數(shù)、1000億參數(shù)的一系列基礎大模型,同時提供了一套全新的能力,包括NLP大模型的知識問答、副本生成和代碼生成,以及多模態(tài)大模型的圖像生成和圖像理解,客戶和合作伙伴可以直接調(diào)用。根據(jù)華為現(xiàn)場展示的氣象行業(yè)案例,在3000臺服務器的高性能計算機集群中,模擬臺風未來10天的路徑用了5個小時。在預先訓練好的盤古氣象模型的支持下,只需要在單臺服務器上配置一張卡,就可以在10秒內(nèi)得到更準確的預測結果。張平安在接受媒體采訪時表示,他不想將盤古模式與ChatGPT相提并論?!傲奶炀褪橇奶欤俏覀儧]有時間聊天。參數(shù)再多,對話能力再好,如果不能解決實際問題也沒什么用。AI最不應該取代的就是畫畫和畫畫。這才是人類應該呈現(xiàn)的。為什么要給機器?”華為之所以切入行業(yè)模式,一方面是基于其過去在To B領域的經(jīng)驗,另一方面也將得益于華為在計算基礎設施方面的布局。計算力是大模型不可或缺的“引擎”,盤古大模型的計算力來自于華為上升的AI集群。根據(jù)華為公布的數(shù)據(jù),目前基于Ascension AI洶涌澎湃的計算能力,研發(fā)和適配的原創(chuàng)大機型已經(jīng)超過30款,占國內(nèi)大機型的近一半。受制裁影響,華為無法使用業(yè)界主流的GPU架構,而是推出了基于其自研達芬奇架構的AI訓練芯片Ascension系列。2019年,華為宣布Ascent 910芯片正式商用。華為當時將其描述為業(yè)界“最強大”的AI處理器。在日前舉行的世界人工智能大會上,華為宣布全面升級盛騰AI集群。集群規(guī)模從最初的4000卡集群擴大到16000卡。據(jù)華為介紹,這是業(yè)內(nèi)首個Wanka AI集群,訓練速度更快,訓練周期穩(wěn)定在30天以上。發(fā)布會上,華為盛騰AI云服務正式上線。據(jù)介紹,盛騰AI云服務提供2000P FLOPS的計算能力,支持主流AI框架和90%以上的算子,訓練效率比業(yè)界主流GPU高1.1倍。華為提升計算業(yè)務總裁張在接受其他媒體采訪時表示,中國對計算能力的需求非常強烈,很多大廠商都能獲得計算能力,很多小企業(yè)卻做不到。張平安還提到,目前英偉達芯片交付周期長,價格高,華為希望為業(yè)界提供另一種選擇。華為在計算基礎設施上投入了大量資金。目前,華為基于盛騰ai在上海、武漢、Xi安等25個城市建設了人工智能計算中心,提供計算基礎設施服務。張平安表示,華為在計算能力方面投入了大量資金?!叭绻褂?計算能力)的人少了,我們就會虧損。但不能因為現(xiàn)在虧損,就不投資了。我相信在我們把AI算力生成做好之后,國內(nèi)很多AI算力都會用我們?,F(xiàn)在談論好處還為時過早?!?br />


作者:杏耀注冊登錄測速平臺
新聞資訊 News
- 科學是如何淪為了大國博弈的棋子...11-23
- 大疆“密會”投資機構:不提上市...11-23
- 奧特曼都點贊,谷歌Gemini 3 P...11-23
- 吉爾莫·德爾·托羅《弗蘭肯斯坦...11-23

