訂閱
糾錯(cuò)
加入自媒體

華為盤古,過河拆“Chat”

經(jīng)歷了漫長期待與紛紜猜測,華為盤古大模型最新進(jìn)展悄然面世。

7月7日,華為云在年度開發(fā)者大會上鄭重其事地揭曉了盤古大模型3.0的面紗,華為常務(wù)董事兼華為云CEO張平安喊出“不做詩,只做事”,正式給盤古大模型定調(diào)。

此前,外界猜想華為的大模型可能會與ChatGPT正面競逐。在中文語言處理(NLP)大模型的領(lǐng)域中,華為可能會構(gòu)建一款主要面向消費(fèi)者端的對話式AI聊天應(yīng)用。

然而,華為內(nèi)部的一位消息人士很快進(jìn)行了辟謠。他透露華為并未正式提及將發(fā)布一個(gè)可以與ChatGPT相提并論的產(chǎn)品,華為不會采用類似于“盤古Chat”這樣的名稱,也不會去“對標(biāo)”任何一個(gè)具體的產(chǎn)品。

上述人士還披露,華為主要是做針對行業(yè)的B端業(yè)務(wù),因此將大模型應(yīng)用在這些領(lǐng)域會更加合適。盡管語言處理是重要的,但他坦白認(rèn)為,這并非華為的強(qiáng)項(xiàng)。如果業(yè)務(wù)不是主攻方向,華為在當(dāng)前階段可能會暫時(shí)停止研發(fā),以更專注于保障公司的生存與發(fā)展。

從此次大會的內(nèi)容來看確實(shí)如此,華為已經(jīng)把盤古大模型明確定位為面向各行各業(yè)的B端產(chǎn)品。他們試圖通過投入盤古大模型的能力,來賦能各個(gè)行業(yè)。

又一個(gè)發(fā)力行業(yè)的大模型

結(jié)合4月8日的人工智能大模型技術(shù)高峰論壇來看,盤古大模型并未突破預(yù)期。

在那次論壇中,華為云人工智能領(lǐng)域的首席科學(xué)家田奇出席,并詳細(xì)介紹了華為云盤古大模型的發(fā)展進(jìn)程以及在實(shí)際應(yīng)用中的情況。因此,這次華為云大會上的內(nèi)容,實(shí)際上是對之前信息的一種延伸。

在前述論壇上,田奇先是提出了一種類似于自動駕駛的等級劃分方式,將大模型的發(fā)展階段劃分為“L0至L2”,分別對應(yīng)著基礎(chǔ)通用模型、行業(yè)模型以及針對細(xì)分場景任務(wù)的特定模型。

這正是華為盤古大模型3.0的核心理念,即通過三層次的模型設(shè)計(jì),實(shí)現(xiàn)大模型在各個(gè)行業(yè)的落地應(yīng)用。

具體來看,第一層L0,是盤古基礎(chǔ)大模型的所在。在這一層,包含了五個(gè)技術(shù)領(lǐng)域的大模型,分別是NLP(自然語言處理)大模型、CV(機(jī)器視覺)大模型、多模態(tài)大模型、預(yù)測大模型和科學(xué)計(jì)算大模型。

第二層L1,專注于行業(yè)大模型的構(gòu)建。華為給行業(yè)客戶提供基于公有領(lǐng)域行業(yè)數(shù)據(jù)訓(xùn)練過的行業(yè)通用大模型。此外,也協(xié)助客戶使用他們自己的數(shù)據(jù)來訓(xùn)練行業(yè)大模型,從而形成屬于他們自己的大模型。

第三層L2,關(guān)注更為垂直的細(xì)分領(lǐng)域,專注于解決某個(gè)細(xì)分領(lǐng)域內(nèi)的應(yīng)用問題,這往往需要大模型與深度技術(shù)緊密結(jié)合。在這個(gè)層級,華為給客戶提供開箱即用的大模型服務(wù),致力于解決更具深度的技術(shù)問題。

發(fā)布針對行業(yè)的大模型產(chǎn)品,早已不是什么新鮮事了。對此田奇指出,行業(yè)內(nèi)大量的業(yè)務(wù)場景迫切需要更多專業(yè)的大模型和專業(yè)的AI應(yīng)用來解決問題,以填補(bǔ)通用大模型在行業(yè)落地時(shí)的短板。

他認(rèn)為,通用大模型在應(yīng)用于行業(yè)時(shí),面臨著專業(yè)性、技能和數(shù)據(jù)安全合規(guī)三方面的挑戰(zhàn)。

首先,雖然通用大模型的適用范圍廣,但在專業(yè)性上相對較弱,需要具備行業(yè)專業(yè)知識才能給出專業(yè)且準(zhǔn)確的答案。其次,盡管通用大模型具備廣泛的知識基礎(chǔ),但在技能方面不足,而企業(yè)場景復(fù)雜,需要模型擁有多樣的技能。最后,數(shù)據(jù)安全和合規(guī)性也是一大挑戰(zhàn),數(shù)據(jù)是企業(yè)的核心資產(chǎn)之一,因此在訓(xùn)練和使用大模型時(shí)必須保障企業(yè)的數(shù)據(jù)安全和合規(guī)。

為了解決這些挑戰(zhàn),華為云基于實(shí)踐經(jīng)驗(yàn),構(gòu)建了分層解耦的大模型架構(gòu),也就是之前提到的三層結(jié)構(gòu),以加速大模型在各行各業(yè)的落地應(yīng)用。

至于如何從基礎(chǔ)大模型煉成行業(yè)大模型,田奇介紹了華為的四大關(guān)鍵舉措:沉淀行業(yè)知識、淬煉行業(yè)技能、對話專業(yè)工具、保障安全合規(guī)。

另一方面,計(jì)算能力是構(gòu)建大模型的核心。大會上,華為云正式發(fā)布了華為昇騰AI云服務(wù)。這項(xiàng)服務(wù)以擁有2000P Flops算力的單集群為基礎(chǔ),在華為云的烏蘭察布和貴安AI算力中心同步上線。

華為構(gòu)筑了一個(gè)以鯤鵬和昇騰為基礎(chǔ)的AI算力云平臺,該平臺包含昇騰的計(jì)算引擎CANN、AI框架MindSpore,以及AI開發(fā)平臺ModelArts,共同組成針對大模型的解決方案。

緣何缺位C端市場?

華為在大模型領(lǐng)域的積淀已經(jīng)歷時(shí)數(shù)年。

從2020年11月的盤古計(jì)劃開始,到2021年4月發(fā)布的盤古NLP大模型、盤古視覺大模型、盤古科學(xué)計(jì)算大模型,再到現(xiàn)在的盤古3.0。華為在人工智能方面的深入研發(fā)和實(shí)際應(yīng)用一步步地展露,只是核心策略更傾向于服務(wù)B端市場,而非C端市場。

從此次發(fā)布會來看,盤古大模型在L0層主要由五個(gè)模型組成,分別是CV、NLP、多模態(tài)、科學(xué)計(jì)算、預(yù)測。但這五個(gè)方向的發(fā)展成熟度完全不一樣。

很明顯,盤古大模型的服務(wù)更側(cè)重于B端客戶,特別是在較為成熟的CV領(lǐng)域。這從兩次大會上對CV大模型的關(guān)注程度可見一斑。而對于行業(yè)內(nèi)倍受關(guān)注的類似ChatGPT的NLP大模型,華為公開的相關(guān)細(xì)節(jié)相對較少。

對此張平安表示,目前全球已發(fā)布數(shù)百個(gè)大模型,中國發(fā)布了超80個(gè),To C類應(yīng)用百花齊放。很多To C的大模型會寫詩作畫,華為盤古大模型不會寫詩,只會做事,致力于深耕行業(yè),為行業(yè)帶來價(jià)值。

這番言論看似貶低了以ChatGPT為代表的語言大模型,但也暴露了華為盤古大模型在應(yīng)用廣度和豐富性上可能存在的不足。

據(jù)業(yè)內(nèi)人士透露,華為在NLP領(lǐng)域還相對較弱,生成性最多能應(yīng)用于一些封閉場景下的客服,語義理解相關(guān)的可以應(yīng)用于輿情的管控、法律司法文書的理解、審計(jì)文書的理解,但在輸出性、內(nèi)容生成性方面,盤古大模型之前并未將其作為一個(gè)發(fā)展重點(diǎn)。

客觀來看,這其實(shí)與應(yīng)用場景有關(guān)。NLP大模型的應(yīng)用場景主要是自然語言、智慧旅游、金融領(lǐng)域。而CV大模型的應(yīng)用場景主要是機(jī)器視覺,例如交通行業(yè)的高速巡檢;電力行業(yè)的日常巡檢、設(shè)備的缺陷識別;制造業(yè)的缺陷識別等。

華為能找到的高價(jià)值的數(shù)字化賦能場景主要以視覺為主,所以這就是盤古大模型更多的研發(fā)項(xiàng)目主要圍繞這一領(lǐng)域的原因。而NLP方面的力度不大,主要還是商業(yè)驅(qū)動力不足,華為一開始做AI就未將C端作為一個(gè)重點(diǎn)。

此外,這也與企業(yè)獨(dú)特的基因生態(tài)結(jié)構(gòu)密切相關(guān)。

雖然華為、騰訊、百度等大模型開拓者在執(zhí)行戰(zhàn)略構(gòu)建和商業(yè)模式落地方面存在一些相似性,但真正區(qū)分它們的核心依舊在于各自的生態(tài)系統(tǒng)。

作為互聯(lián)網(wǎng)巨頭,百度和騰訊通過其廣闊的C端用戶業(yè)務(wù)網(wǎng),比如百度深入的搜索引擎業(yè)務(wù)以及騰訊在社交網(wǎng)絡(luò)、電子游戲和營銷領(lǐng)域的強(qiáng)大陣容,能夠依托其業(yè)務(wù)豐富性,在數(shù)據(jù)樣本的收集上獲得比競爭對手更為顯著的優(yōu)勢。

華為則對B端行業(yè)的深度理解領(lǐng)先于二者。盤古大模型已在多個(gè)行業(yè)中得到應(yīng)用,因此主要關(guān)注點(diǎn)更多的是B端市場。

“不做詩,只做事”的局限性

“不作詩,只做事”這種“行業(yè)優(yōu)先”的策略,滿足了一部分市場需求——為特定行業(yè)解決具體問題。然而,需要深思的是,當(dāng)華為將AI的視線只聚焦在行業(yè)應(yīng)用上,可能會遺失掉更廣闊領(lǐng)域中的發(fā)展機(jī)會。

事實(shí)上,AI技術(shù)的潛在應(yīng)用價(jià)值,遠(yuǎn)超出了眼下所見的“做事”。如果將AI的應(yīng)用范圍僅限于特定行業(yè),這種偏見或許會限制在其他領(lǐng)域?qū)ふ褹I的價(jià)值。

拿詩歌創(chuàng)作來說,AI的詩歌創(chuàng)作不僅僅是在藝術(shù)領(lǐng)域的一種創(chuàng)新形式,更是一種科技的展示。通過此種方式,可以向公眾展示AI的學(xué)習(xí)能力、自然語言處理能力等各種能力。這不僅能拓寬AI的應(yīng)用領(lǐng)域,而且能吸引更多的公眾來關(guān)注和理解AI技術(shù)。

此外,AI的創(chuàng)新性并非與實(shí)際應(yīng)用相互沖突,反而可能互為促進(jìn),相輔相成。藝術(shù)與科技的融合長久以來都是推動創(chuàng)新的重要力量,其中就包括像圖像識別、自然語言處理等技術(shù)。借由將AI應(yīng)用于藝術(shù)創(chuàng)作,能更深入地理解并優(yōu)化這些基礎(chǔ)技術(shù),從而提升AI在實(shí)際應(yīng)用中的效果。

比如說,ChatGPT這樣的大模型,就是通過其強(qiáng)大的語義理解和推斷能力,以及其能提供個(gè)性化和情境化回復(fù)的能力,得到了廣泛的關(guān)注和討論。這種強(qiáng)大的自然語言處理能力,使得AI模型不僅可以在行業(yè)任務(wù)中發(fā)揮其價(jià)值,還能在C端市場中提供更加人性化、有趣且富有創(chuàng)造力的服務(wù)。

實(shí)際上,C端市場對于AI模型的發(fā)展至關(guān)重要。許多創(chuàng)新性的技術(shù)和產(chǎn)品往往首先在C端市場得到接納和普及,然后才逐漸滲透到B端市場。因此,如果大模型產(chǎn)品只將其目光聚焦于行業(yè)應(yīng)用,可能會錯(cuò)過在C端市場建立更深度連接,提供更個(gè)性化和情境化體驗(yàn)的機(jī)會。

華為自身就是個(gè)很好的例證。雖然華為以前的產(chǎn)品在某些B端企業(yè)中已經(jīng)得到了使用,但影響力并不顯著,反而通過ChatGPT的爆火而為人熟知。

隨著AI技術(shù)的不斷發(fā)展和普及,越來越多的普通消費(fèi)者開始接觸和使用AI產(chǎn)品。在這樣的背景下,那些擁有良好用戶體驗(yàn)和人性化交互能力的產(chǎn)品,將會擁有更大的市場需求和發(fā)展空間。

總的來說,華為盤古大模型若是只顧“低頭做事”,也可能在一定程度上忽視了AI的廣泛性、創(chuàng)新性和人性化。一款出色的AI大模型,不僅能“做事”,也能“作詩”,才能實(shí)現(xiàn)真正的平衡和全面的發(fā)展。

       原文標(biāo)題 : 華為盤古,過河拆“Chat”

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號