成人无码a片一区二区三区免费看,国产精品女主播在线观看

大模型混戰(zhàn)，華為阿里商湯走到哪了？

2023-04-10 13:39

3月下旬，英偉達(dá)在美國加州總部舉辦了面向軟件開發(fā)者的年度技術(shù)峰會GTC。會上，創(chuàng)始人黃仁勛發(fā)布了專用于大語言模型部署的GPU推理平臺——H100 NVL，其或?qū)⒃谕评黼A段實現(xiàn)比現(xiàn)有最先進(jìn)的A100快10倍的速度。

但如此先進(jìn)的GPU卻無法運(yùn)往國內(nèi)，去年8月，美國監(jiān)管機(jī)構(gòu)以國家安全為由，對NVIDIA A100、H100兩款GPU實施禁令，不得銷售給國內(nèi)企業(yè)，意在通過“卡脖子”的方法來降低國內(nèi)AI模型的傳輸速度，拖延中國人工智能發(fā)展。

而目前也確實對國內(nèi)AI企業(yè)產(chǎn)生了較大的影響，在算力的大需求之下，呈現(xiàn)出了“一卡難求”的情況，就連閹割版的A800也一直處于缺貨的狀態(tài)。

但與GPU硬件窘迫的境況不同的是，在繼3月16日百度發(fā)布文心一言大模型后，國內(nèi)眾多科技、AI巨頭都相繼公布了各家大模型的發(fā)布會時間：4月8日華為盤古大模型發(fā)布、4月10日商湯大模型發(fā)布、4月11日阿里大模型發(fā)布、4月14日同花順舉辦AI產(chǎn)品發(fā)布會，國內(nèi)大模型的“百家爭鳴”與GPU被禁運(yùn)后的“慘淡”狀況，也形成了鮮明的對比。

這個4月，成為國產(chǎn)大模型混戰(zhàn)期。

那么，在GPU受限的情況下，國內(nèi)AI行業(yè)發(fā)展境況如何，能否交出屬于他們自己的答卷？未來的發(fā)展是否會與國外越差越大？

本文，奇偶派以已經(jīng)發(fā)布或近期即將發(fā)布的大模型與相關(guān)AI應(yīng)用的企業(yè)為例，通過專家訪談等方式，研究和分析各企業(yè)AI大模型的發(fā)展?fàn)顩r。

華為盤古大模型避開GPT

劍走偏鋒？

華為盤古大模型，最近的發(fā)布多少有點(diǎn)高開低走，突破性進(jìn)展不多，尤其是在C端幾乎沒有新應(yīng)用側(cè)產(chǎn)品，主要還是展示了華為在B端智能化方向上的技術(shù)實力，為華為云服務(wù)和可見的銷售市場做技術(shù)支撐。

4月8日，在人工智能大模型技術(shù)高峰論壇上，華為云人工智能領(lǐng)域首席科學(xué)家田奇介紹了盤古大模型的進(jìn)展及其應(yīng)用狀況，包括NLP（自然語言處理）大模型、CV（機(jī)器視覺）大模型、科學(xué)計算大模型、多模態(tài)大模型、語音大模型等的研發(fā)與應(yīng)用的相關(guān)情況。

在會前，最引人關(guān)注的莫過于盤古的NLP大型模型，據(jù)介紹，該模型利用了深度學(xué)習(xí)與自然語言處理技術(shù)，并且采用海量中文語料庫對其進(jìn)行培訓(xùn)。

而在參數(shù)和數(shù)據(jù)的堆量方面，百度文心一言參數(shù)為100億，數(shù)據(jù)為4TB。而GPT-4則達(dá)到了1750億，數(shù)據(jù)45TB。華為盤古大模型的參數(shù)高達(dá)1000億，數(shù)據(jù)高達(dá)40TB。如果單從參數(shù)上看，盤古大模型已接近GPT-3.5。

但在這次發(fā)布會中，田奇卻并沒有提到盤古NLP大模型的相關(guān)應(yīng)用。只是將過去已經(jīng)發(fā)布的功能，進(jìn)行了較為簡單的集合介紹。相對而言，另外兩個大模型則著墨更多，以較多篇幅介紹了CV大模型和科學(xué)計算大模型的應(yīng)用范例。這也讓眾多翹首期盼華為能發(fā)布一款趕上ChatGPT應(yīng)用的“粉絲”們，多少有一些失望。

但實際上，早在發(fā)布會之前的相關(guān)交流中，內(nèi)部專家就已經(jīng)就該話題做出了相關(guān)回答：

“首先，在華為發(fā)展歷史上，很少是在新的趨勢出現(xiàn)后立馬就追上來的。公司發(fā)展的30多年間，基本沒有做到過先發(fā)，而是一直采用后發(fā)制人的打法，在手機(jī)、在云、在汽車上是如此，在這個領(lǐng)域中也會如此。”

“想要做出一個比較完美的NLP大模型，是一個集團(tuán)級的項目，通常做出決定會比較緩慢，在一兩年內(nèi)也不太會出現(xiàn)。而當(dāng)前公司在盡力地完成AI工程化、AI產(chǎn)品化，公司認(rèn)為這是商業(yè)化不得不走的路線，如果采用高度項目制，成本很高，并且也會出現(xiàn)項目不可復(fù)制的情況，因此華為的重點(diǎn)最后才放在了面向行業(yè)的CV大模型上。”

正如相關(guān)專家所說的，盤古大模型中最為領(lǐng)先的，正是CV（機(jī)器視覺）大模型。

會上，田奇還談到，在過去的2022年，華為盤古大模型主要是AI for Industry（AI賦能產(chǎn)業(yè)），為煤礦、水泥、電力、金融、農(nóng)業(yè)等行業(yè)創(chuàng)造了更多產(chǎn)業(yè)價值，其中CV大模型早就有了許多用武之地。

比如在與能源公司合作的盤古礦山大模型中案例中，礦井現(xiàn)場是一個40米長的采掘機(jī)，寬度僅2米左右，傳統(tǒng)相機(jī)很難一下子捕捉到全部畫面，只能用圖中的九宮格視頻畫面。而通過5G+AI全景視頻拼接綜采畫面卷，傳輸?shù)降孛�，地面工作人員將來可以實現(xiàn)地面控制機(jī)器進(jìn)行采礦，實現(xiàn)礦下無人少人安全作業(yè)。

盤古礦山大模型還用在了煤礦的主運(yùn)輸皮帶作業(yè)監(jiān)控。煤礦被采集下來以后，它會通過一個主運(yùn)輸皮帶，從地下傳輸?shù)降厣�。按傳統(tǒng)方法是通過工人配合作業(yè)，華為提出通過視頻對作業(yè)的安全規(guī)范進(jìn)行巡檢，主運(yùn)場景的異物識別精度達(dá)98%，煤礦作業(yè)場景動作識別準(zhǔn)確率達(dá)95%，助井下安全事故減少90%以上。這些都是CV大模型的落地應(yīng)用。

此外，大模型還能進(jìn)行軌道機(jī)車缺陷檢測，比如掉鏈、脫落、裂痕等潛在不安全因素，人工檢測成本較高，盤古大模型提供圖像質(zhì)量的自動評估、小樣本的故障定位與識別等。

可以說，華為選擇了一條與其他AI企業(yè)不一樣的道路——暫時放棄以ChatGPT為代表的C端需求，專注B端工業(yè)需求的開發(fā)。

不可否認(rèn)，華為作為國內(nèi)受美國制裁最嚴(yán)厲的公司，無論從算力資源、或是從公司發(fā)展理念、又或者是從商業(yè)化角度來看，選擇專精于B端的打法是正確的。一來可以避免超大數(shù)據(jù)量的訓(xùn)練，二來又可以為處于“寒冬”中的集團(tuán)早日“造血”。

或許，在算力無法獲取之時，不去糾結(jié)內(nèi)耗于ChatGPT，才是華為真正的AI之路。

手握巨大算力的

商湯大模型，未來有隱憂

緊接著華為盤古大模型發(fā)布后，商湯科技的大模型也即將登場。

不過，由于上市公司相關(guān)信披原因，目前公司正處于發(fā)布大模型之前的靜默期，所以沒有辦法披露過多的大模型相關(guān)內(nèi)容。但是，作為最早把人工智能大模型寫入招股說明書的公司，商湯確實是有著足夠的實力，來推出獨(dú)屬的大模型。

而在近期的相關(guān)交流中，商湯相關(guān)人士還是回答了一些與算力相關(guān)的問題。

首先是大眾最關(guān)注的算力資源方面，商湯擁有極為充足的GPU儲備，對方表示，在去年停售之前就有1萬張A100芯片了，完全可以覆蓋訓(xùn)練一個千億參數(shù)量的語言模型的消耗。

而除了英偉達(dá)專用顯卡外，商湯也有采購國內(nèi)的GPU，專家表示：“比如說寒武紀(jì)與海光，最近這兩家公司可能很多投資人都很關(guān)注，想了解他們的產(chǎn)品是否進(jìn)入了大規(guī)模試用階段。但是，如果大家在去年有去參觀我們商湯的大裝置的話，就應(yīng)該看得到我們在大裝置里面已經(jīng)適配了很多寒武紀(jì)和海光的GPU卡，我們也是寒武紀(jì)最大的客戶之一”。

而在談及國產(chǎn)替代方面時，專家也坦言，“我們很早就開始與國產(chǎn)GPU廠商合作，去適配國產(chǎn)GPU卡，但坦白來說，當(dāng)前的大模型訓(xùn)練，確實是只有A100與A800能夠勝任，國內(nèi)GPU卡的易用性與性價比都無法去比較，但在推理階段，寒武紀(jì)最新款的GPU在大模型領(lǐng)域也有了不錯的表現(xiàn)，期待未來會更好。”

而在被問及H100出現(xiàn)是否會對國內(nèi)AI企業(yè)產(chǎn)生影響時，專家表示，H100加速芯片的出現(xiàn)，確實在性價比上有十分顯著的提高。但如果不考慮性價比的話，當(dāng)前已有的芯片是完全可以勝任的。

而在算力的使用技術(shù)方面，商湯較眾多AI企業(yè)來說有著極為明顯的優(yōu)勢。

在A100存量優(yōu)先的情況下，如何利用僅有的資源去做更多的事情，成為了商湯需要解決的一大問題。

專家表示，商湯科技在過去五年中，有著豐富的千卡并行的訓(xùn)練經(jīng)驗，最大的單任務(wù)訓(xùn)練可以同時調(diào)動4000張A100的GPU卡，等效算力為1萬張A100，已經(jīng)達(dá)到了訓(xùn)練GPT3甚至GPT4的門檻。

而在國產(chǎn)GPU的優(yōu)化適配上，商湯也同樣有豐富的經(jīng)驗，“目前有10%左右的算力，是由國產(chǎn)GPU卡提供了，商湯也一直在進(jìn)行適配，無論是規(guī)模比較大的寒武紀(jì)、海光，或是當(dāng)前規(guī)模比較小的昇騰，都有著相應(yīng)的適配支持”。

也正是因為多年的訓(xùn)練經(jīng)驗，讓商湯獲得了較為明顯的優(yōu)勢，“我們目前的算力規(guī)�？梢灾С�20個千億參數(shù)量超大模型共同計算，同時訓(xùn)練，對客戶的技術(shù)迭代有十分明顯的幫助。”

但被問及當(dāng)下的挑戰(zhàn)之時，專家再次重點(diǎn)提到了國產(chǎn)GPU的適配問題。即當(dāng)前國產(chǎn)GPU不太能夠支持超大模型的訓(xùn)練，還需要投入更多去進(jìn)行優(yōu)化。此外，雖然國產(chǎn)GPU已經(jīng)展現(xiàn)了一定的能力，但依然任重道遠(yuǎn)。

總的來說，商湯科技作為最早一批的AI企業(yè)，有著極為深厚的訓(xùn)練經(jīng)驗，也在禁運(yùn)之前拿到了上萬張A100顯卡，這讓其在當(dāng)前的AI大戰(zhàn)中擁有了極強(qiáng)的競爭力。

但從另外一個角度來看，短期內(nèi)高端GPU禁運(yùn)的影響還可以通過豐富的訓(xùn)練經(jīng)驗、更大的成本投入來進(jìn)行掩蓋，但從長期來看，如何能持續(xù)獲得高端GPU，才是商湯需要考慮的問題。如果禁運(yùn)依舊存在，并且國產(chǎn)GPU無法適配超大模型的訓(xùn)練，那么與國際尖端AI企業(yè)、與最先進(jìn)的大模型之間的距離，將會被持續(xù)拉開。

阿里大模型突上線

全面發(fā)育還是落后？

4月4日，B站一則阿里版ChatGPT全網(wǎng)首測視頻流出，引爆全網(wǎng)，同日下午，阿里正式宣布將于4月11日的阿里云峰會上推出大模型。

從視頻中看，阿里大模型超出大家預(yù)期的主要有兩點(diǎn)：

一是“音色”“文風(fēng)”“情緒”都可改變，定制化屬性顯現(xiàn)，受眾面大幅增加，視頻中UP主先是運(yùn)用了脫口秀演員“鳥鳥”的聲音作為模型交流，然后并要求ChatGPT接下來用“貓娘”的身份進(jìn)行后續(xù)對話，整體定制化特征明確，不再局限于固定形式，代表著后續(xù)每個人可根據(jù)自己的需求定制屬于自己的“性格”不同的ChatGPT，幾乎可滿足所有受眾群體。

二是阿里GPT的成熟程度超出預(yù)期，15個問題中有10個問題的回答都明顯好于國內(nèi)已經(jīng)公布的競品，并且突破了雙工對話，整體帶入性更強(qiáng)。

而就在發(fā)布前的一周，也有相關(guān)內(nèi)部專家接受了采訪，回答了“國內(nèi)語言大模型與ChatGPT有多大差距”的相關(guān)問題。

專家表示，起碼在未來的一年到一年半之間，國內(nèi)是絕不可能出現(xiàn)對標(biāo)GPT4的產(chǎn)品的，只有先把ChatGPT（GPT-3.5）追上，才有資格去談GPT4。目前，國內(nèi)大多仍然都是以文本、圖像、視頻等單模態(tài)的方式發(fā)布的，并且文本大模型已經(jīng)進(jìn)入商用階段，百度走出了第一步，其他的眾多AI企業(yè)和科技企業(yè)也都會在年中或者下半年進(jìn)行發(fā)布。

而在追趕GPT-3.5的過程中，也有著三個核心瓶頸：

一是數(shù)據(jù)量的不足，只有擁有了足夠多的數(shù)據(jù)，才能繼續(xù)訓(xùn)練，而公有的數(shù)據(jù)大家都可以買到，所以核心競爭點(diǎn)是如何獲得足夠多的私有數(shù)據(jù)，權(quán)重占比達(dá)到了三成左右。

二是模型結(jié)構(gòu)的創(chuàng)新性，國內(nèi)的語言大模型目前做不成高層級的架構(gòu)，也就沒辦法做海量的數(shù)據(jù)訓(xùn)練，也是最大的瓶頸，權(quán)重達(dá)到了四成左右。

第三便是工程化的能力，在工程落地的時候，大家都知道需要預(yù)訓(xùn)練、調(diào)優(yōu)訓(xùn)練與推理訓(xùn)練，但在真正部署的時候，是完全要靠自身去摸索的，包括數(shù)據(jù)的處理，模型的訓(xùn)練，模型優(yōu)化，模型的部署和運(yùn)用，都需要投入大量的時間、精力與財力，這方面的權(quán)重與數(shù)據(jù)量類似，也是達(dá)到了三成的權(quán)重。

但這一切的前提是算力充足，阿里是當(dāng)前國內(nèi)擁有A100 GPU最多的企業(yè)，在當(dāng)下階段算力并沒有多大阻礙，但未來伴隨著禁運(yùn)的持續(xù)與算力需求的增加，也將面臨高端運(yùn)算卡不足的情況。

而在追趕ChatGPT之外，電商作為阿里起家的領(lǐng)域，也讓人好奇阿里大模型將會為電商領(lǐng)域帶來多大的改變。

專家表示，在電商場景中，比較主要的還是推薦算法與營銷圖案、文本的生成。未來，阿里大模型將會包攬營銷圖案、產(chǎn)品介紹、產(chǎn)品描述等工作。

“實際上，去年我們就已經(jīng)讓一些商家使用這個技術(shù)了，我們挑選了上百個商家，預(yù)計要花數(shù)百萬去請廣告公司去做的營銷圖案，阿里大模型的AI都可以勝任，cover 40%的工作量。”

“而在營銷之外，還有虛擬直播等許多場景可以被替代，包括倉儲預(yù)測、物流信息的挖掘，都需要一步步找場景滲透，慢慢將老一代的技術(shù)進(jìn)行替代，幫助中小企業(yè)，最終達(dá)到雙贏”。

總的來說，阿里大模型作為一個龐大集團(tuán)下的一條項目線，看起來并不像其他AI科技企業(yè)那么出彩。但目前，阿里的文本大模型進(jìn)度在國內(nèi)也已經(jīng)位屬前列，并且其他模型也在有序推進(jìn)之中。

不過，這一切的前提是算力的充足，伴隨著技術(shù)的推進(jìn)與數(shù)據(jù)量的增加，在未來，算力可能仍是邁不過的那道坎。

股價暴漲

同花順AI是翻新產(chǎn)品嗎？

而在AI巨頭與科技公司之外，各行各業(yè)的企業(yè)其實早已經(jīng)將AI應(yīng)用于實際業(yè)務(wù)中，而同花順就是其中一員，4月14日，同花順也將舉辦AI產(chǎn)品發(fā)布會。

實際上，同花順的AI產(chǎn)品，早就已經(jīng)應(yīng)用，主要包括i問財、基于AI技術(shù)的增值服務(wù)產(chǎn)品與B端AI產(chǎn)品。

其中，同花順主打的便是i問財這款A(yù)I產(chǎn)品。i問財是目前財經(jīng)領(lǐng)域落地較為成功的自然語言交互問答系統(tǒng)，而公司也在2022年進(jìn)一步加大對其研發(fā)投入，采用全新的語義解析方案，結(jié)合AI大模型、小樣本學(xué)習(xí)等技術(shù)的應(yīng)用，有效提升 i 問財服務(wù)效率，可將服務(wù)場景從財經(jīng)領(lǐng)域擴(kuò)展到通用領(lǐng)域，從中文場景擴(kuò)展到多語言場景。

通過i問財機(jī)器人，我們可以獲得相關(guān)資訊、數(shù)據(jù)以及AI的點(diǎn)評；還可以準(zhǔn)確地提供A股公司的基本面及板塊情況，并通過多類圖表的形式顯現(xiàn)出來；還可通過向問財機(jī)器人提問，實現(xiàn)條件選股，是市面上成功的一款財經(jīng)AI。

而在AI之風(fēng)的推動之下，同花順的股價也節(jié)節(jié)走高。自3月17日以來，在短短12個交易日中，股價便從115.57元上漲至最高的239.22元，完成快速翻倍。

在股價飆漲的背后，同花順能否發(fā)布更有含金量的AI應(yīng)用，我們還無從得知。但如果僅僅以目前的AI應(yīng)用水平，是絕無可能撐起如此高的市值的。

而同花順的AI含金量究竟如何，或許只有當(dāng)其產(chǎn)品發(fā)布之時，我們才能知曉吧。

寫在最后

縱觀國內(nèi)已經(jīng)發(fā)布的文本大模型或者AI應(yīng)用，亦或是與各企業(yè)相關(guān)專家進(jìn)行交流，我們都能發(fā)現(xiàn)一個問題，那就是國內(nèi)的大模型水平，實際上才剛剛起步。

在硬件方面，英偉達(dá)高端GPU遭受禁運(yùn)，國內(nèi)只能拿著為數(shù)不多的A100與閹割版的A800進(jìn)行訓(xùn)練和推理。當(dāng)前尚可通過豐富的訓(xùn)練經(jīng)驗，更高的資本投入來短暫掩蓋國內(nèi)算力嚴(yán)重不足的事實。但若是站在更高處，GPU發(fā)展嚴(yán)重落后，終將成為殺死中國AI的一把利刃。

而在算法層面，國內(nèi)AI企業(yè)也面臨著極為尷尬的局面，讓一群善于應(yīng)用創(chuàng)新的企業(yè)直接去做底層創(chuàng)新，無異于趕鴨子上架。在國外AI企業(yè)不再開源

算法后，如何找到模型開發(fā)的創(chuàng)新點(diǎn)，才是最困難的。對于一直停留在64層的眾多國內(nèi)GPT模型來說，想要對標(biāo)ChatGPT甚至GPT-4，無異于癡人說夢。

不可否認(rèn)，應(yīng)用層面的“軟實力”，可以讓一家AI企業(yè)快速找到盈利的目標(biāo)，但在真正的國產(chǎn)AI戰(zhàn)爭打響之后，硬件和算法層面的“硬科技”，才是我們當(dāng)前最缺乏的能力。

若只重視應(yīng)用層面而忽略硬件與算法層面造出來的商業(yè)輝煌，就像井中月、水中花一般，雖然美麗，但一經(jīng)波瀾便稍縱即逝。也只有真正擁有算力、算法層面的能力，才是中國AI發(fā)展歷程中真正的進(jìn)步。

我們的算力之戰(zhàn)和算法之戰(zhàn)剛剛拉開序幕。

此刻，中國AI的翻身之戰(zhàn)，需要一些真正的“硬核武器”，才能正式打響。

原文標(biāo)題 : 專家訪談，看4月大模型混戰(zhàn)，華為阿里商湯都走到哪了？