言犀大模型,云計算競爭中的“泥腿子”
模型競爭持續(xù)了半年,京東雖然遲到卻未缺席。
7月13日上午,京東在2023京東全球科技探索者大會暨京東云峰會上,正式發(fā)布京東言犀大模型,同時發(fā)布言犀AI開發(fā)計算平臺。該平臺已經(jīng)啟動預約注冊,預計8月正式上線。
京東集團技術(shù)委員會主席曹鵬表示,京東靈犀大模型源于產(chǎn)業(yè)、服務產(chǎn)業(yè),具有更高的產(chǎn)業(yè)屬性。
國內(nèi)頭部云廠商中,于大模型領(lǐng)域先行占位者如百度、阿里已經(jīng)在模型能力上卷過一輪,為避免產(chǎn)品服務同質(zhì)化,京東將定位放在“產(chǎn)業(yè)”與“專精”以求差異性。
作為模型競爭的另類參與者,京東不會做大包大攬的“大生態(tài)”,而是更強調(diào)落地應用與產(chǎn)業(yè)場景,承接京東云以往的定位“更懂產(chǎn)業(yè)的云”。
產(chǎn)業(yè)大模型,是京東為自己“量身定做”的服務模式,避開通用能力的橫向比較,聚焦于專項領(lǐng)域的模型處理能力。
數(shù)據(jù)“專項專練”
大模型競爭走入深水區(qū),數(shù)據(jù)的重要性越來越突出。
數(shù)據(jù)規(guī)模與質(zhì)量都會影響模型最終呈現(xiàn)效果,故而當下企業(yè)和研究機構(gòu)都在積極投資于數(shù)據(jù)收集、數(shù)據(jù)清洗和數(shù)據(jù)標注,以獲取更好的數(shù)據(jù)集來訓練其大型模型,作為競爭優(yōu)勢。
數(shù)據(jù)集足夠優(yōu)質(zhì)且有代表性,就能訓練出更專精的產(chǎn)業(yè)大模型。
許多公司在試用 ChatGPT 和其他大模型時,會發(fā)現(xiàn)它們用清晰語言表達復雜想法的能力非常出色,但無法響應有關(guān)專有內(nèi)容或知識的提示或問題。因為訓練大模型的數(shù)據(jù)普遍來自互聯(lián)網(wǎng)公開資料,缺乏對特定領(lǐng)域的深入挖掘。
相比之下,產(chǎn)業(yè)大模型的訓練數(shù)據(jù)更加專注于特定領(lǐng)域。這些更準確、一致和具有產(chǎn)業(yè)代表性的標注信息,能讓大模型學習到適配相應領(lǐng)域的語言規(guī)律,同時減少模型學習到錯誤模式的風險,提高模型的精度和可靠性。
探索者大會上,京東強調(diào),作為一家新型實體企業(yè),自身發(fā)展就來自產(chǎn)業(yè)場景歷練,擁有包括零售、物流、科技、健康、工業(yè)、產(chǎn)發(fā)等豐富的產(chǎn)業(yè)布局。
這為京東積累下每年數(shù)百億條優(yōu)質(zhì)交互數(shù)據(jù),訓練言犀大模型的數(shù)據(jù)庫,就由70%通用數(shù)據(jù)和30%供應鏈原生數(shù)據(jù)組成。
用自家數(shù)據(jù)訓練自家模型,京東的優(yōu)勢就是京東言犀大模型的優(yōu)勢,這是京東想展現(xiàn)給外界的邏輯。
有知情人士提到,京東所有事業(yè)部都在配合模型訓練,并提出自己的需求,其中京東零售幾乎交出了所有數(shù)據(jù)。
京東在電商領(lǐng)域經(jīng)營多年,且一直保持的頭部的體量與影響力,其完整的商品產(chǎn)銷與售后數(shù)據(jù),都是訓練大模型最好的“養(yǎng)料”。京東可以借用大模型研發(fā)搭售商品,輔助商家完成營銷物料準備,或者制定組合策略。
京東介紹,在電商領(lǐng)域,京東大模型在AIGC與內(nèi)容營銷的配合上獨具優(yōu)勢。從一張商品圖出發(fā),它能夠理解商品特征,快速生成電商運營需要的商品主圖、營銷海報圖和商詳圖等,滿足商家快速開店和營銷的需求。人工智能可以讓每套圖的制作成本能降低90%,制作周期也從7天縮短到半天。
這些生成質(zhì)量、效率上的表現(xiàn),都來源于數(shù)據(jù)“專項專練”。通俗來講,就是做電商的最懂電商,京東大模型能為在電商領(lǐng)域有生產(chǎn)力需求的客戶,提供最具針對性的服務。
但略顯尷尬的是,目前京東所描述的,AIGC在零售領(lǐng)域的應用僅限于文生文、文生圖,跨模態(tài)和多模態(tài)能力相對來說并不成熟。
技術(shù)迭代到現(xiàn)在,多模態(tài)處理能力幾乎是頭部大模型產(chǎn)品的標配,京東坐擁足量優(yōu)質(zhì)數(shù)據(jù),在技術(shù)呈現(xiàn)上,卻還顯得相對原始。
產(chǎn)業(yè)大模型,一種“量體裁衣”
各家都在追求以模型通用能力為基礎(chǔ),進而服務千行百業(yè)之時,單獨強調(diào)產(chǎn)業(yè)場景的特殊針對性,難免會讓人覺得有“避重就輕”之嫌。
產(chǎn)業(yè)大模型需要兼顧通用能力,這是提供模型服務的前提。
以最近大熱的BloombergGPT(彭博GPT)為例,同樣是聚焦與特定領(lǐng)域、具體場景,在官方發(fā)布的論文中,對BloombergGPT的評估包含了兩部分,金融領(lǐng)域評估與通用領(lǐng)域評估。
BloombergGPT基于Bloomberg終端(Bloomberg Terminal)的海量金融數(shù)據(jù)進行訓練,數(shù)據(jù)涵蓋了各種金融文檔,如新聞、報告、評論、財務報表等。與京東數(shù)據(jù)“專項專練”的產(chǎn)業(yè)大模型訓練思路頗為一致。
文章指出,在金融領(lǐng)域任務上,BloombergGPT綜合表現(xiàn)最好,同時在通用任務上,BloombergGPT的綜合得分同樣優(yōu)于相同參數(shù)量級的其他模型,甚至在某些任務上的得分要高于參數(shù)量更大的模型。即BloombergGPT在金融領(lǐng)域表現(xiàn)突出的同時,并沒有以犧牲模型通用能力為代價。
更直白的說,如果一個大模型缺乏通用能力,可能會限制模型應用范圍的靈活性。通用大模型通常能夠處理各種類型的語言任務,并從廣泛的語料庫中學習到多樣性的語言模式。作為對比,專業(yè)大模型的泛化能力可能受到限制,無法適應多樣的應用場景和任務。
所以大多數(shù)廠商會選擇在通用大模型的基礎(chǔ)之上,進行特定領(lǐng)域的訓練和優(yōu)化開發(fā)產(chǎn)業(yè)大模型,使其具備更深入的行業(yè)知識和理解,提供更準確的內(nèi)容生成。同時廠商也會重點指出訓練模型時,會兼顧通用與專業(yè)。
而反觀京東對言犀大模型差異化定位的描述,并未強調(diào)其通用模型能力,著重強調(diào)對特定場景、特定行業(yè)問題的解決力。
京東表示,不會向千行百業(yè)提供通用大模型,通用性不是目的,原生數(shù)據(jù)集所帶來的能力,對零售、健康、物流、金融這幾個特定行業(yè)的深入理解,構(gòu)成了言犀大模型的差異。
大模型華山論劍,當各家大廠都在以技術(shù)能力展示其功底如何深厚之時,京東卻話鋒一轉(zhuǎn),說自己身經(jīng)百戰(zhàn),對手眾多皆是一流、京東大模型實力必然也是個中翹楚。
這種“泥腿子”路數(shù)似乎對應著京東一直以來的“江湖味”作風,沒有絕對實力和話語權(quán),又不得缺席競爭,就以江湖經(jīng)驗標榜自己不落人后。
如此看來,不做通用,反復重申自己“產(chǎn)業(yè)大模型”的定位,其實是一種更適合其當下發(fā)展路線的“量體裁衣”:長處不在技術(shù)之時,宣傳場景更有優(yōu)勢。
只是這個定位也非京東獨家。
百度、阿里這類在通用大模型之路上狂奔多時的企業(yè),正不斷推出行業(yè)應用、產(chǎn)業(yè)結(jié)合方案。同樣入局稍晚的騰訊、華為也在近期發(fā)布了自己的行業(yè)大模型。具體場景、特殊領(lǐng)域的模型能力的確更符合應用邏輯,也更容易跑通商業(yè)模式。
無論定位如何,宣傳側(cè)重怎樣,客戶的選用最終還是要看真實產(chǎn)品表現(xiàn)。雖然打出了產(chǎn)業(yè)的旗號,京東目前的宣傳賣點還在側(cè)重于智能客服和智能導購這些相對初級的應用場景,恐怕離“產(chǎn)業(yè)”還有相當一段距離。
先革自己的命
從整體戰(zhàn)略布局來看,京東大模型的推進思路也略有不同。
據(jù)官方解釋,言犀大模型的落地分3步走:第一步,基于內(nèi)部實踐構(gòu)建通用大模型;第二步,在零售、金融、健康、物流等京東內(nèi)部高復雜場景大規(guī)模錘煉,融合行業(yè)解決方案對外輸出;第三步,針對嚴肅商業(yè)場景將大模型能力對外開放。
模型訓練非常依賴實時數(shù)據(jù)反饋,故而多數(shù)廠商會選擇盡快公開投入測試,以求在實用中收集真實數(shù)據(jù),對模型進行調(diào)整。
按照京東的提法,開發(fā)大模型對外服務是下一個階段的目標,當下先得著力滿足自身業(yè)務需求才行。
對此,京東內(nèi)部技術(shù)人員的解釋是,因為京東目前還沒有完全完成模型對內(nèi)部場景的接入。
雖然京東集團各大事業(yè)部都在支持模型訓練,希望盡快接入,但不同業(yè)務對模型的需求差異較大,滿足所有內(nèi)部場景需求在現(xiàn)階段對京東來說壓力不小。
“比如零售業(yè)務需要模型做推薦和風控、研發(fā)團隊希望模型幫助提升編碼效率,都得做針對性調(diào)整。我們會逐步開放一些在內(nèi)部場景磨煉成熟了的能力,今年下半年還是重點在內(nèi)部的打磨。”
可以把這種先拿自家業(yè)務體系做實驗,再對外售賣成熟服務的思路視為一種推己及人。京東旗下業(yè)務涵蓋面廣,“先革自己的命”做出一個大模型應用的范本,也是對自身產(chǎn)品能力的最好證明。
只不過就目前釋放出的消息來看,由內(nèi)及外更像是產(chǎn)品還未打磨完整,出于控制風險和成本的考慮,把測試范圍先限制在內(nèi)部,以保證家丑不外揚。
如前文提到,京東不對外開放其通用大模型,而當下內(nèi)部多場景的協(xié)調(diào)不順,似乎已經(jīng)在暗示一些通用性的不足,拖慢了產(chǎn)品推進的腳步。
原文標題 : 言犀大模型,云計算競爭中的“泥腿子”
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市