當(dāng)Sora驚艷業(yè)界時(shí),李彥宏為何選了另一條路?
AI讓一切變得可能。
手工勞動(dòng)/挖哥手工編輯 /角叔出品/獨(dú)角獸觀察
一位時(shí)尚女性走在充滿溫暖霓虹燈和動(dòng)畫(huà)城市標(biāo)牌的東京街道上。她穿著黑色皮夾克、紅色長(zhǎng)裙和黑色靴子,拎著黑色手提包,戴著墨鏡,涂著紅色口紅。她自信而隨意地走著。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人在街上行走。
今年2月,OpenAI的Sora閃亮登場(chǎng),這段60秒一鏡到底的文生視頻迅速火爆出圈,業(yè)界驚呼AI視頻的GPT時(shí)刻到了。
國(guó)內(nèi)吃瓜群眾在感嘆Sora絲滑同時(shí),也開(kāi)始靈魂拷問(wèn):中國(guó)何時(shí)能有自己的Sora?壓力來(lái)到了百度這樣中國(guó)人工智能扛旗者身上。
跟還是不跟?
11月12日,在百度世界2024大會(huì)上,百度創(chuàng)始人李彥宏給出了答案:“當(dāng)年初整個(gè)中文互聯(lián)網(wǎng)都為Sora捶胸頓足時(shí),我們決定去解決圖像生成的幻覺(jué)問(wèn)題。這個(gè)問(wèn)題看起來(lái)更簡(jiǎn)單,甚至更枯燥,但是不解決就不會(huì)有應(yīng)用。”
這個(gè)取舍多少有些出乎常人意料,畢竟跟Sora相比,這個(gè)一點(diǎn)都不“性感”。
放棄大熱的Sora,選擇枯燥的iRAG,李彥宏做對(duì)了嗎?
01取舍
年初,在Sora特別熱的時(shí)候,《獨(dú)角獸觀察》了解到當(dāng)時(shí)百度內(nèi)部也有過(guò)討論,最后的結(jié)論是:千萬(wàn)不能去做Sora,因?yàn)橹芷谔L(zhǎng)了,可能要投入10年、20年。無(wú)論多火,都不能做。
年底,這個(gè)抉擇讓李彥宏站在上海世博中心的演講臺(tái)上,底氣十足地宣布:“過(guò)去24個(gè)月,這個(gè)行業(yè)最大的變化是大模型基本消除了幻覺(jué),回答問(wèn)題的準(zhǔn)確性大幅提升。”
李彥宏的底氣來(lái)源于百度的一項(xiàng)顛覆性技術(shù)iRAG(image based RAG),檢索增強(qiáng)的文生圖技術(shù)。
眾所周知,大模型是一個(gè)概率模型,生成的內(nèi)容具有一定不確定性,經(jīng)常會(huì)出現(xiàn)一些胡說(shuō)八道,讓人哭笑不得的結(jié)果。業(yè)界把這些由AI產(chǎn)生的不真實(shí)、虛構(gòu)的內(nèi)容稱(chēng)為AI幻覺(jué)現(xiàn)象。
李彥宏在現(xiàn)場(chǎng)展示了一張由開(kāi)源模型生成的北京天壇圖片,看上去很像,但總覺(jué)得哪兒又不對(duì)。直到對(duì)比天壇照片,才發(fā)現(xiàn)真正的天壇其實(shí)是三層,而模型生成的是四層。
這種李鬼替代李逵的情況,自?shī)首詷?lè)還行,要想變得可用、可信賴(lài)、有“人味”,就需要解決幻覺(jué)這個(gè)問(wèn)題。
與Sora相比,幻覺(jué)問(wèn)題可能不那么出彩,但他卻是制約大模型廣泛應(yīng)用的最大限制之一,幻覺(jué)問(wèn)題不僅影響了AI的實(shí)用性,也限制了大模型在很多領(lǐng)域的應(yīng)用。尤其像醫(yī)療、法律這樣需要高度準(zhǔn)確性的應(yīng)用場(chǎng)景,一個(gè)小誤差就可能導(dǎo)致嚴(yán)重的后果。
AI應(yīng)用要迎來(lái)百花齊放,幻覺(jué)問(wèn)題就是那堵遮擋了陽(yáng)光,影響花兒成長(zhǎng)的厚墻。
所以,從輕重緩急來(lái)說(shuō),iRAG比Sora的優(yōu)先級(jí)更高。
如果把格局拉大到整個(gè)人工智能行業(yè),解決幻覺(jué)問(wèn)題比做出Sora重要,它能幫助更多的應(yīng)用落地,讓更多人用上AI技術(shù),從而惠及更多行業(yè)。
百度檢索增強(qiáng)的文生圖技術(shù)iRAG ,通過(guò)把自身億級(jí)圖片數(shù)據(jù)和基礎(chǔ)模型能力結(jié)合,利用檢索到的信息來(lái)指導(dǎo)文本或答案,大大提高了內(nèi)容的質(zhì)量和準(zhǔn)確性,解決了以往文生圖模型生成圖片“機(jī)器味”重、一眼假的問(wèn)題。
耳聽(tīng)為虛,眼見(jiàn)為實(shí)。《獨(dú)角獸觀察》在文小言上實(shí)測(cè)了一輪,生成了下面這組圖片。
▲把蓋茨安排到長(zhǎng)城跟關(guān)羽搓麻將,就問(wèn)他怕不怕?
▲手持狙擊槍的林黛玉,你們從來(lái)沒(méi)見(jiàn)過(guò)吧?
▲老年蘇菲瑪索擁抱年輕的自己。
▲“搬家”到沙漠的自由女神像和埃菲爾鐵塔。
▲一個(gè)人冒雪上朝的張居正。
▲飛越壺口瀑布的法拉利。
雖然這組奇思妙想的圖片,大多不可能在現(xiàn)實(shí)中出現(xiàn),但由iRAG生成的圖片,元素都非常真實(shí),準(zhǔn)確性也非常高,如果不是因?yàn)閮?nèi)容太過(guò)“違和”,已經(jīng)看不出“AI味兒”。
通過(guò)iRAG去偽存真后,AI生成圖片的可用性大大提高,應(yīng)用空間也就隨之打開(kāi)了。像影視作品、漫畫(huà)作品,連續(xù)畫(huà)本,海報(bào)制作等,通過(guò)iRAG生圖可以大幅降低創(chuàng)作成本。
比如,一些大品牌的宣傳,拍一組高質(zhì)量的海報(bào),需要找策劃、模特、攝像等大量人力,消耗大量財(cái)力,動(dòng)輒一個(gè)項(xiàng)目都需要少則一二十萬(wàn),大則幾十萬(wàn),但現(xiàn)在成本接近于0。
李彥宏將iRAG的商業(yè)價(jià)值總結(jié)為:無(wú)幻覺(jué)、超真實(shí)、沒(méi)成本,立等可取。
02有用
李彥宏今年的演講主題是《應(yīng)用來(lái)了》。
與李彥宏過(guò)去1年多對(duì)大模型的思考一脈相承,其核心就兩個(gè)字:有用。
“沒(méi)有構(gòu)建于基礎(chǔ)模型之上的,豐富的AI原生應(yīng)用生態(tài),大模型就一文不值。”去年百度世界大會(huì),李彥宏呼吁創(chuàng)業(yè)者去做更容易產(chǎn)生價(jià)值的應(yīng)用。
今年,李彥宏把有用“升級(jí)”到超級(jí)有用:“百度不是要推出一個(gè)“超級(jí)應(yīng)用”,而是要不斷地幫助更多人、更多企業(yè)打造出數(shù)以百萬(wàn)‘超級(jí)有用’的應(yīng)用。”
正是基于有用的原則,李彥宏舍棄了看上去很華麗的sora,選擇做iRAG去解決幻覺(jué)問(wèn)題,搬走了大模型走向“有用”的最大路障。
“基礎(chǔ)模型能力就緒,我們將迎來(lái)AI應(yīng)用的群星閃耀時(shí)刻。每一個(gè)應(yīng)用都是一顆星,每一個(gè)應(yīng)用都將成為改變世界的力量。”李彥宏認(rèn)為未來(lái)有兩大AI應(yīng)用方向:一個(gè)是智能體,另一個(gè)是產(chǎn)業(yè)應(yīng)用。
大會(huì)現(xiàn)場(chǎng),百度發(fā)布了基于大模型的100大產(chǎn)業(yè)應(yīng)用,涵蓋了制造、能源、交通、政務(wù)、金融、汽車(chē)、教育、互聯(lián)網(wǎng)等眾多行業(yè)。
這宣示著大模型不再是空中樓閣,已開(kāi)始切切實(shí)實(shí)在重塑千行百業(yè)。
如果說(shuō)iRAG 讓大模型更有用,秒噠則讓大模型的使用門(mén)檻更低。
李彥宏演示了通過(guò)秒噠如何搭建一個(gè)活動(dòng)報(bào)名系統(tǒng)。
在整個(gè)“開(kāi)發(fā)”過(guò)程中,李彥宏只是向秒噠描述了需求,小組長(zhǎng)、策劃、小編、程序員和質(zhì)檢員5個(gè)智能體互相協(xié)作,協(xié)同完成策劃、內(nèi)容和開(kāi)發(fā)等各種工作,他們甚至還能自動(dòng)識(shí)別bug。
無(wú)代碼編程、多智能體協(xié)作、多工具調(diào)用,秒噠不用寫(xiě)代碼,就能實(shí)現(xiàn)任意想法,讓每個(gè)人具備程序員的能力。
“我們將迎來(lái)一個(gè)前所未有的只靠想法就能賺錢(qián)的時(shí)代。”百度CEO李彥宏說(shuō)。
這個(gè)將于明年一季度上線的工具,對(duì)大模型的重要性或許不亞于windows系統(tǒng)對(duì)PC普及的意義。
上世紀(jì)末,電腦操作系統(tǒng)還是基于文本命令行界面的dos系統(tǒng),對(duì)沒(méi)有計(jì)算機(jī)基礎(chǔ)的用戶(hù)非常不友好,windows的圖形界面,大大降低電腦使用門(mén)檻,讓電腦真正開(kāi)始進(jìn)入尋常百姓家。
03預(yù)見(jiàn)
從2022年chatgpt橫空出世至今,大模型已經(jīng)火了將近兩年。
這輪全球性的大模型狂熱,究竟是一場(chǎng)新的技術(shù)革命,還是新一輪泡沫?
李彥宏和他的百度文心大模型給出了答案:截至 11 月初,百度文心大模型的日均調(diào)用量超 15 億,最近半年增長(zhǎng)率更是達(dá)到7.5倍。
30多年前,還在北大讀書(shū)的李彥宏主動(dòng)選修了人工智能課程,自此就給AI結(jié)下了不解之緣,成為AI的長(zhǎng)期信仰者。
去年,在chatgpt后,李彥宏率先發(fā)布了國(guó)內(nèi)第一個(gè)大模型。
如今,大模型已成了互聯(lián)網(wǎng)大廠的“一號(hào)工程”。但鮮有像李彥宏這樣的“一號(hào)位”還活躍在前臺(tái),不遺余力大力推介AI。
2023年9月,《時(shí)代》周刊發(fā)布了首屆全球百大AI人物,李彥宏被評(píng)為全球AI領(lǐng)袖,和他一起被評(píng)選上的還有馬斯克、黃仁勛等。
《時(shí)代》評(píng)語(yǔ):“李彥宏是中國(guó)最杰出的未來(lái)主義者,長(zhǎng)期投身于AI發(fā)展的浪潮。”
預(yù)見(jiàn)未來(lái),讓李彥宏在狂熱的市場(chǎng)里,總能保持一份“人間清醒”。
去年,當(dāng)各路人馬蜂擁而入,鏖戰(zhàn)大模型時(shí),李彥宏說(shuō)“不要卷模型,要卷應(yīng)用”。事后證明確實(shí)不需要這么多大模型,如今美國(guó)還在堅(jiān)持做基礎(chǔ)大模型也就剩下幾個(gè)巨頭。
當(dāng)應(yīng)用開(kāi)始被重視,很多人開(kāi)始追求C端AI超級(jí)爆款,李彥宏說(shuō):“大模型對(duì)ToB 業(yè)務(wù)改造,比互聯(lián)網(wǎng)對(duì) ToB 的影響力要大一個(gè)數(shù)量級(jí)。”如今,C端的AI“超級(jí)APP”依然難尋,ToB 應(yīng)用百花齊放。
當(dāng)Sora年初炸場(chǎng)時(shí),李彥宏選擇去解決圖像生成的幻覺(jué)問(wèn)題,收獲了顛覆性技術(shù)iRAG。
在最近的一次專(zhuān)訪中,李彥宏詳解了他放棄做Sora的原因,他認(rèn)為Sora本質(zhì)上是在任意場(chǎng)景下的視頻生成能力,這個(gè)事情本身是非常有意義的,但同時(shí)又非常難,需要很長(zhǎng)很長(zhǎng)時(shí)間才能夠做出來(lái)。
一語(yǔ)成讖。
接近年底,Sora依然難產(chǎn),一些試用Sora的電影制作人體驗(yàn)后覺(jué)得并不太理想,有電影人反饋必須讓模型生成數(shù)百個(gè)短片,才能找到一個(gè)可用的短片。
Sora剛出來(lái)時(shí),擔(dān)心工作被AI取代,好萊塢影視從業(yè)者還爆發(fā)了抗議潮。現(xiàn)在,好萊塢已經(jīng)很久沒(méi)有抗議聲了。
跟著別人跑多為跟風(fēng)者,耐得住寂寞,堅(jiān)持自己方向的人才可能成為追風(fēng)者。
在李彥宏眼中,人工智能很像是一次新的工業(yè)革命,這意味著它不是三五年就結(jié)束,不是一兩年就出現(xiàn)“超級(jí)應(yīng)用”的過(guò)程,它更像是未來(lái)三十、五十年對(duì)整個(gè)社會(huì)一個(gè)非常徹底的重構(gòu)。
在人工智能的這場(chǎng)馬拉松式競(jìng)賽中,不逞一時(shí)之“快”,保持足夠耐心和戰(zhàn)略定力,才不會(huì)掉隊(duì)、跑偏。(完)
原文標(biāo)題 : 當(dāng)Sora驚艷業(yè)界時(shí),李彥宏為何選了另一條路?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
11月20日火熱報(bào)名中>> 2024 智能家居出海論壇
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
推薦專(zhuān)題
- 1 腦機(jī)接口芯片,華為出了新專(zhuān)利!
- 2 銀行業(yè)AI大模型,從入局到求變
- 3 巨頭搶布局,VC狂撒錢(qián),為了能讓「AI讀心」這些公司卷瘋了
- 4 阿斯麥ASML:“骨折級(jí)”洋相,又成AI第一殺手?
- 5 蘋(píng)果市值創(chuàng)新高,iPhone 16能否助力突破4萬(wàn)億美元大關(guān)?
- 6 地平線開(kāi)啟配售,阿里百度各砸5000萬(wàn)美金,市值最高超500億
- 7 小馬智行沖刺納斯達(dá)克:或成「全球Robotaxi第一股」,兩年半營(yíng)收約12億元
- 8 云從科技:營(yíng)收低迷與虧損加劇,2025年盈利目標(biāo)挑戰(zhàn)重重
- 9 AI奇跡:域名賣(mài)爆,無(wú)名小島意外賺2億
- 10 逆境求生,泄密風(fēng)波中的高精地圖
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市