一文讀懂什么是AIGC、ChatGPT、大模型
昨天有讀者私信我,能否解釋一下AIGC和ChatGPT是什么樣的關(guān)系?
確實(shí),在短短的6個(gè)月時(shí)間里,AIGC、ChatGPT、大模型等新詞匯一下成為媒體熱詞,加上所謂“人工智能將取代你的工作”之類的焦慮,張棟偉覺(jué)得有必要寫(xiě)這樣一篇科普。
本文將力求簡(jiǎn)單化的說(shuō)明這次人工智能浪潮帶來(lái)的新詞匯和它的意義,帶你一文讀懂什么是AIGC、ChatGPT、大模型。
1、什么是AI
AI,人工智能(Artificial Intelligence)的英文縮寫(xiě)。
AI是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。
人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。
工廠里的自動(dòng)生產(chǎn)線,小米公司的“鐵蛋”機(jī)器狗,火車(chē)站的人臉識(shí)別通道,科大訊飛的語(yǔ)音輸入法,都是屬于AI系統(tǒng)的應(yīng)用。
2、什么是AIGC
AIGC,全名“AI Generated Content”,中文直譯就是“人工智能生成內(nèi)容”,也可以稱為“生成式AI” (Generative AI)。例如AI文本續(xù)寫(xiě),文字轉(zhuǎn)圖像的AI圖、AI數(shù)字化主持人等,都屬于AIGC的范疇。
3、什么是大模型
首先解釋,什么是GPT。
GPT的全稱,是Generative Pre-Trained Transformer(生成式預(yù)訓(xùn)練轉(zhuǎn)換器)是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來(lái)訓(xùn)練的、文本生成的深度學(xué)習(xí)模型。
GPT是AIGC的一個(gè)種類。
在ChatGPT之前,被公眾關(guān)注的AI模型是用于單一任務(wù)的,比如全球所知的“阿爾法狗”(AlphaGo)可以基于全球圍棋棋譜的計(jì)算,打贏所有的人類圍棋大師。谷歌進(jìn)一步開(kāi)發(fā)的“AlphaZero”在圍棋、國(guó)際象棋和日本象棋等項(xiàng)目上,都是所向無(wú)敵。
這種專注于某個(gè)具體任務(wù)建立的AI數(shù)據(jù)模型,叫“小模型”。
ChatGPT與這種“小模型”不同,GPT大模型更像人類的大腦。它兼具“大規(guī)模”和“預(yù)訓(xùn)練”兩種屬性,可以在海量通用數(shù)據(jù)上進(jìn)行預(yù)先訓(xùn)練,能大幅提升AI的泛化性、通用性、實(shí)用性。
基于GPT機(jī)制建立的AI數(shù)據(jù)模型,就叫“大模型”。
4、什么是ChatGPT
ChatGPT是由美國(guó)OpenAI公司發(fā)布的大模型。
由于ChatGPT 3.5展現(xiàn)了超出現(xiàn)實(shí)預(yù)期的智能數(shù)據(jù)能力,引發(fā)了一場(chǎng)新的全球人工智能競(jìng)賽。2023年3月,ChatGPT -4進(jìn)一步提高了AI的能力。
5、中國(guó)有ChatGPT嗎?
首先再次強(qiáng)調(diào),ChatGPT是特指美國(guó)OpenAI公司的大模型。這是一個(gè)產(chǎn)品名稱。
但是,領(lǐng)先的產(chǎn)品,往往會(huì)成為行業(yè)代名詞,比如我們說(shuō)搜索的時(shí)候,會(huì)簡(jiǎn)單的說(shuō)“百度一下”。但實(shí)際上,搜索引擎還有360、Bing、谷歌等其他方式。
目前,我們把與ChatGPT類似的產(chǎn)品,暫時(shí)叫“類ChatGPT”產(chǎn)品或者直接叫“大模型”產(chǎn)品。
在ChatGPT火爆以后,中國(guó)的科技企業(yè)紛紛“趕上潮流”,推出了自己的大模型產(chǎn)品。以下是《中國(guó)企業(yè)家》雜志統(tǒng)計(jì)出的一些知名公司的產(chǎn)品列表。
但是,這種復(fù)雜的技術(shù)模型,顯然不是一朝一夕就能實(shí)現(xiàn)。多個(gè)國(guó)內(nèi)的大模型被國(guó)外技術(shù)人員質(zhì)疑,是用ChatGPT進(jìn)行“套殼”,用以提升品牌形象和股價(jià)。
中國(guó)的GPT大模型要成熟,還需要比較多的時(shí)間和機(jī)會(huì),本文后面部分會(huì)繼續(xù)說(shuō)明。
6、ChatGPT有什么用途
ChatGPT是一種能生成文本、圖像等內(nèi)容的復(fù)雜系統(tǒng)。
OpenAI的戰(zhàn)略伙伴微軟(Microsoft)已將該技術(shù)添加到其Office MS 365辦公套件及搜索引擎必應(yīng)(Bing)等產(chǎn)品中。
微軟的競(jìng)爭(zhēng)對(duì)手谷歌(Google)也推出了類似的搜索工具Bard。
ChatGPT可以進(jìn)行從歷史到哲學(xué)等話題的對(duì)話,生成不同風(fēng)格的文案、文章、歌詞、詩(shī)歌,甚至直接生成計(jì)算機(jī)代碼,或者對(duì)已有的計(jì)算機(jī)程序代碼提供修改建議。ChatGPT也能處理視覺(jué)信息,諸如回答關(guān)于照片內(nèi)容的問(wèn)題。
ChatGPT是基于從互聯(lián)網(wǎng)上搜羅的大量文章、圖像、網(wǎng)站和社交媒體內(nèi)容,以及與OpenAI人類雇工的實(shí)時(shí)對(duì)話(主要是英語(yǔ))進(jìn)行訓(xùn)練的。實(shí)際上,早在2014年微軟公司面向中國(guó)推出了AI聊天機(jī)器人小冰,目前不知道小冰的對(duì)話內(nèi)容是否也是ChatGPT學(xué)習(xí)的數(shù)據(jù)來(lái)源之一。
ChatGPT學(xué)著模仿寫(xiě)作的語(yǔ)法和結(jié)構(gòu),輸出常用表達(dá)。它還學(xué)習(xí)識(shí)別圖像中的形狀和圖案,如一只貓、一個(gè)孩子或一件襯衫的輪廓。它還可以將單詞和短語(yǔ)與這些形狀和圖案相匹配,允許用戶詢問(wèn)圖像的內(nèi)容,如貓?jiān)谧鍪裁椿蛞r衫的顏色是什么。
因?yàn)镃hatGPT的原始數(shù)據(jù)來(lái)自于公開(kāi)的互聯(lián)網(wǎng),而互聯(lián)網(wǎng)上的信息并不總是準(zhǔn)確的。因此,ChatGPT給出的答案結(jié)果,并沒(méi)有經(jīng)過(guò)事實(shí)核查,不能100%保證準(zhǔn)確,甚至有些完全是“一本正經(jīng)的胡說(shuō)八道”。
ChatGPT需要依靠人類員工的反饋來(lái)提高準(zhǔn)確性。
其他類似的大模型,同樣如此,都需要非常海量的人工能力,來(lái)幫助大模型提升準(zhǔn)確性。這就是類似于在中國(guó),雖然大家覺(jué)得高德地圖、百度地圖、騰訊地圖很智能,但是實(shí)際上,它們不僅僅是在調(diào)用衛(wèi)星數(shù)據(jù)、交通部門(mén)數(shù)據(jù),還有數(shù)以萬(wàn)計(jì)的人工“標(biāo)記員”在幫助和輔助數(shù)據(jù)修正工作。
7、ChatGPT之類的大模型是如何工作的?
前面已經(jīng)說(shuō)過(guò),GPT的意思是“生成式預(yù)訓(xùn)練轉(zhuǎn)換器(Generative Pre-trained Transformer),這是大模型的核心技術(shù)。
轉(zhuǎn)換器是在數(shù)據(jù)序列中尋找長(zhǎng)程模式的專門(mén)算法。轉(zhuǎn)換器不僅能學(xué)會(huì)預(yù)測(cè)一個(gè)句子中的下一個(gè)詞,還能學(xué)會(huì)預(yù)測(cè)一個(gè)段落中的下一個(gè)句子以及一篇文章中的下一個(gè)段落。這就是為什么它能夠在長(zhǎng)文本中緊扣主題。
由于轉(zhuǎn)換器需要大量的數(shù)據(jù),它的訓(xùn)練分為兩個(gè)階段:首先,它用通用數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,這種數(shù)據(jù)更容易大量收集;然后,根據(jù)它要執(zhí)行的具體任務(wù),再利用定制的數(shù)據(jù)進(jìn)行微調(diào)。
張棟偉在最近的兩篇文章中多次強(qiáng)調(diào),大模型的核心取決于三個(gè)因素:數(shù)據(jù)、算力和場(chǎng)景。
所有的大模型都要受制于該公司所能合法獲得的數(shù)據(jù)量,還要具備能支撐這些數(shù)據(jù)的算力。最后,還需要有可以商業(yè)化的場(chǎng)景,形成投資-產(chǎn)出的正循環(huán)。
8、ChatGPT這樣的大模型收費(fèi)嗎?
目前,包括美國(guó)的ChatGPT,以及國(guó)內(nèi)的各種大模型,都是免費(fèi)的。需要個(gè)人去官網(wǎng)注冊(cè)申請(qǐng)。
大模型產(chǎn)品都會(huì)提供一個(gè)API(應(yīng)用程序編程接口),允許各公司將該技術(shù)整合到自家產(chǎn)品或后端解決方案中。這種企業(yè)定制版本,以及面向個(gè)人的高級(jí)版本,會(huì)收費(fèi)。
需要再次提示的是,上文已經(jīng)說(shuō)過(guò),目前大模型都還需要人工進(jìn)行優(yōu)化,因此你在大模型輸入的內(nèi)容,以及大模型給你輸出的答案結(jié)果,這些信息都會(huì)被開(kāi)發(fā)者公司閱讀到。
所以,請(qǐng)不要輸入隱私數(shù)據(jù)或敏感的公司信息。
9、政府對(duì)AIGC的態(tài)度
世界各國(guó)政府正在探索規(guī)范生成式AI工具的方式,擔(dān)心它們可能被濫用于犯罪、傳播虛假信息或威脅國(guó)家安全等情況。
4月11日,國(guó)家互聯(lián)網(wǎng)信息辦公室(簡(jiǎn)稱“網(wǎng)信辦”)發(fā)布通知,就《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》向社會(huì)公開(kāi)征求意見(jiàn),意見(jiàn)反饋截止時(shí)間為5月10日。
網(wǎng)信辦表示, “國(guó)家支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應(yīng)用、國(guó)際合作,鼓勵(lì)優(yōu)先采用安全可信的軟件、工具、計(jì)算和數(shù)據(jù)資源”。
網(wǎng)信辦定義,所謂“生成式人工智能”,是指基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容的技術(shù)。網(wǎng)信辦明確研發(fā)、利用生成式人工智能產(chǎn)品,面向中華人民共和國(guó)境內(nèi)公眾提供服務(wù)的,適用本辦法。
在服務(wù)提供者的準(zhǔn)入資格方面,《意見(jiàn)征求稿》要求利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前,應(yīng)當(dāng)按照《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》(2018年11月發(fā)布)向國(guó)家網(wǎng)信部門(mén)申報(bào)安全評(píng)估,并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(2021年12月發(fā)布)履行算法備案和變更、注銷備案手續(xù)。
《意見(jiàn)征求稿》詳細(xì)地分別對(duì)提供生成式人工智能產(chǎn)品或服務(wù),對(duì)用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。
10、AI會(huì)搶人類飯碗嗎?
任何最新發(fā)明的技術(shù),都會(huì)對(duì)當(dāng)下的崗位和未來(lái)的工作產(chǎn)生重大影響。
在此前的計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的技術(shù)浪潮中,都會(huì)藍(lán)領(lǐng)階層產(chǎn)生了重大影響。
當(dāng)前業(yè)內(nèi)普遍認(rèn)為,AIGC將對(duì)白領(lǐng)職業(yè)產(chǎn)生較大影響。
但是,回首往事,會(huì)發(fā)現(xiàn)計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)三大革命性的新技術(shù),使得社會(huì)經(jīng)濟(jì)變得更加生機(jī)勃勃。
這是因?yàn),?jīng)濟(jì)學(xué)家已經(jīng)發(fā)現(xiàn),新技術(shù)的相關(guān)影響往往包含三個(gè)方面:
(1)一些勞動(dòng)者提高了生產(chǎn)力;
(2)部分崗位實(shí)現(xiàn)自動(dòng)化或被合并;
(3)產(chǎn)生出以前不存在的新崗位。
由于新崗位的生產(chǎn)效率,要優(yōu)于被取代崗位的生產(chǎn)效率,所以實(shí)際上整個(gè)社會(huì)的生產(chǎn)效率是提升的。
但是具體到個(gè)人,只能說(shuō)是:
“最先掌握AI的人,將會(huì)比較晚掌握AI的人有競(jìng)爭(zhēng)優(yōu)勢(shì)”。
這句話,放在計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的開(kāi)局時(shí)期,都是一樣的道理。
如果你也想盡早掌握AI技術(shù),請(qǐng)關(guān)注我。
作者:張棟偉 (資深互聯(lián)網(wǎng)人士、市場(chǎng)營(yíng)銷專家、大學(xué)生就業(yè)創(chuàng)業(yè)導(dǎo)師)
原文標(biāo)題 : 張棟偉:一文讀懂什么是AIGC、ChatGPT、大模型
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專題
- 1 【一周車(chē)話】沒(méi)有方向盤(pán)和踏板的車(chē),你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車(chē),還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 大模型“新星”開(kāi)啟變現(xiàn)競(jìng)速
- 6 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 7 AI 投流卷哭創(chuàng)業(yè)者
- 8 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 9 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 10 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市