Web 3.0后下一個風口,AIGC將成未來內容趨勢?
文/VR陀螺 林德
AI,人工智能,從今年年初到現(xiàn)在已然成為互聯(lián)網最熱門、引起網友討論度最高的科技概念之一。
今年4月,一款名為DALL-E 2的AI繪畫模型誕生,在短短幾個月時間內便風靡全球,成為今年最火熱的AI繪畫模型,被譽為最強AI畫手。
無論是文藝復興風格、寶麗來風格,或是愛德華·霍普畫風、莫奈畫風、數(shù)字藝術,亦或是復古風、二戰(zhàn)歷史攝影風格等等,DALL-E 2都能輕松實現(xiàn),只要給出關鍵詞,大約60秒便可以產生10張圖像供用戶選擇。
DALL-E 2部分作品(圖源:DALL-E 2)
腦洞無限大、寫實、易操作、更準確的指令理解...各種元素的集合誕生了不少令人眼前一亮的創(chuàng)意作品,DALL-E 2的作品在社交媒體得到許多用戶的喜愛。
在DALL-E 2全網爆紅之前,輸入文字生成圖像,這種存在于想象中的事情成為現(xiàn)實的潮流就已經開始流行。在今年年初,AI繪畫工具Disco Diffusion、Midjourney早已受到不少藝術家、時尚先鋒的青睞,不僅用于娛樂自嗨,商業(yè)用途中也能看見AI的身影。
在獲得羅拉多州博覽會藝術創(chuàng)作比賽活動一等獎之前,今年六月《經濟學人》的期刊封面便是出自Midjourney之手。(圖源:《經濟學人》)
AI繪畫平臺Midjourney在Discord上的訂閱人數(shù)也已超過百萬。
截止至9月7日,Midjourney在Discord的訂閱情況(圖源:VR陀螺)
從Disco Diffusion到MidJourney,再到DALL-E 2的全網流行,Text-to-Image(文字生成圖像)從小眾開發(fā)社群火到社交媒體進入大眾眼簾,AI生成圖像的創(chuàng)作方式讓海內外的用戶驚呼AI的發(fā)展竟然到了這種程度!
輸入“骨頭山”、“宗教化”、“火焰”、“無動于衷的人們”四組關鍵詞組獲得的四張AIGC圖像(圖源:VR陀螺)
最近,AI畫畫熱度退散之后,AI寫論文又再度幫助AI破圈。事情源于一篇Reddit上的帖子,發(fā)帖人Urdadgirl69表示他的論文就是由AI代筆完成,而他的老師并沒有發(fā)現(xiàn)作業(yè)的異常情況。
圖源:游戲研究社
更具有沖擊力的是,Meta在十月初發(fā)布的文本轉視頻Make-A-Video功能,意味著AI圖像制作領域又有了新的突破,在圖像逼真內容豐富的情況下,邁向了動態(tài)的視頻領域。
輸入“一只穿著超人紅色披風在天上飛的狗”獲得的視頻(圖源:Meta)
從“人均AI畫師”到“我讓AI幫我寫論文,不僅拿A,還能賺錢”,AI這個關鍵詞頻頻出圈。無論是AI生成圖像,還是AI生成文本,或是AI生成視頻,這些都被統(tǒng)稱為AIGC內容生成模式。
AIGC,人工智能生成內容,顧名思義是由人工智能驅動的工具創(chuàng)造的內容,這種內容生產模式在不僅在繪畫、寫作領域成為熱門趨勢,在游戲場景建模、數(shù)字人、AI聊天、科研AI for Science、AI換臉、音樂等領域也有所建樹,可以看到,這種模式正在成為新的主流。
AIGC當?shù)溃Y本的“新頭好”
獲益于頻頻在大眾視野中“刷臉”,AIGC的熱度以及前景讓越來越多的資本將目光放至于此。
今年9月,紅杉資本官方發(fā)表的一篇文章《Generative AI: A Creative New World》》中認為AIGC將會代表新一輪范式轉移(認知轉移)的開始。
圖源:網絡
近日,依靠文字生成Instagram標題、Tiktok視頻腳本、廣告營銷文本、電子郵件等內容,成立不到兩年時間的AIGC 初創(chuàng)公司 Jasper 宣布自身以15億美元的估值獲得 1.25億美元 A輪融資,搖身一變成為AIGC圈的新興強者。
圖源:Jasper
10月17日,英國開源人工智能公司 Stability AI 宣布獲得 1.01 億美元融資,估值高達 10 億美元,躋身獨角獸企業(yè)行列。
10月21日,根據(jù)澎湃新聞,《華爾街日報》表示谷歌公司正在展開談判,擬向人工智能初創(chuàng)企業(yè)Cohere投資至少2億美元。Cohere的業(yè)務包括開發(fā)自然語言處理軟件,包括聊天機器人等可以理解人類語音和文本的程序。
此外,微軟正對OpenAI的新一輪投資進行后期談判。OpenAI推出了DALL·E 2項目,允許用戶通過文本生成圖像,即AI作畫。
不僅在海外AIGC企業(yè)有多起融資事件,甚至出現(xiàn)獨角獸企業(yè),在國內AIGC類企業(yè)同樣備受資本青睞。
今年1月,超參數(shù)科技宣布完成1億美元B輪融資。
10月,虛擬內容 AIGC 技術服務商慧夜科技完成千萬元人民幣Pre-A+ 輪融資,由高瓴資本和順為資本領投。
同樣發(fā)生在10月,成立于2021年的生成式AI平臺TIAMAT宣布完成數(shù)百萬美元天使輪融資。據(jù)了解,TIAMAT近4個月內的全網曝光量已經達到了5000萬,并且這個數(shù)據(jù)還在不斷攀升。
......
AIGC在投資圈已然成為資本重點關注對象,在科技界,科技大廠們也同樣將其視作重點戰(zhàn)略布局環(huán)節(jié)。
大廠重要戰(zhàn)略布局 AIGC是未來內容趨勢
隨著互聯(lián)網的不斷升級,從Web 1.0到現(xiàn)在的Web 2.0,再到未來Web 3.0時代,以門戶網站為主的媒體時代到自媒體時代、社交平臺的興起,用戶對互聯(lián)網的依賴度逐漸上升,內容生產方式也在進行著變遷。
在Web 3.0時代中,數(shù)字世界將變得更為清晰,AI也一直被視為元宇宙關鍵技術之一、助力數(shù)字孿生的重要利器。從“只讀模式”的PGC(專業(yè)生產內容)到用戶自發(fā)參與的UGC(用戶生產內容)再到AIGC(AI生產內容),內容創(chuàng)作門檻正在逐步降低,內容生產力無疑將獲得更高的釋放。
不妨想象一下,在虛擬世界里,無論是打造比擬真實場景的外在,還是塑造數(shù)字生物的“思想”內在,都需要更高效、更實時的內容創(chuàng)作,這也就凸顯了能夠突破人力限制的AI技術的重要性。
以游戲中的智能NPC為例,若每個NPC以智能體的形式存在,那么它不僅能夠識別所處環(huán)境狀態(tài)的變化,而且能夠根據(jù)環(huán)境狀態(tài)的調整行為策略,做出符合自身個性特征的行為。在任何場景下,玩家與智能體的每一次互動,智能體都能夠根據(jù)玩家狀態(tài)、環(huán)境狀態(tài)和自身狀態(tài)的參數(shù)做出相應的行為,進而在與玩家的互動過程中產生突發(fā)的動態(tài)內容,這將對于數(shù)字世界的意義不言而喻。
電影《失控玩家》中自我意識覺醒的智能NPC男主(圖源:網絡)
邁向下一代互聯(lián)網是各大科技巨頭、互聯(lián)網大廠,如今在元宇宙的加持下,數(shù)字化時代開啟新一輪加速,AIGC的背后生產力--人工智能技術早已被納入巨頭們的重要戰(zhàn)略布局之中。
去年12月,Meta已將其AI團隊并入Reality Labs部門,以開發(fā)元宇宙。
今年1月24日,Meta在一篇博客文章中表示其公司研究團隊正在打造一款新的人工智能超級計算機,并有望在今年下半年沖擊“全球最快AI超算”寶座。
實際上,早在2017年,臉書就發(fā)布了第一代AI超級計算機。據(jù)Meta而言,相較于第一代超算,新的人工智能超級集群(RSC)在運行計算機視覺工作流程的速度上提高了20倍,運行英偉達集體通信庫(nccl)的速度提高了9倍多,自然語言處理能力則提高了三倍多,并且可以從數(shù)萬億例子中學習,在數(shù)百種語言中運作,分析文本、圖像和視頻的內容是否有問題。
Meta AI團隊的研究人員Kevin Lee和Shubho Sengupta在博文中表示,RSC將在下一個計算平臺元宇宙中發(fā)揮重要作用。
圖源:網絡
今年2月,在Meta AI: Inside the Lab活動上,Meta展示了其AIGC向的“探索性工具”原型Builder Bot。在Meta官方發(fā)布的視頻中,隨著扎克伯格“聲聲令下”,公園、海、沙灘、島嶼、云朵等,甚至BGM逐漸形成一個完整的場景。
圖源:Meta
這一切都是由AI驅動生成的內容,通過語音搭建VR場景,Meta稱該工具將“促進元宇宙的創(chuàng)造力”。
可以預見的是,這項技術如果取得成功,有很大可能會對其他VR世界和平臺產生影響,打造VR場景將會變得更加容易。如果將Meta的Builder bot技術整合,元宇宙的內容生態(tài)也將獲得新的增長,例如,與已經開始測試語音功能的游戲元宇宙平臺Roblox合作打造場景,以豐富生態(tài)內容等等。
去年4月,英偉達打造的“工業(yè)元宇宙”創(chuàng)作平臺Omniverse以難辨真假的虛擬黃仁勛出圈,11月份,英偉達推出AI虛擬化身創(chuàng)建平臺Omniverse Avatar說,今年CES 2022上,英偉達宣布Omniverse三項AI新功能,助力AIGC。
從Omniverse到Omniverse Avatar,英偉達皆在幫助用戶更快速地合成所需的數(shù)字內容,包括數(shù)字化場景、Avatar化身、甚至僅需一條音軌即可輕松制作3D人臉動動畫等等。
英偉達中國區(qū)Omniverse業(yè)務發(fā)展經理何展曾表示,“從UGC過渡到AIGC,無論是設計師、創(chuàng)業(yè)公司和很多大的平臺公司都有明顯的趨勢。因為UGC已經發(fā)展了很長時間,現(xiàn)在我們更想要快速工業(yè)化生產的平臺,讓大家能夠從AI紅利獲得更好的益處!
Q版AI黃仁勛(圖源:英偉達)
不止海外大廠對AI,尤其是對AIGC這種新的內容模式“給予厚望”,今年7月,國內互聯(lián)網大廠百度在百度世界大會活動現(xiàn)場利用AI技術復原了《富春山居圖》殘卷,背后的核心技術便是AIGC。
在大會現(xiàn)場,百度掌門人李彥宏還表示:“AIGC是PGC、UGC之后,全新的內容生產方式。它不僅會提升內容生產的效率,也會創(chuàng)造出有獨特價值和獨立視角的內容!
紅框部分為AIGC內容(圖源:網絡)
“未來十年,AIGC將顛覆現(xiàn)有內容生產模式。可以實現(xiàn)以十分之一的成本,以百倍千倍的生產速度,去生成AI原創(chuàng)內容。”
從二維向三維過渡 理想中的AIGC究竟有多難?
根據(jù)中國信通院發(fā)表的《人工智能生成內容(AIGC)白皮書》,AIGC的發(fā)展階段分為三個,首先是受限于技術發(fā)展的早期概念階段,到1990年之后的沉淀積累階段,再到2010年至今的快速發(fā)展階段,特別是從2014年起,生成式對抗網絡(GAN)的提出與迭代更新,以及AI算法的升級讓AIGC迎來了百花齊放的內容時代。
但目前AIGC的涉及范圍更多在圖像、視頻、語音等相對二維化的場景應用中,而回到元宇宙這個愿景,三維化應用場景才是關鍵,AIGC技術的應用無疑將推動二維互聯(lián)網向三維互聯(lián)網的過渡,但理想的AIGC的難度可想而知。
二維與三維的區(qū)別(圖源:網絡)
理想很豐滿,現(xiàn)實很骨感,這句話形容元宇宙,在某些程度上可以說是非常貼近。而要實現(xiàn)元宇宙內容生產上的AIGC化究竟有多難?需要什么?
AIGC技術的提升背靠GAN和AI算法的支持,根據(jù)中國信通院的研究發(fā)現(xiàn),深度神經網絡的升級是推動AIGC快速發(fā)展的另一個主要原因,實驗證明,深度神經網絡的學習能力和模型大小呈正相關,伴隨著模型參數(shù)量的增加,相對應深度神經網絡的能力一般會取得大幅提升。
即使是模型架構各有不同,但可以肯定的是,這些深度學習網絡的生成邏輯往往都需要大量的數(shù)據(jù)支撐。光是自然語言模型的突破,國內外的企業(yè)和高校都投入了巨大的人力、算力,據(jù)悉,模型的參數(shù)量從千萬級已經發(fā)展到了千億級別。
但三維世界的數(shù)據(jù)支撐相對而言就十分有限,要想在元宇宙中實現(xiàn)AIGC生產方式,首先需要龐大的三維素材庫。而三維素材的掃描,數(shù)據(jù)的收集顯然比二維更加麻煩,在如今激光雷達LiDAR這類深度攝像還未普及的情況下,三維素材的素材量顯然是不足以支撐一個理想的AIGC模型訓練。
其次是,算力的升級。
相對于二維平面,三維空間相對增加了許多維度,除了語音語義識別、計算及圖像識別之外,還有空間識別例如距離、大小、空間位置等,因此在算力和模型架構的升級是必不可少的。
以英偉達自動駕駛的演示案例為例,為了保證安全性,自動駕駛的車輛上采集器的數(shù)據(jù)來源需要非常多,激光雷達、雷達、攝像頭等。
這些采樣得到的數(shù)據(jù)不是單一的,而是多樣性的,包括地圖、環(huán)境位置、車內狀況、突發(fā)情況等,因此自動駕駛車規(guī)級的計算機每秒鐘運算的數(shù)據(jù)量是非常巨大的。而要達到高精度的三維場景自主搭建,計算力的升級也是極其重要的一環(huán)。
圖源:CNMO
理想化的元宇宙場景是根據(jù)個人喜好生成符合用戶自身的三維場景、人物形象等,目前,3D建模AIGC化已經能在許多案例中看到,無論是Deepfake換臉技術,還是自動生成3D模型的軟件等。但都還局限于XR技術的發(fā)展,目前3D化的場景與模型都只能在2D平面中看到。
3D建模手辦(圖源:機器之心)
并且,用戶的個性化數(shù)據(jù)需要龐大的用戶基數(shù),但用戶數(shù)據(jù)泄露、非法收集等安全問題也一直被詬病,在虛擬空間中引發(fā)的安全爭議也有不少案例。
此外,理想化AIGC最后一個關鍵是AI需要具備“意識”形成。
這里的意識不是指自我意識,而是能基于不用的語義信息、環(huán)境、概念等進行創(chuàng)作的創(chuàng)作意識,例如一些智能NPC、虛擬人偶像等的應用。
根據(jù)中國信通院的說法,按照技術的發(fā)展進程和實際應用的形態(tài),數(shù)字內容的創(chuàng)作能力可劃分為基于模仿的創(chuàng)作和基于概念的創(chuàng)作兩類。
在未來,深度神經網絡的高速發(fā)展下,人工智能將會被不斷刷新,伴隨著的將是人工智能更強的理解能力以及生成能力,數(shù)字內容也將到達新的高度。
結語
科技巨頭們的舉動無疑是標志著人工智能已經被置于發(fā)展核心布局的一環(huán),在未來,人工智能將扮演關鍵角色。在AI的加持下,互聯(lián)網世界的內容,無論是多樣性還是數(shù)量都將再次達到新的高峰,毫無疑問,AIGC將在互聯(lián)網內容創(chuàng)作迭代上起到多么關鍵的推進作用。
但作為最飽受爭議的科技之一,人工智能在不斷的發(fā)展、融合之中又在不斷地帶來新的創(chuàng)意,新的爭議,同時AI侵入學術界、教育界、藝術界等的事件讓大眾也產生了一定程度的危機感。
水能載舟,亦能覆舟。如同MidJourney的創(chuàng)始人大衛(wèi)·霍爾茨(David Holz)說的一般,“人們把人工智能看作一只老虎,一只危險的、會吃掉人的老虎。不過就像水一樣,水中也有危險,但人們可以游泳、造船、利用水發(fā)電,它既是危險的,又是文明的驅動力。這是一個機會,它沒有意志,我們可能會淹死在水中,但不意味著水應該被禁止。人工智能就是一個新的水源,只要利用得當就會讓人類變更好!
雖然AIGC對于信息生產的擴展性的意義重大,但同時這需要計算機、數(shù)學、心理學、社會學、哲學等許多學科的交集,共同進步人類才能跨越工業(yè)生產的下一步,這也是眾多科技巨頭仍在探索和努力的方向。
原文標題 : Web 3.0后下一個風口,AIGC將成未來內容趨勢?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題