訂閱
糾錯
加入自媒體

爆火的Sora,摩拳擦掌的出海人

2024-02-22 10:14
霞光社
關(guān)注

作者 | 麻吉編輯 | 劉景豐

一年前AI智能涌現(xiàn)的場景又重現(xiàn)。2024開年,Sora就引發(fā)了全球科技圈的集體躁動。當?shù)貢r間2月15日,OpenAI發(fā)布最新視頻生成模型Sora。根據(jù)OpenAI描述,Sora可根據(jù)用戶輸入的簡短文本指令,生成長達1分鐘的高清視頻,并創(chuàng)建具有多個角色、特定類型的運動以及準確的主題和背景細節(jié)的復(fù)雜場景。讓全球受眾感到驚嘆的,是Sora生成視頻中極具真實感的畫面呈現(xiàn),甚至還帶著些許電影質(zhì)感。

圖源:OpenAI網(wǎng)站截圖

在OpenAI發(fā)布的一系列不同主題視頻中,不論是戴墨鏡女子走在東京街頭的場景,或是動畫人物的細節(jié)塑造,雖然這些內(nèi)容完全由AI生成,但其中細節(jié)呈現(xiàn)出的畫面真實感已經(jīng)進入一個全新維度。這讓不少網(wǎng)友感嘆,現(xiàn)實的邊界正在數(shù)字世界中變得愈發(fā)模糊。正如OpenAI 在Sora技術(shù)報告的標題中赫然寫道的,“ Sora 這類視頻生成模型是「世界的模擬器」”。

對中國出海企業(yè)來說,AI技術(shù)推動下內(nèi)容生產(chǎn)力的大幅提升,也將進一步助力產(chǎn)業(yè)升級,并加速企業(yè)的全球化步伐。而TikTok平臺上,已經(jīng)開始充斥各種由AI生成的視頻瘋狂吸粉。

去年初,OpenAI發(fā)布的大語言模型ChatGPT掀起了一輪人工智能的熱潮。ChatGPT上線后,幾乎所有全球科技大廠都全速投入AI領(lǐng)域,發(fā)布了自己的大語言模型,影響著人們?nèi)粘K阉餍畔、查找資料的方式發(fā)生改變。而文生視頻模型Sora的發(fā)布,更直觀地呈現(xiàn)了AI技術(shù)正在以何種速度飛速發(fā)展。在社交媒體X上一條Sora演示視頻下方,特斯拉創(chuàng)始人馬斯克發(fā)表評價說“gg 人類”(gg為Good Games縮寫,代指“打得好,我認輸”)。他還表示,由人工智能增強的人類,將會在未來幾年之內(nèi)創(chuàng)作出最杰出的作品。360集團創(chuàng)始人、董事長周鴻祎則表示,Sora的誕生意味著AGI的實現(xiàn)將從10年縮短至1年。“Sora把AI視頻能力推到了一個新的階段,是走向?qū)嵱没拈_始。

視頻生產(chǎn)成本將大幅降低,所需要的技能也將和以前完全不同。以前的技能是如何找到優(yōu)質(zhì)的拍攝團隊,場地,以及合適的價格進行產(chǎn)品視頻拍攝,如何協(xié)調(diào)和溝通。之后的技能是如何寫prompt,如何讓AI把自己的產(chǎn)品不失真的融入到視頻里,如何讓視頻看起來真實清晰有質(zhì)感。”Passioncy創(chuàng)始人郭林告訴霞光社。就在近日,OpenAI的TikTok賬號上,各種由AI生成的視頻瘋狂吸粉,在短短數(shù)天時間內(nèi)吸粉超10萬,獲得超50萬次點贊。網(wǎng)友們紛紛留言感慨,短視頻創(chuàng)作者是否即將會被AI搶了飯碗,甚至連TikTok平臺都會受到影響。雖然Sora還未正式開放給用戶使用,但已經(jīng)在資本市場掀起波瀾。市場預(yù)計,在最新一輪由風投公司ThriveCapital牽頭的融資中,OpenAI的估值有望超過800億美元。作為對比,去年年初OpenAI發(fā)布ChatGPT不久后的估值約為290億美元。

圖源:Unsplash

而在Sora發(fā)布次日,幾家美國科技公司的股價便應(yīng)聲跌落。據(jù)媒體報道,美國電腦軟件公司Adobe股價暴跌超7%;美國圖片庫、圖片素材、圖片音樂和編輯工具供應(yīng)商Shutterstock跌超5%;幾周前發(fā)布了“文生視頻”工具Lumiere的谷歌母公司股價下挫1.58%。一天以內(nèi),這三家公司的市值就合計蒸發(fā)了近480億美元(折合人民幣近3500億元)。

對不少行業(yè)來說,Sora就像是一顆“重磅炸彈”,讓從業(yè)者在展望未來時既興奮又感到惶恐不安。其中,影視業(yè)首當其沖。在傳統(tǒng)的影視制作過程中,后期及特效制作往往需要投入大量人力、物力和時間,而Sora等AI工具將大大降低這些成本,幫助影視制作公司快速創(chuàng)建出高質(zhì)量的視頻片段,縮短制作周期。在正舉行的柏林電影節(jié)上,Sora就成為電影人熱議的話題之一。據(jù)外媒報道,洛杉磯導(dǎo)演戴夫·克拉克(Dave Clark)認為,創(chuàng)作者需要接受人工智能技術(shù)來制作尚未想象或?qū)崿F(xiàn)的內(nèi)容,而不是感到威脅。德國視覺特效工作室Trixter的董事總經(jīng)理克里斯蒂娜·卡斯珀斯-羅默(Christina Caspers-Roemer)則表示,像Sora這樣的人工智能工具被證明在工作流程中更高效、更快,但即便如此,電影和電視制作將仍然以人類創(chuàng)作為基礎(chǔ)。“最終我們的客戶總會回到現(xiàn)實世界。”她說。

從ChatGPT、DALL-E3,再到Sora,AI內(nèi)容創(chuàng)作已經(jīng)從圖文席卷至視頻創(chuàng)作領(lǐng)域。而實際上,Sora并不是第一個受到關(guān)注的文生視頻大模型。近年,全球科技大廠幾乎無一例外地重金投入人工智能領(lǐng)域,并計劃在未來持續(xù)甚至加大投入。在Sora正式亮相以前,大部分全球頭部科技企業(yè)就已擁有自己的文生視頻大模型。去年11月,文生視頻模型迎來了一波爆發(fā)。11月3日,Runway發(fā)布Gen-2更新,支持4K清晰度作品;11月16日,Meta發(fā)布文生視頻大模型Emu Video;11月18日,字節(jié)跳動發(fā)布PixelDance;11月21日,Stability AI發(fā)布生成式視頻模型Stable Video Diffusion……今年1月,谷歌也發(fā)布了視頻生成模型Lumiere,專門用于將文本轉(zhuǎn)換為視頻。目前,Sora仍處于開發(fā)早期階段,OpenAI表示,當前的模式仍然存在不少弱點。

Sora可能難以準確模擬復(fù)雜場景的物理原理,也可能無法理解因果關(guān)系的具體實例。例如,一個人可能咬了一口餅干,但之后,餅干上可能沒有咬痕。此外,該模型還可能混淆提示的空間細節(jié),例如混淆左和右,并且可能難以精確描述隨時間發(fā)生的事件。而細心的網(wǎng)友也在Sora的演示視頻中發(fā)現(xiàn)了不少Bug。“比如在Sora生成的一個視頻中,呈現(xiàn)的是中國農(nóng)歷新年舞龍的場景,雖然視頻里龍身上和建筑上的文字很像是中國書法撰寫的字體,但實際上并不是中國字,誰也不認識寫的是什么,感覺只是AI臆想出來的中文。另一個視頻里的貓,動起來的時候有三只前腳。”關(guān)注AI行業(yè)的一名讀者向霞光社表示。

圖源:OpenAI網(wǎng)站截圖

但即使如此,不論在生成視頻時長、實現(xiàn)單視頻多機位、擁有精準物理規(guī)則的真實世界等技術(shù)層面,Sora均已實現(xiàn)“碾壓式”領(lǐng)先其他文生視頻模型,推動AI視頻生成進入了一個新的時代。

Sora這樣的生成式AI工具,在降低成本和提高效率方面的顯著優(yōu)勢,為內(nèi)容創(chuàng)作、廣告娛樂等行業(yè)帶來了前所未有的發(fā)展契機,也讓不同類型的中國出海企業(yè)看到了機會。此前,一些企業(yè)將ChatGPT應(yīng)用于多個場景之中,實現(xiàn)降本增效。AMZ123的一項調(diào)查數(shù)據(jù)顯示,2023年,有33%的跨境公司使用ChatGPT,另有將近15%的公司預(yù)計將投入使用。如今Sora尚未完全開放使用,但可以想見,通過更精準的生成式人工智能,不論是制作TikTok等平臺短視頻,或是為自己的產(chǎn)品制作介紹視頻和推廣營銷視頻,都將能大大降低成本、提升效率。

“如何通過AI來生產(chǎn)真正能落地的視頻,是大家開始摸索的東西。Sora給行業(yè)帶來了顛覆性的影響,誰先用上包括Sora在內(nèi)的新AI技術(shù),誰就能吃到第一波行業(yè)紅利。”Passioncy創(chuàng)始人郭林說,“中國公司出?隙ㄒ浞掷煤矛F(xiàn)有的AI能力。對于中小企業(yè),尤其很多工貿(mào)一體企業(yè)來說,難度其實是非常高的。這也是我們目前希望提供幫助的一個方向。”一名廣告行業(yè)資深從業(yè)者也告訴霞光社,她認為Sora將顛覆旅游、生活方式和服務(wù)行業(yè)的內(nèi)容。隨著視頻制作過程變得更簡單,大品牌廣告和小品牌廣告之間的界限將逐步縮小,而“講故事”等內(nèi)容創(chuàng)意環(huán)節(jié),將再次成為廣告中最重要的因素。

圖源:Unsplash

而在游戲出海領(lǐng)域,Share Creators創(chuàng)始人兼CEO Ada Liu認為,視頻生成帶來的改變將是“跨時代”的。

“在游戲行業(yè), AI可以幫助生成前期的概念圖,UI icon等。計算機圖形制作的流程非常長,從3D制作,到渲染、合成,每個環(huán)節(jié)都需要投入大量專業(yè)的人員。尤其在風格探索階段,如果直接生產(chǎn)出視頻,相當于直接跳到最后一步,節(jié)省了大量的制作時間和成本。”但 Ada Liu同時認為,AI生成內(nèi)容想要完全取代人工還存在不少距離。“可能再發(fā)展一兩年,能取代2D部分的一些低端批量制作工種。但主美之類定方向的美術(shù)人員,是不會被取代的。畢竟一個產(chǎn)品的美術(shù)風格需要人來選擇。”Ada表示,Sora的演示視頻效果令人印象深刻,但還是要關(guān)注實際上的效果,因為目前無法試用,只能等等看。

而郭林也認為,目前AI工具距離產(chǎn)出“真正能落地”的視頻,主要差距仍在于內(nèi)容真實性,以及工具易用性兩個方面。根據(jù)IDC的預(yù)測,未來五年內(nèi),AIGC對于營銷、軟件測試等行業(yè)將帶來巨大影響。到2025年,35%的企業(yè)將掌握使用生成式人工智能來開發(fā)數(shù)字產(chǎn)品和服務(wù)。到2026年,生成式AI將承擔42%的傳統(tǒng)營銷瑣碎任務(wù),如搜索引擎優(yōu)化、內(nèi)容和網(wǎng)站優(yōu)化、客戶數(shù)據(jù)分析、細分、潛在客戶評分以及超級個性化。到2028年,基于生成式AI的工具將能夠編寫80%的軟件測試工作,從而減少對人工測試的需求,提高測試覆蓋率、軟件可用性和代碼質(zhì)量。可以預(yù)見的是,即便AI生成內(nèi)容仍然面臨道德和濫用方面的潛在風險,但其在創(chuàng)造力和效率方面的無限潛力,將持續(xù)吸引全球科技巨頭的加碼投入和爭奪。

       原文標題 : 爆火的Sora,摩拳擦掌的出海人

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號