訂閱
糾錯
加入自媒體

谷歌發(fā)力AI搜索,視覺檢索+識別會成主流?AR眼鏡也要東山再起?

知情郎·眼|

侃透天下專利事兒

今年的谷歌開發(fā)者大會(Google I/O 2022)上有什么新玩意、硬科技?

谷歌翻譯、谷歌多重AI搜索、保護性計算、Android 13、谷歌硬件。

在2小時的主題演講上,谷歌梳理了自己現(xiàn)有AI計算的進度,并演示了關(guān)鍵技術(shù)應(yīng)用。并發(fā)布了谷歌手機,還提前曝光了谷歌AR眼鏡!

有不少最新技術(shù)理念和硬核產(chǎn)品,科技圈媒體已經(jīng)鋪天蓋地報道了。

01谷歌的邏輯

一家高科技公司總要有句通俗易懂的口號,方便和用戶直接交流。

曲高和寡、孤芳自賞裝深沉裝睿智是行不通的。

谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)很懂這思路,所以他的口號從來簡明扼要。

這次他的口頭禪是:“谷歌的目的,深化用戶對信息的理解,讓人們無論在哪都能獲得知識!

桑達(dá)爾·皮查伊印度平民家庭出身、買不起新書包的窮學(xué)生,一路爬到谷歌寡頭公司的CEO,皮查伊的成功充滿了勵志色彩,激勵著世界許多寒門子弟奮發(fā)前進。

Google搜索引擎、谷歌Chrome、Chrome OS、地圖、Gmail、Android都是在他的帶領(lǐng)下壯大的,人稱劈柴哥!

谷歌的工程師文化在他手里被發(fā)揚到了極致,一個重要的行事規(guī)則是——殺雞要用牛刀,集重兵狂投入優(yōu)化產(chǎn)品功能性到極點。

Chrome瀏覽器就是這個邏輯的經(jīng)典產(chǎn)品,核心功能細(xì)節(jié)比同行強的時候,用戶蜂擁而至。

工程師文化,就是這點好,拼產(chǎn)品功效功能細(xì)節(jié),沒有花哨,比不過別人就是比不過別人,沒有廢話連篇的自我遮羞布。

市場用戶最公平,不管競爭是否激烈,不管條件是否艱苦,不管舞臺大小,不看你演戲演技演給誰看。

就看產(chǎn)品本身實用性說話。

不行,千萬別浪費觀眾時間,大家都不傻,煩了,人家真會扔臭雞蛋香蕉皮砸人的。

02谷歌翻譯、谷歌地圖

在翻譯領(lǐng)域,谷歌已經(jīng)要超神!

谷歌宣布,谷歌翻譯增加了對24種新語言的支持,深度神經(jīng)網(wǎng)絡(luò)算法功不可沒!

大概全世界所有主流語言都能支持翻譯了。

在視頻領(lǐng)域,YouTube視頻已經(jīng)支持了16種語言的實時翻譯。YouTube去年已經(jīng)可以自動生成章節(jié)分段,F(xiàn)在通過語音/視頻腳本分析等,讓這種分段更準(zhǔn)確,數(shù)量也會達(dá)到8千萬段。

在NLP(自然語言處理)領(lǐng)域,谷歌的AI技術(shù)可以對文字段落進行更好的理解、總結(jié),并幫助用戶快速找到重點信息。

谷歌地圖(Google Maps),進一步完善了地圖數(shù)據(jù),谷歌的心氣自然是讓全世界都能用谷歌地圖,所以這次人家表態(tài),已經(jīng)能讓非洲等偏遠(yuǎn)地區(qū)使用了。

有一說一,谷歌地圖的細(xì)節(jié)處理非常優(yōu)秀。據(jù)官方說,已經(jīng)開始大規(guī)模應(yīng)用3D航拍、AI智能等技術(shù),以此來確保導(dǎo)航、搜索等功能的準(zhǔn)確性。

同時,3D繪圖和機器學(xué)習(xí)等+航拍,讓沉浸式實景地圖更逼真完整。

會上,谷歌也公布了關(guān)于地圖應(yīng)用的最新數(shù)據(jù):已在全球范圍內(nèi)繪制超16億座建筑和6000萬公里的道路。

03多重維度AI搜索

谷歌核心產(chǎn)品是搜索引擎。

2022這產(chǎn)品又添加了什么黑科技功能?

在之前,搜索是類似查詢的方式,你輸入文字,它給出一堆相應(yīng)結(jié)果。

現(xiàn)在,用戶的要求多了,也復(fù)雜了。

例如用戶會上傳一張圖片、一段小視頻,甚至一段鳥叫聲,問圖片里、視頻里的是什么鳥類?

這種問題不再是文字,而是圖片、視頻影音、文字的多維度結(jié)合。

這就是最新的技術(shù)“圖像檢索+識別”,比傳統(tǒng)文字檢索識別更難更復(fù)雜。

這屬于多重搜索,也是谷歌這些年發(fā)力的重點。

簡單的說,“多重搜索”利用AI多模型理解,去理解人們的搜索意圖,并用直觀的方式體現(xiàn)。

一個實例來說,在巧克力店去尋找“不含堅果黑巧克力”,用戶要做的是采用手機鏡頭去掃描貨架,找到指定的產(chǎn)品。

鏡頭去識別物體-加入篩選條件-呈現(xiàn)出結(jié)果。

這是圖像識別+篩選結(jié)果的過程,仍舊是一種搜索,但已經(jīng)跟之前的搜索引擎體驗完全不同。

整個視頻檢索體驗與以往理解傳統(tǒng)文字框搜索很不一樣。

知情郎對這搜索應(yīng)用技術(shù)嘆為觀止。

在德高行全球?qū)@麛?shù)據(jù)庫中,以圖像檢索+識別為關(guān)鍵詞,在谷歌全球?qū)@餀z索了相關(guān)專利,以數(shù)量看,中國專利60件,包括發(fā)明公開32件、發(fā)明授權(quán)28件;美國專利205件,包括發(fā)明公開83件、發(fā)明授權(quán)122件

下表為9件為谷歌近期公開圖像檢索+識別領(lǐng)域的專利。

image.png

image.png

image.png

image.png

這些專利含金量都非常大,谷歌的目標(biāo)是“用任何方式在任何地方進行搜索”,所以研究多維搜索,尤其是通過手機自帶的攝像頭視頻拍攝識別這種模式,大概率會成為主流搜索應(yīng)用之一。

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號