知識圖譜走出至暗時刻
世界擁有不計其數(shù)的實體,以人力已無法將實體和概念建立完整的聯(lián)系,而知識圖譜可以彌補(bǔ)這樣的空缺。
@數(shù)科星球 原創(chuàng)
作者丨科科 編輯丨十里香
人工智能行至半途,在各行各業(yè),AI的滲透與日俱增。作為人工智能的分支,知識圖譜可謂歷史已久。如今,新的應(yīng)用場景被開發(fā),一幅技術(shù)革命的畫面已然呈現(xiàn)在世人面前。
01
沉默的技術(shù)高地
和大多數(shù)的AI技術(shù)一樣,知識圖譜也是一種交叉學(xué)科,其橫跨了包括知識工程、自然語言處理、機(jī)器學(xué)習(xí)、圖數(shù)據(jù)庫等在內(nèi)的多個領(lǐng)域。
在構(gòu)建知識圖譜的流程中,也要通過知識建模、關(guān)系抽取、圖存儲、自動推理、圖譜表示學(xué)習(xí)、語義搜索、智能問答、圖計算分析等一系列步驟才可得以完成。
在這個角度上,說知識圖譜是復(fù)雜的技術(shù)并不為過。
在這項技術(shù)的發(fā)展時間線上,數(shù)科星球(ID:digital-planet)看到,其有谷歌、百度等搜索引擎企業(yè)參與,再到后來,知識圖譜開始走出大企業(yè),開始在醫(yī)療、金融和安全等領(lǐng)域發(fā)揮作用,人們喜聞樂見的小度音箱和天貓精靈等產(chǎn)品更是新一代知識圖譜技術(shù)應(yīng)用的集中體現(xiàn)。
由大型搜索引擎公司所構(gòu)建的知識圖譜,正在賦能于垂直,其提供了更多的旨在表明實體和關(guān)系的語義信息,可以賦能用戶在不同場景下查詢。
如今,市面上仍然可以看到上一代知識圖譜產(chǎn)品的影子:比如出現(xiàn)在谷歌搜索結(jié)果信息流右側(cè)的知識卡片等等。
知識圖譜技術(shù)支撐起了互聯(lián)網(wǎng)發(fā)展的下一個高峰。機(jī)器人的聊天、企業(yè)服務(wù)行業(yè)的智能問答產(chǎn)品以及現(xiàn)在的搜索引擎中的智能推薦,都用到了知識圖譜功能?偟膩碚f,知識圖譜正在走出通用的象牙塔,向著垂直領(lǐng)域發(fā)展。這種垂直不僅意味著垂直行業(yè),更意味著在決策、推薦和問答場景中的細(xì)分。
現(xiàn)在,在知識圖譜界已出現(xiàn)兩大技術(shù)方向——其一是數(shù)據(jù)互聯(lián)網(wǎng),可以理解成基于網(wǎng)頁的產(chǎn)品形態(tài);其二是事物互聯(lián)網(wǎng),其交互場景不以傳統(tǒng)互聯(lián)網(wǎng)形態(tài)存在,如在數(shù)科星球(ID:digital-planet)報道過的汽車后市場、高鐵等領(lǐng)域就以音頻等方式存在。
所以,未來知識圖譜的競爭將在人們看不見的語義網(wǎng)絡(luò)中展開。在巨型企業(yè)中,語義網(wǎng)絡(luò)的競爭已經(jīng)成為常態(tài),其中谷歌有Freebase、IBM Waston有DBpedia和Yago、Amazon Alexa有True Knowledge,幾乎每個人都接觸過的蘋果Siri有Wolfram Alpha等等。
有了知識圖譜,大數(shù)據(jù)分析、語言理解就能更上一個臺階。在發(fā)現(xiàn)更多概念和事物之間的關(guān)系后,“隱藏”知識將被發(fā)現(xiàn),當(dāng)然這其中少不了運用圖數(shù)據(jù)庫、自然語言處理、機(jī)器學(xué)習(xí)等多方面的技術(shù)。
在未來,知識圖譜技術(shù)將會增強(qiáng)機(jī)器學(xué)習(xí)的可解釋性,將在圖卷積輔助圖像分類等多個領(lǐng)域發(fā)揮出越來越重要的作用。數(shù)科星球(ID:digital-planet)將在其后的文章中一一解答知識圖譜所涉及的相關(guān)領(lǐng)域。
02
知識圖譜技術(shù)正在成為新變量
在人工智能發(fā)展早期,人們希望通過用計算機(jī)符號模擬人腦知識并推倒人類的心智,在神經(jīng)網(wǎng)絡(luò)中,強(qiáng)調(diào)信息傳導(dǎo),F(xiàn)在由于計算機(jī)算力和數(shù)據(jù)量的提升,人工智能的研究取得了長足進(jìn)步。
在新的時代下,遙感影像、攝像頭、問卷調(diào)查、手機(jī)信令、GPS追蹤等領(lǐng)域以肉眼可見的速度成長。在這個過程中,所謂“多源異構(gòu)數(shù)據(jù)”正在呈指數(shù)級爆發(fā)。
數(shù)據(jù)的來源更多了,數(shù)據(jù)的類型也不僅僅是上個時代喜聞樂見的表格等信息。在這樣的趨勢下,數(shù)據(jù)庫行業(yè)也在發(fā)生變革,基礎(chǔ)庫、主題庫甚至專題庫紛紛上線,以地理信息、IoT、軌跡數(shù)據(jù)為代表的時空數(shù)據(jù)正在得到大面積應(yīng)用,AP、TP數(shù)據(jù)庫需求顯著分化。
對于企業(yè)來說,多源異構(gòu)數(shù)據(jù)的處理難度變得越來越高。在制造業(yè)中,儀器的檢修、采購、運行數(shù)據(jù)以及產(chǎn)品的銷售、退回記錄和反饋都會遺留在各種各樣的終端之上。在這種情況下,與其將所有數(shù)據(jù)整理成一個整體,不如將數(shù)據(jù)之間建立關(guān)聯(lián),來改善運營現(xiàn)狀,而這就是知識圖譜更大的應(yīng)用場景。
從信息的模糊到準(zhǔn)確、從數(shù)據(jù)的失真到真實,構(gòu)成了企業(yè)在提高效率方面的新閉環(huán),其中不可缺少的就是知識圖譜所帶來的諸多好處。
如今的知識圖譜產(chǎn)品甚至正在沖擊傳統(tǒng)ERP市場。在之前,人們已經(jīng)習(xí)慣手動錄入數(shù)據(jù)到數(shù)據(jù)庫,再通過SQL查詢。現(xiàn)在,二維表可能被知識圖譜取代,割裂在不同領(lǐng)域的知識正在成為一個整體。
這種整體的知識也正在成為企業(yè)新的競爭力體現(xiàn):如在智能搜索、競品分析、反欺詐、論文查重和實時輿情分析中,知識圖譜都有用武之地。
一段時間后,隨著軟件廠商在圖數(shù)據(jù)模型、規(guī)則模型和算法模型的進(jìn)一步積累,各行各業(yè)也將出現(xiàn)服務(wù)于不同行業(yè)的知識圖譜產(chǎn)品。至少,已經(jīng)有不少公司正在這樣做。
03
知識圖譜的未來展望
客觀上,世界擁有不計其數(shù)的實體,以人力已無法將實體和概念建立完整的聯(lián)系,而知識圖譜可以彌補(bǔ)這樣的空缺。
目前知識圖譜行業(yè)還存在一些軟肋有待攻破:
其一,知識圖譜對所屬行業(yè)的業(yè)務(wù)了解不夠透徹,底層技術(shù)能力難以覆蓋完整的生產(chǎn)流程;
其二,一些知識圖譜公司將太多精力投入在可視化展示之中,而在場景的深度挖掘以及數(shù)據(jù)積累上還有待提高;
其三,是行業(yè)人才匱乏,技術(shù)難以趕上業(yè)務(wù)需求的增長。
在不足的另一側(cè),是行業(yè)的迅速增長。艾瑞的咨詢報告顯示,2021年,知識圖譜核心市場規(guī)模預(yù)計達(dá)到107億元,而到2026年,相應(yīng)規(guī)模將超過296億元,2021-2026年CA?GR=22.5%。知識圖譜成為20%以上增長的行業(yè)之一,高速的增長理應(yīng)引起廣大投資者們的重視。
目前,金融和公安行業(yè)已成為知識圖譜行業(yè)應(yīng)用最快的垂直行業(yè)。在上述兩個行業(yè)中,企業(yè)的投入不遺余力,成為了知識圖譜行業(yè)增長的不可忽視的動力。在未來,政務(wù)+知識圖譜的市場將被喚醒,一些行業(yè)專家認(rèn)為,政務(wù)的需求同樣不可忽視。
目前,知識圖譜的國家標(biāo)準(zhǔn)正在積極籌備中,一些知名企業(yè)也在其中起到了重要作用。以達(dá)觀數(shù)據(jù)為例,其產(chǎn)品已廣泛應(yīng)用于汽車工業(yè)、軍事裝備、核工業(yè)、電力電網(wǎng)、能源、消費電子、通信、集成電路、船舶制造、材料、航空航天、制藥、醫(yī)療設(shè)備、機(jī)械裝備、礦業(yè)、鋰電等領(lǐng)。
回顧知識圖譜的發(fā)展歷史,人們會驚訝于該領(lǐng)域的崛起速度。早期,ConceptNet 5.0也僅包含2800萬個RDF三元組關(guān)系描述,而現(xiàn)在,這樣的數(shù)據(jù)已超千億級別。
*數(shù)科星球(ID:digital-planet)出品
原文標(biāo)題 : 知識圖譜走出至暗時刻
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市