訂閱
糾錯(cuò)
加入自媒體

更“主動(dòng)”和“乖巧”的 Siri,能成為語音交互的最新發(fā)動(dòng)機(jī)么?

2018-07-04 08:47
來源: 極客公園

被詬病“不好用”的Siri,曾一度因?yàn)镠omePod的發(fā)布迎來更加糟糕的風(fēng)評(píng)。

作為“智能音箱”,HomePod的音質(zhì)收獲了幾乎所有人的一致贊美,但代表其“智能”這部分的Siri卻表現(xiàn)欠佳。在亞馬遜和Google兩家巨頭將智能語音助手之爭(zhēng)演變成軍備競(jìng)賽的這兩年里,Siri始終沒有什么存在感。相比Alexa和GoogleAssistant,Siri常常被用戶吐槽“聽不懂,做不到”,整體的指令識(shí)別成功率偏低。同時(shí),Siri的第三方開發(fā)的生態(tài)也不如Alexa和Google那么豐富,用戶也很難通過向Siri下達(dá)指令來獲取第三方服務(wù)。

但這一次,蘋果不想再讓用戶久等。就在各種批評(píng)聲音還未散去之時(shí),蘋果在WWDC18上針對(duì)Siri交出了一份答卷。蘋果為Siri體系帶來了一個(gè)全新的自動(dòng)化工具:Shortcuts,這相當(dāng)于給Siri配上了一臺(tái)全新的發(fā)動(dòng)機(jī)。Shortcuts讓用戶可以將指令和動(dòng)作依照自己的需求綁定起來,也讓Siri可以更細(xì)致地獲知用戶的需求,并且主動(dòng)給出推薦。通過Shortcuts,蘋果希望讓Siri能聽懂用戶的指令,接入到盡可能多的服務(wù),最終融入豐富廣闊的iOS開發(fā)生態(tài)。

在Siri和第三方App間搭起一座橋

這并不是蘋果第一次為Siri的開放費(fèi)盡心思。

在2016年的WWDC上,蘋果就發(fā)布了SiriKit。這是蘋果第一次將Siri開放給第三方開發(fā)者,希望用戶可以借助Siri訪問更多第三方服務(wù)。開發(fā)者可以基于自己的App功能定義指令,然后蘋果會(huì)將這些指令集成到Siri里,當(dāng)用戶發(fā)出的語音指令中包含正確的觸發(fā)詞時(shí),App內(nèi)的功能就會(huì)被觸發(fā)。

但這個(gè)功能一直存在著一個(gè)隱患。自然語言里的關(guān)鍵詞極為有限,如果少數(shù)的重要關(guān)鍵詞比如“叫車”、“訂餐”被少數(shù)的開發(fā)者所把控,這是會(huì)比“域名爭(zhēng)奪”更可怕的一件事。因此,蘋果在此事上一直保持著謹(jǐn)慎的態(tài)度。針對(duì)SiriKit,蘋果最初僅僅開放了包括短信和通話在內(nèi)的6類服務(wù),允許開發(fā)者接入。雖然蘋果后續(xù)又陸續(xù)開放了一些服務(wù),但真正得以接入SiriKit的App數(shù)量少得可憐。另一方面,即便是接入了SiriKit的App,也因?yàn)殚_發(fā)者定義的指令不能廣泛契合大多數(shù)用戶發(fā)出語音指令的方式,很難讓用戶流暢使用。

不過,蘋果并沒有放棄這方面的努力,并且在仔細(xì)思考,如何在Siri開放的過程中利用好自身優(yōu)勢(shì)。去年3月,蘋果宣布收購(gòu)Workflow;诜夯木W(wǎng)址系統(tǒng)(包括一切url和urlscheme)。這個(gè)iOS上的著名自動(dòng)化App可以讓用戶可以將不同的指令、動(dòng)作串聯(lián)起來,編寫自動(dòng)化操作。

在被蘋果收購(gòu)之后,iOS商店里Workflow的價(jià)格從之前的18-45元人民幣變?yōu)槊赓M(fèi),整個(gè)開發(fā)團(tuán)隊(duì)也得以加入蘋果。當(dāng)時(shí)外界普遍認(rèn)為,蘋果是希望基于Workflow來為iOS打造一款類似macOS上Automator的生產(chǎn)力工具。但蘋果顯然著更深層次思考,在收購(gòu)Workflow之后,蘋果將整個(gè)團(tuán)隊(duì)整合進(jìn)了Siri團(tuán)隊(duì),在過去的一年多時(shí)間里,基于Workflow,這個(gè)新融合的團(tuán)隊(duì)開發(fā)出了Shortcuts。

在智能鑰匙扣的App里,讓鑰匙扣響鈴就變成了一個(gè)Intention。

脫胎于Workflow的Shortcuts在“第三方服務(wù)接入”這件事上獲得了一個(gè)質(zhì)的飛躍。任何開發(fā)者都可以在自己的App內(nèi)定義一些名為“Intention”的動(dòng)作:比如用戶用星巴克App點(diǎn)咖啡,星巴克的開發(fā)團(tuán)隊(duì)就可以將“點(diǎn)咖啡”這個(gè)動(dòng)作定義為一個(gè)Intention。而這些Intention最終都可以被用戶手動(dòng)加入到Siri。App開發(fā)者也不再需要去思考“用戶會(huì)說什么關(guān)鍵詞來觸發(fā)我的服務(wù)”,而是只需要將用戶在自家App上進(jìn)行的動(dòng)作總結(jié)、精煉出來,接入到Shortcuts就行了。

Shortcuts使任何iOS開發(fā)者都可以輕松地將自己的App接入Siri,滿足用戶的需求。它相當(dāng)于一座橋梁,將豐富而廣闊的iOS應(yīng)用生態(tài),和不夠完善的Siri進(jìn)行了一種連接。

當(dāng)Alexa和GoogleAssistant正各自試圖將自家的語音助手打造成一個(gè)獨(dú)立的平臺(tái)、并拉攏新開發(fā)者時(shí),蘋果正試圖利用iOS本身的優(yōu)勢(shì)來完成一次超越。

Siri的主動(dòng)推薦有了更豐富的細(xì)節(jié)

2016年,隨著iOS9的問世,蘋果推出了“ProactiveSiri”(Siri主動(dòng)推薦)功能。蘋果希望Siri不僅僅是一個(gè)被動(dòng)接受并執(zhí)行指令的“語音助手”,而是想讓它成為一個(gè)能主動(dòng)預(yù)測(cè)用戶需求的智能私人助手。藉由Siri主動(dòng)推薦功能,用戶在特定的地點(diǎn)和時(shí)間,會(huì)在多任務(wù)界面看到推薦打開的App;連上車載藍(lán)牙之后iPhone會(huì)自動(dòng)給出回家的路線規(guī)劃和行程預(yù)測(cè);Siri會(huì)自動(dòng)識(shí)別規(guī)律性日歷項(xiàng)發(fā)生的地點(diǎn),提前預(yù)測(cè)路況,提醒你該出發(fā)了;插上耳機(jī)之后iPhone會(huì)自動(dòng)推薦打開你常用的音樂或視頻App……

但就過去兩年,就在GoogleAssistant和Alexa高歌猛進(jìn)時(shí),Siri的主動(dòng)推薦功能并沒有成為iOS下的“殺手級(jí)功能”,甚至都不怎么為人所知。背后的一個(gè)重要原因是,其針對(duì)第三方App的支持僅僅只能停留在“推薦用戶打開App”這樣一個(gè)很淺的層面上,它既無法從App中獲取到更深層次的信息,也無法一步深入到App內(nèi)的某個(gè)行為上。其中真正有意義的深度推薦都是基于蘋果自家App的,這就大大限制了Siri主動(dòng)推薦的發(fā)揮空間。

現(xiàn)在,蘋果希望Shortcuts的出現(xiàn)徹底改變這個(gè)困境。

Siri會(huì)自動(dòng)分析你的需求給出動(dòng)作推薦

在Shortcuts中,由開發(fā)者定義的“Intention”將會(huì)被整體接入到Siri主動(dòng)推薦中。開發(fā)者可以定義這個(gè)動(dòng)作的關(guān)鍵參考要素,比如時(shí)間、地點(diǎn)……這樣iOS就會(huì)在后臺(tái)對(duì)用戶進(jìn)行這些動(dòng)作時(shí)的關(guān)鍵參考要素進(jìn)行觀察,比如用戶每天早上都會(huì)用某個(gè)App點(diǎn)咖啡,那么Siri就會(huì)以通知的形式在早上主動(dòng)推薦用戶執(zhí)行這個(gè)動(dòng)作,用戶只需要在鎖屏界面點(diǎn)擊一下,App就會(huì)接到指令,自動(dòng)幫忙點(diǎn)好咖啡。同時(shí),這些Shortcuts也會(huì)在AppleWatch的Siri表盤上顯示,并可以在智能手表上執(zhí)行。

這套機(jī)制讓Siri可以更精細(xì)地洞察用戶的需求,提供更多方便的快捷方式。更“貼心”的一點(diǎn)是,蘋果在進(jìn)行這一系列創(chuàng)新時(shí),已經(jīng)自覺站在了用戶那邊,它周全的考慮了用戶隱私的問題:這些和用戶需求相關(guān)的數(shù)據(jù)收集和處理全部都由iOS在本地執(zhí)行,開發(fā)者并不能獲取到詳細(xì)的用戶行為數(shù)據(jù)。

讓用戶自己來訓(xùn)練和教導(dǎo)Siri

除了自動(dòng)推薦,蘋果當(dāng)然也沒忘了Siri最初的起點(diǎn)——語音控制。

在iOS12之前,人們對(duì)Siri最大的不滿,并非在于Siri聽不懂他們?cè)谡f什么——事實(shí)上,Siri大部分時(shí)候都能夠?qū)⒙曇舯容^準(zhǔn)確地轉(zhuǎn)換為文字。但將不同用戶心中各不相同的自然語言習(xí)慣轉(zhuǎn)換成正確的命令,才是Siri一直沒有跨越的門檻。

在Twitter上,著名科技評(píng)論人莫博士曾經(jīng)毫不留情的吐槽過Siri理解指令的能力:在控制播放音樂時(shí),用戶必須按照標(biāo)準(zhǔn)的句式,準(zhǔn)確地說出歌名、專輯名、歌手名,Siri才能正確地理解你想聽的是什么,否則就很容易表現(xiàn)成“人工智障”。

自然語言處理是計(jì)算機(jī)領(lǐng)域幾十年來的難題,也是智能語音助手想要真正進(jìn)入更復(fù)雜場(chǎng)景時(shí)必須跨越的巨大障礙,F(xiàn)在,蘋果在這件事上做出了一個(gè)關(guān)鍵選擇。它不再完全讓iOS團(tuán)隊(duì)或第三方app開發(fā)者來決定Siri對(duì)自然語言的理解,而是把訓(xùn)練和教導(dǎo)Siri“聽話”的權(quán)利交給用戶。

也就是說,用戶現(xiàn)在可以將各種app的動(dòng)作編寫成Shortcuts,然后自己設(shè)置一個(gè)觸發(fā)詞來執(zhí)行Shortcuts。一個(gè)典型的場(chǎng)景是,用戶可以將“打開家里的空調(diào)”、“向家人發(fā)一條短信告知自己晚上回來吃飯”、“叫一輛回家的Uber”三件事連在一起編寫成一個(gè)Shortcut,將Siri關(guān)鍵詞設(shè)置成“下班回家”,在晚上離開辦公室前,對(duì)Siri說一句“下班回家”,Siri就會(huì)自動(dòng)完成開空調(diào),發(fā)短信以及叫Uber三個(gè)動(dòng)作。

我們使用手機(jī)的方式是很復(fù)雜的,即使業(yè)界高喊著voice-first,語音交互真正能接管的,還是很少的一部分場(chǎng)景。而Shortcuts要做的,就是把那些具有一定復(fù)雜性但有規(guī)律可循的任務(wù),讓用戶去自定義設(shè)置程序并教給Siri。進(jìn)而把一個(gè)非常復(fù)雜的流程變成一句語音指令就可以搞定的事。用戶不再需要去“不斷嘗試”什么樣的指令是Siri能聽懂的,而是可以像做一個(gè)Workflow一樣把很多不同的動(dòng)作變成一種“一觸即發(fā)”的體驗(yàn)。

這種機(jī)制讓Shortcuts可以在AppleWatch和HomePod上被輕松觸發(fā),AppleWatch和HomePod會(huì)將執(zhí)行Shortcuts的指令發(fā)送到iPhone。同時(shí)也讓多語言的Siri變得有可能。對(duì)于中國(guó)用戶來說,需要用到多語言的情況還是挺常見的,而通過Shortcuts,類似“用中文Siri無法控制播放英文歌曲”的問題都可以通過自己設(shè)定Shortcuts來解決,你可以用中文指令去控制播放英文的歌單、播客,也可以用英文指令去觸發(fā)中文App里的訂餐、打車以及發(fā)短信。

在我們都以為作為“語音助手”的Siri正被亞馬遜和谷歌遠(yuǎn)遠(yuǎn)地甩在身后時(shí),蘋果卻已經(jīng)對(duì)Siri有了更深遠(yuǎn)的思考。很顯然,蘋果正希望Siri超越語音助手的定位,成為一個(gè)能夠聽懂指令,且能夠主動(dòng)理解用戶需求的“綜合性AI助手”。只不過,想要達(dá)成這個(gè)目標(biāo)很困難,在過去的幾年里,蘋果的嘗試沒有取得太多成功。

而Shortcuts的問世,讓開發(fā)者和用戶被放到了各自合適的位置上,將一個(gè)遠(yuǎn)大卻有點(diǎn)虛無縹緲的目標(biāo),轉(zhuǎn)化成了一種更實(shí)際的應(yīng)用機(jī)制。它讓更多的第三方服務(wù)有機(jī)會(huì)輕松接入Siri,也讓Siri能夠調(diào)用App內(nèi)更深層次的動(dòng)作,并且讓用戶能夠主動(dòng)控制這件事。

擁有這樣一個(gè)全新的發(fā)動(dòng)機(jī)后,Siri需要達(dá)成的目標(biāo)不再“神奇”,已經(jīng)開始變得更加“實(shí)際”。這或許是我們?cè)趇OS12中看到的最令人興奮的更新之一。(作者:Jesse)

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)