捷通華聲:靈云人工智能開(kāi)啟家電智能語(yǔ)音交互新時(shí)代
捷通華聲:靈云人工智能開(kāi)啟家電智能語(yǔ)音交互新時(shí)代
物聯(lián)網(wǎng)時(shí)代,人工智能技術(shù)的融入尤其是語(yǔ)音交互技術(shù),給家庭交互、客廳娛樂(lè)等帶來(lái)無(wú)限可能。在當(dāng)下的智能家居行業(yè),語(yǔ)音基于其交互的自然性,被認(rèn)為是未來(lái)人與家居交互的主要入口路徑,業(yè)內(nèi)普遍認(rèn)為,“語(yǔ)音將成為入口連接各種服務(wù),構(gòu)建智家生態(tài)”。
捷通華聲憑借在人工智能領(lǐng)域多年的積累,依托托國(guó)內(nèi)首個(gè)全方位人工智能開(kāi)放平臺(tái)——靈云平臺(tái),結(jié)合國(guó)內(nèi)領(lǐng)先的靈云遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù),以及人臉識(shí)別、聲紋識(shí)別、指紋識(shí)別等技術(shù)全面賦能物聯(lián)網(wǎng),成功在智能電視、智能機(jī)頂盒、智能車(chē)載、智能音箱、智能機(jī)器人等眾多領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用。
同時(shí),行業(yè)解決方案已經(jīng)在業(yè)內(nèi)得到廣泛認(rèn)可,成功應(yīng)用于新松、棠棣、木爺?shù)葞资曳?wù)型機(jī)器人中,以及長(zhǎng)安等眾多智能車(chē)載產(chǎn)品中,并與樂(lè)視、小米等眾多電視、空調(diào)家電廠商建立了合作。
近日,捷通華聲總經(jīng)理武衛(wèi)東接受了媒體專(zhuān)題訪談,主要探討了以語(yǔ)音交互技術(shù)為核心的人工智能技術(shù)如何推動(dòng)智能家電發(fā)展,并對(duì)AI與家電未來(lái)的深度結(jié)合進(jìn)行了展望,以下為采訪整理稿。
請(qǐng)簡(jiǎn)單介紹公司目前在人工智能領(lǐng)域的布局,尤其以語(yǔ)音識(shí)別、語(yǔ)音交互為技術(shù)核心的人工智能戰(zhàn)略。
通過(guò)構(gòu)建人工智能開(kāi)放平臺(tái)的方式,深化行業(yè)應(yīng)用、聚集合作伙伴,進(jìn)而構(gòu)建人工智能產(chǎn)業(yè)生態(tài)是捷通華聲重要的戰(zhàn)略布局。捷通華聲在這方面很早就進(jìn)行了積極的探索,2011年,捷通華聲的靈云全方位人工智能開(kāi)放平臺(tái)就面向產(chǎn)業(yè)全面開(kāi)放,并以“云 + 端”方式,為產(chǎn)業(yè)界提供語(yǔ)音合成、自然語(yǔ)言理解、語(yǔ)音識(shí)別、麥克風(fēng)陣列、語(yǔ)音喚醒、手寫(xiě)識(shí)別、光學(xué)字符識(shí)別、人臉識(shí)別、聲紋識(shí)別、指紋識(shí)別、數(shù)據(jù)挖掘、機(jī)器翻譯等全方位人工智能能力。通過(guò)將其積累的人工智能技術(shù)開(kāi)放出來(lái),捷通華聲積累了眾多的合作伙伴,并服務(wù)大量的行業(yè)客戶(hù)。
以全方位人工智能技術(shù)為基石,捷通華聲已經(jīng)構(gòu)建了完善的人工智能云服務(wù)和產(chǎn)品生態(tài)系統(tǒng),從公有云、私有云到行業(yè)解決方案,全面賦能各行各業(yè),努力實(shí)現(xiàn)“讓每一家企業(yè)都擁有人工智能,讓每個(gè)人都能享受到人工智能的方便與快捷”的人工智能戰(zhàn)略。
目前,靈云人工智能云服務(wù)及產(chǎn)品生態(tài)系統(tǒng)包括以下五大類(lèi):
靈云云服務(wù)平臺(tái)(AICloud),包含語(yǔ)音云、圖像云、鎮(zhèn)客服云、智能外呼云等智能方案云服務(wù)以及智能語(yǔ)音、智能圖像等全方位AI技術(shù)云服務(wù);
智能物聯(lián)網(wǎng)(AIoT),包含智能電視語(yǔ)音助手、智能音箱語(yǔ)音助手、智能車(chē)載輸入法等,致力于讓每個(gè)智能終端“能聽(tīng)會(huì)說(shuō)、能思考會(huì)判斷”;
全方位人工智能能力平臺(tái)(AICP),為企業(yè)提供包括靈云智能語(yǔ)音、智能圖像、智能語(yǔ)義、生物特征識(shí)別等全能力私有云能力平臺(tái),客戶(hù)可以靈活挑選、組合AI技術(shù),實(shí)現(xiàn)企業(yè)業(yè)務(wù)、應(yīng)用的智能化升級(jí);
人工智能聯(lián)絡(luò)中心(AICC),包含全渠道智能客服系統(tǒng)、智能外呼系統(tǒng)、智能語(yǔ)音分析系統(tǒng)等在內(nèi)的,面向智能客戶(hù)服務(wù)中心的全方位人工智能門(mén)戶(hù)解決方案;
行業(yè)智能解決方案(AIIS),包括應(yīng)用于會(huì)議、司法、醫(yī)療領(lǐng)域的智能語(yǔ)音轉(zhuǎn)錄系統(tǒng),支持文本、名片、票據(jù)、證照識(shí)別的智能圖像識(shí)別系統(tǒng),以及可對(duì)人臉、聲紋等身份信息進(jìn)行綜合認(rèn)證的多維生物特征識(shí)別系統(tǒng)等。
在您看來(lái)人工智能目前處在怎樣的發(fā)展階段和什么樣的歷史位置?
目前,人工智能已經(jīng)處在了從技術(shù)快速發(fā)展到技術(shù)落地應(yīng)用的階段。例如經(jīng)過(guò)十幾年的發(fā)展,語(yǔ)音識(shí)別技術(shù)進(jìn)入到自由說(shuō)的狀態(tài):當(dāng)人自然說(shuō)話、自然表達(dá)時(shí)能夠準(zhǔn)確識(shí)別,這推動(dòng)語(yǔ)音識(shí)別進(jìn)入到實(shí)現(xiàn)應(yīng)用的階段。捷通華聲將先進(jìn)的語(yǔ)音交互技術(shù)成功應(yīng)用與智能客服、智能外呼機(jī)器人、智能電視語(yǔ)音助手等產(chǎn)品上就是典型案例。
但除卻語(yǔ)音和計(jì)算機(jī)視覺(jué)領(lǐng)域,人工智能技術(shù)在其它領(lǐng)域的“落地”卻并不盡如人意,拿不出一份接地氣的商業(yè)落地成績(jī)單。很多人工智能技術(shù)開(kāi)發(fā)者技術(shù)很強(qiáng),但面對(duì)復(fù)雜的商業(yè)應(yīng)用場(chǎng)景時(shí)便顯得有些捉襟見(jiàn)肘?!叭斯ぶ悄?行業(yè)”是人工智能落地的基礎(chǔ),它只有像水滴一樣滲透到實(shí)體經(jīng)濟(jì)中,滲透到各個(gè)行業(yè)中,才能帶來(lái)價(jià)值。
如今人工智能已如當(dāng)年的互聯(lián)網(wǎng)一樣,成為整個(gè)時(shí)代的引領(lǐng)者,其應(yīng)用落地也會(huì)對(duì)各行各業(yè)帶來(lái)深遠(yuǎn)影響。在未來(lái)的發(fā)展中,人工智能技術(shù)的發(fā)展還會(huì)有起伏,但不會(huì)再出現(xiàn)大的波瀾,它已然成為一項(xiàng)實(shí)用的技術(shù),正在各個(gè)領(lǐng)域進(jìn)入實(shí)用階段,必然會(huì)對(duì)未來(lái)帶來(lái)巨大變革。
就AI技術(shù)的發(fā)展而言,目前和家電產(chǎn)品是怎么結(jié)合的?能給家電行業(yè)帶來(lái)哪些變化?
目前在家電產(chǎn)品上應(yīng)用最廣泛的還是語(yǔ)音交互相關(guān)的AI技術(shù),通過(guò)使用語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解等技術(shù),使家庭中靜止的家居轉(zhuǎn)變?yōu)槟苈?tīng)可說(shuō)會(huì)思考的智能設(shè)備,用戶(hù)通過(guò)簡(jiǎn)單的語(yǔ)音交互便能實(shí)現(xiàn)家居設(shè)備的控制。
AI技術(shù)的發(fā)展,其實(shí)改變了傳統(tǒng)的以遙控器或手機(jī)APP進(jìn)行人機(jī)交互的方式,給家電行業(yè)注入了新動(dòng)能,并促使著整個(gè)家電行業(yè)進(jìn)行轉(zhuǎn)型升級(jí),以更加智能化、便捷化、人性化的方式為消費(fèi)者提供服務(wù)。
在諸多有可能被AI技術(shù)顛覆的領(lǐng)域中,家電是否有被AI賦能的需求?貴公司又是如何給家電行業(yè)帶來(lái)變化和發(fā)展?
這個(gè)需求是肯定的,特別是物聯(lián)網(wǎng)技術(shù)的發(fā)展,我們正在進(jìn)入到一個(gè)萬(wàn)物互聯(lián)互通的時(shí)代。而與我們息息相關(guān)的家電等設(shè)備,作為一個(gè)個(gè)獨(dú)立的終端,由于傳統(tǒng)交互方式及功能的單一,亟需通過(guò)AI賦能來(lái)提升用戶(hù)體驗(yàn)并提供額外的增值服務(wù)。
目前捷通華聲已經(jīng)在和各大家電廠商合作,通過(guò)輸出ASR(語(yǔ)音識(shí)別)、TTS(語(yǔ)音合成)、NLU(語(yǔ)義理解)等核心能力,為家電廠商提供產(chǎn)品智能化升級(jí)的技術(shù)保障。
提供核心技術(shù)的同時(shí),捷通華聲也打造了智能電視語(yǔ)音助手、遠(yuǎn)場(chǎng)機(jī)頂盒語(yǔ)音助手、智能音箱語(yǔ)音助手等各類(lèi)語(yǔ)音交互產(chǎn)品,從核心技術(shù)到應(yīng)用產(chǎn)品全面賦能,從而實(shí)現(xiàn)讓每個(gè)智能終端“能聽(tīng)會(huì)說(shuō)、能思考會(huì)判斷”。
站在貴公司的角度,如何推動(dòng)人工智能家電的發(fā)展?能為家電企業(yè)提供怎么樣的技術(shù)與解決方案?
捷通華聲擁有語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解、麥克風(fēng)陣列技術(shù)、圖像識(shí)別、人臉識(shí)別、聲紋識(shí)別等12項(xiàng)人工智能核心技術(shù),并在2011年率先推出了全球首個(gè)全方位人工智能開(kāi)放平臺(tái)——靈云平臺(tái),30多種人工智能技術(shù)SDK全部免費(fèi)下載使用,為各行各業(yè)進(jìn)行AI賦能。針對(duì)家電企業(yè),我們除了提供我們的語(yǔ)音、語(yǔ)義、人臉識(shí)別、聲紋識(shí)別相關(guān)的AI技術(shù)外,我們還提供智能機(jī)頂盒、智能音箱、智能家居等一整套的語(yǔ)音交互解決方案,并且已經(jīng)在一些項(xiàng)目中成功落地。
靈云智能終端解決方案的一大優(yōu)勢(shì)就是適應(yīng)性強(qiáng)、可復(fù)制性強(qiáng),可根據(jù)客戶(hù)需要在不同設(shè)備中實(shí)現(xiàn)助手級(jí)的語(yǔ)音交互能力。例如靈云電視語(yǔ)音助手可快速嵌入到電視、機(jī)頂盒、廣電盒子等設(shè)備中,通過(guò)藍(lán)牙遙控器直接語(yǔ)音控制電視,或利用麥克陣列,直接與電視對(duì)話,輕松實(shí)現(xiàn)語(yǔ)音搜索、設(shè)備控制、天氣查詢(xún)等功能。助手級(jí)解決方案同樣可以應(yīng)用于機(jī)頂盒廠商、OTT盒子、IPTV盒子等電視盒子中,讓盒子也能快速擁有語(yǔ)音交互能力。
貴公司目前是否和家電企業(yè)建立合作,哪些家電品類(lèi)對(duì)AI技術(shù)需求更迫切?您認(rèn)為哪些家電需要AI技術(shù)的加持和賦能。
捷通華聲一直和家電企業(yè)保持有密切合作,在家電品類(lèi)上,例如電視、冰箱、空調(diào)等大家電及微波爐、燈具、掃地機(jī)器人等小家電都有智能化升級(jí)的需求和必要,通過(guò)結(jié)合語(yǔ)音識(shí)別、圖像識(shí)別等AI技術(shù),賦予家電新的交互方式,例如可以邊看電視邊通過(guò)圖像識(shí)別下單購(gòu)物,空調(diào)可以根據(jù)室內(nèi)溫度及用戶(hù)習(xí)慣自動(dòng)調(diào)節(jié),冰箱可以根據(jù)已有食材為你搭配菜譜等等,總之,有了AI技術(shù)的加持,家電會(huì)變得越來(lái)越“懂你”。
在AI技術(shù)具體落地方面,主要有哪些?是大數(shù)據(jù)的分析、云計(jì)算,還是主要指交互方式的變化?
這幾方面應(yīng)該都有。AI技術(shù)的發(fā)展一方面的確會(huì)改變傳統(tǒng)的交互方式,比如傳統(tǒng)家電的按鍵到遙控器模式,再到手機(jī)APP控制形式,再到最近比較流行的語(yǔ)音交互形式,將來(lái)還可能會(huì)出現(xiàn)腦電波控制家電的場(chǎng)景;另一方面,通過(guò)與大數(shù)據(jù)、云計(jì)算技術(shù)的結(jié)合,人工智能還能夠根據(jù)用戶(hù)行為歸納預(yù)測(cè)并智能推薦個(gè)性化服務(wù),例如,冰箱的雞蛋快吃完時(shí),它能夠主動(dòng)發(fā)出提醒并完成下單;每天回家前一個(gè)小時(shí),空調(diào)就會(huì)自動(dòng)啟動(dòng),并調(diào)至主人習(xí)慣的溫度等等。
AI技術(shù)在實(shí)現(xiàn)過(guò)程中的難點(diǎn)主要是哪個(gè)方面?
AI技術(shù)的發(fā)展其實(shí)是螺旋上升的一個(gè)過(guò)程,它并不完美,想要達(dá)到人們期望的效果其實(shí)是有一定難度的,一些人類(lèi)簡(jiǎn)單的操作如看和聽(tīng),對(duì)于機(jī)器來(lái)說(shuō)并不容易,而且讓機(jī)器能夠像人類(lèi)一樣思考更是難上加難,這也是AI技術(shù)在實(shí)際落地中面臨的最大挑戰(zhàn)。
目前來(lái)看,您如何看待,人工智能對(duì)家電的影響主要體現(xiàn)在交互方式的變化,語(yǔ)音、圖像以及手勢(shì)識(shí)別?未來(lái)還會(huì)有哪些變化?除了交互方式,還有哪些是AI能帶給家電的?
目前,人工智能主要改變的是家電的交互方式,用戶(hù)通過(guò)語(yǔ)音、圖像、手勢(shì)等操作方式更自然地與設(shè)備進(jìn)行交互,但這其實(shí)仍然依賴(lài)人去操控,而未來(lái)智能家電會(huì)根據(jù)用戶(hù)行為分析,主動(dòng)去提供一些個(gè)性化服務(wù)。
除了交互方式外,AI將來(lái)甚至?xí)淖兗译姷男螒B(tài),例如電視機(jī)將不會(huì)再有實(shí)體設(shè)備,而是一個(gè)虛擬的立體投影,除了看電視,還兼具家庭管家、視頻聊天、智能陪護(hù)等功能
在交互方式變化的背后,有哪些革命性技術(shù)?作為人工智能技術(shù)解決方案商,貴公司能給家電企業(yè)帶來(lái)什么?
交互方式的改變,離不開(kāi)語(yǔ)音識(shí)別、語(yǔ)義理解、圖像識(shí)別等人工智能核心技術(shù),而這些技術(shù)的發(fā)展其實(shí)離不開(kāi)深度學(xué)習(xí)技術(shù)所帶來(lái)的革命性突破。捷通華聲依托與清華大學(xué)建立戰(zhàn)略合作,擁有一大批人工智能的核心算法研究團(tuán)隊(duì),目前公司所推出的12項(xiàng)人工智能技術(shù)均為捷通華聲完全自主知識(shí)產(chǎn)權(quán),全方位的開(kāi)放平臺(tái)為家電企業(yè)變革創(chuàng)新帶來(lái)了新的契機(jī)。
伴隨全屋智能發(fā)展起來(lái)的還有智能音箱這一新品類(lèi),您認(rèn)為在未來(lái)智能音箱在AI鏈條中的地位是怎樣的?
智能音箱其實(shí)目前更多是起到一個(gè)教育用戶(hù)認(rèn)知人工智能的作用,相較于國(guó)外流行的音樂(lè)文化,國(guó)內(nèi)的大多數(shù)用戶(hù)并沒(méi)有在家庭中使用音箱(或音響)的習(xí)慣,而目前智能音箱的火爆,其實(shí)是人們對(duì)語(yǔ)音交互及智能問(wèn)答等功能的好奇“嘗鮮”,而在未來(lái),智能音箱很可能會(huì)演變?yōu)榧彝サ闹悄苷Z(yǔ)音助手,但是,無(wú)論未來(lái)語(yǔ)音助手演化成何種形態(tài),都不會(huì)僅僅局限于現(xiàn)有的音箱模式之中。
目前AI交互技術(shù)存在的問(wèn)題是哪些?不完美的地方有哪些?距離真正的智能還有多遠(yuǎn)?
AI技術(shù)存在的問(wèn)題是目前并不完美,離人們的期望還存在一定差距。例如人臉識(shí)別、聲紋識(shí)別等身份認(rèn)證技術(shù),雖然已經(jīng)達(dá)到了很高的識(shí)別準(zhǔn)確率,但由于應(yīng)用場(chǎng)景的特殊性,千萬(wàn)分之一的錯(cuò)誤都可能帶來(lái)嚴(yán)重的后果。
另外由于目前NLU技術(shù)(語(yǔ)義理解)的發(fā)展瓶頸,市面上大多數(shù)的智能化產(chǎn)品其實(shí)并不太智能,依然需要人為主動(dòng)地進(jìn)行操控??傊?,距離真正的智能還有很遠(yuǎn)的路要走。
您能描述一下,AI家電的使用場(chǎng)景和終極發(fā)展階段的樣貌。
在未來(lái),所有的家電將會(huì)互聯(lián)互通,除了與人交互外,設(shè)備間也能進(jìn)行“溝通”,家電通過(guò)學(xué)習(xí)用戶(hù)行為,能夠在無(wú)感知無(wú)指令的情況下為人們提供適時(shí)適宜的服務(wù)并且不會(huì)產(chǎn)生打擾。另外,家電設(shè)備的形態(tài)也可能會(huì)發(fā)生變化,人們將會(huì)體驗(yàn)到真正智能化、便捷化、人性化的家居服務(wù)。
評(píng)論:
目前沒(méi)有評(píng)論內(nèi)容。