2021年6月17日-19日,由中國汽車工業(yè)協(xié)會主辦的第11屆中國汽車論壇在上海嘉定舉辦。站在新五年起點上,本屆論壇以“新起點 新戰(zhàn)略
新格局——推動汽車產(chǎn)業(yè)高質(zhì)量發(fā)展”為主題,設(shè)置“1場閉門峰會+1個大會論壇+2個中外論壇+12個主題論壇”,全面集聚政府主管領(lǐng)導、全球汽車企業(yè)領(lǐng)袖、汽車行業(yè)精英,共商汽車強國大計,落實國家提出的“碳達峰、碳中和”戰(zhàn)略目標要求,助力構(gòu)建“雙循環(huán)”新發(fā)展格局。其中,在6月18日下午舉辦的主題論壇“智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)生態(tài)的融合與升級”上,科大訊飛智能汽車副總裁雷琴輝發(fā)表了主題演講。以下內(nèi)容為現(xiàn)場演講實錄:
非常高興到上海參加今天論壇,前面有很多主機廠領(lǐng)導友商都提到了我們,今天我就在這里面給大家介紹一下,科大訊飛在智能座艙里面的想法,和大家一起分享。
分兩塊兒:1.我們希望聯(lián)合構(gòu)建智能座艙工程化的協(xié)同體系。
2、匯智共創(chuàng)智能座艙產(chǎn)品體驗新高度。
我們看一下這里,整車軟件開發(fā)模式,其實現(xiàn)在在發(fā)生變更,從感知輸入融合決策,以人工智能為核心的軟件體系,成為我們智能汽車的核心競爭力。
在訊飛角度,我們理解分了這么多層,其中用戶輸入、車輛感知以及智能駕駛座艙的平臺軟件,我們從感知輸入層面到融合決策層面做了這幾個事情,這幾個事情也是訊飛現(xiàn)在做得比較多的地方。
我們整個傳統(tǒng)的智能汽車軟件開發(fā)面臨巨大的挑戰(zhàn),其實問題不用多說,我們也都知道,剛才有些朋友問我,為什么訊飛從單點語音合成到識別,到現(xiàn)在整個智能化都有了,其實想回答并不是訊飛做了這些,而是行業(yè)變革了,需要這些東西,所以我們才越做越多了,原來我們做的是合成,原來汽車做TTS就為了導航的播報,“前方左拐”。慢慢合成以后有了識別的需求,識別以后有了自然語言理解的需求,理解完了以后有對話的需求,有了視覺的需求,這些需求包括后面數(shù)據(jù)的管理,大數(shù)據(jù)的推動等等,還有場景,都是行業(yè)發(fā)展使我們有這些東西。
我們構(gòu)建了訊飛這方面做的事情,我們認為要從全棧的,端到端的產(chǎn)品能力。從云端到產(chǎn)品,從云端產(chǎn)品原子化,解決剛才的問題,我們希望能夠不管云端還是本地端能夠原子化,能夠某些模塊為我們所用,不是原來那樣的,每個都要特定的定制開發(fā),但是最終肯定面向不同的用戶,不同的客戶,不同的車有不同的展現(xiàn)形式。
另外科大訊飛通過工具和平臺的沉淀,使我們場景工程化高效落地。我們有AI平臺、場景平臺、知識大腦、有設(shè)計工具平臺,把角色盒子、大數(shù)據(jù)平臺、對話平臺運營管理標注,這是訊飛相對擅長的一塊兒。
圍繞汽車生命周期,我們協(xié)同構(gòu)建了從產(chǎn)品的開發(fā)體系,從產(chǎn)品規(guī)劃、交付到營銷推廣售后,全方位推出自己的產(chǎn)品。比如汽車產(chǎn)品規(guī)劃階段,我們有自己的產(chǎn)品技術(shù)、交互、數(shù)據(jù),從交付之后,我們做質(zhì)量成本定制,營銷我們也做量點包裝,品牌賦能,產(chǎn)品培訓,最后我們對客戶問題的響應(yīng),對問題的OTA,這一系列東西,是我們工程化的基礎(chǔ)。
我們看一下,基于工程化之后,訊飛在智能座艙里面想達到比較好的體驗,我們做了哪些想法?與各位領(lǐng)導專家一起分享。
我們目標五條:
1、智能座艙產(chǎn)品持續(xù)引領(lǐng)行業(yè)變革。
2、我們擁有超級的音效體驗產(chǎn)品。
3、每臺車都可以不斷成長。
4、每個用戶都能觸達。
5、我們對每一個車都提供無憂的服務(wù)。
我們從哪些方面來做?這是訊飛認為汽車全產(chǎn)業(yè)鏈的價值鏈,或者用戶的使用,就不一一給大家念了。
基于從這些用戶的鏈里面推出了智能交互、智能音效,汽車AI營銷等四大解決方案,這里面有我們的工程化的底座+AI技術(shù)支撐+云平臺,一起支持這個事情的呈現(xiàn)。
解決方案里面,如果我們換一個視角看這個事情,我們場景和用戶體驗驅(qū)動我們的設(shè)計,這四個產(chǎn)品還在,我們建立自己的數(shù)據(jù)中心,數(shù)據(jù)中臺,這個也不全是訊飛自己的也可以和各個車廠聯(lián)合建,我們的人工智能技術(shù)還是放在這。
通過這里面打造了一起更加“智能”的,打了一個引號“智能”的各種東西,希望通過人工智能能夠在面向整個汽車的全生命鏈里面,提供我們的能力。剛才有一位兄弟一直問我,訊飛汽車信源怎么樣,其實我們是開放、包容的,我們既不站隊,也不建隊,我們希望自己的技術(shù),我們的產(chǎn)品能夠和行業(yè)里面優(yōu)秀的,好的信源,好的內(nèi)容一塊兒,一起往前走。
從用戶體驗來說,我們的生態(tài),其實這些開放的生態(tài),車廠自己的生態(tài),線下4S店的生態(tài),這是屬于原來理解比較多的,咱們比較開放的生態(tài),訊飛自己基本都沒建,都是跟大家一起,各位兄弟伙伴給面子合作,抬著我們一起往前走的,比如高德、QQ音樂都有合作,我們不排除任何一家。
訊飛有自己的特色,在這個地方。其實不管我們的玩具、教育、醫(yī)療,我們的交通車網(wǎng),訊飛有很多面向各個行業(yè)里面的其他生態(tài),這是我們比較獨特的。
我們回過頭剛才說了音效,其實訊飛在音效解決方案里面,做了硬件、軟件,也跟剛才說的各位朋友一起做了應(yīng)用,也做了品牌。其實汽車里面,聲音大家感知還是蠻強烈的,我開車這么多年,車里面的聲音對我們這些人有感覺,而現(xiàn)在其實國內(nèi)大家都在熱,現(xiàn)在人都招不到了,挺熱了。而我們布這個事兒是2018年,訊飛從技術(shù)底層,從音效算法、合成算法開始往前做,這塊兒訊飛有這個想法,聽這塊兒也要做。
我們最終就是希望每一臺車都有懂你的助手,我們從形象、聲音、感知、推薦、情感各個方面打造一個助手,剛才威馬的林總說了這個事情。
我們看一下,助手有哪些東西?我們有做人設(shè)、做形象,有通過各種組件給整合成一個,打造一個符合每一款車都有獨特的個性,最終目標希望對每個人有不同的,對這臺車的體驗有不同的感覺?;剡^頭來,我們是屬于技術(shù)派,拆出來變成我們做這么多的場景,這些場景里面怎么用技術(shù)能夠支撐得了它,實現(xiàn)得了它。
這里聲音復刻,時間關(guān)系不播了,能夠讓小孩兒變成車上合成的聲音,TTS的聲音變成你家小孩兒了,這還是挺有用的事情。
另外感知側(cè)我們做了哪些事兒?我們希望這個車可以聽得更準,怎么聽得更準?我們在這里面做了降噪以及各種分音區(qū),使得我們聽得更準,首先車要和你交互,像在座的各位,首先我得有一個揚聲器,否則這個聲音出不來,擴大不了,它得聽清楚。
第二希望看得清楚。前段大會視頻或者是遠程的感覺還是差一些,在座的各位也有對我這塊兒表示鼓勵的,也有充滿疑惑的,我都能看到大家的表情,我認為這是一件很重要的事情。車上也是一樣,如果一輛車聽得見,看不見肯定也是有問題,所以它也得看清楚。
基于聽得見,看得見,我們將聲音和圖像結(jié)合起來,中間部分就是結(jié)合的,身份識別也是可以靠聲音,也是可以靠圖像,畫像也是。咱們通過“純動+聲音”可以極大提高在高噪和惡劣環(huán)境下的語音識別效果。這兩邊是各自有效的事情。
除了剛才說的針對聽和看,其實還有一大塊兒,后面咱們國內(nèi)車廠兄弟也會出去,我們還是先放一下,就是要做的,第一大類方言,沒法給中國每一個方言做一套識別器,今天上午有媒體朋友問我,我說做不到,因為我是江西人,當時提問兩個媒體也是江西的,我們那邊說,隔山聽不見,隔條河也聽不清楚,這是事實,特別是山多、水多的地方,所以不太可能給每個方言做一個語言,但是做大類沒有問題。
另一個事情就是多語種,要往前做。國內(nèi)的車廠,包括合資的還是自主的,合資屬于進口轉(zhuǎn)出口,咱們也有從國內(nèi)做好了,往外賣的,還有自主車廠走出去的,如果我們需要多語種,訊飛在這塊兒是義不容辭要布局的,我們也努力將這塊兒做好。另外交互我們希望更直接、更簡潔地往前走。
除了剛才車本身的能力之外,我們還要看到每個車,它讓每個乘客,我們希望它能夠做到獨享的空間,這個已經(jīng)做到了,剛才王總提到我們應(yīng)該也在合作做一些多音區(qū)的聽,分區(qū)聽,分區(qū)說,還有3D環(huán)繞聲,在不同的聲音上出來這種聲音。訊飛還是比較技術(shù)的,我們提供了手勢、音效、語音識別、合成、交互、回聲、分區(qū),目的還是希望能夠讓各個車廠、合作伙伴能夠看菜選單,形成不同的組合的特色產(chǎn)品。
交互里面我們通過視覺知道它在哪里面,這也是我們的目標。有了這些之后還差一點,你感知到了,比如在座的地方感知到我熱了,怎么辦?它最好能夠把空調(diào)自己調(diào)一下,感知到我口渴了,最好水就過來了這里也是一樣,感知到這些動作以后要做推薦,推薦也有算法,為什么訊飛做推薦,或者數(shù)據(jù)公司的推薦,因為要大數(shù)據(jù),這個也是我們?yōu)樾袠I(yè)提供的能力,我既可以提供推薦,分析數(shù)據(jù)的能力,歸納數(shù)據(jù)的能力,也可以做推薦的場景。這個地方要實時刷新,這里也要和各位合作伙伴一起合作,實現(xiàn)共贏的生態(tài)。
這里簡單的演示,通過定制,剛才的華為領(lǐng)導做過了,他做了ADAS的,我們可以定制整個交互,你想怎么定制怎么定制,定制完了,屏幕可以顯示出來,時間關(guān)系就不放了。各種配置,看菜單做編程,還不是我們真正寫代碼,就這樣的編程,基本上可以做到各種推薦、配置、界面變化基本都能夠出來了。一鍵下去,這邊響應(yīng)出來,把一個場景通過可視化的方式做出來。
另外我們?yōu)橹悄芄芗?,比如智能化的?gòu)建,是專家支持運營。這個事情額外提一句,專家知識比較難搞,我們現(xiàn)在喊得比較多,認得知識構(gòu)建能力遠超過機器,人是很奇特的,我第一次來到這個酒店,第一次來到這個房間,第一次見到各位領(lǐng)導同事,但我很快就知道我在做什么,我在哪里,我要做什么事兒。但是要讓電腦完成這個事情是比較困難的,知識圖譜這件事情,雖然大家喊得很厲害,但是技術(shù)角度來說,這是我們未來人工智能很難的一件事情。
另外我們打造一個沉浸式的體驗,比如上車的交互引導、智能問答就不念了,這個事情怎么說好像大家都在做,我們也在做,我們希望做出一點有特色,有亮點的東西過來,然后和各位朋友一起共創(chuàng)更好,更有亮點的東西。
最后是我們在產(chǎn)品,集團數(shù)智體驗升級。剛才我提到整個車從它的線下實體店,到閉環(huán)這么一圈,各個地方離不開。比如OAI消毒系統(tǒng),我們?nèi)ツ晖瞥鰜恚衲昶鋵嵅簧偃讼胗?,確實還有些用處,不能說絕對好用,但確實有些用處,能解決我們很多問題。原來我們傳統(tǒng)的,或者我們用最基礎(chǔ)的方法,去打電話,去分析電話怎么樣,現(xiàn)在機器基本可以替大家完成了。
我們從整個鏈條里面提供所有的信息和數(shù)據(jù)的匯總,當然這個車廠可以自己建。最后還是到這一句,我講得比較快,如果有伙伴、媒體想更多了解,可以線下交流。
最后我們還是希望通過打造智能的五點,讓我們在行業(yè)繼續(xù)發(fā)揮自己作用,讓汽車智能化這個行業(yè),越做越大,因為越做越大,越做越多,我們做軟件、算法的,就有更多的市占,對我們來說就是好的事情。
謝謝大家!
|