自從Apple 4S引入了Siri這項語音識別技術(shù),相信類似上面這種經(jīng)典對白給不少人的生活增添了笑料。而在這之前,一只可愛的學(xué)舌的Tom貓早已讓太多人對掌上的這部智能手機(jī)停不下來,生活原來還可以如此DIY。
沒錯,有了語音識別技術(shù),智能手機(jī)這一類消費(fèi)終端才可以實(shí)現(xiàn)很多更加智能的功能。而在專業(yè)從事聽覺神經(jīng)學(xué)產(chǎn)品化的Audience公司的技術(shù)路線圖上,語音控制將成為繼觸控之后的電腦界面的新革命。
為此也就不難理解Audience為何看中了這一領(lǐng)域,并潛心開發(fā)其earSmart這種基于人耳仿生學(xué)的語音識別技術(shù)。Audience市場營銷副總裁Robert Schoenfield表示,采用了earSmart技術(shù)的終端可同時實(shí)現(xiàn)實(shí)時通訊、多媒體播放以及語音識別功能。而目前為止,Audience是唯一一家通過硬件的單芯片方式來實(shí)現(xiàn)高品質(zhì)語音識別技術(shù),提供專業(yè)語音處理器產(chǎn)品的公司。Robert指出,用硬件來實(shí)現(xiàn)語音識別和噪聲抑制的好處顯而易見,在完成背景噪聲抑制的同時真實(shí)語音信號的保真度會更加出色。
經(jīng)過幾代的演進(jìn),目前Audience公司的產(chǎn)品進(jìn)入第三代eS325和eS515系列。相較于此前的第二代產(chǎn)品,第三代產(chǎn)品從雙麥克風(fēng)升級為3路麥克風(fēng),可以更好的捕捉真實(shí)語音信號,采用移動De-Reverb和超級寬帶噪音抑制技術(shù),通過ASR Assist技術(shù)實(shí)現(xiàn)優(yōu)化的自動語音識別功能,同時具有移動音頻變焦和增強(qiáng)型高清立體聲錄音功能。在此基礎(chǔ)上,eS515還將音頻編解碼器和功率管理模塊集成到芯片內(nèi),降低系統(tǒng)整體設(shè)計成本,Audience稱之為“第一代智能語音處理器”。其中eS325已被三星Galaxy S4等智能終端采用。未來Audience看好的市場包括手機(jī)、平板電腦和超級本這類便攜設(shè)備。
在和與非網(wǎng)記者的交流中,Robert一再強(qiáng)調(diào)中國市場對其發(fā)展的重要性。這點(diǎn)毋庸置疑,從客戶名單中我們看到華為、聯(lián)想、小米、中興、步步高、魅族等國內(nèi)一線廠商都已采用Audience的產(chǎn)品。交流中記者了解到,目前國內(nèi)手機(jī)廠商采用的多是Audience第二代包括eS305和eS310兩款產(chǎn)品。這里Robert還特別強(qiáng)調(diào)了Audience和國內(nèi)智能語音識別技術(shù)軟件提供商科大訊飛的最新合作動態(tài),雖然合作模式尚不清晰,但我想Audience是看中了科大訊飛的產(chǎn)品在國內(nèi)品牌手機(jī)市場上的占有率和客戶群,想借和科大訊飛的合作,將自己的芯片產(chǎn)品帶到更多的國內(nèi)手機(jī)廠商的生產(chǎn)線上。
同時,Audience還積極開展與移動運(yùn)營商的深層合作,包括和中國移動達(dá)成3個層次的合作,即應(yīng)用程序與生態(tài)系統(tǒng)開發(fā)、規(guī)范與測試以及語音實(shí)驗室的建立。
基于這些動作,可見Audience致力于投入中國市場,重新定義針對中國超過7億用戶的移動語音體驗。