你可能不知道Nuance是做什么的,但你一定知道iPhone 4S帶來的一項革 命性的人機交互產品——“Siri”。事實上,為“Siri”提供語音數據庫支持的正是Nuance,此前曾用過一段時間Vlingo的平臺。
作為全球領先的語音和語言解決方案提供商,Nuance因為是T9輸入法的擁有者被業(yè)界所熟知,目前全球90%以上的手機都采用T9輸入法,這個輸入法原本是一家名為“Tegic Communications”所開發(fā),后來被Nuance買了下來。Nuance同時也在近期收購了滑動輸入法的公司Swype。
關鍵的數據收集
近日Nuance在深圳舉行了“2012年Nuance移動論壇”,這家以往“隱身”于各大國際公司背后的企業(yè)出現在了國內,吸引了深圳諸多廠商的興趣。Nuance在會上展示了三段不同的Video,這三段Video其中就有大家所熟知的Siri的廣告片,另外一段則是Nuance自己的“聲龍”系列產品,最后一段則是將語音技術結合手勢控制應用到智能電視的場景。通過短片,Nuance不但展示了目前語音技術發(fā)展的最新動態(tài)和趨勢,同時也展示了諸多國際企業(yè)所重視的關鍵點——用戶體驗,這將是在未來企業(yè)競爭中取勝的殺手锏。而Nuance的目標,也就是幫助這些企業(yè)提高用戶體驗。

語音技術的出現顯著改變了人機互動的方式,但如果你對Siri有一定的研究,你會發(fā)現其實語音識別技術(ASR)只占到其中的20%,真正重要的則是語義識別技術。語義識別能幫助用戶更準確地能否搜索出想要的結果。這種技術基于Statistic Language model(語言模型統(tǒng)計),需要大量的數據來完善搜索的結果。同時對于自然語言的理解(NLU技術),也需要數據庫的數據,來進行語法的收集!霸蕉嗟臄祿饺菀讕椭覀兣鋵τ脩羲枰膬热,了解用戶的意圖,將意圖翻譯成行動,效果最終也是取決于本身數據的質量!盢uance大中華區(qū)總經理鄭裕慶表示。
Nuance的Dragon Go憑借在美國的Apple App Store和Android Market兩大移動應用平臺巨大的下載量而被用戶熟知。Dragon Go將Nuance的聲龍語音識別和自然語言理解技術與人工智能技術相結合,從而顯著簡化了搜索移動內容的體驗。因此,用戶僅憑借語音便能得到他們想要的內容,并能將更多的時間用于瀏覽而非查找在線內容。也就是說,Dragon Go能聽懂用戶說的話并能理解用戶意圖。用戶僅需說出一個簡單的短語,他們所喜愛和最相關的內容提供商便會顯示在眼前,用戶能輕松地獲取餐廳評述、購買電影票、觀看流媒體電影和電視節(jié)目、在線購物、查找方向、聽喜愛的音樂、還可以通過Expedia預定酒店。
如何提供更好的用戶體驗?
據了解,目前Nuance主要采用兩種商業(yè)模式。一種是直接向OEM廠商和制造廠商提供語音技術和解決方案,同時收取授權費用。這里不僅包括了手機、TV、PC等消費電子產品,還包括大量的企業(yè)級行業(yè)應用。另一方面,Nuance提供了自主研發(fā)的產品“如Dragon go”,供智能手機用戶方便的在AppStore以及Android Market免費下載。通過向消費者提供免費下載使用,Nuance得以收集龐大的語音數據,從而對語音引擎進行訓練,從而提高引擎的準確度。
“我們的DragonDictation(聲龍聽寫)和DragonSearch(聲龍搜索)這兩個應用,是比蘋果的Siri出來還要早,就是因為我們要先做前期投入,只有收集了這個數據庫,才能提高產品體驗。”鄭裕慶表示,數據庫的豐富程度會直接影響到語音和語義的辨識度。所以Nuance早在1999年就已經開始在PC上應用語音引擎,到目前為止已經更新了11個版本,可以說是一個非常成熟的引擎。
“除了成熟的引擎,我們最大的優(yōu)勢,其實是如何能把用戶體驗做得更好的經驗。事實上語音識別率已經不是目前最重要的因素了,因為大家可能差距都不太大。但是用戶體驗就不一樣了!编嵲c表示,包括如何解決噪音問題、如何優(yōu)化語音控制界面,這些提高用戶體驗的東西,Nuance有著豐富的經驗以及完善的解決方案。
據統(tǒng)計,2011年通過云端訪問Nuance的語音數據庫便有20億的訪問量。而據鄭裕慶介紹,Nuance目前已經跟不少國際知名的品牌進行了合作。其中就包括三星智能電視,以及BMW汽車。而在今天年年初,Nuance也發(fā)布了跟Intel的合作,未來Nuance將為Urtrabook提供語音服務,包括開啟軟件、寫email、更新社群網站、控制音樂播放等操作都可通過語音完成。
電子工程專輯
相關閱讀: