加聲紋識別搶奪市場?阿里音箱這步棋其實很懸
導讀:不出所料,加聲阿里還是紋識發布了智能音箱。從亞馬遜三年前的別搶鄭州美女約炮(電話微信189-4469-7302)大保健可上門安排外圍外圍上門外圍女桑拿全套按摩無心插柳到今天阿里的入局,智能音箱市場的奪市爆發讓人始料未及,但這的箱步確發生了。
Echo已累計銷售近2000萬臺,實懸谷歌、加聲微軟、紋識蘋果隨之跟進,別搶之后的奪市一段時間里,國內的箱步軟件廠商、硬件產商、實懸內容廠商爭相進入,加聲好不熱鬧。紋識
而直到本月初,別搶阿里才正式發布智能音箱天貓精靈X1,既出乎意料又在情理之中,使得語音入口的爭奪戰因為阿里的入局變得更加有趣。
其實,499元的天貓精靈在發布前一天,雷鋒網就曾寫過一篇題為[為何中國版Echo還未問世,明天阿里的AI新品能帶來驚喜嗎]的文章。
那么,鄭州美女約炮(電話微信189-4469-7302)大保健可上門安排外圍外圍上門外圍女桑拿全套按摩阿里的智能音箱到底帶來了哪些有別于其他同類產品的驚喜?
眼前一亮的“驚喜”
此前有媒體稱,為了這款智能音箱,阿里巴巴甚至將馬云投入上億美元的Pepper機器人項目中止,把人員隊伍拆分劃進人工智能實驗室。而花了這么大代價出來的產品好像似乎與Echo等音箱并無本質上的差異,所含功能大致包括播音樂、叫外賣、查天氣、設鬧鐘、智能家電操控等。
根據天貓精靈對外宣傳的賣點,其中非常重要一點就是連Echo都不具備的聲紋識別功能。
阿里稱,通過聲紋識別技術,音箱可以分辨家里的每一個人,并且根據每個人的喜好而設定推送不同的內容,目前最多可以識別6個人的身份;另外,用戶還可通過自己的聲音完成購物支付驗證環節。而Echo在分辨人的身份上,還需要通過進一步操作來獲取用戶的個人信息。
讓雷鋒網好奇的是,如此酷炫的功能為何亞馬遜至今都還沒用在Echo上。
據悉,亞馬遜很早就想應用這項技術,但據亞馬遜員工介紹,從聲紋識別領域的硬件和軟件公司中得到的反饋看來,讓這些語音控制設備去識別不同用戶的聲音比想象中要艱難很多。
“由于設備需要去除噪音,回聲,混響,使得它難以對聽到的發聲者的身份進行識別。”Conexant語音部門副總裁Vineet Ganju說道。
那么擁有聲紋識別的天貓精靈真的能撐起它所重點訴求的這個賣點嗎?
我看懸。
聲紋識別功能為什么懸?
先從聲紋識別算法層面講,聲智科技創始人陳孝良博士此前在接受雷鋒網專訪時表示,聲紋識別還是一個比較窄的學科,應用也相對較少。現在大部分研究都是有關動態實時檢測,動態檢測的方法自然要利用靜態檢測的各種原理方法,同時也需要增加其他很多算法, 比如VAD、降噪、去混響等。VAD的目的是檢測是不是人的聲音,降噪和去混響是排除環境干擾。
VAD常用兩個方法,基于能量檢測和LTSD(Long-Term Spectral Divergence),當前用的較多是LTSD,另外特征提取方面還需要:動態時間規整(DTW)、矢量量化 (VQ)、支持向量機 (SVM),模型方面則需要隱馬爾可夫模型(HMM)和高斯混合模型 (GMM)。
從上面模型不難看出,聲紋識別還是一種基于數據驅動的模式識別問題,因為所有模式識別存在的問題聲紋都存在,而且聲紋識別還有一些不太好解決的物理和計算問題。
聲紋識別的唯一性很好,但實際上現有的設備和技術仍然很難做出準確分辨,特別是人的聲音還具有易變性,易受身體狀況、年齡、情緒等的影響。若在環境噪音較大和混合說話人的環境下,聲紋特征也是很難提取和建模的。 現階段,遠場聲紋識別理論并不成熟,研究進展也不大。
陳孝良認為,深度學習帶給模式識別極大的提升,甚至還有開源的相關算法,但是聲紋識別的研究進展仍然不大,這仍然受制于聲紋的采集和特征的建立。
聲紋識別提供商SpeakIn資深科學家陳東鵬博士談到,從聲紋識別這一單項技術來講,容易受到真實環境下的各種影響,包括:噪音問題、多人說話、身體狀況、情緒影響等,現在確實很棘手。包括他們在內的一些公司也在大力通過軟、硬件算法去優化這些行業通用問題,在深度學習的加持下,整個行業的進步也比以往更快。陳博士補充到,聲紋識別只是一個環節,效果判斷還需看產品本身和使用場景等因素。
在產品層面,剛剛發布“小雅”智能音箱的喜馬拉雅表達了他們的看法。喜馬拉雅副總裁李海波表示,對于聲紋識別的應用,公司內部也攻關了很久,但無法做到完全準確,目前還只是實驗階段,效果一般。
在談及阿里天貓精靈時,他講到,遠場語音識別通常在三米到五米內有效,降噪是在70dB左右,環境噪音和音響聲音大于這個標準就很難喚醒。而遠場聲紋識別在同等距離下就更加不穩定,目前客廳、電視機、廚房、床頭是智能音箱的四個常用場景,而除了床頭外,其他三個常用場景實際距離通常情況均超過三米,所以阿里音箱聲紋識別的具體實用性還不可得知。
至于亞馬遜Echo為何至今還沒用這個功能,李海波認為該技術還不成熟,雖然很炫但風險很大。
另外,Sensory公司的CEO Todd Mozer也認為對Echo這樣的遠場語音設備來說,識別誰在說話是很困難的。隨著信號/噪聲比例提高,設備的表現隨之變差。
“降噪和從噪聲中分離語音的處理對于用戶身份的識別有非常大的影響,目前為止,市場上還沒有產品同時處理好用戶身份識別,遠場語音和噪聲處理。”Mozer說道。
再從遠場聲紋識別的實際應用情況來看,中科院自動化所、極限元資深智能語音算法專家劉斌向雷鋒網談到了他的看法。劉博士表示,遠場語音識別受到噪聲、回聲、混響的干擾,無論是語音識別還是聲紋識別都很具有挑戰性。
目前遠場語音識別可靠的識別距離大約是3-5米;對于聲紋識別還要更難一些。因為語音識別的目的是理解語音信號中的言語內容,言語內容信息跟共振峰高度相關,共振峰主要集中在低頻帶,語音信號低頻帶能量較高,受外部干擾相對較小,而說話人相關特征更多集中在高頻帶,語音高頻帶能量相對較低,更容易收到各種干擾的影響,因此遠距離聲紋識別更具挑戰。他隨即說到,因為每個人說話特征會隨著不同因素而變化,例如感冒時發音跟正常時肯定有所差異,所以近場聲紋識別還不敢保證特別成熟,遠場條件下肯定不太容易實用。總體來說,對于大多數用戶,聲紋識別應用于智能音箱并不是剛需,從技術角度分析,聲紋識別尚不成熟。
那么,相比遠場語音識別來說,更加不成熟的遠場聲紋識別技術為何會被阿里急著應用到音箱中呢?
除了用此技術滿足用戶的個性化需求尋求差異化搶占市場外,劉博士還提到,介于阿里在電商領域的一些積累和優勢,應用在電商身份認證也是阿里重點推進的方向。
阿里基于淘寶、天貓巨大的資源優勢將購物場景引入音箱中聽上去無可厚非,但從之前亞馬遜將此場景應用在Echo上來看,用戶用其購物的使用頻率并不高,使用體驗也不理想。
科大訊飛執行總裁胡郁此前接受雷鋒網采訪就說到,從整個市場來看,購物場景應用于音箱中還非常不成熟。真需求一定是用來滿足用戶剛需行為的功能,雖然Echo現在賣的很好,但調查后發現,用戶真正用得比較多的工具不過是設個提醒、查個天氣等等。之前亞馬遜大力推的Echo語音購物功能并沒有做起來,當用戶用語音交互的形式去買東西時,會發現里面各個環節和場景挺麻煩,還不如直接在屏幕操作來的方便。
所以這也是很多企業一直在強調語音交互要和視覺呈現的原因,因為用戶在面對沒有視覺呈現的情況下,你獲得的信息不夠,這時候很難完成一些復雜的操作。所以有些功能和場景都是我們自己憑空想出來的,直到真正投入實際使用時卻發現用戶的思維與行為習慣并不是產品設計的那樣。
這里可以看出,如果用戶連使用電商功能的習慣都尚未養成,且聲紋技術問題重重,那么在電商中加入聲紋識別的訴求,目測也很難以經得住市場考驗。
總體來看,阿里此次在智能音箱中加入聲紋識別的出發點很好:大打Echo和京東叮咚都沒有的功能營銷牌,在同質化產品浪潮中,用前沿技術來提升競爭力。
但在整個技術和市場尚未成熟之際,阿里在音箱中嫁接聲紋識別,這步棋怕是走早了一步。
智能電視/盒子資訊歡迎關注智能電視資訊網news.znds.com,以及ZNDS君的微信公眾號zndscom,官方微博智能電視網,歡迎投(sao)喂(rao)。
Echo已累計銷售近2000萬臺,實懸谷歌、加聲微軟、紋識蘋果隨之跟進,別搶之后的奪市一段時間里,國內的箱步軟件廠商、硬件產商、實懸內容廠商爭相進入,加聲好不熱鬧。紋識
而直到本月初,別搶阿里才正式發布智能音箱天貓精靈X1,既出乎意料又在情理之中,使得語音入口的爭奪戰因為阿里的入局變得更加有趣。
其實,499元的天貓精靈在發布前一天,雷鋒網就曾寫過一篇題為[為何中國版Echo還未問世,明天阿里的AI新品能帶來驚喜嗎]的文章。
那么,鄭州美女約炮(電話微信189-4469-7302)大保健可上門安排外圍外圍上門外圍女桑拿全套按摩阿里的智能音箱到底帶來了哪些有別于其他同類產品的驚喜?
眼前一亮的“驚喜”
此前有媒體稱,為了這款智能音箱,阿里巴巴甚至將馬云投入上億美元的Pepper機器人項目中止,把人員隊伍拆分劃進人工智能實驗室。而花了這么大代價出來的產品好像似乎與Echo等音箱并無本質上的差異,所含功能大致包括播音樂、叫外賣、查天氣、設鬧鐘、智能家電操控等。
根據天貓精靈對外宣傳的賣點,其中非常重要一點就是連Echo都不具備的聲紋識別功能。
阿里稱,通過聲紋識別技術,音箱可以分辨家里的每一個人,并且根據每個人的喜好而設定推送不同的內容,目前最多可以識別6個人的身份;另外,用戶還可通過自己的聲音完成購物支付驗證環節。而Echo在分辨人的身份上,還需要通過進一步操作來獲取用戶的個人信息。
讓雷鋒網好奇的是,如此酷炫的功能為何亞馬遜至今都還沒用在Echo上。
據悉,亞馬遜很早就想應用這項技術,但據亞馬遜員工介紹,從聲紋識別領域的硬件和軟件公司中得到的反饋看來,讓這些語音控制設備去識別不同用戶的聲音比想象中要艱難很多。
“由于設備需要去除噪音,回聲,混響,使得它難以對聽到的發聲者的身份進行識別。”Conexant語音部門副總裁Vineet Ganju說道。
那么擁有聲紋識別的天貓精靈真的能撐起它所重點訴求的這個賣點嗎?
我看懸。
聲紋識別功能為什么懸?
先從聲紋識別算法層面講,聲智科技創始人陳孝良博士此前在接受雷鋒網專訪時表示,聲紋識別還是一個比較窄的學科,應用也相對較少。現在大部分研究都是有關動態實時檢測,動態檢測的方法自然要利用靜態檢測的各種原理方法,同時也需要增加其他很多算法, 比如VAD、降噪、去混響等。VAD的目的是檢測是不是人的聲音,降噪和去混響是排除環境干擾。
VAD常用兩個方法,基于能量檢測和LTSD(Long-Term Spectral Divergence),當前用的較多是LTSD,另外特征提取方面還需要:動態時間規整(DTW)、矢量量化 (VQ)、支持向量機 (SVM),模型方面則需要隱馬爾可夫模型(HMM)和高斯混合模型 (GMM)。
從上面模型不難看出,聲紋識別還是一種基于數據驅動的模式識別問題,因為所有模式識別存在的問題聲紋都存在,而且聲紋識別還有一些不太好解決的物理和計算問題。
聲紋識別的唯一性很好,但實際上現有的設備和技術仍然很難做出準確分辨,特別是人的聲音還具有易變性,易受身體狀況、年齡、情緒等的影響。若在環境噪音較大和混合說話人的環境下,聲紋特征也是很難提取和建模的。 現階段,遠場聲紋識別理論并不成熟,研究進展也不大。
陳孝良認為,深度學習帶給模式識別極大的提升,甚至還有開源的相關算法,但是聲紋識別的研究進展仍然不大,這仍然受制于聲紋的采集和特征的建立。
聲紋識別提供商SpeakIn資深科學家陳東鵬博士談到,從聲紋識別這一單項技術來講,容易受到真實環境下的各種影響,包括:噪音問題、多人說話、身體狀況、情緒影響等,現在確實很棘手。包括他們在內的一些公司也在大力通過軟、硬件算法去優化這些行業通用問題,在深度學習的加持下,整個行業的進步也比以往更快。陳博士補充到,聲紋識別只是一個環節,效果判斷還需看產品本身和使用場景等因素。
在產品層面,剛剛發布“小雅”智能音箱的喜馬拉雅表達了他們的看法。喜馬拉雅副總裁李海波表示,對于聲紋識別的應用,公司內部也攻關了很久,但無法做到完全準確,目前還只是實驗階段,效果一般。
在談及阿里天貓精靈時,他講到,遠場語音識別通常在三米到五米內有效,降噪是在70dB左右,環境噪音和音響聲音大于這個標準就很難喚醒。而遠場聲紋識別在同等距離下就更加不穩定,目前客廳、電視機、廚房、床頭是智能音箱的四個常用場景,而除了床頭外,其他三個常用場景實際距離通常情況均超過三米,所以阿里音箱聲紋識別的具體實用性還不可得知。
至于亞馬遜Echo為何至今還沒用這個功能,李海波認為該技術還不成熟,雖然很炫但風險很大。
另外,Sensory公司的CEO Todd Mozer也認為對Echo這樣的遠場語音設備來說,識別誰在說話是很困難的。隨著信號/噪聲比例提高,設備的表現隨之變差。
“降噪和從噪聲中分離語音的處理對于用戶身份的識別有非常大的影響,目前為止,市場上還沒有產品同時處理好用戶身份識別,遠場語音和噪聲處理。”Mozer說道。
再從遠場聲紋識別的實際應用情況來看,中科院自動化所、極限元資深智能語音算法專家劉斌向雷鋒網談到了他的看法。劉博士表示,遠場語音識別受到噪聲、回聲、混響的干擾,無論是語音識別還是聲紋識別都很具有挑戰性。
目前遠場語音識別可靠的識別距離大約是3-5米;對于聲紋識別還要更難一些。因為語音識別的目的是理解語音信號中的言語內容,言語內容信息跟共振峰高度相關,共振峰主要集中在低頻帶,語音信號低頻帶能量較高,受外部干擾相對較小,而說話人相關特征更多集中在高頻帶,語音高頻帶能量相對較低,更容易收到各種干擾的影響,因此遠距離聲紋識別更具挑戰。他隨即說到,因為每個人說話特征會隨著不同因素而變化,例如感冒時發音跟正常時肯定有所差異,所以近場聲紋識別還不敢保證特別成熟,遠場條件下肯定不太容易實用。總體來說,對于大多數用戶,聲紋識別應用于智能音箱并不是剛需,從技術角度分析,聲紋識別尚不成熟。
那么,相比遠場語音識別來說,更加不成熟的遠場聲紋識別技術為何會被阿里急著應用到音箱中呢?
除了用此技術滿足用戶的個性化需求尋求差異化搶占市場外,劉博士還提到,介于阿里在電商領域的一些積累和優勢,應用在電商身份認證也是阿里重點推進的方向。
阿里基于淘寶、天貓巨大的資源優勢將購物場景引入音箱中聽上去無可厚非,但從之前亞馬遜將此場景應用在Echo上來看,用戶用其購物的使用頻率并不高,使用體驗也不理想。
科大訊飛執行總裁胡郁此前接受雷鋒網采訪就說到,從整個市場來看,購物場景應用于音箱中還非常不成熟。真需求一定是用來滿足用戶剛需行為的功能,雖然Echo現在賣的很好,但調查后發現,用戶真正用得比較多的工具不過是設個提醒、查個天氣等等。之前亞馬遜大力推的Echo語音購物功能并沒有做起來,當用戶用語音交互的形式去買東西時,會發現里面各個環節和場景挺麻煩,還不如直接在屏幕操作來的方便。
所以這也是很多企業一直在強調語音交互要和視覺呈現的原因,因為用戶在面對沒有視覺呈現的情況下,你獲得的信息不夠,這時候很難完成一些復雜的操作。所以有些功能和場景都是我們自己憑空想出來的,直到真正投入實際使用時卻發現用戶的思維與行為習慣并不是產品設計的那樣。
這里可以看出,如果用戶連使用電商功能的習慣都尚未養成,且聲紋技術問題重重,那么在電商中加入聲紋識別的訴求,目測也很難以經得住市場考驗。
總體來看,阿里此次在智能音箱中加入聲紋識別的出發點很好:大打Echo和京東叮咚都沒有的功能營銷牌,在同質化產品浪潮中,用前沿技術來提升競爭力。
但在整個技術和市場尚未成熟之際,阿里在音箱中嫁接聲紋識別,這步棋怕是走早了一步。
智能電視/盒子資訊歡迎關注智能電視資訊網news.znds.com,以及ZNDS君的微信公眾號zndscom,官方微博智能電視網,歡迎投(sao)喂(rao)。
(責任編輯:焦點)
推薦文章
-
3D動作游戲《DISORDER》上線Steam預計第四季度正式發售
3D動作游戲《DISORDER》上線Steam預計第四季度正式發售2024-07-31 09:44:58編輯:柒柒 《DI
...[詳細]
-
6月8日動靜,蘋果正在齊球開辟者大年夜會(WWDC)上公布了最新的真擬真際頭隱Vision Pro,其3499好圓約開人仄易遠幣24800元)的賣價也激收熱議。很多網友吐槽Vision Pro訂價太下
...[詳細]
-
《自然》雜志:全球約有五分之一的珊瑚礁中的鯊魚已經“功能性滅絕”
《自然》雜志:全球約有五分之一的珊瑚礁中的鯊魚已經“功能性滅絕”神秘的地球uux.cn報道)據cnBeta:根據周三發表在《自然》雜志上的一項研究,目前全球約有五分之一的珊瑚礁中的鯊魚幾乎滅絕。全球F
...[詳細]
-
比去正在日本雇用網站Adecco Group上,呈現了一份日本嵌進式體系開辟職員的雇用告白,他們正正在雇用一名初級工程師,以支撐一家位于京皆的“聞名游戲公司”完成“次世代游戲機”的開辟工做,而任天國是
...[詳細]
-
《真三國無雙8》Steam版昨天正式上架售賣了,但是目前還不支持中文版,游戲的售價是349元,看不懂英文的玩家還會花這個錢來買游戲嗎,《真三國無雙7》就是在上架3年后才出的中文版,不知道這次又要等多久
...[詳細]
-
股份有限公司SNK頒布收表,PlayStation?4/Xbox One/Nintendo Switch仄臺劍戟對戰搏斗游戲《侍魂 曉》英文名:SAMURAI SHODOWN)的DLC遁減角色王虎將于
...[詳細]
-
Neowiz插足2023夏季游戲節,《匹諾曹的謊話》demo上線開啟預賣
著名電玩活動策劃掌管人喬婦?基斯利(Geoff Keighley)主理的電玩游戲慶典「夏季游戲節(Summer Game Fest,SGF)」正在來日誥日凌晨4時(本天時候6月8日下午12時)定時停止
...[詳細]
-
開適耐暫玩的戚閑足游是很多的玩家很喜好的游戲的范例之一,正在開適耐暫玩的戚閑足游中玩家能夠體會到分歧的興趣,上里小編便去先容幾款好玩的開適耐暫玩的戚閑足游,感興趣的小水陪一起去看看吧。1.人類跌降烏苦
...[詳細]
-
這天一大早,大灰狼(wolf)就跑到小豬(porket)家的門口草叢里躲了起來。眼看著小豬要出門了,就偷偷的溜進了小豬的木屋,它心里想:哼,小豬仔,我就待在你家等你返來,你一進門,我二話不說就撲上去狠
...[詳細]
-
股份有限公司SNK頒布收表,PlayStation?4/Xbox One/Nintendo SwitchTM仄臺刀劍對戰搏斗游戲《侍魂 曉》英文稱吸:SAMURAI SHODOWN)季票2中DLC角色
...[詳細]
熱點閱讀
- 上海美女兼職外圍上門外圍女(微信189-4469-7302)一二線城市預約、空姐、模特、留學生、熟女、白領、老師、優質資源
- 三亞外圍上門(三亞外圍預約)電話微信189-4469-7302提供高端外圍上門真實靠譜快速安排不收定金見人滿意付款
- 無錫外圍(外圍預約)外圍女價格(微信189-4469-7302)提供一二線城市真實上門外圍上門外圍女,快速安排90分鐘到達
- 福州外圍(外圍美女)外圍聯系方式(微信189-4469-7302)高端外圍預約快速安排90分鐘到達
- 沈陽外圍(外圍預約)外圍女聯系方式(電話微信189-4469-7302)一二線熱門城市上門
- 石家莊外圍(外圍預約)外圍女價格(微信189-4469-7302)提供一二線城市真實上門外圍上門外圍女,快速安排90分鐘到達
- 杭州外圍(杭州外圍女)外圍上門(電話微信189-4469-7302)一二線城市外圍預約、空姐、模特、留學生、熟女、白領、老師、優質資源
- 蘇州外圍女那個靠譜(微信189-4469-7302)蘇州外圍真實可靠快速安排
- 天津外圍(外圍聯系方式)(電話微信189-4469-7302)全國1-2線熱門城市高端外圍預約快速安排90分鐘到達
- 廣州美女兼職外圍上門外圍女(電話微信189-4469-7302)一二線城市預約、空姐、模特、留學生、熟女、白領、老師、優質資源

哪些食物可以引發過敏性休克?花生、巧克力、蝦、魚蛋白、牛奶蛋白和日用化學品
年齡較長者感染SARS
喜迎便宜版 《逝世化危急2:RE》免費DEMO再上線
日本手游周收入排行榜:米哈游新作《絕區零》登頂
