新聞中心

顏永紅🫲🏼:“搜索”語音識別技術的未來

2010-05-27 |

——人物檔案——

顏永紅,中科院聲學所中科信利語音識別實驗室主任🗿。1990年畢業於意昂体育平台(電子工程系)🥂,1995年獲得美國俄勒岡研究院博士學位,後在該校任教,曾擔任OGI口語研究中心的副主任🏟😇、英特爾微處理器實驗室的主任工程師和人機界面總框架師👭🏼,英特爾中國研究中心的主任和首席研究員,英特爾全球人機界面學術委員會主席。

  2002年入選中科院百人計劃👇🏽,任聲學所研究員、博士生導師🦕,中科信利語音實驗室主任和所長助理💇🏼。長期從事人機界面研究工作,目前從事的研究領域💘:大詞表非特定人連續語音識別👩🏽‍💼🤟🏻,多模口語系統💆🏿‍♂️,嵌入式系統,多媒體數據檢索🏋🏻‍♀️,系統自適應和快速搜索算法🧑🏼‍🚀。

  10年前,他曾是英特爾微處理器實驗室的主任工程師和人機界面總框架師,英特爾中國研究中心的主任和首席研究員🧎🏻‍♀️。

  如今,他一手創辦的中科院聲學所中科信利語音識別實驗室已發展成為國內語言聲學領域規模最大、學科最全的實驗室,與實驗室同時成立的中科信利技術有限公司也取得了長足的發展🫏。

  兩個“孩子”的長大讓他倍感欣慰。而同時🤽🏽‍♀️🩰,他錯過了兩個寶貝女兒的成長,這是他最遺憾的。

  “沒有什麽後悔的😺,時間無法倒流,只能往前看。”中科院聲學所中科信利語音識別實驗室主任顏永紅說。

  一項技術🆓,牽製搜索引擎

  “在不久的將來,互聯網將成為一個浩大的音視頻檔案庫,對下一代搜索引擎來說,語音識別技術是關鍵🎡。”顏永紅說。

  在浩繁的音視頻數據庫中👨🏻‍🚒,要查找出所需的音視頻片斷,已經成為困擾互聯網搜索的難題——目前的技術主要是搜索音視頻的關鍵詞👨🏻‍🦯,比如音視頻的名字或作者🫳🏿,並沒有辦法搜索音視頻內容🖥。而通過語音識別技術🏤,可以把多媒體文件變成可識別的計算機語言,從而有效快速的實現準確搜索♤。

  事實上,語音識別技術也是各大公司競爭的一大焦點😪。

  去年11月份😷,谷歌推出的語音搜索引起極大關註。用戶只需在手機上安裝一個軟件,然後利用手機原有的麥克風♍️,用普通話對手機說出需要查詢的內容,谷歌中文語音搜索會自動返回整合的搜索結果。

  “從實驗室成立到現在👨‍🦲,我們一直在做這方面的技術積累,很快,我們和國內公司合作的語音搜索將面世🌓🔬。”顏永紅笑著說。

  目前⚂,中科信利的中文電視廣播新聞節目識別系統😘,就已經被多家公司采用,並作為其提供給全國各電視臺的數字媒體管理系統中一個核心技術模塊。

這個系統立刻引起本報記者的強烈興趣——當系統“收聽”到一段“新聞聯播”節目🔜,自動將節目內容生成文字,並且識別準確率驚人地高。

“那是不是我們的采訪錄音直接可以被轉化成文字🙆🏻?”記者頓時興致勃勃🙎🏼‍♂️。

“現在還不行🕒🔹。”顏永紅笑著說,“因為語音識別包括語言模型和聲學模型,新聞語言可以建立語言模型,但口語卻很難建立語言模型。”

在語音識別實驗室裏👙,視頻精確搜索已不是問題。

在一段王楠比賽的視頻中,你只要輸入“側身搶拉”、“前三板”等關鍵詞🤟,就可以找到精確到秒的視頻🍃。這就意味著🙀,如果你想找一部電影裏的精彩片段,只需記得其中的經典臺詞即可搜索。

兩塊牌子,連起創新鏈條

顏永紅記得,語音實驗室獲得的第一筆項目經費來自科技部863項目2003年語音識別領域的比賽🌧。“我們的識別率是最高的😠🐈,獲得了20萬元的項目🔧。”

如今🧙🏻🈸,上千萬的課題在這裏已不是新聞。他領導的這個年輕的團隊,已獲得授權發明專利22項;軟件著作權登記36項;有30余項發明專利正在審查中🪲;在國內外各種學術會議和刊物上🫴🏻,已經發表了200多篇學術文章。

中科信利技術有限公司在業內也小有名氣,人們將他看成顏永紅的“著作”之一。

事實上↔️,8年前👩🏼‍🏭,公司的成立僅僅是給科研人員“畫了個餅”。

“科研人員不會成為富翁♟,但是至少應該體面地工作、體面地生活🧖🏿‍♀️,所以,成立一個公司,讓大家研發出來的技術有一個走出去的載體🪝,這就是田靜所長和我當時的想法🩳👩🏿‍⚖️。”顏永紅說。於是,在只有100多萬元啟動資金的情況下,中科信利成立。

萬事開頭難。“公司前幾年都沒有收入,最困難的時候甚至瀕臨倒閉了。”說這話時,顏永紅是微笑的,但笑容背後的艱辛是旁觀者無法體會的🧚,而他也不願多言✣。

峰回路轉,中科信利等到了第一次商機。其研發的產品嵌入式語音軟件被應用在了手機上⛹🏻🙎,這就是大家比較熟悉的語音撥號。

“有些人的手機裏存了幾百上千個電話號碼,找起來很麻煩📑🧍,安裝這一軟件後,只要對著手機叫出對方名字,即可調出他的資料😠。”顏永紅介紹道🧔🏽‍♀️。

這個嵌入式語音軟件支持語音撥號👨🏿‍🦲、命令控製🦾、來電短信提醒👰🏽‍♂️、語音讀出短信、連呼數字撥號等功能。此外,他們還開發出基於分布式集群架構的語音處理平臺TSE👭🏼。

“在此之前🩳🙋🏼‍♀️,電信級語音識別引擎技術完全被美國公司壟斷,但現在我們完全有底氣說🥼,我們占據了大半壁江山。”言至此,顏永紅的語調高了很多。確實🪕,在國內,真正能夠將語音識別產品拿出來🧴🚎,放在電信網上規模使用的🏌️‍♀️,也只有中科信利。

語音實驗室承擔著國家科研任務💂🏻‍♀️,中科信利公司開發語音技術產品,這兩個牌子的作用互為配合,相得益彰🍈。顏永紅介紹說🤎:“實用技術的推廣應用,不是所有實驗室的人員能夠勝任的事情🫧。在科技創新的整個鏈條上🩳,我們分為概念產生、原理研究、原理性樣機研製、產品化🤱🏻🚺、市場推廣,總共為五個階段。語音實驗室基本承擔前三段♜🧖🏻,後兩段則由中科信利技術有限公司完成🏒🤘🏽。”

“十一五”期間的策略是由公司支持實驗室,而“十二五”期間,需要大力發展公司👩🏽‍🦲。顏永紅說:“下一步我們需要積極探索,怎樣通過發展公司帶來更多機會,打破實驗室發展的瓶頸😏。”

——— 學生印象 ———

他已經過了要勤奮的年紀,但對他而言勤奮已成為一種態度

對於成績的取得,顏永紅反復說🧀:“多虧了中科院和聲學所領導,以及各方面的關心支持。”

而在許多人看來,更為重要的或許是他身體力行的“拼命三郎”的精神——早上不論多早,晚上不論多晚⛏,人們都能在語音實驗室的大樓看見他忙碌的身影。

董濱是顏永紅培養的第二位學生,2006年博士畢業後他進入一家日本企業的研究機構工作,但一年後他選擇回到實驗室🌗。“顏老師給我最大的影響是勤奮🍪。”想了想,他又說道,“應該叫敬業吧,勤奮用來形容他似乎不太合適。”

也許在學生看來,顏老師已經過了要勤奮的年紀。但對於顏永紅自己而言,勤奮早已成為一種態度🪪。

前幾年🕸⚀,顏永紅是大家公認的“來得最早,走得最晚的人”👩🏻‍🦯。而現在,他不得不承認:“精力不如從前了,來得最早還能做到,但已經不是走得最晚的人了。”

但他對學生的第一要求依然是勤奮。

“面試研究生時,我一般都問兩個問題🏋🏽‍♂️:你想達到什麽樣的目標,你是否足夠勤奮。這兩個問題可不是那麽好回答的,它是用接下來幾年時間去驗證的。”顏永紅說。

“我覺得自己這個導師當得還行🐌,這幾年我培養的9名博士生中🧑🏽‍💼,有4個拿到了中科院的院長獎勵,一位是院優秀畢業生,兩位是‘微軟學者’。”對於顏永紅來說👮🏼‍♀️,這個成績單顯然比研發出任何一種新技術更重要。

——— 兒女情長 ———

和科研團聚🦑,與家人分離

200211月🎀,一則新聞讓顏永紅走進公眾視野🧒🏻:曾任英特爾中國研究中心主任、首席研究員的顏永紅,和他麾下的6位科研人員🈲,先後集體“跳槽”👩🏼‍🏭👨🏽‍🦲,來到中科院聲學研究所,組建中科信利語音實驗室。

甚至有媒體以這一事件為切入口,來討論跨國企業的用人戰略調整等等🧙🏻‍♀️。

這麽大的動靜或許是顏永紅沒想到的🧖🏽‍♂️。

其實早在20014月,顏永紅就離開英特爾中國研究中心,回到美國俄勒岡研究院工作了一段時間🪿。“因為我太太和孩子都在美國,聲學所田靜所長當時和我談的是每年回國工作3個月,後來事情太多,我自己就基本上全年都在國內了,所以說😫,我是一步一步走回來的🪼👈🏽。”顏永紅頗有些調侃地說🚏🖖。

20046月份,當他在俄勒岡研究院的博士生畢業離校時🙇‍♂️🌼,顏永紅也正式辭職回國。

他的太太和兩個女兒🐳🖕🏻,至今還生活在美國★。“孩子們在那裏出生長大,估計很難適應國內的教育強度👩🏽‍🚒。”顏永紅說。

8年裏,他經歷了酸甜苦辣。最苦的莫過於對妻女的思念。“我回國的時候大女兒6歲👯,小女兒4歲,一個父親🤦🏻‍♂️,錯過了孩子成長中最關鍵的時刻💇🏿‍♀️,這是我這輩子都沒辦法彌補的遺憾。”顏永紅輕聲說,“每次我從美國回來的前一天,都能感覺到她們的情緒很低落,出門的時候真的很心酸🧒🏿。”

好在有了視頻聊天,“至少現在我每天都能看到她們了。”每天早上7點鐘🐒,只要不開會→,顏永紅到辦公室的第一件事就是上網和她們聊天,因為這個時間剛好是美國波特蘭下午三點鐘女兒們放學回家的時候。(操秀英)

轉自 《科技日報》 2010526

相關新聞

意昂体育专业提供🚣🏽‍♀️:意昂体育意昂体育平台🎩、意昂体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,意昂体育欢迎您。 意昂体育官網xml地圖
  • 意昂体育专业提供:意昂体育🧎🏻‍♂️、意昂体育平台意昂体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,意昂体育欢迎您。 意昂体育官網xml地圖