背后的黑色技術(shù)
你可以用一只嘴在手機(jī)上遠(yuǎn)距離打字,通過拍照,你的照片上各種潦草的手寫文字可以立即變成可編輯的文檔,你還可以輸入來自世界各地的外語,并在幾秒鐘內(nèi)將其翻譯成中文.這些場景,曾經(jīng)只能在復(fù)雜設(shè)備的幫助下才能實(shí)現(xiàn),現(xiàn)在可以通過手機(jī)中的小訊飛輸入法來實(shí)現(xiàn)。接下來,邊肖將向大家展示我們不知道的訊飛輸入法背后的強(qiáng)大功能,揭開訊飛輸入法背后的人工智能技術(shù)的真相,了解擅長語音識別技術(shù)的訊飛,以及如何將流行的云計算和人工智能技術(shù)應(yīng)用到手機(jī)輸入法中,使上述科幻電影場景成為可能,成為人工智能登陸的典型例子?!耙环昼?00字”,在手機(jī)上打字應(yīng)該“快速、簡單、經(jīng)濟(jì)”。研究表明,80%的人類輸入信息來自眼睛,因此許多人認(rèn)為機(jī)器人視覺非常重要。然而,還有一個數(shù)字你可能沒有注意到,那就是90%的人類輸出信息來自嘴。十年前,訊飛輸入法利用訊飛在語音識別方面的技術(shù)優(yōu)勢,率先將中文語音輸入引入行業(yè),顛覆了人們現(xiàn)有的“打字”認(rèn)知。經(jīng)過十幾年的發(fā)展,訊飛輸入法已經(jīng)在一分鐘內(nèi)輕松實(shí)現(xiàn)了400字語音輸入,準(zhǔn)確率達(dá)到98%以上。即使你輕聲細(xì)語,你也能準(zhǔn)確地認(rèn)出它。噪聲等許多不確定和復(fù)雜的場景仍能保持較高的識別率,這大大擴(kuò)展了語音輸入的范圍。此外,訊飛輸入法洞察用戶需求,率先引入方言語音輸入,支持粵語、四川話、東北話、閩南話等23種方言,能夠快速輸入最熟悉的家鄉(xiāng)話,惠及更多的區(qū)域用戶。語音輸入從0到1的突破,離不開智能語音技術(shù)的長期積累和研發(fā)。訊飛輸入法的人工智能語音輸入承載了HKUST訊飛強(qiáng)大的語音識別框架,提高了在線語音識別的準(zhǔn)確性,并借助20多萬小時的訓(xùn)練數(shù)據(jù),使機(jī)器能夠聽懂人們在說什么,從而將手機(jī)的輸入效率提升到一個新的水平。2020年5月,在國際權(quán)威英語語音識別大賽“磬-6”中,HKUST iFlytek和中國科技大學(xué)語音與語言信息處理國家工程實(shí)驗(yàn)室獲得冠軍,大大刷新了本次大賽歷史上的最佳紀(jì)錄。十多種外語和中文可以實(shí)時互譯,小輸入法也可以在幾秒鐘內(nèi)改變。自“譯者”成立20年以來,HKUST訊飛不僅實(shí)現(xiàn)了“讓漢語語音技術(shù)成為世界上最好的”的小目標(biāo),甚至實(shí)現(xiàn)了英語