近日訊飛輸入法新版上線,科大訊飛正式推出一套離線輸入方式,包括完全離線的拼音、語音及手寫輸入,以更好的保護用戶數(shù)據(jù)安全。
據(jù)《信息安全技術(shù)移動互聯(lián)網(wǎng)應(yīng)用(App)收集個人信息基本規(guī)范》規(guī)定,輸入法類應(yīng)用程序為用戶提供鍵盤、手寫、語音等方式輸入字符功能的服務(wù),該服務(wù)類型必須遵循知情同意和最小必要原則,明確無需個人信息即可使用基本服務(wù)功能。
其他類型的互聯(lián)網(wǎng)App也需如此。近日,國家對互聯(lián)網(wǎng)平臺違規(guī)收集用戶個人信息的行為監(jiān)管日趨激烈嚴格,已有多家互聯(lián)網(wǎng)企業(yè)下架接受網(wǎng)絡(luò)安全審查。未來,把個人數(shù)據(jù)的控制權(quán)交給用戶,將會成為互聯(lián)網(wǎng)App的主流趨勢。
拼音輸入、手寫、語音識別均可“離線化”
據(jù)悉,在新版訊飛輸入法內(nèi),手寫和拼音輸入都可以實現(xiàn)“離線化”,用戶打字數(shù)據(jù)不會被傳到互聯(lián)網(wǎng)上。同時,該版本也會將AI能力“離線化”,既保證智能化體驗,又可解決用戶數(shù)據(jù)安全問題。
如離線語音輸入方面,新版訊飛輸入法升級了AI語音識別模型,在不聯(lián)網(wǎng)的環(huán)境下,無云端數(shù)據(jù)傳輸,通過手機本地解碼就能為用戶提供轉(zhuǎn)文字服務(wù),可以滿足在任何場景下進行語音輸入的需求。用戶也可以通過設(shè)置自主選擇啟用或停用離線語音輸入。
后續(xù),訊飛輸入法將對OCR識別、智能翻譯等更多AI功能進行廣泛的“本地化”。
值得一提的是,訊飛輸入法新版還推出“基礎(chǔ)輸入”模式,該模式下不上傳任何數(shù)據(jù)也能順暢輸入,同時用戶可以使用皮膚、表情等功能,盡可能保障輸入體驗。如果想獲得更多元的輸入體驗,享受更智能化的服務(wù),用戶可以通過【全部設(shè)置】-【隱私設(shè)置】-【使用方式】-開啟完整體驗。對于“完整體驗”的設(shè)計,訊飛輸入法也會進行嚴格把關(guān),清晰列出系統(tǒng)權(quán)限使用說明。
能力行業(yè)領(lǐng)先
在AI能力方面,訊飛輸入法一直走在行業(yè)前列。
訊飛輸入法AI功能包括智能語音輸入、智能OCR識別、智能翻譯等多個方面。
智能語音輸入即識別用戶語音自動輸入文字。目前,訊飛輸入法語音輸入可實現(xiàn)1分鐘打400字。
為提高識別準確率,科大訊飛持續(xù)深耕語音識別領(lǐng)域,令通用語音識別率在98%基礎(chǔ)上再獲重大突破。
在扎實技術(shù)的支持下,訊飛輸入法還支持粵語、四川話、東北話、閩南語等23種方案識別,以及英、日、韓、俄等多國語言輸入。
除提高正常語音情況下的識別率外,通過搭載耳語識別等技術(shù),訊飛輸入法在輕聲說話、噪聲等復雜環(huán)境中也能保持超高識別率。
此外,訊飛語音輸入還可在PC端操作,支持23種方言、3種民族語言以及4種外語,同時支持跨屏操作:手機充當電腦麥克風,使用手機語音輸入時,電腦屏幕上能快速打字。
在手寫識別方面,訊飛輸入法基于空間注意力機制的端到端思想獨家打造出OCR識別引擎,支持兩萬多類中文字符、52類英文字符、10類阿拉伯數(shù)字以及100多種特殊符號,行書、草書、生僻字、數(shù)字符號等都能識別并轉(zhuǎn)成電子文檔。
此外,訊飛輸入法還拓展了機器視覺技術(shù),在傳統(tǒng)OCR文字識別基礎(chǔ)上新增拍照翻譯、手寫公示識別等功能,甚至能夠?qū)?shù)學運算進行智能批改。
在翻譯方面,據(jù)了解,憑借自研核心的翻譯技術(shù)以及對大數(shù)據(jù)的深度挖掘,訊飛輸入法的隨聲譯能夠支持日語、韓語、西班牙語、泰語越南語、德語、法語、俄語等多國主流語言與中文的即時互譯。
技術(shù)的發(fā)展也是為服務(wù)更多的人群,在這些AI技術(shù)的支持下,訊飛輸入法成為了國內(nèi)最早適配無障礙功能的App之一,依托無障礙語音輸入、表情輸入等功能,為視障人群鋪設(shè)了通向互聯(lián)網(wǎng)世界的“盲道”。
以訊飛輸入法在無障礙模式上做了諸多適配。拿安卓用戶舉例,用戶進入安卓系統(tǒng)【設(shè)置】-【無障礙】-【屏幕閱讀器】使用TalkBack服務(wù),訊飛輸入法就會提供語音反饋。
在語音指示下開啟無障礙模式后,訊飛輸入法的輸入面板、菜單面板以及表情面板的屏幕即可隨選朗讀,即便視力不便情況也能打字,待語音輸入完成后輸入法會自動朗讀,用戶便可得知輸入結(jié)果是否準確,并且進行修改。
此外,無障礙模式下,用戶打開文字掃描功能,對著圖片或者文本拍照,瞬間文字就能提取出來,識別的文字通過語音播報讓視障人群知道。值得一提的是,訊飛輸入法也是中國盲人協(xié)會認證的首個輸入法產(chǎn)品,獲得了中國盲人協(xié)會頒發(fā)的無障礙認證證書。
11年征程,“用人工智能建設(shè)美好世界”
從2010年成立至今,訊飛輸入法已經(jīng)走過了11年的歷程。
2010年10月28日,全球首款基于云計算實現(xiàn)的語音輸入法--訊飛輸入法正式發(fā)布;同年,訊飛AI研究院就將GMM-hmm-隱馬爾可夫模型應(yīng)用到語音識別系統(tǒng)中,通過運用WFST解碼器,提高復雜的語言模型,達到了70%識別率。
2012年,訊飛又在輸入法中使用了深度神經(jīng)網(wǎng)絡(luò)技術(shù),把全球首個中文云識別的DNA上線到產(chǎn)品中,使得語音識別率一下子提升了到80%。2018年 ,訊飛又開始使用HybridCNN 算法,通過結(jié)構(gòu)優(yōu)化大幅提升并發(fā)路數(shù),語音識別準確率突破98%。
2020年,訊飛又在產(chǎn)品中加入了動態(tài)自適應(yīng)編解碼語音識別引擎 ,進一步實現(xiàn)了多模態(tài)輸入和領(lǐng)域個性化識別。
疫情期間,訊飛輸入法在10天內(nèi)上線了武漢話轉(zhuǎn)普通話功能,開放給馳援武漢的醫(yī)生、護士,助力醫(yī)患團隊溝通,累計服務(wù)了3萬人。
除方言外,訊飛輸入法還在持續(xù)發(fā)展“個性化語音”功能,2012年便在行業(yè)內(nèi)首創(chuàng)了個性化語音識別,允許用戶將本地的人名,自己定義的專業(yè)詞匯,特有詞語,上傳到云端進行機器學習。用戶下次說到這些詞語時,訊飛輸入法就可以把相應(yīng)的詞語識別出來。
如今,在5G和Alot的技術(shù)大背景下,訊飛輸入法也在不斷進步以適應(yīng)人機交互和萬物互聯(lián)的世界。訊飛輸入法此前推出10.0版本上,就搭載了“動態(tài)自適應(yīng)編解碼語音識別引擎”,新增的唇形輔助輸入,能夠提高嘈雜環(huán)境及近距離多人說話的識別效果。
該版本還優(yōu)化了領(lǐng)域詞識別,可更精準的匹配游戲、醫(yī)療、旅游、購物等不同的場景詞匯。除了語音功能邊界的拓展,訊飛輸入法10.0版本還基于“免切換”的理念,實現(xiàn)英文單詞連續(xù)手寫,即在輸入面板既可以手寫漢字也可以直接手寫完整的英文單詞。
而此次完全離線版本的出現(xiàn),說明訊飛輸入法在發(fā)展技術(shù)的同時也在注重保護用戶的數(shù)據(jù)和隱私安全,真正切切為用戶考慮更多。
- QQ:61149512