AI“讀唇術”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內容。近日,不同于運用機器視覺技術識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內容。近日,不同于運用機器視覺技術識別說話人的唇部動作的的技術,一種僅靠檢測喉嚨運動的“讀唇術”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學和索尼計算機科學研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內容。

AI系統(tǒng)“Derma”應用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學習,通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
創(chuàng)維百吋電視銷量中國第一,強勢領跑
2
消滅藥丸屏!蘋果屏下Face ID專利曝光
3
追覓、石頭掃機器加裝機械臂,國產(chǎn)清潔電器越來越像“機器人”了
4
力推全棧聯(lián)動式大規(guī)模創(chuàng)新,亞馬遜云科技加速生成式AI價值釋放
5
達人探訪海信研發(fā)中心,親身體驗“開機3分鐘,滿屋是新風”
6
業(yè)界唯一!科大訊飛發(fā)布首個基于全國產(chǎn)算力的深度推理大模型X1
7
斥資134億收購LGD工廠,TCL科技押注LCD市場勝算幾何?
8
12月中國電視整機出貨量378.5萬臺,同比增長9.7%
9
京東方拿下美國專利榜全球第12!顯示領域唯一中企
10
今起買電動自行車有重大變化:出廠鎖死25km/h 無法改裝
11
BBA全球銷量下滑:奧迪跌幅最大 唏噓
12
蘋果想做但沒做出來!OPPO Watch X2全球首發(fā)高血壓風險評估功能
13
CES觀察:空調新年出海第一站,“中國風”如何席卷全球?
14
我國新能源汽車產(chǎn)銷連續(xù)十年位居全球第一
15
英偉達:拜登政府監(jiān)管政策將削弱美國的全球競爭力
16
中國電信完成業(yè)界首個無線AI新型調度技術現(xiàn)網(wǎng)試驗
17
2025剛開年 家電行業(yè)產(chǎn)能再擴張
18
電視開機率斷崖式下跌,是什么讓人們不在看電視呢?
19
OPPO Find N5居然比鉛筆都要薄,“全球最薄折疊旗艦”官宣二月見!
20
消息稱藍廠大折疊手機vivo X Fold 4 Pro延期至Q3發(fā)布
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512