快手技術(shù)副總裁王仲遠(yuǎn):快手以AI技術(shù)推動(dòng)音樂大眾化發(fā)展
6月6日,2021全球人工智能技術(shù)大會“發(fā)展與挑戰(zhàn)”專題論壇在杭州舉行??焓旨夹g(shù)副總裁、MMUY-tech負(fù)責(zé)人王仲遠(yuǎn)出席論壇并發(fā)表《音樂與技術(shù)的碰撞交融——藝術(shù)如何隨時(shí)代變遷》主題演講,分享快手在AI音樂方面的動(dòng)態(tài)與進(jìn)展,充分展現(xiàn)快手領(lǐng)先的人工智能技術(shù),以及AI音樂為短視頻帶來的強(qiáng)大助力。AI技術(shù)+音樂深度融合,快手持續(xù)提升短視頻觀看體驗(yàn)作為國民短視頻APP,快手擁有海量內(nèi)容、超大流量和高用戶粘
2021-06-09 16:39:38
來源:釘科技??

6月6日,2021全球人工智能技術(shù)大會“發(fā)展與挑戰(zhàn)”專題論壇在杭州舉行??焓旨夹g(shù)副總裁、MMU&Y-tech負(fù)責(zé)人王仲遠(yuǎn)出席論壇并發(fā)表《音樂與技術(shù)的碰撞交融——藝術(shù)如何隨時(shí)代變遷》主題演講,分享快手在AI音樂方面的動(dòng)態(tài)與進(jìn)展,充分展現(xiàn)快手領(lǐng)先的人工智能技術(shù),以及AI音樂為短視頻帶來的強(qiáng)大助力。

image.png

AI技術(shù)+音樂深度融合,快手持續(xù)提升短視頻觀看體驗(yàn)

作為國民短視頻APP,快手擁有海量內(nèi)容、超大流量和高用戶粘性。數(shù)據(jù)顯示,平均每月快手用戶上傳的短視頻數(shù)量超11億,整體日活達(dá)3.7億+,用戶平均每日在快手平臺觀看短視頻和直播內(nèi)容的時(shí)長近100分鐘。

在豐富的快手社區(qū)生態(tài)中,音樂成為激勵(lì)用戶創(chuàng)作的因素之一。在快手,76%的快手作品有配樂,90%的快手用戶期望大部分短視頻有配樂。

為何用戶在創(chuàng)作短視頻時(shí),對于音樂有如此強(qiáng)的依賴性?王仲遠(yuǎn)表示:“對于短視頻的制作體驗(yàn)而言,音樂的正向影響至關(guān)重要。比如唯美風(fēng)短視頻如果去掉背景音樂只剩原始聲音,就會削弱其氛圍感,給用戶留下與之前截然不同的印象?!?/span>

image.png

對此,王仲遠(yuǎn)進(jìn)一步分析了音樂的獨(dú)特魅力。在他看來,音樂可以與人的思想情緒聯(lián)系在一起,能夠讓人感到歡喜,感到悲傷,感到期待等。當(dāng)中國人聽到春節(jié)序曲時(shí),往往會產(chǎn)生一種春回大地、萬物復(fù)蘇的感受,央視春晚主持人的開場詞也不自覺在腦海中浮現(xiàn)。

作為一種具有魔力的藝術(shù)表現(xiàn)形式,音樂也隨著技術(shù)的發(fā)展而產(chǎn)生新的形式。在工業(yè)化時(shí)代,制造工藝的改進(jìn)使得樂器可以發(fā)出的聲音更加豐富、層次化。在電子化時(shí)代,電子技術(shù)的發(fā)展創(chuàng)造出自然界機(jī)械無法發(fā)出的聲音,音樂的表現(xiàn)力更加多元化。

如今,步入人工智能時(shí)代,AI技術(shù)則幫助音樂實(shí)現(xiàn)全面的個(gè)性化和智能化,為音樂和短視頻帶來了新的發(fā)展空間。據(jù)王仲遠(yuǎn)介紹,前段時(shí)間火爆全網(wǎng)的《螞蟻呀嘿》正是將音樂和視覺AI技術(shù)進(jìn)行了創(chuàng)意融合,用戶只需要一張照片就可以自動(dòng)生成詼諧好玩的動(dòng)態(tài)唱歌視頻,再加上魔性的BGM,很快成為短視頻用戶爭相創(chuàng)作的模板。

AI技術(shù)推動(dòng)音樂大眾化,快手自建模型還原專業(yè)級演唱

在技術(shù)的加持下,音樂制作進(jìn)入大眾化時(shí)代。如何幫助更多用戶創(chuàng)作出個(gè)性化的音樂?快手自主研究了AI音樂創(chuàng)作模型和AI歌手。

從音樂制作流程上來看,大多偏向于流水線化、工程化和模塊化,首先是把握創(chuàng)作動(dòng)機(jī),然后進(jìn)行作詞、作曲,之后進(jìn)行編曲,最后錄音和混音。而通過快手搭建的AI模型,其中的每一步都可以借助AI完成。

王仲遠(yuǎn)表示:“在AI時(shí)代,動(dòng)機(jī)變得十分簡單。把隨機(jī)關(guān)鍵詞輸入快手AI音樂模型中,模型就能把詞轉(zhuǎn)換成動(dòng)機(jī)的一種表示,乃至于各種初始化的音樂。”

image.png

確定好動(dòng)機(jī)之后就可以利用快手AI模塊生成歌詞。在AI歌詞方面,快手針對數(shù)百萬已有歌曲對模型進(jìn)行重新訓(xùn)練,以確保AI可以很好地理解詞義,讓用戶只需輸入一個(gè)主題、一個(gè)情感、一個(gè)風(fēng)格,就能在數(shù)秒內(nèi)生成數(shù)十首歌詞。

在AI旋律的創(chuàng)作上,快手也采用類似方法,搭建了數(shù)十萬首曲譜和百萬首歌曲音頻訓(xùn)練模型再通過迷你數(shù)據(jù)庫讓模型自監(jiān)督學(xué)習(xí)歌曲的內(nèi)在關(guān)聯(lián),從而訓(xùn)練AI旋律生成的能力。

image.png

據(jù)了解,快手邀請了平臺內(nèi)的音樂人使用AI模型來創(chuàng)作新歌曲,已創(chuàng)作的流行音樂有《甜甜的味道》《夜》《勇往直前》等。

錄制一首高質(zhì)量的成品歌曲,對歌手的演唱水平要求極高。為了解決部分用戶面臨的唱歌跑調(diào)、音色不好聽等問題,快手則推出了AI歌手輔助創(chuàng)作功能,并不斷提升其模型的精準(zhǔn)度。

據(jù)介紹,2020年5月,AI歌手的演唱還是KTV水平;到2020年12月,普通人已經(jīng)很難發(fā)現(xiàn)AI歌手演唱中的瑕疵;如今,模型會根據(jù)曲譜自動(dòng)調(diào)整音高、節(jié)拍和歌詞,AI歌手可以逼真地還原出專業(yè)級歌手的演唱水平。

演講最后,王仲遠(yuǎn)表示:“未來,快手還將探索更多新技術(shù),豐富生成側(cè)的玩法。借助語音識別技術(shù),快手希望AI歌手將來可以模仿個(gè)人音色,AI音樂則能夠把說的話直接轉(zhuǎn)成歌曲,滿足用戶更個(gè)性化的音樂創(chuàng)作需求,持續(xù)助力短視頻領(lǐng)域創(chuàng)作?!?/span>

原創(chuàng)文章
最新文章
1
全球16連冠:海爾究竟領(lǐng)先在哪?
2
本田攜手亞馬遜云科技打造下一代軟件定義汽車,并利用生成式AI提升充電體驗(yàn)
3
引領(lǐng)聚合力 共創(chuàng)好產(chǎn)品:2024中國家電行業(yè)“好產(chǎn)品”發(fā)布盛典在北京召開
4
CES2025:中國“智”造新年秀實(shí)力第一站,長虹攜多款A(yù)I產(chǎn)品描繪生活之美
5
新年新氣象,盤點(diǎn)2025年智能電視行業(yè)發(fā)展的趨勢和方向
6
國補(bǔ)擴(kuò)圍,洗碗機(jī)、凈水器市場即將迎來爆發(fā)式增長?
7
融合科技與藝術(shù)之美,家電如何構(gòu)建幸福生活?
8
AI改為GPT-4o,999元賣爆的中國首款A(yù)I眼鏡出海了!
9
最新手機(jī)數(shù)碼類國補(bǔ)政策出爐,最高補(bǔ)貼五百元,想換機(jī)的朋友直接沖!
10
CES 2025:六大手機(jī)廠商缺席 一加和TCL成明星
11
日本芯片公司Rapidus將向博通提供2nm芯片樣品:與臺積電競爭
12
徹底告別劉海、藥丸屏!iPhone 18 Pro系列變成單挖孔
13
2024投影行業(yè)十大事件:4K+激光勢猛,LCoS挑戰(zhàn)DLP,車載成增長點(diǎn)
14
2025家電明星品類,凈水器已經(jīng)鎖定一個(gè)席位?
15
海信羅馬假日mini斬獲CES 2025創(chuàng)新獎(jiǎng),引領(lǐng)精致健康洗護(hù)潮流
16
CES觀察:科技品牌兩翼齊飛,九號公司的“智造未來”
17
極米攜全新概念產(chǎn)品XGIMI Ascend亮相CES 2025
18
CES2025:全球最大RGB-Mini LED電視亮相,海信讓液晶電視首次發(fā)出彩色光源
19
BOE(京東方)全新概念級“AI視聽中心”亮相CES 2025 攜手高通引領(lǐng)智慧家居娛樂新圖景
20
趨勢2025 | 投資產(chǎn)出雙向奔赴,算力布局不斷優(yōu)化
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512