用戶可以在平臺直接創(chuàng)建自己的虛擬形象,適配短視頻制作、視頻翻譯等需求。
多知網(wǎng)3月11日消息,有道智云平臺今日官宣“小采樣數(shù)字人平臺”,基于智能化、個性化積累,用戶可以在平臺直接創(chuàng)建自己的虛擬形象,適配短視頻制作、視頻翻譯等需求。
據(jù)介紹,這些虛擬形象可以模仿真人表情動作、在多種場景下自然交流,同時支持照片說話和唱歌功能,靜態(tài)照片與圖像均可以通過語音或旋律更生動地表達。
官方推文介紹了幾個功能:
在視頻翻譯為例,該功能融合人工智能、自然語言處理和數(shù)字形象合成技術,可以將視頻內容轉換成多語言版本,包括產品宣傳片、互動直播等等。
以形象克隆為例,該功能可以對真實人物進行一比一的深度復制,包括視覺上的面部特征、身形輪廓,動態(tài)表現(xiàn)的動作習慣、微妙表情,以及聲音質感和語氣節(jié)奏等。
以歌聲合成為例,區(qū)別于語音合成技術(TTS),有道小采樣數(shù)字人采用的是原創(chuàng)歌聲合成技術,能夠滿足說話、高難度歌曲演繹等需求。用戶上傳一張照片和一段聲音(日常聊天內容或歌唱音頻等均可),10分鐘后即可生成。
目前平臺talk.youdao.com已經免費開放。(多知網(wǎng) Mint)