鳳凰網(wǎng)科技訊 7月26日,在WAIC世界人工智能大會期間,百度公司對外展示了其在數(shù)字人領域的最新研發(fā)成果——新一代數(shù)字人技術NOVA。該技術依托百度慧播星平臺發(fā)布,旨在顯著提升數(shù)字人在直播場景下的綜合表現(xiàn)力與互動能力。
NOVA技術核心優(yōu)勢體現(xiàn)在三個方面。首先,該技術基于文心大模型4.5構建的大師級劇本模式,能夠自動生成高質量直播腳本,通過多模態(tài)技術協(xié)同實現(xiàn)數(shù)字人在直播環(huán)境中的形態(tài)、神情、聲音和容貌的精準統(tǒng)一。
在智能交互層面,NOVA配備的AI決策系統(tǒng)能夠實時分析直播數(shù)據(jù)流,通過多智能體調度機制完成觀眾問答互動,同時結合實時熱點生成具有個性化風格的直播內容。
技術復刻效率成為該方案的突出亮點。根據(jù)百度介紹,NOVA僅需采集10分鐘的真人樣本數(shù)據(jù),即可完成對目標對象聲音特征、動作習慣以及表達氛圍的全面復刻,實現(xiàn)高度還原的數(shù)字人形象。
該技術此前已在商業(yè)場景中得到驗證。羅永浩數(shù)字人直播間運用該技術創(chuàng)造了5500萬元的商品交易總額,展現(xiàn)了數(shù)字人直播的商業(yè)潛力。
百度方面透露,NOVA技術計劃于今年10月面向全行業(yè)開放使用。屆時,普通商家和個人用戶將能夠獲得專業(yè)級的數(shù)字人直播能力。目前,該技術已啟動邀請測試階段,率先在教育培訓、健康醫(yī)療等十余個垂直行業(yè)的內容創(chuàng)作者和商家中進行應用試點。
上一篇:阿里巴巴:人到中年
下一篇:沒有了