?
8月8日,中國電信舉辦2023年中期業績說明會。與以往財報會所不同的是,中國電信的新一代超寫實數字人“新翼”首次與觀眾見面并全程主持業績介紹和問答互動的環節。
“新翼”一亮相就吸引來線上與線下的投資者的目光。精細到毛孔、服裝紋理和皮膚質感的細節處理帶來了影視級別的視覺沖擊力,且能夠隨著鏡頭的遠近推拉自動優化,360度無死角地向觀眾展示了幾近真人的皮膚、五官、發絲和身體。同時,站定、轉身、抬手引領和微笑致意等微表情和動作姿勢也保持了極高的流暢性和自然度。開口說話時的語音語調和唇形匹配更是達到了讓觀眾難以區分虛擬和現實的水準。
揭秘“新翼”技術鏈
電信自主研發超寫實數字人
據介紹,“新翼”的原型取自電信的杰出青年,并在設計時著重突出自信自強的面貌和紅色電信精神。目前,“新翼”已經具備了主持人的基本能力和水平,后期會逐步拓展包括中英文翻譯、手語翻譯、眼神即微表情識別,以及歌舞才藝展示在內的多種能力。
而支撐起“新翼”超高仿真外表和自然語言能力的是其背后扎實的技術能力。
研發團隊使用了業界最先進的4D LightStage采集技術掃描原始數據,并通過自定義的超寫實級虛擬人數資標準,將繁復的點云數據精簡至一個約5萬面的臉部模型網絡,賦予了“新翼”電影級的皮膚質感。同時研發團隊自研了一套骨骼+BS的混合驅動方式和隱式學習+多模態特征融合的數字人驅動引擎,通過實時捕捉演員表情變化和追蹤角色口型,幫助“新翼”實現了面部的微表情驅動。
以“新翼”的面部為例,其骨骼數量就超過600根?!靶乱怼毖矍虻暮缒ぴ诓煌慕嵌染艹尸F出不同程度的扭曲變形效果。在眉頭的位置,傳統的模型網格變化難以達到明顯的褶皺效果來凸顯眉頭的川字紋,而通過特殊貼圖的處理方式,在特殊表情觸發法線貼圖的混合,從而強化微觀表情細節的效果。
此外,在數字人的環境渲染方面,研發團隊也做了細致的處理。為了模擬真實皮膚的光照細節,研發團隊基于次表面散射效果,特意開發了超寫實風格的相關渲染環境,便利光線不被阻擋地對皮膚進行透射。
打造3D數字人全鏈路能力
建設電信數字人產品矩陣
建設電信數字人產品矩陣,通過數字人生產管理平臺,實現數字人快速建模和快速應用;打造數字人客服系統,完成3D數字人全鏈路能力的打造,自研端云結合渲染引擎,打造行業領先的數字人產品。這一系列的動作,證明了電信智科自研的數字人系統已經具備數字人生產、驅動、渲染、數資管理的全鏈路能力,支持將現有技術標準化地快速賦能到各類應用和快速復制輸出至新的數字人形象。本次亮相的“新翼”并非電信智科推出的第一款數字人,早在今年5月,身份型數字人“數數”即出席并與央視名嘴康輝互動主持2023數博會開幕式及論壇發布會。
不僅如此,服務型數字人同時也實現了在北京、浙江、安徽、廣東客服系統加載落地,實現全網統一形象、統一能力、統一業務;助理數字人更是貼合電信核心的通話業務,打造新一代通信助理、視頻彩鈴業務。
發力數字人業務,搶灘大模型賽道,電信智科緊緊跟隨行業發展風向,積極布局新技術。目前,電信智科的數字人客服已經在計算機視覺(CV)、NLP和語音三項核心能力上達到了行業的一線水平。在技術層面,唇形驅動算法在雙盲測試中,全面超越業內頭部算法,該算法獲得AIWIN世界人工智能大賽第四名。在計算機視覺領域頂級國際會議CVPR 2023競賽環節中,電信智科AI團隊在6項競賽中名列三甲,其中包括兩項冠軍,體現了強大的自研能力。
響應數字中國建設整體布局規劃的號召,踐行央企使命擔當,中國電信集團在AI自研的征程上斬獲豐厚成果。未來,中國電信將不遺余力推動數字人核心技術突破創新,響應行業需求,打造全棧式智能產業鏈,賦能千行百業,助力數字經濟發展。