數字人即是華為AI技術能力合集,也如張平安所言:其目標是為客戶提供全流程、場景化的數字人開發(fā)和應用支持,使能數字人進入千行百業(yè)。
作 者 丨 宿藝
編 輯 丨 子淇
“數字人”正在迎來爆發(fā)時刻。
過去一年時間,幾乎所有科技企業(yè)都推出了自身數字人形象或者創(chuàng)新技術,并且開始向娛樂、電視、內容產業(yè)加速普及。
Research And Markets研究預計,到2028年,全球虛擬數字人產業(yè)規(guī)模將達到5047.6億美元(約32707.44億元),是一個真正的“萬億級新賽道”。第三方統(tǒng)計數據顯示,2020年國內虛擬數字人相關企業(yè)新增數量為36080家,2021年該數據達到66293家,同比增長80%。天眼查數據顯示,我國現有“虛擬數字人”相關企業(yè)約30萬家。
6月15日舉行的華為伙伴暨開發(fā)者大會2022上,華為云CEO張平安發(fā)布了15大創(chuàng)新服務,覆蓋了經驗即服務、技術即服務和基礎設施即服務三大領域。其中華為云數字內容生產線MetaStudio推出了“數字人”全新升級方案,引發(fā)了產業(yè)、開發(fā)者與媒體的廣泛關注。這也是張平安即2021年9月華為全聯接大會之后,第二次與華為云虛擬數字人“云笙”的公開對話與溝通展示。
華為云“數字人”不僅是華為長期以來在AI領域持續(xù)技術投入與引領創(chuàng)新的代表應用,也是體現華為云“技術即服務”優(yōu)勢、為開發(fā)者與合作伙伴提供更加高效便捷的AI開發(fā)能力,推動產業(yè)“數字人自由”普及與加速邁向“元宇宙”的重要布局。
數字人概念火熱,元宇宙賽道擁擠,但所有人都無法忽視現實世界中存在的諸多瓶頸問題。
首先,是成本難題。
去年10月被稱為“現象級數字人”的柳夜熙憑借“捉妖”題材短視頻爆紅,一夜?jié)q粉363萬,但在之后卻因為更新頻率被粉絲頻繁“催更”,其他數字人更是出現了出道后人氣不斷下滑的普遍現象。
據業(yè)界人士分析,采用傳統(tǒng)方法制作CG級的視頻成本非常高,往往一分鐘的視頻需要2-3個月的制作周期,稍有品質的寫實數字人形象更是百萬級投入門檻起步。曾經引起轟動的黃仁勛虛擬人可作為參考,根據英偉達官方博客,黃仁勛虛擬人在發(fā)布會上出鏡的14秒視頻,共有34位3D美術師和15位軟件工程師協(xié)同參與,總計近千工時。這就造成了數字人要么面臨“粗制濫造”,要么淪為“大廠游戲”的產業(yè)現狀。
第二,場景“擬人化”的交互難題。
數字人并非是一個人物建模、渲染與皮膚貼片這樣簡單,關鍵之一是可以給用戶提供所在場景適合的“擬人化”交互?;蛘哒f,得讓用戶感覺其“不違和”、“不跳場”。從技術角度來看,需要自然語音處理與準確語義理解能力、音色擬人合成、知識圖譜、動作捕捉與機械學習等眾多AI技術共同聚合創(chuàng)新的結果。這實際上也是如今很多數字人都僅限于2D、動作僵硬、以及肢體和語音不協(xié)調,看起來“智商不夠”和“肢體不調”的重要原因。
第三,必須深入結合場景與應用。
目前很多大廠推出的數字人還處于“亮肌肉”與“品牌營銷”概念。而數字人真正走向普及,必須深入真實的用戶使用場景、必須與具體行業(yè)應用深度結合,這些顯然不是一家企業(yè)可以完成,需要大量行業(yè)企業(yè)與開發(fā)者共同推動實現,但顯然目前整個行業(yè)缺乏足夠吸引開發(fā)者興趣、并且提供足夠創(chuàng)新技術能力的解決方案。這也就決定了數字人無論是距離用戶、開發(fā)者還是行業(yè)普及應用還都“太遠”,
以至于有媒體評論稱:數字人理想很豐滿,但現實很骨感,產業(yè)應用更是處于“尷尬期”。
去年華為全聯接2021上,華為云數字人“云笙”以一段 Rap+街舞展示了“工程師的數字人浪漫”。對于華為云而言,“云笙”更代表了華為云為行業(yè)伙伴與開發(fā)者提供完整數字人技術賦能與開發(fā)解決方案、共建智能世界云底座的理想與決心。
今年2022華為伙伴暨開發(fā)者大會上,“云笙”在形象、交互與能力上皆實現了全面升級,并作為“講解員”詳細介紹了華為云數字內容生產線 MetaStudio 全新發(fā)布的數字人服務,概括來講有三個顯著能力與兩大優(yōu)勢特點:
讓人人都可以用得起數字人。
與目前行業(yè)中數字人制作動輒幾十或上百萬費用、數個月的長周期制作相比,華為云數字內容生產線 MetaStudio推出的“數字人生成服務”可以為用戶提供“照片直接上傳、5 秒生成專屬3D數字人”創(chuàng)新功能。通過AI讀取面部關鍵特征可實現快捷3D建模,數字人面部還保留了真人標志性的特征,相似度很高,并且支持用戶的個性化“捏臉”和美顏設置。
對于開發(fā)者而言,“數字人生成服務”可以滿足用戶的高效、相似與個性化的數字人生成體驗,開發(fā)者可以更加專注于更多功能與場景的創(chuàng)新,比如游戲、電商或者社交應用服務,而不再將大量的開發(fā)資源投入到基礎能力的低效重復建設,按照“云笙”的話來說,就是“零門檻分分鐘”實現“數字人自由”。
即使是行業(yè)中如今對制作要求較高的“寫實數字人服務”,MetaStudio通過光籠掃描 360 度真人照片,幾何生成基礎模型大約10分鐘時間,通過AI 紋理補全算法對模型進行著色也僅需1個小時即可完成。同時擁有1000+高精度寫實素材,可基于多維特征自動匹配頭發(fā)、眼睛、眉毛等,最終加上人工精修,整個制作周期從業(yè)界 2-3個月縮短至7天以內。對于很多品牌企業(yè)打造品牌形象數字代言人,或者影視/游戲企業(yè)制作數字人CG需求,MetaStudio寫實數字人服務同樣可以擁有低成本、高效率、高品質的數字人生成能力。
讓人人用得好數字人。
MetaStudio此次還發(fā)布了“數字人直播”與“數字人視頻制作”兩大創(chuàng)新服務。
如今很多數字人直播采用的還是2D卡通版本,其中最主要的原因是3D數字人需要單獨購買幾十萬甚至上百萬元的專業(yè)動作捕捉設備,同時還需要相關的場地搭建和技術運維人員,成本和門檻都相當高。而華為云MetaStudio提供的數字人直播服務基于強大的AI算法,只需單攝像頭就可實時驅動3D數字人,并且結合了華為云強大的直播和實時音視頻能力,讓交互時延低于 100ms,由此數字人在直播帶貨、健身演示、影視劇創(chuàng)作中都具備廣泛的應用場景。在華為伙伴暨開發(fā)者大會2022上,一位來自華為云的工作人員,也現場演示了與“云笙”的同頻共舞,令業(yè)界和開發(fā)者印象深刻。
這種理念非常相似智能手機領域的計算影像,比如蘋果和谷歌Pixel之前用單攝像頭就可打敗很多安卓品牌的多攝像頭方案成像能力,其中AI算法領先和對場景的理解已經可以做到超越“堆硬件”方式,數字人領域也同樣如此,可以有效降低開發(fā)者和用戶對硬件的需求門檻,從而加速數字人面向大眾用戶的應用創(chuàng)新與普及節(jié)奏。如今這個方案已經在湖南多豆樂漫娛傳媒完成落地。
另一個是MetaStudio此次發(fā)布的“數字人視頻制作”服務,只需后臺輸入文字,即可通過 AI 驅動制作出數字人視頻講解,并且還可以不同場景需求設定不同情緒。這項能力可以幫助數字人更好地服務于客戶、在線教育、新聞主播、社交、情感陪伴等眾多場景,有利于開發(fā)者高效、低成本地打造全新應用形態(tài),或者大幅提升現有應用的在線交互體驗。
從“人人都可以用得起”到“用的好”,體現了華為云的一大理念:將簡單留給伙伴與開發(fā)者,將復雜留給自己,并通過技術創(chuàng)新與生態(tài)開放的方式將復雜的問題變簡單,共同為用戶/客戶打造更好的體驗與服務。
在中國科技企業(yè)中,華為云是打造“數字人底座”的產業(yè)最優(yōu)選之一,主要有四大層面的原因:
首先,是華為云對數字人的獨特理念與清晰判斷。
華為云CTO張宇昕在大會期間的媒體對話環(huán)節(jié),闡述了華為云對元宇宙與數字人的戰(zhàn)略判斷。張宇昕認為,華為是一個以技術為本的科技公司,對概念炒作不感興趣,而是希望通過關注技術本身,洞察概念背后的問題本質。
元宇宙肯定是大方向,其本質是數字世界與物理世界“融合”,起碼需要三點技術支撐:數字內容的生產、圍繞內容做數字世界的應用,以及跨界融合互動(包括數字內容與物理實體、數字內容之間、數字對象之間的互動),這些都需要有一個強大的互動框架來實現數字內容之間的協(xié)同。華為云數字內容生產線 MetaStudio應運而生,并且在本次大會期間推出了全新的數字人服務,就是為了滿足數字內容生產、協(xié)同、融合與應用的廣泛需求。
張宇昕表示,華為云推出數字人目的主要有兩個:幫助數字人做得更好,通過數字人的一系列服務幫助數字生產變得簡單。這兩個目標將會解決數字人目前很多尷尬問題與叫好不叫做的產業(yè)現狀,幫助合作伙伴和客戶面向千行百業(yè)大力發(fā)展數字人的創(chuàng)新與普及應用。
第二,是重視行業(yè)落地。
就如張宇昕所說,華為云推動數字人的目標并非“炫技”,而是通過AI技術與方案賦能合作伙伴,真正撬動行業(yè)的數字人普及。這種踏實的理念和動作,也為華為云數字人的落地創(chuàng)造了更加高效的行業(yè)落地通道。比如湖南衛(wèi)視的《你好星期六》綜藝節(jié)目中,節(jié)目主持人“小漾”就是基于華為云MetaStudio生產出來的數字人,也被觀眾稱之為“何炅老師的最佳新人搭檔”、“接梗都流利自然”。
華為云在長沙馬欄山音視頻創(chuàng)新中心已經構建了攝影棚,通過 72 臺世界領先級高精度拍攝系統(tǒng),能夠對目標人物每個角度的色彩及深度光場信息進行采集,直接將真人動作視頻掃描成 mash 化的幾何模型,無需驅動即可應用到后期視頻制作當中。同時還具備三大特點:1)模型重建、編碼,視頻合成等全部上云,按需租用,極大減少了本地自建工作站的成本;2)模型傳輸過程中,通過華為 ReMesh Tracking 專利壓縮算法,帶寬成本節(jié)省 50%;3)通過 AI 材質估計與重光照處理,虛實融合更加自然,重構了傳統(tǒng)影視虛擬制作過程。
第三,華為擁有全球科技企業(yè)中少有的“全棧全場景AI解決方案”。
數字人本身就是如今眾多AI技術的“合集”,同時又有充足的能力與潛力服務于千行百業(yè)的AI場景創(chuàng)新。華為AI在技術上有三大特點:持續(xù)的強勁投入、AI全棧解決方案,原生關鍵技術能力。
AI即是應用科學,也與基礎性技術研發(fā)密切相關。而真正實現AI無所不及,AI解決方案必定是原生全場景的。華為多年來一直強調對基礎科技研究的高度重視,任正非曾對此指出:華為要敢于“向上捅破天、向下扎下根”。華為過去十年研發(fā)投入8450億元,其中2021年就高達1427億元,占全年收入的22.4%,僅基礎研究上投入一年就超過200億元。在AI領域,華為輪值董事長徐直軍早在2018年就曾透露過一個數據:當年AI研發(fā)投入達15億美元(約百億人民幣),研發(fā)團隊超過5000人。伴隨近兩年華為AI大規(guī)模應用與全棧技術持續(xù)突破,相關投入注定也會呈現強勁增長,這在全球AI企業(yè)中也處于絕對頭部位置。
最后,華為云推動的AI開放策略。
“智能世界的云底座”是華為云的明確定位與成長戰(zhàn)略,也是如今華為云堅持推動“一切皆服務”的重要原因?!胺丈獭崩砟?,讓華為云可以專注于通過技術開放賦能行業(yè)伙伴與開發(fā)者,共同打造更好的方案與應用服務好客戶/用戶,從而創(chuàng)造全新價值與商業(yè)生態(tài)模式。在這個過程中,華為云也可以通過確立清晰的邊界,更快更好地獲得合作伙伴的廣泛支持,從而更加高效順利地達成“構建萬物互聯的智能世界”的企業(yè)愿景。
今年華為伙伴暨開發(fā)者大會2022上,張平安發(fā)布了華為云新的伙伴政策,并宣布啟動華為開發(fā)者大賽。其中新伙伴體系包括 GoCloud 和 GrowCloud 2 個合作框架,前者在于培育與發(fā)展伙伴能力,為客戶創(chuàng)造更多價值,后者目標幫助合作伙伴擴大客戶覆蓋,實現商業(yè)共贏。在媒體專訪環(huán)節(jié),張平安對此表示:華為過去都是以銷售為主導,但云服務應該是生態(tài)與服務為主導,這與華為過去的體系不同,也是云服務的一大差異化特點。云不是賣設備,而是長期服務,因此華為云業(yè)務形態(tài)正在走出全新的體系與模式探索。
公開數據顯示,目前華為云伙伴數量已超過 38000家,開發(fā)者數量超過302萬,伙伴在華為云市場上架的應用數量已達 7400 多個。更加廣泛的開發(fā)者,與適配度更高的模式創(chuàng)新,有利于華為云AI從技術領先走向生態(tài)引領,也有利于華為云數字人可以更加高效地完成千行百業(yè)的落地,實現與合作伙伴、商業(yè)客戶的共同生態(tài)創(chuàng)新與產業(yè)應用。
由此來看,華為云數字人從技術特點、“一切皆服務”理念、共贏生態(tài)打造,以及千行百業(yè)落地方式等多個維度,都與華為云的理念、能力與目標一脈相承。對于華為云而言,數字人即是華為AI技術能力合集,也如張平安所言:其目標是為客戶提供全流程、場景化的數字人開發(fā)和應用支持,使能數字人進入千行百業(yè)。
“數字人”其實并非是一個新鮮事物。
早在1958年,音樂制作人羅斯·巴格達薩里安(Ross Bagdasarian)用動畫和調音技術,制作了由三個擬人化的花栗鼠組成的虛擬樂隊——艾爾文與花栗鼠(Alvin and the Chipmunks),第二年,這個虛擬樂隊的專輯就獲得了格萊美最佳兒童唱片、最佳喜劇表演和最佳工程唱片三項大獎。
80年代動畫片《超時空要塞》的女主角,在向入侵的外星軍團發(fā)起總攻時,明美作為人類的頭號歌姬在太空唱響的那周《可曾記得愛》,至今仍被很多動漫迷視為“不可超越的經典”。
2013年上映的人文與科幻經典電影《Her》,講述了作家西奧多在結束了一段令他心碎的愛情長跑之后,愛上了電腦操作系統(tǒng)中一個叫做“薩曼莎”的“姑娘”。她風趣幽默、善解人意,為孤獨的男主提供了十分治愈的情感陪伴。這個溫暖的超現實科技畫面,震撼了全球觀眾,也讓科技行業(yè)看到了數字人的廣闊創(chuàng)新空間與美好未來。
如今“數字人”再次成為各行業(yè)跨界投入的熱點方向,主要的原因有三個:元宇宙概念興起、技術開始進入成熟門檻,以及用戶的廣泛需求與期待。萬物智聯之下,當所有終端與設備全部聯網,數據與服務都跑在云端,那么“數字人”就會成為用戶穿越在數字世界與物理世界之間的最好的交互體驗。對于千行百業(yè)而言一方面“數字人”可以面向大眾用戶提供更好的“擬人化”服務,而不是過去Logo化的冰冷品牌印象;另一方面則可以更好地面對數字化與智能化產業(yè)升級需求,幫助操作人員更加高效與低門檻的完成任務操作。Gartner預測稱,到2026年,全球30%的企業(yè)機構將擁有用于數字人和元宇宙的產品與服務。
這也是華為云積極部署數字人的重要原因,因為其一方面要支撐終端業(yè)務面向大眾用戶與商業(yè)市場的智慧全場景變革需求,另一方面也同樣要面對千行百業(yè)的數字化升級與創(chuàng)新落地方案。而華為云MetaStudio此次推動的全新數字人服務,就是華為云打造“最佳數字人創(chuàng)新生態(tài)平臺”的開始。
星星之火,可以燎原。華為云與開發(fā)者和合作伙伴的數字人創(chuàng)新之旅,也會成為照亮智能世界、引導數字科技創(chuàng)新的璀璨之光。
END
「壹觀察」創(chuàng)始人宿藝
原搜狐科技通信主編
今日頭條、騰訊新聞、搜狐搜索「壹觀察」
百家號、微博、抖音搜索「宿藝」關注更多
丨智能硬件丨通信丨新零售丨人工智能丨
丨智聯網汽車丨智能家居丨
轉載、合作聯系微信:yiguancha_01