英偉達的元宇宙布局

要點歸納:

如何看待元宇宙: 元宇宙是一個概念集合,是在 AI 、區(qū)塊鏈、 XR 技術(shù)、圖形可視化技術(shù)、引擎技術(shù)等一系列技術(shù)的集合體。

為什么今年 “ 元宇宙 ” 這么火熱: 三個因素: ① 消費者的需求和現(xiàn)有技術(shù)提供的應(yīng)用間存在矛盾,未來將會出現(xiàn)更沉浸式、更讓年輕人喜歡的消費模式。 ②AI 、區(qū)塊鏈、 XR 等技術(shù)在比較集中的時間點取得了突破性進展。 ③ 疫情推動了從線下到線上的進程。

英偉達在數(shù)字孿生領(lǐng)域的分行業(yè) “ 三步走 ” 計劃: 第一步,先做傳媒娛樂和建筑兩個行業(yè),初步應(yīng)用數(shù)字化。第二步,做產(chǎn)品設(shè)計,是微觀數(shù)字化。第三步,最終目標(biāo)是實現(xiàn)數(shù)字孿生的工業(yè)制造。

Omniverse 平臺:

目標(biāo): 找到用戶的需求和痛點,并且滿足它。

設(shè)計初衷: 未來英偉達會開源出來越來越多工具免費供大家使用,這將大大降低很多人參與創(chuàng)作的門檻,讓每個人都可以成為設(shè)計師。

解決的問題: ① 通過統(tǒng)一的文件格式解決了設(shè)計協(xié)同問題; ② 通過文件輕量化解決了文件過大的問題; ③ 通過多樣的應(yīng)用初步滿足了不同行業(yè)的需求。

平臺定位: Omniverse 不會替代 UE4 、 Unreal 等離線引擎。我們的理念是提供一個基于引擎等產(chǎn)品之下的底層技術(shù)服務(wù)平臺。

虛擬人融入日常生活需要多久,是否可行: 虛擬人技術(shù)行業(yè)分了三步發(fā)展: ① 實現(xiàn)超寫實;② 引入 AI ,使其擁有對話能力; ③ 情緒識別。虛擬人項目英偉達已經(jīng)研發(fā)幾年了,目前還處于初期。我們認為在未來 3-5 年內(nèi),虛擬人融入日常生活有可能會實現(xiàn)。

英偉達在虛擬人技術(shù)領(lǐng)域的壁壘: 最核心的技術(shù)是數(shù)字人 1.0 時代的超寫實逼真感。不管是光線追蹤還是路徑追蹤,都需要大量算力,目前能提供這樣技術(shù)的平臺只有英偉達。

【國海傳媒】嘉賓: NVIDIA 中國區(qū) Omniverse 業(yè)務(wù)經(jīng)理 何總

嘉賓介紹:

我們?nèi)绾慰创钪妫?/strong>

首先元宇宙是一個概念的集合,它不是某項可以落地的應(yīng)用,這點是大家都公認的。另外,我們可以看到它是很多技術(shù)的摻雜在一起的,大家認為未來的數(shù)字化世界,或是未來的世界,都可以被統(tǒng)稱為 “ 元宇宙 ” 。這里涉及很多具體技術(shù)概念問題,在比如 AI 、區(qū)塊鏈、 XR 技術(shù)、圖形可視化技術(shù)、引擎技術(shù)等一系列技術(shù)的加持下,元宇宙是一個很多不同專業(yè)、不同方向的技術(shù)集合體。最終 “ 元宇宙 ” 這個概念在 2021 年集中落地和爆發(fā),在讓大家看到這些概念都可以有長足進步的前提下,大家也在熱炒這個概念。因此,元宇宙總結(jié)來講,是一個整體的概念集合。

為什么今年大家把 “ 元宇宙 ” 概念炒得這么熱?

我們認為有 3 個因素:

① 大家可以看到在過去 20-30 年里,從互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)的蓬勃發(fā)展,造就了一系列比較偉大的公司,這里不乏有中國的企業(yè)。我們今天使用的互聯(lián)網(wǎng)產(chǎn)品有幾類,包括視頻、音樂、短視頻、網(wǎng)上購物等,可以說都是 2D 的?,F(xiàn)在供求雙方的平衡有點被打破了,尤其是最近一兩年,大家看到抖音 APP , DAU 有 6-7 億,昨天晚上看到 TikTok 上周已達到 10 億 DAU,日活用戶已經(jīng)到了瓶頸階段。在這個前提下, 2D 互聯(lián)網(wǎng)出現(xiàn)了什么變化呢? 消費者需要在某些環(huán)境中得到滿足,和現(xiàn)在技術(shù)提供給消費者已有的應(yīng)用,相互之間是有矛盾的。所以未來消費者需要的更好的、更沉浸式、更有讓年輕人,尤其是 00 后年輕人喜歡的消費模式一定會出現(xiàn) ,這是第一個因素。

② 剛剛提到的比如 AI 和 XR 等各類技術(shù)。大家可能關(guān)注了 AI , AI 在 6-7 年前開始,到現(xiàn)在已經(jīng)有比較成熟的落地 AI 應(yīng)用,比如大家去機場,工作人員不需要人工審核身份證、人臉對比,而是通過 AI 進行人臉識別。所以現(xiàn)實場景中已經(jīng)有很多應(yīng)用了,并且許多這樣的應(yīng)用已經(jīng)落地了很多年,并且技術(shù)成熟了。 XR 也是一樣, XR 在 2014 、 2015 年曾經(jīng)有過一段低谷,但隨著技術(shù)進步,比如我?guī)讉€月前戴著 Pico 打了一次乒乓球,感覺體驗比 5 年前好多了。雖然現(xiàn)在設(shè)備的感受還有進一步提升的空間,但這個方向已經(jīng)逐漸落地成熟了。同時還有一系列不同行業(yè)專業(yè)的技術(shù),比如區(qū)塊鏈、物理學(xué)模擬、圖形可視化渲染技術(shù)等,這些技術(shù)越來越成熟了,而且這些技術(shù)成熟在同一時間節(jié)點發(fā)生。另外, 推動市場熱炒 “ 元宇宙 ” 概念,就是因為這些技術(shù)都在同一時間點集中爆發(fā),讓大家看到了一種可能 。當(dāng)這些技術(shù)同時進步,同時達到一個節(jié)點的時候,那我們幻想中某一概念就會出來,現(xiàn)在大家都找到了這樣一個概念,叫元宇宙。

③ 我們不能回避疫情對前兩件事情的促進,讓大家看到了線上辦公、線上會議,甚至前兩天看西城男孩的線上演唱會,各種各樣的活動由原來線下的形式搬到線上來。這是疫情的推動,讓這件事情進入到公眾的視野。

我首先進行了簡單回顧、總結(jié)了一下我所理解的元宇宙。然后就為什么大家在今年熱炒這個概念分析了 3 個方向的因素和推動力。

在我講完怎么看待元宇宙概念之后,再回到英偉達怎么去看元宇宙。其實英偉達不是為了元宇宙而做了什么平臺,其實 Omniverse 平臺已經(jīng)研發(fā) 5 年了,這在公司 , 財報、創(chuàng)始人黃仁勛先生的發(fā)言中均有提到。公司在這個平臺上已經(jīng)投入了數(shù)億美元, Omniverse 在 2019 年發(fā)布,但當(dāng)時大家的關(guān)注度還不太夠。所以這也側(cè)面印證了公司是以技術(shù)為導(dǎo)向的,創(chuàng)始人也非常具有技術(shù)的前瞻性。

我們先談 Omniverse 平臺的由來。這個平臺最開始解決我們從用戶、從客戶使用端角度看到的3 個方向的難題:

① 設(shè)計協(xié)同問題。 我們發(fā)現(xiàn)全球有 4100 萬設(shè)計師,或者說各種創(chuàng)意工作者,每天會用大量不同的軟件,比如大家耳熟能詳?shù)?nbsp;CAD 、 CAE 、 CAM 軟件等。而且這些軟件可以有超過 30多家不同 CAD 軟件公司,甚至超過 50 個不同類型的設(shè)計軟件工具,這些都出自這 4100 萬全球設(shè)計師手中。再比如我們在做概念設(shè)計用 Maya ,比如設(shè)計一個杯子,完成這個杯子的概念設(shè)計后,我們就需要添加材質(zhì),比如用陶瓷質(zhì)感,然后發(fā)現(xiàn)添加材質(zhì)需要用到 Substance 這款軟件,材質(zhì)添加好再去做渲染,發(fā)現(xiàn)還要用軟件渲染軟件??偨Y(jié)下來,在一個經(jīng)典的設(shè)計流程中,一個設(shè)計師每天至少面對 3 款不同的軟件,而這 3 款不同的軟件恰恰還不是同一家公司的,而且文件的格式也不是標(biāo)準(zhǔn)統(tǒng)一的,這會讓設(shè)計師很痛苦,從概念設(shè)計到加材質(zhì)、渲染,整個過程中需要把文件反復(fù)傳進傳出,這個過程非常痛苦。比如說現(xiàn)在 PPT 格式的大小和十年前完全不一樣。同樣 3D 設(shè)計里的文件也是與日俱增的,越來越大的,所以操作起來非常麻煩。

② 文件量巨大會導(dǎo)致很多工作根本做不了。 傳統(tǒng)設(shè)計軟件的版本每年迭代一次,又不能舍棄對傳統(tǒng)文件研發(fā)支持,只能在以前的版本和研發(fā)平臺上更新。這就導(dǎo)致文件越來越大,解決不了輕量化的問題。

③ 不同行業(yè)的需求。 我們發(fā)現(xiàn)這 4100 萬名工程師分布在不同的行業(yè),有的在傳媒娛樂做電影設(shè)計、動效大片,有的在樓宇設(shè)計里做建筑,有的在工廠里做制造,甚至還有做科學(xué)研究仿真的。每個行業(yè)之間又有不同的行業(yè)屬性,不同行業(yè)需求不同 。

在公司看到 3 個痛點后,公司就推出了 Omniverse 這樣的平臺。我們公司是一個硬件平臺公司,而 Omniverse 是一個承在所有設(shè)計軟件之下的技術(shù)平臺,它幫助大家集成同一個文件格式,比如 USD 。大家都在同一個頁面下,基于英偉達的 Omniverse 平臺,同時操作概念設(shè)計軟件、添加材質(zhì)的軟件、同時可以看到渲染的效果,在整個協(xié)同的過程中至少能節(jié)省 50% 的設(shè)計效率。我們在數(shù)據(jù)量上也做了一個測試,一個 72GB 的 Maya 文件可以輕量化到 700+K ,也就是 10 的 5 次方的降維。這樣就能實現(xiàn)會我們在 GTC 上看到寶馬工廠的展示。這樣即使是上 1TB 的數(shù)據(jù),我們也能夠輕而易舉在里面做修改、渲染,以及各種各樣的工作。我之前在 GE 這樣工業(yè)公司工作過,在前 10 年、 20 年,工業(yè)公司一直想做,但一直沒有推出來。直到今年有Omniverse 才把它推出來,這是數(shù)據(jù)量巨大的情況下,我們通過輕量化方式實現(xiàn)的。第三,我們在各行業(yè)都有各自不同的應(yīng)用,我們面向不同行業(yè),都有不同行業(yè)的專有技術(shù)集成在這個平臺里。同時我們在平臺上又開放了面向不同行業(yè)開發(fā)者的開發(fā)權(quán)限,我們有一個產(chǎn)品叫 Omniverse Kit extension ,基于 extension 可以通過 API ,通過 Python ,通過 C++ 語言,實現(xiàn)對不同行業(yè)的開發(fā)定制功能。

總結(jié)下來,我們是基于用戶的需求和痛點來推出這個平臺,而且是在兩年前推出的。今年也基于這個平臺做了很多應(yīng)用,比如我們的工業(yè)機器人 Isaac Sim 、自動駕駛的 DRIVE AGX 、數(shù)字虛擬偶像的 Avatar 平臺,類似還有很多。 我們也會在接下來研發(fā)中發(fā)布行業(yè)應(yīng)用方向的產(chǎn)品。這些就是向全球用戶展示基于 Omniverse 可以實現(xiàn)無限不同行業(yè)的可能,這是我們推出這個平臺的核心邏輯。

其實這個平臺是根據(jù)羅列出的 3 點需求推出的,讓我們的用戶,甚至不單單這 4100 萬設(shè)計師,未來可能是全民化都可以參與 3D 世界設(shè)計、數(shù)字世界設(shè)計的平臺。這個平臺整合了英偉達過去 20 多年積累的專業(yè)圖形可視化、 XR 、 AI 、物理學(xué)模擬引擎、基于核心數(shù)據(jù)中心級別算力,這 5 大項技術(shù)融合在一起的技術(shù)平臺基座。它是下沉于剛剛提到的 CAD 等各種軟件工具, 我們不會去替代這些工具,而是提供給未來設(shè)計師所使用軟件的技術(shù)底座。 有很多媒體報道稱這個平臺是為了元宇宙準(zhǔn)備的,其實只是有點不謀而合的感覺。

最后,和大家分享一下,如何看待在元宇宙在未來數(shù)字世界里, 有哪些業(yè)務(wù)場景是可以應(yīng)用。我們的邏輯非常簡單,就是找到用戶的需求和痛點是什么,并且滿足它。 舉個例子,比如我們創(chuàng)建出了一個數(shù)字孿生的世界,這個世界是要反饋給真實的物理世界中的用戶,滿足人類的設(shè)計工作的需要。比如說寶馬的數(shù)字化工廠,過去是沒有辦法去數(shù)字化孿生整個工廠車間。大家知道生產(chǎn)車有四大工藝,沖壓、焊裝、涂裝、總裝,其中光總裝車間全部做完就已經(jīng)有上 TB的數(shù)據(jù)。至于寶馬的數(shù)字工廠有什么用處,根據(jù)寶馬董事會的米蘭先生介紹的,每年都會調(diào)整寶馬的生產(chǎn)線,以利于它的產(chǎn)能和產(chǎn)量,甚至是工藝的改進,每次改產(chǎn)品線都是他們的大難題。但如果這件事情能夠搬到數(shù)字世界中,正如英偉達和它合作做這樣數(shù)字化孿生寶馬工廠的案例一樣,其工作的效率提升了 30% ,這個工作效率的提升都是可以通過真金白銀體現(xiàn)出來的。

另外,在一個月之前 GTC 大會上,我們發(fā)布了虛擬人制作平臺,平臺里展示了 Toy-Me ,也就是玩具版的 黃仁勛先生 。它非常智能,可以聽懂不同專業(yè)科學(xué)家提出的非常復(fù)雜的問題和文化,同時可以講述非常專業(yè)的知識,比如天體物理學(xué)、哲學(xué)方面、分子蛋白相關(guān)比較深層次的專業(yè)領(lǐng)域知識,這是對未來數(shù)字人這方面的研究進展。落在具體應(yīng)用領(lǐng)域里,我們又展示了點餐機器人,這個和我們每天工作生活息息相關(guān),比如去一個便利店買東西,或者去快餐店點一份東西,這是我們?nèi)粘=?jīng)??吹降膱鼍?。我們做了一個調(diào)研,大概全球 2500 萬個 Store 小店,我們理論認為在未來數(shù)字化轉(zhuǎn)型過程中,這些小店都會進行數(shù)字化轉(zhuǎn)型,都應(yīng)該放一個點餐的機器人。我們做了不同行業(yè)案例都是回饋到現(xiàn)實生活需求中,這是我們在不同的行業(yè)和應(yīng)用的落地。

Q&A :

Q :能否展開談一談在英偉達計劃當(dāng)中,數(shù)字孿生的前景是怎樣的?英偉達是不是致力于構(gòu)建一個和整個現(xiàn)實世界完全映射的數(shù)字世界?如果要實現(xiàn)這個目標(biāo)的話,會初步分成哪幾個階段,它的標(biāo)志會是怎樣的,大家預(yù)期會在怎樣的時間去實現(xiàn)?

A : 其實 “ 數(shù)字孿生 ” 這個概念很早就提出了,我沒有記錯應(yīng)該是麻省理工學(xué)院一個教授或者博導(dǎo)提出這個概念,這已經(jīng)是 10 多年甚至 20 年前的事情了。這個概念有點像工業(yè)界做一個工廠,一個車間,甚至是設(shè)計某一個產(chǎn)品,可以映射在數(shù)字世界里的一個概念。這是我們剛剛在介紹了寶馬工廠時,解釋他們?yōu)槭裁葱枰羞@樣一個數(shù)字化映射。主要原因在于這個數(shù)字化映射對于他們現(xiàn)實中工廠生產(chǎn)布局的改造,或是工藝流程升級和革新非常重要,所以才有了這個概念。這個概念大家都想做,但如果數(shù)據(jù)量超級大的話,吃很多算力的同時,還要實現(xiàn)各種不同軟件、平臺、主數(shù)據(jù)的打通等,所以進展比較緩慢。這是數(shù)字孿生的背景。

我們?nèi)绾稳タ磾?shù)字孿生,其實英偉達服務(wù)數(shù)字孿生,包括像達索、西門子、 PGC 這些公司,已經(jīng)合作 20 多年了,我們非常清楚這些軟件公司,這些工業(yè)客戶需要什么。我們看到這些痛點之后走了幾步,有幾個規(guī)劃。 我們發(fā)現(xiàn)需要分行業(yè)進行 “ 三步走 ” :

第一步是先做兩個行業(yè):傳媒娛樂, 大家如果喜歡看電影,那些電影的特效,是最早應(yīng)用這些數(shù)字化理念孿生,比如像《復(fù)仇者聯(lián)盟》的動漫形象,變形金剛等,都是數(shù)字化。第二個行業(yè)是 建筑 ,建筑里有 BIM (建筑信息模型)和 CIM (城市信息模型)的概念。這兩個行業(yè)是我們在一年半前已經(jīng)打通了,這是第一步走,在這個行業(yè)里怎么做數(shù)字化。

第二步是產(chǎn)品設(shè)計,可以理解為微觀的數(shù)字化。 比如耳機,某一個單體產(chǎn)品設(shè)計的數(shù)字化,這個還在進行中,我們的進展還是如預(yù)期一樣,也都集成了很多。

第三步,我們最終目標(biāo)就是數(shù)字孿生的工業(yè)制造 ,類似于寶馬工廠這種級別的。雖然現(xiàn)在我們跟寶馬做出來了,但是它不具備可復(fù)制性。因為世界上沒有任何其他的工廠能有寶馬工廠數(shù)字化這么全面的。所以這一步的前提要求非常高,要有所有工廠的數(shù)字化數(shù)據(jù),同時還要引入類似 Omniverse 的技術(shù)平臺,整合整個流程、數(shù)據(jù)標(biāo)準(zhǔn)能力的平臺,同時還要具備一定算力。所以這是我們對數(shù)字化孿生工廠 “ 三步走 ” 規(guī)劃。

總結(jié)起來,我們對于未來數(shù)字化世界的創(chuàng)建,包括元宇宙世界的創(chuàng)建,技術(shù)是非常重要的。我們認為,所謂的數(shù)字孿生不單單是 1 : 1 把世界孿生出來。我們數(shù)字孿生世界應(yīng)該會比真實世界大幾百倍,甚至幾千倍,幾萬倍,因為你要做整個場景,比如寶馬工廠的場景,需要切分成不同的設(shè)計模組,或者不同的數(shù)字世界,其實它會比真實世界大好多倍,這是我們看到的。反饋回來對我們的工廠也好,其他行業(yè)也好,都是非常有意義的。

Q : Omniverse 的定位和 Unreal 這些引擎之間如何分工,目前有多少功能是重疊的,長期來看是否會逐漸取代它們?

A : 如果大家對于引擎稍有了解,可以這樣分享一個例子,我們的引擎和友商的引擎是不一樣的。大家玩游戲的話知道手機上的 “ 吃雞游戲 ” ,或者 PC 端的《魔獸世界》、《暗黑破壞神》等,這些游戲都下載下來,手機上需要幾個 G , PC 端甚至有幾百個 G 的游戲。而那些幾個G ,幾十 G ,幾百 G 的文件是什么呢,其實那些就是像 Unreal 這樣的引擎 所做的,是提前預(yù)制好的、并且離線的, 所以它們的定義是離線引擎。而 Omniverse 要做的平臺是實時的 ,這兩個是完全不一樣的概念。

目前我們和所有的 CAD 軟件公司,包括和引擎公司合作這么多年關(guān)系都非常不錯, 我們不會去替代他們?nèi)魏我粋€產(chǎn)品。我們的理念是提供一個基于他們產(chǎn)品之下,底層技術(shù)的服務(wù)平臺。

Q :能否請您詳細介紹一下實時和離線的區(qū)別是什么,分別都是什么樣的應(yīng)用場景,能否舉一下例子?

A :因為我玩的游戲比較少,最近幾年就玩過手機端的 “ 吃雞游戲 ” ,這其實是一個離線游戲。大家注意到,角色跑動時的影子是沒有光影的?;蛘哒f一顆手雷在現(xiàn)實世界可以把房子炸掉,但游戲里的樓始終還是在那兒,不會塌的。這個就叫離線,它不會動,也不會變。

什么是實時呢,未來實時的引擎應(yīng)該是人在那兒跑,影子一直跟著走,光照也會發(fā)生改變。比如真實的場景里會有日出日落,我們就針對那個場景做出應(yīng)該有的日出日落,但現(xiàn)在離線游戲中有一些是沒有這些實時光影。

在實時引擎中,有日出日落,有時間的變化,隨著時間變化太陽的角度也不一樣,人的光影也不一樣,下雨了影子也會發(fā)生變化。更進一步,我扔了一顆手雷真的有可能把木屋和廁所炸掉,旁邊的物體會發(fā)生變化,這就是離線和實時的區(qū)別。

Q : Omniverse 現(xiàn)階段推廣比較大的障礙是什么,是技術(shù)上不夠成熟,還是應(yīng)用場景受限,或者價格,或者說消費者的一些習(xí)慣?您預(yù)計 Omniverse 的推廣和普及的拐點會出現(xiàn)在什么時候?

A : 這是個好問題,我們實際上非常重視生態(tài)的開發(fā),所以 Omniverse 在兩年前推出的時候,我們就一直在布局整個生態(tài),像我這樣的角色在全球也有其他的同事在做。

先分享中國的,中國的生態(tài)已經(jīng)有很多個,我們有超過 3000 名開發(fā)者正在使用,這個數(shù)據(jù)每天都在上升,每天都有人在我們的網(wǎng)站上去下載這個產(chǎn)品。我們的目的是有了這樣的平臺后,要大大降低設(shè)計者的門檻。我們在全球的 4100 萬設(shè)計師,很多都是以前工科畢業(yè)的,像計算機的,包括 CAD 、輔助設(shè)計,還有各種各樣花了很多年圖紙的工程師,都具備一定的專業(yè)能力。

大家可以關(guān)注我們一個產(chǎn)品 GauGAN , GAN 就是繪圖生成軟件的簡稱,這是我們推出完全免費的繪圖工具。以前的繪圖工具比如用 CAD 軟件需要一筆一筆畫,畫完之后做三維造型,添加材質(zhì)渲染,然后做出三維模型。 GauGAN 引入了 AI 和深度學(xué)習(xí)的工具,現(xiàn)在 GauGAN 2.0 版本是幾個禮拜前發(fā)布的,你可以輸入一段文字,比如說 Cloud ,它就會直接生成一個云彩。比如輸入一段 “ 我想要非常陽光明媚的陽光,但我要讓那個陽光穿透在森林里 ” ,它就會自動生成一個樹林里穿透陽光的照片。對于我們公司來說, 未來我們會開源出來越來越多這樣的工具,免費給大家使用。這會大大降低很多人參與創(chuàng)作的門檻,也就是人人皆可以成為設(shè)計師,這也是我們的設(shè)計初衷。我們非常重視生態(tài),讓大家在平臺上自己去開發(fā)工具,自己生成作品,這是我們的核心想法。

另外在推廣過程中有哪些困難,因為 Omniverse 這樣新鮮的事物出來,我們肯定還會逐步擴展功能。我們在軟件平臺的各種不同專業(yè)方向和行業(yè)延伸,這些都在不斷探索。我再舉個例子,比如我們現(xiàn)在有一個平臺叫 Audio2Face ,大家可能聽說過,字面理解就知道。就是我輸入一段語音或文字,就可以驅(qū)動現(xiàn)在比較流行的三維數(shù)字人模型面部動作。 Audio2Face 我們已經(jīng)推出了兩年多了,其實我們還不止于此,我們還開發(fā)出 Audio2Translator (語音語義驅(qū)動動作),自己讓數(shù)字人身體,比如像老黃演講,輸入一段他的手怎么樣去擺,這是我們在不斷研發(fā)的。未來我們還會上 Audio2Emotion ,同樣我喊了一個 “ 啊 ” ,這個 “ 啊 ” 表情應(yīng)該是什么樣,是驚訝,還是被人不小心碰到了疼了一下的痛,都會是成為我們研究的發(fā)展方向。推廣出來需要迭代,不斷進步的,我們的功能和性能會往更寬廣應(yīng)用方向努力的,這是我們一直非常關(guān)注的,也是我們不斷努力,讓平臺更加優(yōu)化,算法更加好,門檻更加低,讓每個人成為設(shè)計師。

這里給大家打個小廣告,我剛才說的 Audio2Face ,我們硅谷同事的 6 歲女兒,給她父親生日派對上,她就花了幾分鐘時間,用筆記本 Audio2Face 唱了一首生日歌,把這首歌輸入 Audio2Face 平臺里,驅(qū)動她特別喜歡的一個卡通動畫里的犀牛角色,讓犀牛唱出來,現(xiàn)場播放給她父親。我們有這樣的工具可以大大降低設(shè)計師、設(shè)計者的門檻,這是我們想要看到的未來趨勢,這也是我們一直努力的方向。

Q :現(xiàn)在虛擬數(shù)字人也比較火,你覺得虛擬人真的融入我們的生活,比如說做直播,或者是做偶像,或者是做營銷這種,您覺得技術(shù)方面達到普及需要多久,是否困難?商業(yè)模式上是否可行?

A : 其實我本人在國內(nèi)已經(jīng)做了 3 年的數(shù)字虛擬人的生態(tài),整個市場的需求在過去一兩年內(nèi)非常多。

先回答一下這個技術(shù),其實這個技術(shù)里也是分了 “ 三步走 ” ,英偉達在硅谷有數(shù)字研究院。 ①實現(xiàn)超寫實。 國際上包括國內(nèi)做的超寫實級別的數(shù)字人基本上離不開我們的技術(shù),我本人也親自去跟進了一些項目,帶著我們的團隊一起,包括生態(tài)合作伙伴一起做的超寫實數(shù)字人,比如央視主持人,比如新華社,比如其他超寫實級別的項目,我們都做過。 ② 要引入 AI ,要讓它有對話的能力 , Conversation AI 這方面我們已經(jīng)開始有布局了,而且已經(jīng)實現(xiàn)了。 ③ 情緒情感的識別 ,這種情緒情感的識別就在于,今天我們是電話會議,如果面對面的話,真實人類對對方的表情、情緒的識別是非常準(zhǔn)確的。 我們?nèi)绾巫寯?shù)字人能夠具備這種能力,這個我們已經(jīng)研發(fā)幾年了,目前還處于初期。我們認為未來 3-5 年內(nèi),虛擬人融入日常生活真的有可能會實現(xiàn) ,這是從技術(shù)角度看到的。

另外是市場前景。特別巧,前一段時間我剛看過一個數(shù)據(jù),全球數(shù)字虛擬人的市場在 2028 年可能會達到 513 億美金的市場規(guī)模。中國可能會在 2030 年達到 50 億美金,也就是 1/10 的市場,所以這個市場前景還是很大的。剛剛您提到的業(yè)務(wù)場景都是數(shù)字人 1.0 時代了,比如數(shù)字偶像、數(shù)字直播、主播,這些都是賺眼球的。我覺得就像藝人一樣,一股風(fēng)過去這個浪潮也就過去了。 我們更關(guān)注的是真正能落地,幫助到大家切實的應(yīng)用。 比如剛才說的點餐機器人,數(shù)字人也可以做出來的,包括未來可以通過全息投影的方式,在店里做一個數(shù)字的點餐員,這些都有可能會出現(xiàn),這些才是真正地服務(wù)我們落地的需求。

其實我們的數(shù)字寶馬孿生工廠里大量引入了數(shù)字人,在視頻里會有很多工人,那個工人都是我們用數(shù)字人的技術(shù)做出來的。 人在里面怎么走,操作臺的高低,是否需要彎下腰走過某一臺設(shè)備和操作臺,這些都是符合人體工程學(xué)的。 這些才是服務(wù)真實應(yīng)用場景。所以我們認為未來的數(shù)字虛擬人應(yīng)該真正應(yīng)用到這樣的業(yè)務(wù)場景里,才會有真正的業(yè)務(wù)邏輯在里面,所以前景非常大。

Q :您說超寫實數(shù)字人形象的技術(shù)上一定要用到英偉達的技術(shù)才能實現(xiàn)嗎?

A : 不是一定,是用了我們的會更好。

Q :關(guān)于數(shù)字人的塑造,同行中的平均水平是什么樣子,以及達到你們這樣的水平,或者進行商業(yè)化水平需要多久,或者多難?

A : 這里核心的一個技術(shù)就是數(shù)字人 1.0 時代的超寫實逼真感,這個逼真感核心是圖形學(xué)理論輪廓范圍內(nèi)。圖形學(xué),上世紀就開始很多人研究算法。比如從光柵化算法過渡到光線追蹤,光線追蹤是圖形學(xué)里的里程碑,或者圖形學(xué)巔峰的算法是路徑追蹤。光柵化就是三角面,看到那些好萊塢大片后來制作的,好萊塢也做了很多虛擬人物,這些人物以前都是光柵化,因為是用多少億的三角面做出來的,這就是一個技術(shù)。

2018 年英偉達提出實時光線追蹤,這是現(xiàn)在比較流行的,也是最高端的一個技術(shù)。實時光線追蹤的核心是光源打在臉上反射出來的效果,這個技術(shù)叫光線追蹤,這是英偉達提出來了。我們技術(shù)路線是在 2035 年實現(xiàn)路徑追蹤,也就是追蹤所有的光線,實現(xiàn)路徑追蹤。

回到您問為什么一定是英偉達呢, 因為不管是光柵化也好還是光線追蹤也好,還是未來的路徑追蹤也好,它會要大量的算力。還有一個核心的圖形學(xué)底層的技術(shù),比如這種光線追蹤技術(shù),算力 + 圖形學(xué)底層技術(shù),能夠提供這樣技術(shù)的平臺只有英偉達。 目前看來, GPU 市場我們占80% 以上。 另外,我們不但是芯片的制造公司和銷售公司,我們的圖形學(xué)算法科學(xué)家,還有深度學(xué)習(xí)、 AI 人工智能算法科學(xué)家,在我們公司里這些人員占全球的 60% 。所以,我們在軟件、算法、圖形學(xué)理論算法研究儲備是遠遠領(lǐng)先于同行的,這是為什么大家在做這個時離不開我們的技術(shù),或者說選擇我們的技術(shù)會比別人要好很多,超過和領(lǐng)先別人很多個身位的核心原因就是這樣。

Q :以后英偉達會成為一個內(nèi)容輸出服務(wù)平臺的話,這個版權(quán)是屬于定制者,還是屬于技術(shù)提供公司呢?

A : 我們是在這個過程中提供了 GPU 顯卡,剛剛提到的算法,包括圖形學(xué)的東西其實都是開源免費給大家用的,我們沒有跟別人分享這個人代言費 100 萬,我們提成多少,從來沒有,這是需要明確的。

Q :英偉達現(xiàn)在商業(yè)模式是提供數(shù)字人編制服務(wù),然后收取數(shù)字服務(wù)費嗎?

A : 我們沒有服務(wù)費,別人會選擇我們的 GPU , GPU 上有我們的算法,算法上很多是免費的,我們沒有收過任何服務(wù)費。

Q :那之后英偉達的商業(yè)模式是怎樣的?

A : 我們剛才也提到了生態(tài)合作伙伴, 我們更想讓生態(tài)合作伙伴在平臺上做應(yīng)用,由我們的生態(tài)合作伙伴提供這樣的服務(wù)給大家,我們不會自己去做。 我們也沒有那么多人去做這樣具體落地的事情。

Q :聽起來 Omniverse 平臺主要是給 Autodesk 等產(chǎn)品提供一個標(biāo)準(zhǔn)的數(shù)據(jù)格式是嗎?

A : 是的。

Q :現(xiàn)在 Autodesk 也有數(shù)據(jù)格式,而且也是比較公開的格式。英偉達的數(shù)據(jù)格式相對以前的來講有什么優(yōu)勢嗎,會有什么改進嗎?

A : 其實 Autodesk 和達索都嘗試推出類似 Omniverse 平臺的產(chǎn)品,但都沒有成功。其核心的邏輯在于 Autodesk 和達索都不會使用對方的產(chǎn)品,比如 Autodesk 競爭對手可能有幾十家,它要推出自己的格式讓大家去用的話,那幾十家都要使用它的格式,但大家都是它的競爭對手。所以這件事情只有硬件公司,在它們利益范圍之外的平臺,中立的平臺才會做成,就是這么簡單。我們選擇的是 USD 格式,這是皮克斯 2016 年提出的,是免費開源的。

Q :剛才你提到 GAN 這個算法,主要用在動畫制作上,工業(yè)設(shè)計上基本上用不到的對嗎?

A :剛才我提到的工具都是我們的探索,未來某一天也許會提出工業(yè)相關(guān)的 GAN 算法生成。

Q :使用我們平臺的話可以把設(shè)計的文件包大小縮減,是說我們把一部分放在云端了嗎?

A :它是 USD 技術(shù),可以輕量化,并沒有放在云端,它的結(jié)構(gòu)就是顛覆的。文件大小的縮小,純粹是 USD 的優(yōu)勢,這是最核心的。如果大家對這個感興趣,可以上網(wǎng)搜一下 USD ,這是非常偉大的發(fā)明。

本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/quan/53859.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2021-12-22 14:03
下一篇 2021-12-22 15:47

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論