Sora之后，視頻生成公司如何生存？| 對話魔琺創(chuàng)始人柴金祥

文｜郝 ?? 鑫

爆火于元宇宙，轉(zhuǎn)而銷聲匿跡，又在大模型來臨后死灰復(fù)燃，眼看著一波波創(chuàng)業(yè)公司倒在黎明前，一波波新生力量又在風(fēng)口爆發(fā)后崛起，風(fēng)險與機會齊飛。

想要在曲折而不確定性的虛擬人賽道找尋發(fā)展的確定性，通過虛擬人來穿越技術(shù)和經(jīng)濟的發(fā)展周期成為一件極其困難的事情。

魔琺科技，這家從元宇宙開始到現(xiàn)在始終堅持3D虛擬人方向的公司，用每個階段不同的技術(shù)探索以及對虛擬人的認(rèn)知更新來回答“如何穿越周期”這個問題。

不管行業(yè)如何變化，自成立至今，魔琺一直在探索3D虛擬人的生成路徑。

2018年成立初期，魔琺將構(gòu)建元宇宙的基礎(chǔ)設(shè)施為核心目標(biāo)，并提出了“虛擬+X”的概念，掌握了全棧式的虛擬內(nèi)容智能化制作技術(shù)，打造了虛擬直播和線下實時互動產(chǎn)品以及三維AI虛擬人能力平臺。

2023年，大模型和AIGC技術(shù)讓虛擬人實現(xiàn)突破，魔琺重新定義AIGC時代的虛擬人，并發(fā)布了虛擬人直播 AIGC 平臺 “ 魔琺有光”、虛擬人視頻 AIGC 平臺 “ 魔琺有言 ”和虛擬人服務(wù) AIGC 平臺 “ 魔琺有靈 ”，三款超寫實 3D 虛擬人產(chǎn)品。

Sora之后，視頻生成公司如何生存？| 對話魔琺創(chuàng)始人柴金祥

魔琺CEO柴金祥表示：“3D虛擬人具有高質(zhì)量超寫實形象，能表達(dá)，可互動，且是AIGC生成的”，要同時具備超寫實3D形象、生動的表達(dá)能力和垂直領(lǐng)域的專業(yè)能力。

從更宏觀的角度，柴金祥認(rèn)為，“文生文、文生圖、文生視頻都只不過是AIGC的能力，而AIGC演進(jìn)的終極形態(tài)一定是3D虛擬人。”

2024年開年，Sora炸翻了天，令國內(nèi)的創(chuàng)業(yè)公司和投資人感到震驚和恐慌。在這樣的背景下，手握3D虛擬人AIGC視頻生成平臺且已經(jīng)開始產(chǎn)品化的魔琺，顯得格外冷靜。

柴金祥認(rèn)為，Sora的路線不一定適合中國企業(yè)，Sora走2D視頻生成路線，更適合創(chuàng)意類視頻生成；魔琺選擇走3D視頻生成路線，滿足企業(yè)對信息復(fù)雜度、精準(zhǔn)性輸出的需求。

回顧魔琺的發(fā)展，其核心能力是在3D虛擬人的核心能力上做加法，以前是3D虛擬人+元宇宙，現(xiàn)在是3D虛擬人AIGC+圖文、視頻，再加電商直播、教育、文旅等千行百業(yè)。變的是整個時代發(fā)展脈絡(luò)，不變的是核心技術(shù)能力和產(chǎn)品能力。

在與行業(yè)結(jié)合的過程中，柴金祥形成了自己對科技公司商業(yè)化的思考。他認(rèn)為，對魔琺在內(nèi)的所有科技企業(yè)來說最重要的還是PMF（Product Market Fit 產(chǎn)品市場匹配度），即能不能找到更契合市場的產(chǎn)品，多長時間能得到驗證。此外就是，在這款產(chǎn)品的增長過程中，能不能實現(xiàn)規(guī)?；?/p>

柴金祥介紹，魔琺從早期做項目再到產(chǎn)品化就是在不斷尋找規(guī)?；耐黄泣c，“現(xiàn)在3D虛擬人視頻生成產(chǎn)品的成本基本是GPU的成本”，如果有一天達(dá)到了PMF，后面的任務(wù)就是持續(xù)保持用戶增長。

帶著這樣的視角，光錐智能對話魔琺創(chuàng)始人兼CEO柴金祥，深入理解魔琺穿越技術(shù)周期的思路以及對虛擬人產(chǎn)品化的實踐。

核心觀點如下：

1、文生視頻存在兩條路徑：一條是Sora，用大規(guī)模視頻數(shù)據(jù)訓(xùn)練大模型，生成2D視頻內(nèi)容；一條是3D內(nèi)容的AIGC，通過3D物理引擎渲染生成視頻。

2、魔琺要做的是3D超寫實虛擬AIGC+X，每家企業(yè)都能有一個AIGC 3D虛擬人，這個虛擬人有形象、會表達(dá)且夠?qū)I(yè)。

3、3D視頻生成的核心難點是缺乏高質(zhì)量的3D數(shù)據(jù)，其次才是算力、算法。

4、對科技企業(yè)來說最重要的還是PMF（Product Market Fit 產(chǎn)品市場匹配度），即能不能找到更契合市場的產(chǎn)品，多長時間能得到驗證。

5、在OpenAI的延長線上的公司都很危險，Sora更適合創(chuàng)意類視頻生成。

以下為對話實錄：

Q：Sora的爆火點燃了 AI 視頻賽道的戰(zhàn)火，Sora就是最佳路徑嗎？魔琺選擇的是哪條技術(shù)路徑？

A：文生圖片、文生視頻、文生3D從視頻的AIGC角度來說，有兩條核心路徑：一條路徑就是最近比較火的Sora路徑，它生成的是2D視頻，從互聯(lián)網(wǎng)上獲取大量的視頻數(shù)據(jù)來訓(xùn)練大模型，然后輸出生成視頻。像Pika、Runway這些美國公司以前都是走同一個路徑，只是效果做得相對較差，中國現(xiàn)在想完全照搬也不一定能學(xué)成。

還有一條路徑，就是3D內(nèi)容的AIGC，這也是魔琺現(xiàn)在選擇的道路。無論國內(nèi)外，三維內(nèi)容AIGC大家多多少少都有聽過，但是沒見過產(chǎn)品，也沒見過好的Demo，導(dǎo)致對3D內(nèi)容的AIGC其實缺乏一定的概念。

Q：什么是3D虛擬人AIGC產(chǎn)品？

A：我們定義里的3D虛擬人，我自己認(rèn)為它是一種最高級的內(nèi)容形態(tài)。意思是說，通過虛擬人可以復(fù)制無窮個自己，從而打破時間、空間的限制，也能和任意的節(jié)點產(chǎn)生聯(lián)系和互動，達(dá)到一種隨時在線的狀態(tài)。我們認(rèn)為它是比圖文、比視頻更高級的形態(tài)，因為它是把所有東西都結(jié)合起來，本質(zhì)上是一個智能體。

Sora之后，視頻生成公司如何生存？| 對話魔琺創(chuàng)始人柴金祥

我們的AIGC體現(xiàn)在哪里？視頻里人物的所有表達(dá)都是AIGC生成的，包括他的表情、眼神、手勢、動作、聲音等等。現(xiàn)在，AIGC的功能體現(xiàn)是文本腳本生成，我們3月底的下一個版本，大家會看到把我們自己的大模型、文本大模型結(jié)合進(jìn)去，用戶直接輸入prompt 就能完成操作。

Q：虛擬人賽道的廠商和企業(yè)眾多，魔琺如何定位自身，差異性體現(xiàn)在哪里？

A：魔琺要做的是3D超寫實虛擬AIGC+X，從我們的愿景來講，希望每家企業(yè)都能有一個AIGC 3D虛擬人，這個虛擬人有形象、會表達(dá)且夠?qū)I(yè)。視頻就是“+”的一種方式，直播也是“＋”，一對一互動也是“＋”，各個行業(yè)也是“＋”。3D 虛擬人不是個單體，比如做視頻，不能只有 3D 虛擬人，要做綜合性的產(chǎn)品，做直播的時候也不能只有個虛擬人，做一對一交互的時候也是，核心就是通過產(chǎn)品去賦能千行百業(yè)。

值得一提的是，大概在半年以后，我們可能把3D超寫實虛擬人AIGC全棧能力開放出去，打造一個像 ChatGPT一樣的開放平臺，無論C端還是B端用戶，都可以通過調(diào)用API，來使用魔琺的技術(shù)能力。

我們把魔琺定位為一家產(chǎn)品驅(qū)動的公司，思考和做抉擇都圍繞著：技術(shù)有沒有用，能不能落地到產(chǎn)品中，產(chǎn)品能不能給用戶和客戶帶來價值等幾個關(guān)鍵性問題。

Q：您覺得3D視頻生成的難點有哪些？魔琺有哪些能力是Sora所不具備的？

A：最核心的難點是缺乏高質(zhì)量的3D數(shù)據(jù)。雖然理論上講文生圖、文生視頻的訓(xùn)練數(shù)據(jù)可以從網(wǎng)上獲得，但這跟3D訓(xùn)練數(shù)據(jù)根本不是一回事兒，即使是國內(nèi)外的動畫公司和游戲公司所訓(xùn)練的3D內(nèi)容數(shù)據(jù)質(zhì)量也是非常差的。解決了3D數(shù)據(jù)來源的問題，才能在這基礎(chǔ)上拼算法和算力。

魔琺3D的AIGC產(chǎn)品能覆蓋到Sora不能涉及的場景。Sora現(xiàn)在所能呈現(xiàn)的視頻基本上全是創(chuàng)意類的視頻，當(dāng)用戶想去生成內(nèi)容信息密度高、又要求精準(zhǔn)表達(dá)的視頻時，它是無法做到的，比如知識分享、發(fā)布會、教育培訓(xùn)類的場景。而我們所針對的恰恰是這類場景，在這里面，我們希望能做到準(zhǔn)確傳遞信息、精準(zhǔn)控制內(nèi)容生成、內(nèi)容可控和可編輯。

Sora之后，視頻生成公司如何生存？| 對話魔琺創(chuàng)始人柴金祥

Q:針對3D數(shù)據(jù)匱乏這個難點，魔琺是怎么解決這個問題的？

A：在過去五六年，我們一直在堅持兩件事情，一是底層根技術(shù)的提升，以前PGC時代，你可能要找十個人，干幾個月才能做一個3D虛擬人，或者找兩三個人做幾周，才能完成場景的搭建，但現(xiàn)在可能幾分鐘就能實現(xiàn)。

二是3D美術(shù)質(zhì)量的提升，大家可以看我們虛擬人整體的質(zhì)量，包括場景、人物、美術(shù)，整個都在不斷地提升。同時我們也在服務(wù)B端企業(yè)的過程中，做了很多數(shù)據(jù)的沉淀，這個數(shù)據(jù)不是說我今天一下子做的，而是在過去五六年過程中不停地積累。

Q：對于科技公司而言，前期投入成本很大，在虛擬人這個行業(yè)同樣存在這個問題，魔琺是如何理解盈利問題的？

A：對魔琺在內(nèi)的所有科技企業(yè)來說最重要的還是PMF，即能不能找到更契合市場的產(chǎn)品，多長時間能得到驗證。此外就是，在這款產(chǎn)品的增長過程中，能不能實現(xiàn)規(guī)?；?/strong>

科技跟其他所有公司屬性不一樣的點就是爆發(fā)力，一家科技公司的壁壘應(yīng)該很高，假如找到了市場契合的產(chǎn)品，后面應(yīng)該得以爆發(fā)。但是不幸的是，我們看過去十年的AI公司，即使上市也存在持續(xù)虧損的狀態(tài)，原因在于其沒有找到一款爆發(fā)性的產(chǎn)品，所以沒有看到它在某一個點，實現(xiàn)指數(shù)性的增長。但在產(chǎn)品行業(yè)，爆發(fā)性增長的例子比比皆是，在國外，不一定非得是AI，ChatGPT、Canva、Figma 都是在產(chǎn)品和市場匹配后，實現(xiàn)了快速的增長。

魔琺的早期一直在做項目，這意味著在某一點很難去規(guī)?；?，這就是為什么從兩年前開始，下定決心要做產(chǎn)品化。像我們現(xiàn)在的這款產(chǎn)品，所有的成本都是GPU的成本，C端也好，B端也好，不管有多少用戶，對我們成本都是一樣的。如果有一天我們達(dá)到了PMF，后面要做的事就是保持用戶增長即可。

Q：元宇宙時期虛擬人的造價成本非常高昂，隨著AIGC技術(shù)的落地，虛擬人成本降低了多少？

A：最早時候，企業(yè)定制形象成交價在60萬以上，落實到我們自己成本也要幾十萬。而現(xiàn)在，你能看到的企業(yè)的形象定制化虛擬人，成本已經(jīng)降至很低的價格。再往后，發(fā)展到今年的6、7月份，當(dāng)普通用戶都能用AIGC生成圖片、捏臉時，我們的成本基本趨近于零。

在整個過程中，技術(shù)的進(jìn)步使得內(nèi)容生產(chǎn)變得越來越簡單，將經(jīng)歷PGC、UGC再到AIGC的發(fā)展曲線。無論是文本、圖片、視頻還是3D，AI的價值就在于使內(nèi)容制作門檻越來越低，企業(yè)成本越來越低，內(nèi)容生成質(zhì)量越來越好。

Q：您提到3D虛擬人終點是一個智能體，需要把最好的經(jīng)驗去復(fù)制。那魔琺是怎么實現(xiàn)各個行業(yè)的結(jié)合和復(fù)制的？

A：虛擬人要有形象、會表達(dá)、有技能，當(dāng)把虛擬人定義成一個賺錢工具時，企業(yè)在意的是ROI和轉(zhuǎn)化率。想要效果好，就需要最佳實踐。

以電商直播場景為例，我們虛擬人訓(xùn)練的所有聲音、動作都找了演員去模擬。AI的方式就是復(fù)制最優(yōu)秀的，這里面包括了主播的聲音、表達(dá)方式、話術(shù)。要是深入研究，你就會發(fā)現(xiàn)，主播大促，淘寶和抖音不同平臺以及不同品類的話術(shù)表達(dá)都是不同的，講品過程邏輯也是不同的。所以看似ChatGPT 也能做同樣的事情，但要和具體產(chǎn)業(yè)結(jié)合仍然需要很長的時間。

Q：Sora的升溫也讓國內(nèi)視頻生成賽道的初創(chuàng)企業(yè)受到了關(guān)注，您如何看待未來的競爭格局？

A：從路徑上分化，就是剛才提到的以Sora為代表的2D視頻生成路線，和魔琺選擇的3D視頻生成路線。

一個很殘酷的事實是，在OpenAI的延長線上的公司都很危險。你可以去問一些投資人，在年前Sora還沒出來的時候，盡管一些創(chuàng)業(yè)公司還在demo階段，投資人可能已經(jīng)有意向去投資，甚至部分協(xié)議都簽完了。但是，Sora一出來就全部不投了。這個事已經(jīng)證明，創(chuàng)業(yè)公司但凡在OpenAI的延長線上，都可能會面臨被顛覆的命運，現(xiàn)在的Pika、Runway在市場競爭處境也變得很艱難。

目前Sora產(chǎn)品沒有公開，且不可編輯、時長也有限制，未來它也可以彌補這些不足。但到底技術(shù)迭代發(fā)展的曲線是陡峭還是平緩？還是不確定的，你今天說他很陡峭，難道他一直會很陡峭嗎？Sora這條路，我認(rèn)為如果做出來，更適合創(chuàng)意類視頻生成。

本文來自投稿，不代表增長黑客立場，如若轉(zhuǎn)載，請注明出處：http://allfloridahomeinspectors.com/cgo/115054.html