DeepSeek爆火，讓整個(gè)大模型行業(yè)重燃對技術(shù)的熱情。

如同一場祛魅儀式，DeepSeek以高效率和低成本的方式，驗(yàn)證了強(qiáng)化學(xué)習(xí)路線的可行性，從而打破了OpenAI、Anthropic等頭部閉源大模型的技術(shù)壟斷。從今以后，大家都可以通過蒸餾的方式，獲得高質(zhì)量數(shù)據(jù)和性能媲美頭部模型的小參數(shù)模型。

開源在行業(yè)中蔚然成風(fēng)，“六小虎”之一的階躍星辰，不久前接連發(fā)布兩款最強(qiáng)開源多模態(tài)。截至目前，階躍星辰已經(jīng)是業(yè)內(nèi)基座模型矩陣最全面的公司之一。

據(jù)光子星球了解，階躍星辰圖生視頻開源模型，即將在3月份發(fā)布?！耙曈X+推理”方向的新模型，也正在加緊研發(fā)當(dāng)中。

技術(shù)上的開源，讓構(gòu)建應(yīng)用和場景落地變得更簡單。階躍星辰創(chuàng)始人、CEO姜大昕判斷，由于多模態(tài)能力和慢思考能力的雙重突破，Agent已經(jīng)來到了爆發(fā)的臨界點(diǎn)。

“每個(gè)人都希望有一個(gè)Jarvis，這一愿望也許將在不久實(shí)現(xiàn)。”

姜大昕表示，無論是AI手機(jī)、PC、智能汽車、IoT設(shè)備還是機(jī)器人，未來每一臺終端設(shè)備都將會(huì)有一個(gè)Agent。Agent會(huì)用多模態(tài)的方式與人類交互，幫助我們完成復(fù)雜任務(wù)。

押注智能終端和垂類場景Agent方向，階躍星辰打響今年大模型技術(shù)應(yīng)用的第一槍。

2月21日，在首屆Step UP生態(tài)開放日上，階躍星辰再次闡述技術(shù)進(jìn)化路線圖，并宣布與吉利汽車集團(tuán)、OPPO、智元機(jī)器人等企業(yè)合作關(guān)系。同時(shí)，與新零售、金融財(cái)經(jīng)、內(nèi)容創(chuàng)作、數(shù)字人等產(chǎn)業(yè)合作伙伴，共同打造垂直場景下C端應(yīng)用，探索B端業(yè)務(wù)AI生產(chǎn)力新價(jià)值。

從多模態(tài)到Agent

階躍星辰是國內(nèi)少有在入場初期，就有清晰路線規(guī)劃圖的公司。按照其AGI路線圖，分為三個(gè)階段，模擬世界、探索世界和歸納世界。

具體來看，在模擬世界的階段，訓(xùn)練大模型的主要范式是模仿學(xué)習(xí)。學(xué)習(xí)各種模態(tài)的表征，包括從文本、聲音、圖像、視頻一直到4D時(shí)空的物理世界。需要解決的關(guān)鍵問題是，如何用神經(jīng)網(wǎng)絡(luò)統(tǒng)一表征，統(tǒng)一從簡單到復(fù)雜的各種模態(tài)。

當(dāng)模型學(xué)會(huì)了表征世界以后，下一步就要培養(yǎng)模型解決問題的能力，比如解數(shù)學(xué)題、寫代碼，以及泛化到各個(gè)領(lǐng)域的復(fù)雜問題，這就是探索世界階段。智能的下一個(gè)階段，是機(jī)器通過自主學(xué)習(xí)，主動(dòng)發(fā)現(xiàn)物理規(guī)律。

目前，階躍星辰已經(jīng)形成了從千億參數(shù)到萬億參數(shù)，從語言模型到多模態(tài)模型，從多模理解到多模生成，從模仿學(xué)習(xí)到強(qiáng)化學(xué)習(xí)的模型矩陣。

伴隨開源程度的加大，階躍星辰過去在多模態(tài)領(lǐng)域的積累被更多人看到。

開源的文生視頻Step-Video-T2V，參數(shù)量300億，可直接生成204幀、分辨率540P的高質(zhì)量視頻，是目前世界參數(shù)量最大的開源視頻生成模型。Step-Audio是行業(yè)內(nèi)首個(gè)產(chǎn)品級的開源語音交互模型，參數(shù)量達(dá)到1300億。在LlamaQuestion、Web Questions等幾個(gè)主流公開測試集中，模型性能均超過了行業(yè)內(nèi)同類型開源模型。

OpenAI o1、DeepSeek-R1誕生后，大模型篇章翻到新一頁，邁入推理時(shí)代，也是階躍星辰預(yù)判的“探索世界”階段。可以說，從過去到現(xiàn)在，階躍星辰一直在既有的軌道行駛。

其和清華大學(xué)合作推出的Open-Reasoner-Zero，背后也采用了和OpenAI的o系列模型類似的強(qiáng)化學(xué)習(xí)算法。在原有基礎(chǔ)上，該模型實(shí)現(xiàn)了推理能力和效率的同步提升。例如在GPQA(專為研究生級別設(shè)計(jì)的問答基準(zhǔn)數(shù)據(jù)集)上，僅用4%迭代次數(shù)，就超越了相同尺寸模型采用DeepSeek-R1-Zero方案的分?jǐn)?shù)，其訓(xùn)練效率提高了25倍。據(jù)悉，這一探索的所有實(shí)驗(yàn)結(jié)果、代碼、數(shù)據(jù)以及論文也都計(jì)劃開源。

此外，階躍星辰正在研發(fā)“視覺推理模型”，把強(qiáng)化學(xué)習(xí)的方法引入到視覺領(lǐng)域，實(shí)現(xiàn)在視覺空間下的慢思考。DeepSeek-R1能力停留在文本模型層面，但視覺和文本一樣，遇到復(fù)雜問題還是需要思維鏈和推理。比如，沿著箭頭行人要到達(dá)某個(gè)商店，要達(dá)到目的地，就需要連續(xù)跟著箭頭移動(dòng)，這就是視覺慢思考過程。

至此，階躍星辰完成了在多模態(tài)和推理能力的突破積累。姜大昕認(rèn)為這恰恰是Agent爆發(fā)的兩個(gè)必要條件。

他解釋，多模態(tài)能力能讓智能體充分感知和理解世界，也能更好地理解用戶任務(wù)。此外，要想提升任務(wù)完成率，Agent還需要強(qiáng)大的推理能力，也就是所謂的慢思考。

基于上述的判斷，階躍星辰最新發(fā)力方向，放在了智能終端Agent和垂類Agent上。近期，手機(jī)、PC、智能汽車、IoT設(shè)備以及機(jī)器人在AI加持下，隱隱有爆發(fā)之勢。智能終端Agent成為重中之重，推演智能終端Agent發(fā)展，姜大昕劃分為了五個(gè)階段。

Level 1是能夠完成簡單任務(wù)，往往是一個(gè)App就能完成的任務(wù)，例如打開支付寶，在螞蟻森林里收集能量；Level 2是能夠完成組合任務(wù)，可能需要多個(gè)步驟，跨越多個(gè)App；Level 3是完成復(fù)雜任務(wù)，需要深度思考能力，具體案例可參考OpenAI發(fā)布的“Deep Research”功能。

Level 4執(zhí)行任務(wù)，從被動(dòng)完成任務(wù)變成可以主動(dòng)提示或完成任務(wù)，這需要對用戶環(huán)境以及用戶偏好有非常深入的了解；Level 5從智商上升到情商，可以理解用戶在物理世界發(fā)生的種種，做到感同身受，提供情緒價(jià)值和情感陪伴。

布局Agent端側(cè)全產(chǎn)業(yè)

階躍星辰的智能終端Agent第一步落子，重點(diǎn)布局“車+手機(jī)+IoT+具身智能”端側(cè)全產(chǎn)業(yè)。

四個(gè)細(xì)分領(lǐng)域未來發(fā)展都需要依賴高級Agent的“智商+情商”。在服務(wù)于人的過程中，既需要智能解決出行、生活、工作的大小問題，也時(shí)刻處于人與機(jī)器和人與人的關(guān)系之中。當(dāng)硬件具備的人的情感，將有機(jī)會(huì)重構(gòu)終端與人的關(guān)系。

Agent代表著一種全新的分發(fā)邏輯，它就像一個(gè)集中接收器，可以讓終端繞過細(xì)分應(yīng)用，直接給用戶提供服務(wù)。Agent作為中臺的角色，統(tǒng)一指揮調(diào)度，每個(gè)硬件就負(fù)責(zé)觸達(dá)用戶和解決問題。于是，統(tǒng)一的軟硬一體生態(tài)供給和服務(wù)變成了關(guān)鍵，生態(tài)越完善，用戶所能享受到的便利就越多。

屆時(shí)，用戶將不在乎服務(wù)的提供商是誰，需要的是可靠、高性能和低價(jià)的服務(wù)，硬件的重要性就會(huì)進(jìn)一步凸顯。

階躍星辰大模型技術(shù)的產(chǎn)業(yè)落地，可能也是Agent生態(tài)形成的第一步。

面向智能汽車，階躍星辰與吉利汽車集團(tuán)、千里科技深化技術(shù)合作，共同推動(dòng)“AI+車”的深度融合。此前，階躍星辰與吉利聯(lián)合開源了Step系列模型。吉利在整車制造、智算平臺、衛(wèi)星網(wǎng)絡(luò)等領(lǐng)域具有基建優(yōu)勢，千里科技的產(chǎn)品創(chuàng)新能力以及階躍星辰在多模態(tài)大模型的技術(shù)積累，三方將構(gòu)建包含“算力中心、大模型、智能架構(gòu)、智駕、智艙、芯片、手機(jī)、衛(wèi)星、飛行器”的完整智能化生態(tài)。

車正在從單純的行駛工具變?yōu)榇怪睉?yīng)用場景，幾乎每個(gè)域（動(dòng)力、底盤、座艙、自動(dòng)駕駛、車身）都為Agent落地提供了諸多想象力。用戶感知最明顯是座艙域的交互。

座艙智能化喊了很多年，此前能實(shí)現(xiàn)的功能依然很表面，停留在空調(diào)溫度控制和按摩檔次簡單需求。當(dāng)大模型決策能力和用車環(huán)境、用戶需求和具體場景結(jié)合，應(yīng)該做到提前預(yù)判。用車的過程中，用戶還沒提要求，大模型已經(jīng)在悄無聲息中解決了潛在的問題。

另一方面體現(xiàn)在類人情感化上，吉利已經(jīng)和階躍多模態(tài)大模型進(jìn)行了很多探索。把文本、語音、視頻能力融合，結(jié)合用戶用車情緒做交互，進(jìn)一步提升用戶的愉悅程度。未來，當(dāng)用戶的用車時(shí)間變長，車可能就從交通工具轉(zhuǎn)變?yōu)榈谌臻g。人與車的關(guān)系被重構(gòu)后，隨之也將延伸出更多情感陪伴的需求。

面向手機(jī)終端，階躍星辰與手機(jī)廠商共建，將Agent技術(shù)深度集成到手機(jī)中，共同打造更好的交互體驗(yàn)。2月19日，OPPO推出的旗艦機(jī)型OPPO Find N5背后就搭載了階躍星辰多模態(tài)大模型。

包括蘋果在內(nèi)的手機(jī)廠商都在找尋大模型合作伙伴，打造類Apple Intelligence功能。智能手機(jī)幾乎變成了用戶剛需，因?yàn)楦哳l和快速反應(yīng)，對多模態(tài)能力要求更高。階躍星辰自身的智能助手“躍問”曾做過嘗試，把視覺搜索功能“拍照問”接入了iPhone16的相機(jī)控制按鈕。

OPPO智能助理部部長、小布助手負(fù)責(zé)人萬玉龍表示，隨著新一代AI技術(shù)與移動(dòng)終端的深度融合，手機(jī)已經(jīng)逐步進(jìn)化為能夠理解用戶意圖、提供主動(dòng)服務(wù)、甚至預(yù)判用戶需求的智能助理。

基于階躍Step系列多模態(tài)模型，OPPO打造了“一鍵問屏”和“一鍵全能搜”兩大AI手機(jī)功能。用戶使用小布助手App，可以通過多模態(tài)視覺跟AI交互，實(shí)現(xiàn)拍照問答、文檔問答，識屏問答等多種功能。此外，用戶只需對小布助手下達(dá)指令，AI就可以獨(dú)立進(jìn)入各種App端完成任務(wù)，比如一鍵搜所有。

此外，在具身智能領(lǐng)域，階躍星辰宣布了與智元機(jī)器人的戰(zhàn)略合作，共同探索AI+具身機(jī)器人應(yīng)用場景。

在IoT終端，其通過生態(tài)開放的方式，與包括TCL在內(nèi)的一系列IoT平臺和設(shè)備廠商協(xié)作，推動(dòng)設(shè)備間的智能化升級和體驗(yàn)的無縫連接。

與行業(yè)共建

此前，階躍星辰與開發(fā)者合作將多模態(tài)技術(shù)運(yùn)用到AI應(yīng)用開發(fā)中，打造過一系列爆款。

“物圓”是國內(nèi)首個(gè)面向C端用戶的AI電商應(yīng)用；“胃之書”沖上App Store美食類暢銷榜前三名；“林間聊愈室”獲蘋果應(yīng)用商店編輯推薦；ChatPPT?有注冊用戶突破300萬，累計(jì)服務(wù)B端平臺用戶超千萬。

此次與金融財(cái)經(jīng)、內(nèi)容創(chuàng)作、新零售、數(shù)字人的合作，可以視為進(jìn)一步深入產(chǎn)業(yè)的動(dòng)作。大模型技術(shù)從實(shí)驗(yàn)室走向行業(yè)場景，一方面驗(yàn)證技術(shù)積累的能力，另一方面也是加速大模型商業(yè)化，形成技術(shù)到應(yīng)用的正向創(chuàng)新反饋路徑。

活動(dòng)當(dāng)天，階躍星辰與咖啡連鎖品牌瑞幸咖啡、通用GPU高端芯片及超級算力系統(tǒng)提供商天數(shù)智芯共同宣布達(dá)成戰(zhàn)略合作。國內(nèi)首個(gè)集新零售品牌、基座模型公司、算力服務(wù)商三方于一體的“AI+新零售”合作模式，打通了從技術(shù)研發(fā)到消費(fèi)場景的閉環(huán)。

在金融財(cái)經(jīng)領(lǐng)域，2024年，階躍星辰跟上海報(bào)業(yè)旗下界面財(cái)聯(lián)社達(dá)成深度戰(zhàn)略合作，聯(lián)合創(chuàng)辦大模型科技公司財(cái)躍星辰，率先探索大模型在金融財(cái)經(jīng)領(lǐng)域的應(yīng)用。

在B端，結(jié)合界面財(cái)聯(lián)社的金融信息服務(wù)優(yōu)勢和階躍星辰的通用大模型技術(shù)，整合行業(yè)數(shù)據(jù)、行業(yè)經(jīng)驗(yàn)和大模型底座能力，致力于為金融機(jī)構(gòu)、投資機(jī)構(gòu)、個(gè)人投資者等提供數(shù)據(jù)、算力、模型、應(yīng)用、智能體等一站式解決方案。

在C端，雙方合作推出了“AI小財(cái)神”智能體應(yīng)用，主打AI數(shù)據(jù)挖掘、AI對話、AI熱點(diǎn)信息解讀等功能。目前，該款應(yīng)用已經(jīng)上線了“深度思考”模式。面對復(fù)雜的投資理財(cái)問題，“AI小財(cái)神”會(huì)先進(jìn)行思考，再回復(fù)用戶。用戶能看到大模型的推理路徑，以及援引信源和數(shù)據(jù)庫。

終

隨著時(shí)間的推移，人們開始形成共識，大模型這件事不是單打獨(dú)斗，生態(tài)的重要性越來越凸顯。

開源的大模型生態(tài)允許全球開發(fā)者共同參與代碼優(yōu)化，使得模型的性能提升不再局限于單個(gè)團(tuán)隊(duì)的智慧。

在應(yīng)用拓展層面，大模型生態(tài)正在與千行百業(yè)深度融合。不同領(lǐng)域的企業(yè)可以基于大模型開發(fā)出適配自身業(yè)務(wù)特點(diǎn)的專業(yè)應(yīng)用，釋放技術(shù)創(chuàng)新潛力。通過與開發(fā)者緊密合作，深度融入各個(gè)行業(yè)場景，階躍星辰正在構(gòu)建一個(gè)開放、共贏的大模型生態(tài)系統(tǒng)。

積極擁抱開源，堅(jiān)持在AGI的技術(shù)路線上繼續(xù)前行，牽手合作伙伴共創(chuàng)產(chǎn)業(yè)價(jià)值，這將是階躍星辰接下來繼續(xù)前進(jìn)的底氣。

本文來自投稿，不代表增長黑客立場，如若轉(zhuǎn)載，請注明出處：http://allfloridahomeinspectors.com/cgo/131328.html

AI中場戰(zhàn)事：階躍星辰加速卷Agent落地

從多模態(tài)到Agent

布局Agent端側(cè)全產(chǎn)業(yè)

與行業(yè)共建

終

關(guān)于作者

光子星球優(yōu)創(chuàng)媒體

發(fā)表回復(fù)

AI中場戰(zhàn)事：階躍星辰加速卷Agent落地

從多模態(tài)到Agent

布局Agent端側(cè)全產(chǎn)業(yè)

與行業(yè)共建

終

關(guān)于作者

光子星球優(yōu)創(chuàng)媒體

增長黑客Growthhk.cn薦讀更多>>

Q1劇集市場“繁花”涌現(xiàn)，大劇營銷再出“鮮”招

商業(yè)增長：領(lǐng)先者、落伍者、不甘者的國美躁動(dòng)

為之“毫厘”、追之“千里”，“僅退款”的存廢之爭

谷海松：To B出海，谷歌SEO增長策略｜To B CGO

年收入過億，這家美食網(wǎng)站如何經(jīng)營用戶？

潮流運(yùn)動(dòng)“上新”，年輕人愛上徒步

發(fā)表回復(fù)

商業(yè)增長：領(lǐng)先者、落伍者、不甘者的國美躁動(dòng)

為之“毫厘”、追之“千里”，“僅退款”的存廢之爭

谷海松：To B出海，谷歌SEO增長策略｜To B CGO

年收入過億，這家美食網(wǎng)站如何經(jīng)營用戶？