AI中場戰(zhàn)事:階躍星辰加速卷Agent落地

讓大模型落地到產(chǎn)業(yè)當(dāng)中

DeepSeek爆火,讓整個(gè)大模型行業(yè)重燃對技術(shù)的熱情。

如同一場祛魅儀式,DeepSeek以高效率和低成本的方式,驗(yàn)證了強(qiáng)化學(xué)習(xí)路線的可行性,從而打破了OpenAI、Anthropic等頭部閉源大模型的技術(shù)壟斷。從今以后,大家都可以通過蒸餾的方式,獲得高質(zhì)量數(shù)據(jù)和性能媲美頭部模型的小參數(shù)模型。

開源在行業(yè)中蔚然成風(fēng),“六小虎”之一的階躍星辰,不久前接連發(fā)布兩款最強(qiáng)開源多模態(tài)。截至目前,階躍星辰已經(jīng)是業(yè)內(nèi)基座模型矩陣最全面的公司之一。

據(jù)光子星球了解,階躍星辰圖生視頻開源模型,即將在3月份發(fā)布?!耙曈X+推理”方向的新模型,也正在加緊研發(fā)當(dāng)中。

技術(shù)上的開源,讓構(gòu)建應(yīng)用和場景落地變得更簡單。階躍星辰創(chuàng)始人、CEO姜大昕判斷,由于多模態(tài)能力和慢思考能力的雙重突破,Agent已經(jīng)來到了爆發(fā)的臨界點(diǎn)。

“每個(gè)人都希望有一個(gè)Jarvis,這一愿望也許將在不久實(shí)現(xiàn)。”

姜大昕表示,無論是AI手機(jī)、PC、智能汽車、IoT設(shè)備還是機(jī)器人,未來每一臺終端設(shè)備都將會(huì)有一個(gè)Agent。Agent會(huì)用多模態(tài)的方式與人類交互,幫助我們完成復(fù)雜任務(wù)。

AI中場戰(zhàn)事:階躍星辰加速卷Agent落地

押注智能終端和垂類場景Agent方向,階躍星辰打響今年大模型技術(shù)應(yīng)用的第一槍。

2月21日,在首屆Step UP生態(tài)開放日上,階躍星辰再次闡述技術(shù)進(jìn)化路線圖,并宣布與吉利汽車集團(tuán)、OPPO、智元機(jī)器人等企業(yè)合作關(guān)系。同時(shí),與新零售、金融財(cái)經(jīng)、內(nèi)容創(chuàng)作、數(shù)字人等產(chǎn)業(yè)合作伙伴,共同打造垂直場景下C端應(yīng)用,探索B端業(yè)務(wù)AI生產(chǎn)力新價(jià)值。

從多模態(tài)到Agent

階躍星辰是國內(nèi)少有在入場初期,就有清晰路線規(guī)劃圖的公司。按照其AGI路線圖,分為三個(gè)階段,模擬世界、探索世界和歸納世界。

具體來看,在模擬世界的階段,訓(xùn)練大模型的主要范式是模仿學(xué)習(xí)。學(xué)習(xí)各種模態(tài)的表征,包括從文本、聲音、圖像、視頻一直到4D時(shí)空的物理世界。需要解決的關(guān)鍵問題是,如何用神經(jīng)網(wǎng)絡(luò)統(tǒng)一表征,統(tǒng)一從簡單到復(fù)雜的各種模態(tài)。

當(dāng)模型學(xué)會(huì)了表征世界以后,下一步就要培養(yǎng)模型解決問題的能力,比如解數(shù)學(xué)題、寫代碼,以及泛化到各個(gè)領(lǐng)域的復(fù)雜問題,這就是探索世界階段。智能的下一個(gè)階段,是機(jī)器通過自主學(xué)習(xí),主動(dòng)發(fā)現(xiàn)物理規(guī)律。

目前,階躍星辰已經(jīng)形成了從千億參數(shù)到萬億參數(shù),從語言模型到多模態(tài)模型,從多模理解到多模生成,從模仿學(xué)習(xí)到強(qiáng)化學(xué)習(xí)的模型矩陣。

伴隨開源程度的加大,階躍星辰過去在多模態(tài)領(lǐng)域的積累被更多人看到。

AI中場戰(zhàn)事:階躍星辰加速卷Agent落地

開源的文生視頻Step-Video-T2V,參數(shù)量300億,可直接生成204幀、分辨率540P的高質(zhì)量視頻,是目前世界參數(shù)量最大的開源視頻生成模型。Step-Audio是行業(yè)內(nèi)首個(gè)產(chǎn)品級的開源語音交互模型,參數(shù)量達(dá)到1300億。在LlamaQuestion、Web Questions等幾個(gè)主流公開測試集中,模型性能均超過了行業(yè)內(nèi)同類型開源模型。

OpenAI o1、DeepSeek-R1誕生后,大模型篇章翻到新一頁,邁入推理時(shí)代,也是階躍星辰預(yù)判的“探索世界”階段。可以說,從過去到現(xiàn)在,階躍星辰一直在既有的軌道行駛。

其和清華大學(xué)合作推出的Open-Reasoner-Zero,背后也采用了和OpenAI的o系列模型類似的強(qiáng)化學(xué)習(xí)算法。在原有基礎(chǔ)上,該模型實(shí)現(xiàn)了推理能力和效率的同步提升。例如在GPQA(專為研究生級別設(shè)計(jì)的問答基準(zhǔn)數(shù)據(jù)集)上,僅用4%迭代次數(shù),就超越了相同尺寸模型采用DeepSeek-R1-Zero方案的分?jǐn)?shù),其訓(xùn)練效率提高了25倍。據(jù)悉,這一探索的所有實(shí)驗(yàn)結(jié)果、代碼、數(shù)據(jù)以及論文也都計(jì)劃開源。

此外,階躍星辰正在研發(fā)“視覺推理模型”,把強(qiáng)化學(xué)習(xí)的方法引入到視覺領(lǐng)域,實(shí)現(xiàn)在視覺空間下的慢思考。DeepSeek-R1能力停留在文本模型層面,但視覺和文本一樣,遇到復(fù)雜問題還是需要思維鏈和推理。比如,沿著箭頭行人要到達(dá)某個(gè)商店,要達(dá)到目的地,就需要連續(xù)跟著箭頭移動(dòng),這就是視覺慢思考過程。

至此,階躍星辰完成了在多模態(tài)和推理能力的突破積累。姜大昕認(rèn)為這恰恰是Agent爆發(fā)的兩個(gè)必要條件。

他解釋,多模態(tài)能力能讓智能體充分感知和理解世界,也能更好地理解用戶任務(wù)。此外,要想提升任務(wù)完成率,Agent還需要強(qiáng)大的推理能力,也就是所謂的慢思考。

基于上述的判斷,階躍星辰最新發(fā)力方向,放在了智能終端Agent和垂類Agent上。近期,手機(jī)、PC、智能汽車、IoT設(shè)備以及機(jī)器人在AI加持下,隱隱有爆發(fā)之勢。智能終端Agent成為重中之重,推演智能終端Agent發(fā)展,姜大昕劃分為了五個(gè)階段。

AI中場戰(zhàn)事:階躍星辰加速卷Agent落地

Level 1是能夠完成簡單任務(wù),往往是一個(gè)App就能完成的任務(wù),例如打開支付寶,在螞蟻森林里收集能量;Level 2是能夠完成組合任務(wù),可能需要多個(gè)步驟,跨越多個(gè)App;Level 3是完成復(fù)雜任務(wù),需要深度思考能力,具體案例可參考OpenAI發(fā)布的“Deep Research”功能。

Level 4執(zhí)行任務(wù),從被動(dòng)完成任務(wù)變成可以主動(dòng)提示或完成任務(wù),這需要對用戶環(huán)境以及用戶偏好有非常深入的了解;Level 5從智商上升到情商,可以理解用戶在物理世界發(fā)生的種種,做到感同身受,提供情緒價(jià)值和情感陪伴。

布局Agent端側(cè)全產(chǎn)業(yè)

階躍星辰的智能終端Agent第一步落子,重點(diǎn)布局“車+手機(jī)+IoT+具身智能”端側(cè)全產(chǎn)業(yè)。

四個(gè)細(xì)分領(lǐng)域未來發(fā)展都需要依賴高級Agent的“智商+情商”。在服務(wù)于人的過程中,既需要智能解決出行、生活、工作的大小問題,也時(shí)刻處于人與機(jī)器和人與人的關(guān)系之中。當(dāng)硬件具備的人的情感,將有機(jī)會(huì)重構(gòu)終端與人的關(guān)系。

Agent代表著一種全新的分發(fā)邏輯,它就像一個(gè)集中接收器,可以讓終端繞過細(xì)分應(yīng)用,直接給用戶提供服務(wù)。Agent作為中臺的角色,統(tǒng)一指揮調(diào)度,每個(gè)硬件就負(fù)責(zé)觸達(dá)用戶和解決問題。于是,統(tǒng)一的軟硬一體生態(tài)供給和服務(wù)變成了關(guān)鍵,生態(tài)越完善,用戶所能享受到的便利就越多。

屆時(shí),用戶將不在乎服務(wù)的提供商是誰,需要的是可靠、高性能和低價(jià)的服務(wù),硬件的重要性就會(huì)進(jìn)一步凸顯。

階躍星辰大模型技術(shù)的產(chǎn)業(yè)落地,可能也是Agent生態(tài)形成的第一步。

面向智能汽車,階躍星辰與吉利汽車集團(tuán)、千里科技深化技術(shù)合作,共同推動(dòng)“AI+車”的深度融合。此前,階躍星辰與吉利聯(lián)合開源了Step系列模型。吉利在整車制造、智算平臺、衛(wèi)星網(wǎng)絡(luò)等領(lǐng)域具有基建優(yōu)勢,千里科技的產(chǎn)品創(chuàng)新能力以及階躍星辰在多模態(tài)大模型的技術(shù)積累,三方將構(gòu)建包含“算力中心、大模型、智能架構(gòu)、智駕、智艙、芯片、手機(jī)、衛(wèi)星、飛行器”的完整智能化生態(tài)。

AI中場戰(zhàn)事:階躍星辰加速卷Agent落地

車正在從單純的行駛工具變?yōu)榇怪睉?yīng)用場景,幾乎每個(gè)域(動(dòng)力、底盤、座艙、自動(dòng)駕駛、車身)都為Agent落地提供了諸多想象力。用戶感知最明顯是座艙域的交互。

座艙智能化喊了很多年,此前能實(shí)現(xiàn)的功能依然很表面,停留在空調(diào)溫度控制和按摩檔次簡單需求。當(dāng)大模型決策能力和用車環(huán)境、用戶需求和具體場景結(jié)合,應(yīng)該做到提前預(yù)判。用車的過程中,用戶還沒提要求,大模型已經(jīng)在悄無聲息中解決了潛在的問題。

另一方面體現(xiàn)在類人情感化上,吉利已經(jīng)和階躍多模態(tài)大模型進(jìn)行了很多探索。把文本、語音、視頻能力融合,結(jié)合用戶用車情緒做交互,進(jìn)一步提升用戶的愉悅程度。未來,當(dāng)用戶的用車時(shí)間變長,車可能就從交通工具轉(zhuǎn)變?yōu)榈谌臻g。人與車的關(guān)系被重構(gòu)后,隨之也將延伸出更多情感陪伴的需求。

面向手機(jī)終端,階躍星辰與手機(jī)廠商共建,將Agent技術(shù)深度集成到手機(jī)中,共同打造更好的交互體驗(yàn)。2月19日,OPPO推出的旗艦機(jī)型OPPO Find N5背后就搭載了階躍星辰多模態(tài)大模型。

AI中場戰(zhàn)事:階躍星辰加速卷Agent落地

包括蘋果在內(nèi)的手機(jī)廠商都在找尋大模型合作伙伴,打造類Apple Intelligence功能。智能手機(jī)幾乎變成了用戶剛需,因?yàn)楦哳l和快速反應(yīng),對多模態(tài)能力要求更高。階躍星辰自身的智能助手“躍問”曾做過嘗試,把視覺搜索功能“拍照問”接入了iPhone16的相機(jī)控制按鈕。

OPPO智能助理部部長、小布助手負(fù)責(zé)人萬玉龍表示,隨著新一代AI技術(shù)與移動(dòng)終端的深度融合,手機(jī)已經(jīng)逐步進(jìn)化為能夠理解用戶意圖、提供主動(dòng)服務(wù)、甚至預(yù)判用戶需求的智能助理。

基于階躍Step系列多模態(tài)模型,OPPO打造了“一鍵問屏”和“一鍵全能搜”兩大AI手機(jī)功能。用戶使用小布助手App,可以通過多模態(tài)視覺跟AI交互,實(shí)現(xiàn)拍照問答、文檔問答,識屏問答等多種功能。此外,用戶只需對小布助手下達(dá)指令,AI就可以獨(dú)立進(jìn)入各種App端完成任務(wù),比如一鍵搜所有。

此外,在具身智能領(lǐng)域,階躍星辰宣布了與智元機(jī)器人的戰(zhàn)略合作,共同探索AI+具身機(jī)器人應(yīng)用場景。

在IoT終端,其通過生態(tài)開放的方式,與包括TCL在內(nèi)的一系列IoT平臺和設(shè)備廠商協(xié)作,推動(dòng)設(shè)備間的智能化升級和體驗(yàn)的無縫連接。

與行業(yè)共建

此前,階躍星辰與開發(fā)者合作將多模態(tài)技術(shù)運(yùn)用到AI應(yīng)用開發(fā)中,打造過一系列爆款。

“物圓”是國內(nèi)首個(gè)面向C端用戶的AI電商應(yīng)用;“胃之書”沖上App Store美食類暢銷榜前三名;“林間聊愈室”獲蘋果應(yīng)用商店編輯推薦;ChatPPT?有注冊用戶突破300萬,累計(jì)服務(wù)B端平臺用戶超千萬。

此次與金融財(cái)經(jīng)、內(nèi)容創(chuàng)作、新零售、數(shù)字人的合作,可以視為進(jìn)一步深入產(chǎn)業(yè)的動(dòng)作。大模型技術(shù)從實(shí)驗(yàn)室走向行業(yè)場景,一方面驗(yàn)證技術(shù)積累的能力,另一方面也是加速大模型商業(yè)化,形成技術(shù)到應(yīng)用的正向創(chuàng)新反饋路徑。

活動(dòng)當(dāng)天,階躍星辰與咖啡連鎖品牌瑞幸咖啡、通用GPU高端芯片及超級算力系統(tǒng)提供商天數(shù)智芯共同宣布達(dá)成戰(zhàn)略合作。國內(nèi)首個(gè)集新零售品牌、基座模型公司、算力服務(wù)商三方于一體的“AI+新零售”合作模式,打通了從技術(shù)研發(fā)到消費(fèi)場景的閉環(huán)。

在金融財(cái)經(jīng)領(lǐng)域,2024年,階躍星辰跟上海報(bào)業(yè)旗下界面財(cái)聯(lián)社達(dá)成深度戰(zhàn)略合作,聯(lián)合創(chuàng)辦大模型科技公司財(cái)躍星辰,率先探索大模型在金融財(cái)經(jīng)領(lǐng)域的應(yīng)用。

AI中場戰(zhàn)事:階躍星辰加速卷Agent落地

在B端,結(jié)合界面財(cái)聯(lián)社的金融信息服務(wù)優(yōu)勢和階躍星辰的通用大模型技術(shù),整合行業(yè)數(shù)據(jù)、行業(yè)經(jīng)驗(yàn)和大模型底座能力,致力于為金融機(jī)構(gòu)、投資機(jī)構(gòu)、個(gè)人投資者等提供數(shù)據(jù)、算力、模型、應(yīng)用、智能體等一站式解決方案。

在C端,雙方合作推出了“AI小財(cái)神”智能體應(yīng)用,主打AI數(shù)據(jù)挖掘、AI對話、AI熱點(diǎn)信息解讀等功能。目前,該款應(yīng)用已經(jīng)上線了“深度思考”模式。面對復(fù)雜的投資理財(cái)問題,“AI小財(cái)神”會(huì)先進(jìn)行思考,再回復(fù)用戶。用戶能看到大模型的推理路徑,以及援引信源和數(shù)據(jù)庫。

隨著時(shí)間的推移,人們開始形成共識,大模型這件事不是單打獨(dú)斗,生態(tài)的重要性越來越凸顯。

開源的大模型生態(tài)允許全球開發(fā)者共同參與代碼優(yōu)化,使得模型的性能提升不再局限于單個(gè)團(tuán)隊(duì)的智慧。

在應(yīng)用拓展層面,大模型生態(tài)正在與千行百業(yè)深度融合。不同領(lǐng)域的企業(yè)可以基于大模型開發(fā)出適配自身業(yè)務(wù)特點(diǎn)的專業(yè)應(yīng)用,釋放技術(shù)創(chuàng)新潛力。通過與開發(fā)者緊密合作,深度融入各個(gè)行業(yè)場景,階躍星辰正在構(gòu)建一個(gè)開放、共贏的大模型生態(tài)系統(tǒng)。

積極擁抱開源,堅(jiān)持在AGI的技術(shù)路線上繼續(xù)前行,牽手合作伙伴共創(chuàng)產(chǎn)業(yè)價(jià)值,這將是階躍星辰接下來繼續(xù)前進(jìn)的底氣。

 

本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/cgo/131328.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2025-02-24 15:38
下一篇 2025-02-24 18:32

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論