文/王慧瑩
編輯/子夜
國產(chǎn)大模型追上ChatGPT要多久?
“百模大戰(zhàn)”伊始,這個問題的答案就成為國產(chǎn)大模型廠商的一種執(zhí)念。
五個月前,國內(nèi)市場正掀起一場大模型的熱潮,科大訊飛帶著星火大模型跑步入場,立下了全面對標ChatGPT的“軍令狀”。
“10月24日科大訊飛全球開發(fā)者大會期間,星火有望能夠全面對標ChatGPT:在中文上要超越ChatGPT,在英文上要達到跟它相當?shù)乃健?。彼時,科大訊飛董事長劉慶峰提出這個目標。
盡管市場將信將疑,但科大訊飛給出了一張時間表,并在前天給出了答案。
10月24日,科大訊飛召開全球1024開發(fā)者節(jié)開幕,并發(fā)布了“訊飛星火”認知大模型V3.0。據(jù)劉慶峰介紹,該大模型已全面對標ChatGPT(GPT3.5),英文能力相當,中文能力已實現(xiàn)超越。
圖源科大訊飛微信公眾號
與此同時,科大訊飛還發(fā)布了一系列應用場景。醫(yī)療、教育、編程、汽車等多個垂類賽道都有星火大模型的身影。劉慶峰提到,“大模型首先要能夠在工業(yè)和科研領域造福人類,這才是我們真正解決社會剛需的地方?!?/p>
事實上,過去五個月,科大訊飛已經(jīng)完成了對星火大模型的多次升級。6月9日,星火大模型V1.5發(fā)布,開放式問答、多輪對話及數(shù)學能力升級;8月15日,星火大模型升級至V2.0,突破代碼能力、多模態(tài)交互再升級。
依靠算力、技術的支撐,星火大模型升級迭代速度的確夠快。不過,當同行業(yè)都在用力奔跑時,科大訊飛也必須要面臨技術上和落地場景的考驗。
更重要的是,過去幾年,業(yè)績增速放緩、凈利潤下跌,科大訊飛需要一個新的故事來證明自己,并挽回資本市場信心。作為“A股第一家以人工智能為主業(yè)上市的公司 ”,抓住大模型的意義對于科大訊飛來說不亞于尋找一條新的增長曲線。
當然,大模型行業(yè)的投入并非一朝一夕,科大訊飛還在繼續(xù)投入,劉慶峰又提出了一個新目標——2024年上半年,星火大模型要實現(xiàn)對標GPT-4,新的時間表的提出,也意味著科大訊飛接下來依然要全情投入,這對科大訊飛來說,有動力也有壓力。
1、星火大模型,跑到了哪一步??
“我們?nèi)缙趦冬F(xiàn)了自己給大家的時刻表?!?/strong>
10月24日,科大訊飛全球開發(fā)者大會上,科大訊飛董事長劉慶峰激動地說出這句話,同時發(fā)布了“訊飛星火”認知大模型V3.0。
這對于科大訊飛來說確實不容易。從發(fā)布時間上看,隨著百度文心一言、阿里通義千問的推出,今年5月份科大訊飛的星火大模型姍姍來遲,并不具備先發(fā)優(yōu)勢。
不過,和別家不同的是,從一開始科大訊飛就給出了明確的升級版本時間表。
彼時,科大訊飛方面表示,在2023年內(nèi)預計還會進行三次升級,分批次增強數(shù)學能力、補足代碼能力,希望最終將在10月24日全球開發(fā)者大會期間,能夠全面對標ChatGPT,在中文上要超越ChatGPT,英文上要達到和它相當?shù)乃健?/p>
科大訊飛研究院院長劉聰在接受媒體群訪時談及原因,“定這個東西肯定不是拍腦袋,之所以能立這個 flag,是因為既有技術邏輯,也有我們產(chǎn)品和場景落地的邏輯。”
從科大訊飛宣布的進展來看,經(jīng)歷兩次迭代,訊飛星火大模型先后突破開放式問答、代碼能力,并升級了多輪對話能力、多模態(tài)交互能力。此次,星火V3.0在文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力和多模態(tài)能力7大方面都有了顯著的提升。
其中,星火V3.0最受關注的新功能莫過于虛擬人格功能。在應用過程中,用戶可以通過“友伴”從性格、情緒、表達風格等方面設定AI助手的基本人設,且可以導入特定的知識、相關對話記錄形成個性化的記憶。
據(jù)劉慶峰介紹,科大訊飛根據(jù)《通用認知智能大模型評測體系》構建測試集,采用盲測進行測試,結果顯示:訊飛星火V3.0的中文能力客觀評測已超越ChatGPT。
可以看到,自從入科大訊飛入局以來,ChatGPT就被科大訊飛反復提及,并對標超越。如今,要討論星火大模型是否超過了ChatGPT,一組報告或許可以參考。
根據(jù)國務院發(fā)展中心國研經(jīng)濟研究院的橫評報告,星火大模型綜合能力已超越ChatGPT,實現(xiàn)國內(nèi)領先,國際一流,且在教育、醫(yī)療和法律行業(yè)表現(xiàn)尤為突出。
此外,根據(jù)OpenAI在官網(wǎng)發(fā)布的英文任務測試集,在10月16日至20日的測試中,星火V3.0的英文能力對標ChatGPT48項任務結果相當,二者得分分別為85.1%(星火V3.0)和84.3%。
事實上,星火V3.0是在星火V2.0基礎上的升級,尤其是在數(shù)學能力和代碼能力等上有了明顯的“進化”,也讓星火V3.0趕超ChatGPT3.5成為可能。
在發(fā)布會上,劉慶峰喊出了新一步的目標,預計在2024年上半年將會發(fā)布星火認知大模型V4.0,屆時將會對標GPT4。
不過,盡管科大訊飛提到,星火V3.0綜合能力已經(jīng)超過ChatGPT3.5,但國產(chǎn)大模型仍在一些方面與ChatGPT存在差距,這也增加了星火大模型4.0對標ChatGPT4的難度。
“中國現(xiàn)有的大模型根基實力,與GPT-4仍有差距?!?/strong>劉慶峰坦言,在復雜知識推理、小樣本快速學習、超長文本處理以及跨模態(tài)的統(tǒng)一理解上,國產(chǎn)模型還有不小的差距。
“雖然 flag 立在那,但是客觀來說完成得并沒有那么輕松。每次快開發(fā)布會時,都處于緊急上線的狀態(tài),實際上這個目標還是有挑戰(zhàn)性的。然而,有這樣一個團隊存在,再加上我們之前對 AI 的積累和理解,我們對達到 GPT4 這個水平非常有信心。唯一令人擔心的是我們需要花費多少時間來實現(xiàn)這個目標?!笨拼笥嶏w研究院院長劉聰如是說道。
2、為大模型投入巨大,也需要大模型拉升信心
“遙遙領先,如期而至”,這是發(fā)布會上科大訊飛董事長劉慶峰多次提到的字眼。
看似篤定的話語中,其實透露著劉慶峰和科大訊飛的焦慮。盡管科大訊飛在AI領域有著多年積累,這場國產(chǎn)大模型軍備競賽依舊打得火熱,科大訊飛想要一直對標并超越ChatGPT,難度不小。
眾所周知,大模型是“大數(shù)據(jù)+大算力+強算法”結合的產(chǎn)物,科技企業(yè)的技術底座決定了其AI大模型的應用價值。
對于星火大模型而言,科大訊飛很早就確認了“1+N+X”的生態(tài)布局?!?”是核心的底座,“N”是訊飛自有賽道的自有產(chǎn)品,“X”是生態(tài)。它們之間的關聯(lián)是,底座本身的提升會帶來“N”的提升,也帶來“X”的提升。
這樣的思路之下,今年8月中旬,科大訊飛聯(lián)合華為推出了大模型算力硬件 “星火一體機”。一體機的特點是可以私有化部署大模型,讓所有企業(yè)都可以在國產(chǎn)自主創(chuàng)新平臺上私有化部署大模型。
1個月后的華為全聯(lián)接大會上,劉慶峰在演講中透露了與華為的進一步合作。而在10月24日,科大訊飛聯(lián)合華為正式推出基于昇騰生態(tài)的自主創(chuàng)新大模型算力底座“飛星一號”平臺,支持訊飛星火大模型在對標GPT-4之路上,實現(xiàn)更大規(guī)模的訓練。
自5月6日星火發(fā)布以來,訊飛開放平臺新增143.4萬開發(fā)者團隊,同比增幅331%,其中新增大模型開發(fā)者17.8萬。大模型也顯著降低了開發(fā)者門檻,在訊飛星火上,已有1.5萬助手開發(fā)者,開發(fā)超2.9萬個助手應用。
技術的升級,離不開真金白銀的投入,更何況是燒錢的大模型行業(yè)。據(jù)新智元報道,大模型的訓練及運行成本極高,GPT-4一次訓練成本估計要6300萬美元,且由于每次提問都需要進行大量新的計算,難以形成標準軟件的規(guī)律效益,企業(yè)投入成本是個不小挑戰(zhàn)。
9月,知名投資機構紅杉資本的David Cahn發(fā)布文章稱,如今的AI產(chǎn)業(yè)還需1250億美元的營收,才能掙回為了大模型在GPU、數(shù)據(jù)中心、能源等成本上的投入。但目前AI在應用層面上的創(chuàng)新與商業(yè)化前景,與1250億美元的閾值還有巨大的分歧。
巨大的投入成本,在科大訊飛身上也有體現(xiàn)。
科大訊飛2023年三季度財報顯示,2023年第三季度公司實現(xiàn)營業(yè)收入47.72億元,同比增長2.89%;歸母凈利潤為2579.01萬元,同比下滑81.86%;扣非后歸母凈利潤由盈轉(zhuǎn)虧,為-2018.87萬元,同比降113.65%。
從前三季度情況看,科大訊飛實現(xiàn)營業(yè)收入126.14億元,同比略微下滑0.37%;歸屬于上市公司股東的凈利潤9936.21萬元,同比下滑76%。
對于財報的表現(xiàn),科大訊飛給出的理由為,“在通用人工智能認知大模型等方面堅定投入”。今年前三季度,科大訊飛在研發(fā)方面支出費用達到24.98億,同比增長7.19%。
成本居高不下,繼續(xù)投入?yún)s有必要,這種情況下,更需要盡快實現(xiàn)商業(yè)化。因此,當廠商們在比拼技術時,拼場景、拼應用也在同步進行。
民生證券在研報中指出,“單純發(fā)布一個大模型的門檻沒有市場想象中的那么高”,難的是“有一個能持續(xù)迭代,性能不斷提升的優(yōu)質(zhì)大模型”,優(yōu)質(zhì)的、獨特的數(shù)據(jù)價值更大。
事實上,大模型的浪潮,科大訊飛必須要抓住。這不僅能給科大訊飛帶來新的增長,更重要的是通過大模型挽回資本市場的信心。
在發(fā)布星火V3.0的當天,資本市場給科大訊飛澆了一盆冷水。10月24日,科大訊飛午后跳水持續(xù)走低,截至收盤,科大訊飛以跌停價46.70元報收。截至發(fā)稿,科大訊飛市值為1054.33億元。
總的來看,技術層面科大訊飛已然拿到了AI大模型的門票,最終能否在行業(yè)中搶占新的先機,還要看具體的商業(yè)落地表現(xiàn)。
3、深耕垂類,更有希望?
科大訊飛是一家典型的技術公司。1999年,科大訊飛以智能語音技術起家,經(jīng)過二十多年的發(fā)展,科大訊飛在語音合成、語音識別、自然語言處理等核心技術領域處于國際領先水平。
但在AI大模型領域,技術是一回事,商業(yè)落地又是另一回事?;谶@樣的思考,“技術頂天,應用落地”是科大訊飛在發(fā)展大模型過程中始終遵循的兩項準則,在研發(fā)技術的同時,思考場景落地與商業(yè)化。
一個業(yè)內(nèi)的共識是,“百模大戰(zhàn)”至今,國產(chǎn)大模型已從“卷參數(shù)”進入了“卷應用”。紅衫資本在近期的一份研究報告中也指出,當下的大模型競逐已進入第二階段,比起技術,更強調(diào)產(chǎn)品體驗與應用形態(tài)。
簡而言之,大模型跑得快的標準正變成好用和實用。
放眼整個行業(yè),B端仍是大模型商業(yè)化落地的重點,各行各業(yè)對大模型的需求很強烈,大家都想借助大模型的AI能力,助力企業(yè)的數(shù)智化轉(zhuǎn)型。
具體而言,發(fā)布會上,科大訊飛發(fā)布了星火V3.0的能力集成與部署進一系列賦能行業(yè)與場景的商業(yè)化產(chǎn)品中,如全新升級的iFlyCode2.0(智能編程助手),與中科院文獻情報中心聯(lián)合打造的星火科研助手、教育領域的AI心理伙伴、醫(yī)療領域的曉醫(yī)助手等。
此外,最新發(fā)布的訊飛星火V3.0將賦能智能座艙全面升級,面向多樣化的汽車使用場景,科大訊飛推出星火座艙OS、星火汽車APP和星火座艙域控,支持實時檢索,可以實現(xiàn)插件化調(diào)度,并集成多模態(tài)生成的能力,為合作伙伴提供自主可控、組件化、更開放的座艙解決方案。
同時,科大訊飛還面向金融、汽車、運營商、工業(yè)、住建、物業(yè)、法律、科研文獻、傳媒、政務、文旅、水利等12個領域發(fā)布了垂直行業(yè)大模型。
一個明顯的趨勢是,大模型C端市場需求增量明顯,這給了B端和C端兩條腿走路的科大訊飛更多大模型落地的機會。
發(fā)布會上,星火V3.0推出了多項應用大模型的C端產(chǎn)品,如具備英語AI答疑輔學的訊飛AI學習機、面向未來的人形機器人等。
值得關注的是,教育一直是科大訊飛的核心產(chǎn)品線。此次發(fā)布的AI心理咨詢師“小星”與以往發(fā)布的教育產(chǎn)品不同,更加關注學生心理健康?!靶⌒恰痹谛腔鸫竽P偷募映窒?,能夠通過視頻、語音、文字等多模態(tài)方式與青少年展開類人自由對話,理解青少年的情緒情感,表達接納與共情,促進青少年自我覺察,并提供個性化行動建議。
圖源科大訊飛微信公眾號
不過,無論是企業(yè)和開發(fā)者,對于大模型的和使用方式有不同的差異。比起主打普惠使用的“全面型”能力,大模型要在千行百業(yè)應用起來,考驗的是更快速精準的算力,和更具特色化的功能。想讓大模型真正用起來,需要國產(chǎn)大模型廠商找到高頻剛需的應用場景,打造殺手級應用。
劉慶峰在會上透露,自訊飛星火9月5日對公眾開放以來,當前已有1200萬用戶。升級到V3.0后,訊飛星火在七大能力——文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力以及多模態(tài)上有了持續(xù)的提升。
談及大模型的商業(yè)回報周期,劉慶峰表示,“至于商業(yè)收益方面,我認為明年將會顯現(xiàn)出明顯的效果。然而,我們還有很多工作要做,不能說已經(jīng)達到了一個穩(wěn)定狀態(tài),還需要時間來完善細節(jié)并逐步訓練?!?/p>
大模型掀起的熱潮過去了大半年,經(jīng)歷了一輪輪軍備競賽之后,大模型已經(jīng)告別了最初的技術比拼,玩家們開始冷靜思考下半場的決勝點。或許,誰能率先將大模型技術與更多產(chǎn)業(yè)場景結合,訓練更垂直化的能力,誰就能搶到更多蛋糕。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/quan/107770.html