點(diǎn)擊關(guān)注
文|郝鑫
編|劉雨琦
剛過去的WAIC(世界人工智能大會(huì))儼然成為了大模型廠商的成果匯報(bào)大會(huì)。
百度文心大模型升級到3.5版本,訓(xùn)練速度提升2倍,推理速度提升30倍;華為云發(fā)布盤古大模型3.0,包含L0基礎(chǔ)大模型、L1行業(yè)大模型和L2場景模型;阿里云發(fā)布AI繪畫創(chuàng)作模型通義萬相;騰訊云MaaS底座、行業(yè)大模型場景全面升級;商湯“日日新”大模型升級,金融、醫(yī)療等行業(yè)場景落地已超20個(gè)。
大模型走過從無到有,在當(dāng)下的階段,即使是站在同一起跑線的廠商,也走上了不同的分叉路:有人做通用大模型,有人做行業(yè)大模型;有人在為大模型的安全運(yùn)行保駕護(hù)航,有人在提供造大模型的工具。
7月7日,在中國信通院發(fā)布的《2023大模型和AIGC產(chǎn)業(yè)圖譜》中,將大模型和AIGC產(chǎn)業(yè)鏈上下游分成了行業(yè)應(yīng)用、產(chǎn)品服務(wù)、模型與工具和基礎(chǔ)層四個(gè)主要部分。
(圖源:中國通訊院)
從圖上看,大模型就像造房子,很難有一家企業(yè)完成所有環(huán)節(jié)。也就是說,如同互聯(lián)網(wǎng)的大航海時(shí)代一般,大模型生態(tài)建設(shè),所有人都有機(jī)會(huì)。
正如騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲告訴光錐智能:“大模型時(shí)代,開放是非常重要的特點(diǎn)。大模型要結(jié)合行業(yè)落地,需要花費(fèi)大量的成本,在這種情況下,要想發(fā)揮最大的價(jià)值,只有開放,通過讓各行各業(yè)的專家、各類角色的人員加入進(jìn)來,才能讓整個(gè)生態(tài)體系更健康,從而產(chǎn)生更多的可能性?!?/p>
發(fā)展的同時(shí),問題也在逐漸暴露出來。相較于國外成熟的大模型市場,中國到現(xiàn)在還未構(gòu)建起完整的大模型產(chǎn)業(yè)鏈,在底層的數(shù)據(jù)、芯片、計(jì)算能力存在欠缺,在模型訓(xùn)練、部署等環(huán)節(jié)還十分薄弱。
針對大模型產(chǎn)業(yè)鏈存在的痛點(diǎn),騰訊云MaaS大模型精選商店升級技術(shù)底座,發(fā)布向量數(shù)據(jù)庫和星脈網(wǎng)絡(luò),創(chuàng)新行業(yè)大模型的應(yīng)用場景。
追本溯源,可以看出騰訊延續(xù)互聯(lián)網(wǎng)時(shí)代的思路,騰訊云依然不做通用大模型,要繼續(xù)做工具箱和連接器。
Always工具箱和連接器
據(jù)光錐智能了解到,早在6月19日,騰訊云就公布了行業(yè)大模型技術(shù)解決方案。該方案依托騰訊云TI平臺(tái)打造行業(yè)大模型精選商店,為客戶提供MaaS一站式服務(wù),客戶只需要加入自己獨(dú)有的場景數(shù)據(jù),就可以快速生成專屬模型,結(jié)合實(shí)際業(yè)務(wù)場景需求,開發(fā)低成本、高可用的智能應(yīng)用和服務(wù)。
騰訊云MaaS大模型商店重點(diǎn)突出了兩個(gè)特點(diǎn),一是精專,二是靈活。
“精?!敝饕w現(xiàn)在對行業(yè)模型的訓(xùn)練上,騰訊云在其技術(shù)底座就內(nèi)置了金融、政務(wù)、文旅、傳媒、教育等多個(gè)行業(yè)大模型,這意味著從預(yù)訓(xùn)練時(shí)期開始,大模型便明確了方向,開始與行業(yè)經(jīng)驗(yàn)結(jié)合。
打個(gè)比方,就好比大學(xué)生一入學(xué)就被分到了不同的專業(yè),之后在此基礎(chǔ)上繼續(xù)研究生、博士深造。騰訊云的思路也是如此,把訓(xùn)練的數(shù)據(jù)先在行業(yè)大模型中磨礪一遍,然后再結(jié)合企業(yè)的私有數(shù)據(jù),精調(diào)后生成企業(yè)專屬模型??梢哉f,行業(yè)認(rèn)知貫穿了模型訓(xùn)練、推理、部署的全過程,由此來提升行業(yè)場景的應(yīng)用能力。
“靈活”主要體現(xiàn)在企業(yè)調(diào)取、使用模型能力、工具上?;ヂ?lián)網(wǎng)時(shí)代,馬化騰曾將騰訊的角色定位為“工具箱”,在大模型時(shí)代,騰訊云TI平臺(tái)的角色有著異曲同工之處。
工具鏈決定著企業(yè)能不能把大模型能力和自己的業(yè)務(wù)、產(chǎn)品相結(jié)合,為此,騰訊云提供了包括數(shù)據(jù)標(biāo)注、訓(xùn)練、評估、測試和部署等大模型工具箱和配套服務(wù)。企業(yè)可以在本地按需選用和組合工具,在保障安全的前提下進(jìn)行私有化數(shù)據(jù)訓(xùn)練,還可根據(jù)業(yè)務(wù)場景需求,按需定制不同參數(shù)、規(guī)格的模型服務(wù)。
以前,騰訊連接了B端商家和C端用戶,現(xiàn)在騰訊云也將這種能力復(fù)刻到大模型商店。工具組合形成的工具鏈還只是平臺(tái)中的一環(huán),連接起企業(yè)產(chǎn)品和大模型;另一條主線——數(shù)據(jù)(私有+公有),則串連起了大模型、企業(yè)、產(chǎn)業(yè)和用戶。
行業(yè)應(yīng)用是起點(diǎn),也是終點(diǎn),正如吳運(yùn)聲所言,“不管是什么樣的技術(shù),我們最根本的出發(fā)點(diǎn),還是要解決實(shí)際的問題?!?/p>
大模型加速器
如何在大模型賽道上找到合適自己的節(jié)奏,騰訊云似乎已經(jīng)摸到了脈路。
騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生曾表示:“關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)做好,而且更關(guān)鍵的是場景落地?!?/p>
延續(xù)著這樣的思路,騰訊云一手抓底層算法、算力和數(shù)據(jù),一手落地場景,MaaS大模型商店實(shí)現(xiàn)了全面的升級。
在技術(shù)底座環(huán)節(jié),騰訊云聚焦一個(gè)“快”字,發(fā)布了星脈網(wǎng)絡(luò)和向量數(shù)據(jù)庫,為大模型安上了“風(fēng)火輪”。
大模型進(jìn)入萬億參數(shù)時(shí)代,單體服務(wù)器算力有限,需要將大量服務(wù)器通過高性能網(wǎng)絡(luò)相連,打造大規(guī)模算力集群。
基于此,騰訊云通過對處理器、網(wǎng)絡(luò)架構(gòu)和存儲(chǔ)性能的全面優(yōu)化,攻克下了大集群場景下算力損耗問題,正式發(fā)布新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群。
該集群采用騰訊云星星海自研服務(wù)器,搭載英偉達(dá)最新代次H800 GPU,能提升40%的GPU利用率,節(jié)省30%-60%的模型訓(xùn)練成本,為AI大模型帶來10倍通信性能提升?;隍v訊云新一代算力集群HCC,可支持10萬卡的超大計(jì)算規(guī)模。
據(jù)騰訊云透露,騰訊云新一代集群的算力性能較前代提升高達(dá)3倍,是國內(nèi)性能最強(qiáng)的大模型計(jì)算集群。
高性能計(jì)算群是一種底座能力,其技術(shù)的應(yīng)用體現(xiàn)了通過技術(shù)手段的降本增效。
首先,相比于大量分散的計(jì)算機(jī),高性能計(jì)算集群可以降低硬件成本和運(yùn)維成本,同時(shí)方便集中管理。其次,它可以提升計(jì)算、搜索的效率。提供分布式的計(jì)算能力,為向量數(shù)據(jù)庫提供支持;還能進(jìn)行復(fù)雜的科學(xué)計(jì)算和建模,這也是騰訊云“AI for Science”能迅速在天文、甲骨文考釋取得成果的原因。
在大模型訓(xùn)練過程中,湯道生談起過數(shù)據(jù)質(zhì)量的問題,他表示:“目前通用大模型一般都是基于廣泛的公開文獻(xiàn)與網(wǎng)絡(luò)信息來訓(xùn)練的,網(wǎng)上的信息可能有錯(cuò)誤、有謠言、有偏見,許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致模型的行業(yè)針對性與精準(zhǔn)度不夠,數(shù)據(jù)噪音過大?!?/p>
數(shù)據(jù)對大模型訓(xùn)練的意義不言而喻,當(dāng)前,除了數(shù)據(jù)噪聲過大,還存在數(shù)據(jù)處理、數(shù)據(jù)更新、數(shù)據(jù)安全等眾多問題。
此外,大模型還存在一個(gè)致命的缺點(diǎn)——沒有長期記憶,C端對話場景還可以重新提問,但應(yīng)用在行業(yè),就可能造成系統(tǒng)崩潰。
OpenAI 很早就意識到這個(gè)問題,通過與Zilliz、Pinecone、Weaviate等向量數(shù)據(jù)庫公司合作,為ChatGPT配置上了“外置緩存”,向量數(shù)據(jù)庫+大模型也被稱之為“黃金搭檔”。
國外向量數(shù)據(jù)庫大熱帶動(dòng)了國內(nèi)廠商加速,騰訊云也趕上了第一波,發(fā)布了國內(nèi)首個(gè)AI 原生向量數(shù)據(jù)庫。
針對大模型場景,它在接入層、計(jì)算層、存儲(chǔ)層實(shí)現(xiàn)了全面AI化:
在接入層,智能化支持自然語言文本的直接檢索;
在計(jì)算層,通過AI算子替代企業(yè)尋找/調(diào)優(yōu)AI算法,將接入工期從一個(gè)月縮短到3天;
在存儲(chǔ)層,融合智能壓縮算法,把向量存儲(chǔ)成本降低50%。
企業(yè)數(shù)據(jù)接入需要分為三步,分別為文本切分、向量化以及導(dǎo)入。以前,這三步分別由不同的公司來做,因此周期被拉得無限長,而騰訊云將三步化作一步,直接實(shí)現(xiàn)了一站式接入,效率提升了10倍。
不過,從參數(shù)來看,目前騰訊云向量數(shù)據(jù)庫性能依舊在初級的階段。
舉個(gè)例子,騰訊云向量數(shù)據(jù)庫最高支持10億級向量檢索規(guī)模,并將延遲控制在毫秒級。作為對比Milvus最大能支持560億向量檢索規(guī)模,支持每秒進(jìn)行上百萬的向量相似性搜索。
但10億級也可以說是向量數(shù)據(jù)庫的入門級參數(shù)。Pinecone 官方demo 表明其可以在 10 億條向量中實(shí)時(shí)搜索;Weaviate算法可支持十億量級的向量索引。
工欲善其事,必先利其器。從最底層一步步砸實(shí)技術(shù),看似騰訊云走了一條慢路,但小布快走,實(shí)現(xiàn)快速迭代后,帶動(dòng)的將是整個(gè)生態(tài)系統(tǒng)的提升。
50個(gè)場景,騰訊云批量著陸
場景一直是騰訊所強(qiáng)調(diào)的產(chǎn)品文化,即做一個(gè)產(chǎn)品或者上線一個(gè)功能,首先考慮的是,能不能找到場景,找到用戶。
同樣切入MaaS,站在新的起跑線上,騰訊云通過沉淀的行業(yè)Konw-how,瞄準(zhǔn)企業(yè)應(yīng)用剛需,推進(jìn)大模型應(yīng)用落地,將場景作為訓(xùn)練大模型的磨刀石。
“大模型雖好,但用起來還是有很高的門檻。尤其對一些傳統(tǒng)領(lǐng)域企業(yè)而言,通用大模型無法精準(zhǔn)適配、達(dá)到降本增效的預(yù)期。企業(yè)需要的,是在實(shí)際場景中真正解決某個(gè)問題,而不是在100個(gè)場景中解決了70%-80%的問題。”吳運(yùn)聲道。
騰訊云認(rèn)為,大模型不只是少數(shù)人的游戲,把大模型從“通才”轉(zhuǎn)變?yōu)椤皩2拧?,對企業(yè)來說或許是一個(gè)可行的路徑。騰訊云在其中承擔(dān)的角色,就是要將門檻打下來,提供一條龍服務(wù),幫助企業(yè)跳過模型訓(xùn)練、部署的“冷啟動(dòng)”階段。
據(jù)光錐智能了解,基于騰訊在互聯(lián)網(wǎng)行業(yè)的長期沉淀,騰訊云已聯(lián)合金融、文旅、政務(wù)、傳媒、教育等十多個(gè)行業(yè)頭部客戶,共同打造了超過50個(gè)行業(yè)大模型解決方案,這些都是騰訊 CSIG 的重點(diǎn)服務(wù)行業(yè)。
在金融風(fēng)控場景,騰訊云風(fēng)控大模型融合了騰訊過去20多年黑灰產(chǎn)對抗經(jīng)驗(yàn),和上千個(gè)真實(shí)業(yè)務(wù)場景,提供了金融風(fēng)控解決方案。企業(yè)可以基于prompt模式,迭代風(fēng)控能力,從樣本收集、模型訓(xùn)練到部署上線,實(shí)現(xiàn)全流程零人工參與,目前,建模時(shí)間已經(jīng)做到從2周減少到僅需2天。
在交互翻譯場景,基于行業(yè)大模型技術(shù),騰訊云無需百萬級的訓(xùn)練數(shù)據(jù),使用小樣本訓(xùn)練也可以獲得不錯(cuò)的翻譯結(jié)果,讓每一次交互翻譯,都能對下一句的翻譯提升發(fā)揮實(shí)時(shí)作用。
以行業(yè)場景為切入,技術(shù)、應(yīng)用同時(shí)迭代升級,這樣的速度明顯要更快,效果也更加顯著。
據(jù)騰訊云在WAIC最新數(shù)據(jù),上述金融風(fēng)控解決方案,相比之前已有了10倍效率的提升,整體反欺詐效果比傳統(tǒng)模式有20%左右的提升;騰訊云數(shù)智人工廠,內(nèi)置超過10個(gè)AI算法模型,騰訊云MaaS能力,可以讓2D數(shù)智人分身復(fù)刻縮短至24小時(shí)。
技術(shù)和應(yīng)用兩條腿同時(shí)跑,底層大模型支撐應(yīng)用場景落地,場景也反過來反哺大模型。
正如同騰訊云所強(qiáng)調(diào)的一個(gè)觀點(diǎn)“產(chǎn)業(yè)場景是大模型的最佳練兵場”,前期大模型所學(xué)習(xí)到的行業(yè)經(jīng)驗(yàn)可以在現(xiàn)實(shí)應(yīng)用場景中得到矯正,再次沉淀到騰訊云MaaS平臺(tái)行業(yè)模型底座,重新更新認(rèn)知,以此循環(huán)往復(fù),行業(yè)大模型將越調(diào)越精,企業(yè)也越用越靈。
另一方面,成熟的應(yīng)用落地場景,或許又將為大模型商業(yè)化開拓出新的道路。
事實(shí)證明,貪圖一時(shí)的熱鬧并不長遠(yuǎn),即使是擁有絕對技術(shù)壁壘的ChatGPT也面臨著流量下滑的命運(yùn),OpenAI 創(chuàng)始人更是直言,ChatGPT插件不如預(yù)期的原因在于,人們更想把GPT的能力用到自己的應(yīng)用當(dāng)中。
開啟大模型下一個(gè)競爭階段,場景與商業(yè)化能力或?qū)⒆兊酶用芮小?/p>
正如騰訊云副總裁、騰訊云智能研發(fā)負(fù)責(zé)人吳永堅(jiān)所認(rèn)為的:“互聯(lián)網(wǎng)已經(jīng)走到從最開始的純免費(fèi)階段,慢慢向某些場景去如何商業(yè)化的階段,這不是大模型帶來的,但大模型將我們商業(yè)化的途徑變得更清晰了?!?/p>
?
歡迎關(guān)注“光錐智能”增長黑客號,關(guān)注前沿科技!
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/quan/101714.html