AI又一次迎來質(zhì)變的進(jìn)化:9月13日,OpenAI o1-preview落地,一時間引發(fā)人們對“Inference law(推理定律)”取代“Scaling Law(規(guī)模定律)”的熱議。當(dāng)大家深入探討OpenAI o1的“思維鏈”時,才發(fā)現(xiàn),這不是與兩個月前周鴻祎說的“慢思考”是一個底層邏輯嗎?
AI的發(fā)展,不僅要卷技術(shù)的領(lǐng)先,更要卷思維的前瞻。洞察趨勢,預(yù)見到未來的方向,才能真正領(lǐng)跑未來。
“思維鏈”不謀而合“慢思考”
具有強(qiáng)大推理能力、適用于復(fù)雜任務(wù)的OpenAI o1,再次給業(yè)界帶來震動。用OpenAI官方的說法:“這個模型在復(fù)雜推理任務(wù)上是一個重大的進(jìn)步,代表了人工智能能力的一個新水平;因此,我們決定重新開始編號,把這一系列模型命名為OpenAI o1。”言外之意就是,這是AI思維模式、發(fā)展路徑的一次重大改變,預(yù)示著未來AI發(fā)展的全新路徑。
過去的GPT系列模型雖精確且量大,但缺乏“思考”環(huán)節(jié),因此難以真正理解復(fù)雜學(xué)科如物理學(xué)和數(shù)學(xué)。
這一次的具體變化歸結(jié)為“思維鏈” (Chain-of-Thought, CoT)一詞。o1 系列模型采用全新的訓(xùn)練方法,不再局限于模仿訓(xùn)練數(shù)據(jù)中的模式,而是通過強(qiáng)化學(xué)習(xí)和“思維鏈”技術(shù),引導(dǎo)模型自主解決問題,主打推理能力。工作原理本質(zhì)上是-思維鏈的自動化,把一個復(fù)雜問題拆解成若干簡單步驟,從而有利于大模型解決復(fù)雜的邏輯問題。
OpenAI 創(chuàng)始人山姆·奧特曼(Sam Altman) 將 o1 稱為“迄今為止最強(qiáng)大、最一致的一系列模型”,并將其視為邁向自主系統(tǒng)或代理的關(guān)鍵一步。
總結(jié)起來,“思維鏈”有幾個特性:像人一樣思考,自主推理,自動分解步驟,通過一系列模型協(xié)同完成。
有沒有覺得“似曾相識”?沒錯,早在7月底的ISC.AI 2024大會上,360集團(tuán)創(chuàng)始人周鴻祎就提出:“用基于智能體的框架打造慢思考系統(tǒng),從而增強(qiáng)大模型的慢思考能力?!?/p>
他認(rèn)為,快思考的特點是快速直覺、無意識,反應(yīng)很快但能力不夠強(qiáng)。GPT類大模型通過訓(xùn)練大量知識,主要學(xué)習(xí)的是快思考能力,GPT這類大模型可以做到脫口而出,但是質(zhì)量不夠穩(wěn)定,甚至?xí)耙槐菊?jīng)地胡說八道”,所答非所問。而慢思考則是緩慢、有意識、有邏輯性,需要分很多步驟,類似寫一篇復(fù)雜的文章,要先列提綱,根據(jù)提綱去搜集數(shù)據(jù),收集素材,根據(jù)素材進(jìn)行討論,再把文章寫出來,還要進(jìn)行潤色和修改。也就是說,慢思考更像真正的人類一樣去思考,先了解問題的意圖,再對分步完成一項復(fù)雜的任務(wù)。
周鴻祎評價:“這一次OpenAI o1擁有了人類慢思考的特質(zhì),在回答問題前會反復(fù)地思考,拆解、理解、推理,可能會自己問自己1000遍,然后才能給出最終的答案?!?/p>
顯然,“思維鏈”與“慢思考”是一套邏輯體系,不謀而合,只是周鴻祎無論從觀點到實踐,都早了近兩個月。
這也將是產(chǎn)業(yè)的一個轉(zhuǎn)折點。GPT當(dāng)年很轟動,并引發(fā)了千模大戰(zhàn)。但是卷大模型的道路上,普遍缺乏“思考”環(huán)節(jié),有時不能正確理解問題,有時不能解答復(fù)雜的科學(xué)問題。隨著“思維鏈”與“慢思考”的提出,為AI的發(fā)展引入了新的底層思維邏輯,不僅在生成內(nèi)容時進(jìn)行計算,還模擬了“先想后說”的過程,更接近人類思維模式,標(biāo)志著向通用人工智能(AGI)邁進(jìn)的重要一步。
正如周鴻祎所說:“所以,以后比的不是多快能給你答案,而是給的答案完不完整,人工智能到最后還是要參考人類大腦的組成來構(gòu)造工作模式。”
多模型協(xié)同:搭臺子、建班子、練隊伍
與過去一味地卷大模型不同,周鴻祎更關(guān)注的是如何讓AI真正解決問題,真正給用戶帶來價值。兩個月前,周鴻祎在提出“慢思考”的全新邏輯時,也拿了出全新的解題思路—-多模型協(xié)同。
如何通過多模型協(xié)同來實現(xiàn)人類的思維模式呢?
- 首先是搭臺子——CoE。
以前MoE(Mixture-of-Experts,混合專家)架構(gòu)的稀疏混合專家模型都被認(rèn)為是Transformer之后大模型下一個發(fā)展趨勢。MoE模型可以只選擇某一專家模型來處理數(shù)據(jù),這使得模型在推理過程中更為高效,因為大部分專家處于未激活狀態(tài),從而減少了不必要的計算,即所謂的快思考。而在7月底的ISC大會上,360推出了CoE(Collaboration-of-Experts,專家協(xié)同)技術(shù)架構(gòu),可以讓多個模型分工協(xié)作、并行作戰(zhàn),執(zhí)行多步推理,不同模型之間可以相互補(bǔ)充、相互校驗,確保面對復(fù)雜問題可以有更穩(wěn)定的輸出,解決“AI幻覺”的弊端??梢灶A(yù)見,未來CoE會替代MoE成為新趨勢,開啟多模型協(xié)同時代。
- 其次是建班子——大模型聯(lián)盟。
由360牽頭,百度、騰訊、阿里巴巴、智譜AI、Minimax、月之暗面等16家國內(nèi)主流大模型廠商形成一個聯(lián)盟,將這些企業(yè)的54款大模型產(chǎn)品接入CoE,協(xié)同發(fā)揮作用。其實,今年以來,大模型企業(yè)之間的合作、聯(lián)手越來越多,只是360這次的聯(lián)盟聲勢比較大,并且將一些互聯(lián)網(wǎng)頭部企業(yè)都囊括進(jìn)來,在市場上影響比較大。
據(jù)悉,CoE技術(shù)架構(gòu)不僅接入了“大模型”,還接入了很多十億甚至更小參數(shù)的專家模型,這使得整個系統(tǒng)更加智能。CoE架構(gòu)在實現(xiàn)“讓最強(qiáng)的模型回答最難的問題”的同時,還能在回答簡單問題時調(diào)用更精準(zhǔn)的“小模型”,在獲得高質(zhì)量回答的同時,節(jié)約推理資源、提升響應(yīng)速度。
- 第三是練隊伍——加速應(yīng)用落地。
有了技術(shù)架構(gòu),有了大模型,更重要的是要有應(yīng)用,通過應(yīng)用才能讓大模型更好用,大模型的協(xié)同效果才能得到驗證。360在加速產(chǎn)品的AI化的同時,在多個產(chǎn)品中都通過多模型協(xié)同實現(xiàn)產(chǎn)品的領(lǐng)先優(yōu)勢。
360AI搜索就是基于CoE技術(shù)架構(gòu),支持多模型協(xié)作重構(gòu)了搜索的底層鏈路,是一種真正意義上的“AI原生搜索引擎”。 360AI搜索“深入回答”模式,首先是構(gòu)建意圖分類模型,然后打造任務(wù)路由模型對問題進(jìn)行拆解,最后再構(gòu)建AI工作流,整個過程會涉及7-15次的大模型調(diào)用,這才能讓用戶獲得真正高質(zhì)量的回答。
在CoE技術(shù)架構(gòu)的加持下,360AI搜索僅用了八九個月的時間,就超越了Perplexity AI,蟬聯(lián)全球最大的AI原生搜索引擎;并且依然勢能強(qiáng)勁,以113%的月訪問量增速,位列全球主要搜索引擎首位。
入駐360AI瀏覽器的AI助手(bot.360.com)的「多模型協(xié)作」能力,近期也成為了行業(yè)焦點。用戶可以從國內(nèi)主流16家廠商的54款LLMs中任意3款,分別做專家、反思者和總結(jié)者,直觀體驗LLM領(lǐng)域的“三英戰(zhàn)呂布”。讓3款LLM協(xié)作起來,組隊碾壓GPT-4o、媲美OpenAI o1。
由此可見,作為國內(nèi)“AI教父”的周鴻祎,并不只是一個思考者,更是一個行動者。他在洞察到大模型的諸多問題之后,給出新的路徑;并且身體力行,通過搭臺子、建班子、練隊伍的方式,將這個路徑給驗證了。這才是真正難得的地方。
跑得快,更要跑對方向
自從OpenAI掀起大模型浪潮之后,周鴻祎非常活躍,在語言上和行動上都是。一方面,他在各種場合交流對AI發(fā)展趨勢的見解;另一方面,迅速推動公司所有產(chǎn)品的AI化,兩者相互促進(jìn)。
而這次,在大模型前進(jìn)道路上邁出的關(guān)鍵一步,周鴻祎和360不僅與OpenAI不謀而合,并且還快了一步,正是其在思考中實踐、在實踐中思考的結(jié)果。
如今,AI的發(fā)展還處于初級階段。最近,“慢思考”與“思維鏈”理念的提出,對AI的發(fā)展帶來三點啟示。
- 第一,戰(zhàn)略高于戰(zhàn)術(shù),格局重于技術(shù)。
大模型火了之后,傳統(tǒng)互聯(lián)網(wǎng)大廠、創(chuàng)業(yè)者都進(jìn)來卷,但卷大模型的價值有那么大嗎?從終局來看,AI 不是被動接受指令的工具,而是能夠自主“思考”、決策和行動的智能伙伴。
周鴻祎在看到大模型強(qiáng)大的同時,也很早就看到AI幻覺的問題,并思考未來的發(fā)展方向。戰(zhàn)略方向比具體的戰(zhàn)術(shù)更重要,單點的技術(shù)創(chuàng)新是戰(zhàn)術(shù),而終局思維才是戰(zhàn)略方向,這是其“慢思考”的來源。
跑得快很重要,但是更重要的是在對的方向上跑得快。如果一味地卷大模型,其實是對產(chǎn)業(yè)資源的浪費。
今天,“慢思考”與“思維鏈”也不是終局,只是在向終局的路上邁進(jìn)了一大步。
- 第二,卷應(yīng)用比卷模型更有價值。
技術(shù)創(chuàng)新與用戶價值之間,往往隔著一道鴻溝,跨過這道鴻溝的企業(yè)比發(fā)明技術(shù)的企業(yè)更偉大。最早發(fā)明二維碼的不是微信,但是微信是二維碼最大的推動者。新能源電池不是特斯拉發(fā)明的,但特斯拉確是新能源汽車產(chǎn)業(yè)的先行者。
大模型很酷,但如何能為用戶創(chuàng)造價值更重要。也就是說,卷應(yīng)用落地比卷大模型更有意義。360的產(chǎn)品全面AI化,目的就是讓小白用戶可以簡單輕松地體驗到AI帶來的好處。在應(yīng)用的落地方面,360走得很快,特別是在多模型協(xié)同上領(lǐng)先了OpenAI兩個月。
學(xué)習(xí)、辦公是最常見的應(yīng)用場景,為了推動應(yīng)用了落地,360還推出了AI辦公,是一個一站式學(xué)習(xí)辦公工具,用戶可以體驗到AI圖片、AI文檔、AI音視頻、AI PPT等超過200多個AI能力,幾乎覆蓋所有學(xué)習(xí)、辦公所需。
- 第三,獨行不如眾行遠(yuǎn)。
AI的實現(xiàn),是一個非常復(fù)雜的系統(tǒng)工程,不是單個企業(yè)可以實現(xiàn)的。在業(yè)界有一個共識,未來AI的競爭是生態(tài)的競爭。單個OpenAI可能很強(qiáng),但是通過協(xié)同作戰(zhàn),中國的大模型可以用全新的思路彎道超車。
經(jīng)測試,基于CoE架構(gòu)集各家所長的混合大模型能力就超過了GPT-4o。該混合大模型在翻譯、寫作等12項指標(biāo)的測試中取得了80.49分的綜合成績,超越了GPT-4o的69.22分;而且除了代碼以外,其余11項指標(biāo)均優(yōu)于GPT-4o。特別是在“邏輯推理”、“多步推理”、“詩詞賞析”這類比較具有中文特色的問題上,CoE的領(lǐng)先優(yōu)勢更加明顯。
目前,360“多模型協(xié)作”在測試中,已經(jīng)打敗并遠(yuǎn)遠(yuǎn)甩開GPT-4o,媲美o1-preview,這就是聯(lián)盟的力量,生態(tài)的威力。
【結(jié)束語】
AI發(fā)展初期,從大模型來看好像中國落后一步。如果跟在別人后面延著人家的軌跡追,差距只會越拉越遠(yuǎn)。以終局思維重新審視AI的發(fā)展路徑,技術(shù)創(chuàng)新的同時更要路徑創(chuàng)新?!奥伎肌迸c“思維鏈”的巧合,是中國AI發(fā)展趕超的新契機(jī)。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/cgo/model/124161.html