周鴻祎的 “慢思考”快了OpenAI一步

「 AI領(lǐng)域卷大模型,從卷算法到卷參數(shù)再到卷價(jià)格,如今要卷思維?!?/p>

 

AI又一次迎來(lái)質(zhì)變的進(jìn)化:9月13日,OpenAI o1-preview落地,一時(shí)間引發(fā)人們對(duì)“Inference law(推理定律)”取代“Scaling Law(規(guī)模定律)”的熱議。當(dāng)大家深入探討OpenAI o1的“思維鏈”時(shí),才發(fā)現(xiàn),這不是與兩個(gè)月前周鴻祎說(shuō)的“慢思考”是一個(gè)底層邏輯嗎?

AI的發(fā)展,不僅要卷技術(shù)的領(lǐng)先,更要卷思維的前瞻。洞察趨勢(shì),預(yù)見(jiàn)到未來(lái)的方向,才能真正領(lǐng)跑未來(lái)。

周鴻祎的 “慢思考”快了OpenAI一步

“思維鏈”不謀而合“慢思考”

具有強(qiáng)大推理能力、適用于復(fù)雜任務(wù)的OpenAI o1,再次給業(yè)界帶來(lái)震動(dòng)。用OpenAI官方的說(shuō)法:“這個(gè)模型在復(fù)雜推理任務(wù)上是一個(gè)重大的進(jìn)步,代表了人工智能能力的一個(gè)新水平;因此,我們決定重新開(kāi)始編號(hào),把這一系列模型命名為OpenAI o1?!?strong>言外之意就是,這是AI思維模式、發(fā)展路徑的一次重大改變,預(yù)示著未來(lái)AI發(fā)展的全新路徑。

過(guò)去的GPT系列模型雖精確且量大,但缺乏“思考”環(huán)節(jié),因此難以真正理解復(fù)雜學(xué)科如物理學(xué)和數(shù)學(xué)。

這一次的具體變化歸結(jié)為“思維鏈” (Chain-of-Thought, CoT)一詞。o1 系列模型采用全新的訓(xùn)練方法,不再局限于模仿訓(xùn)練數(shù)據(jù)中的模式,而是通過(guò)強(qiáng)化學(xué)習(xí)和“思維鏈”技術(shù),引導(dǎo)模型自主解決問(wèn)題,主打推理能力。工作原理本質(zhì)上是-思維鏈的自動(dòng)化,把一個(gè)復(fù)雜問(wèn)題拆解成若干簡(jiǎn)單步驟,從而有利于大模型解決復(fù)雜的邏輯問(wèn)題。

OpenAI 創(chuàng)始人山姆·奧特曼(Sam Altman) 將 o1 稱(chēng)為“迄今為止最強(qiáng)大、最一致的一系列模型”,并將其視為邁向自主系統(tǒng)或代理的關(guān)鍵一步。

總結(jié)起來(lái),“思維鏈”有幾個(gè)特性:像人一樣思考,自主推理,自動(dòng)分解步驟,通過(guò)一系列模型協(xié)同完成。

有沒(méi)有覺(jué)得“似曾相識(shí)”?沒(méi)錯(cuò),早在7月底的ISC.AI 2024大會(huì)上,360集團(tuán)創(chuàng)始人周鴻祎就提出:“用基于智能體的框架打造慢思考系統(tǒng),從而增強(qiáng)大模型的慢思考能力?!?/p>

周鴻祎的 “慢思考”快了OpenAI一步

他認(rèn)為,快思考的特點(diǎn)是快速直覺(jué)、無(wú)意識(shí),反應(yīng)很快但能力不夠強(qiáng)。GPT類(lèi)大模型通過(guò)訓(xùn)練大量知識(shí),主要學(xué)習(xí)的是快思考能力,GPT這類(lèi)大模型可以做到脫口而出,但是質(zhì)量不夠穩(wěn)定,甚至?xí)耙槐菊?jīng)地胡說(shuō)八道”,所答非所問(wèn)。而慢思考則是緩慢、有意識(shí)、有邏輯性,需要分很多步驟,類(lèi)似寫(xiě)一篇復(fù)雜的文章,要先列提綱,根據(jù)提綱去搜集數(shù)據(jù),收集素材,根據(jù)素材進(jìn)行討論,再把文章寫(xiě)出來(lái),還要進(jìn)行潤(rùn)色和修改。也就是說(shuō),慢思考更像真正的人類(lèi)一樣去思考,先了解問(wèn)題的意圖,再對(duì)分步完成一項(xiàng)復(fù)雜的任務(wù)。

周鴻祎評(píng)價(jià):“這一次OpenAI o1擁有了人類(lèi)慢思考的特質(zhì),在回答問(wèn)題前會(huì)反復(fù)地思考,拆解、理解、推理,可能會(huì)自己?jiǎn)栕约?000遍,然后才能給出最終的答案。”

顯然,“思維鏈”與“慢思考”是一套邏輯體系,不謀而合,只是周鴻祎無(wú)論從觀點(diǎn)到實(shí)踐,都早了近兩個(gè)月。

這也將是產(chǎn)業(yè)的一個(gè)轉(zhuǎn)折點(diǎn)。GPT當(dāng)年很轟動(dòng),并引發(fā)了千模大戰(zhàn)。但是卷大模型的道路上,普遍缺乏“思考”環(huán)節(jié),有時(shí)不能正確理解問(wèn)題,有時(shí)不能解答復(fù)雜的科學(xué)問(wèn)題。隨著“思維鏈”與“慢思考”的提出,為AI的發(fā)展引入了新的底層思維邏輯,不僅在生成內(nèi)容時(shí)進(jìn)行計(jì)算,還模擬了“先想后說(shuō)”的過(guò)程,更接近人類(lèi)思維模式,標(biāo)志著向通用人工智能(AGI)邁進(jìn)的重要一步。

正如周鴻祎所說(shuō):“所以,以后比的不是多快能給你答案,而是給的答案完不完整,人工智能到最后還是要參考人類(lèi)大腦的組成來(lái)構(gòu)造工作模式?!?/p>

多模型協(xié)同:搭臺(tái)子、建班子、練隊(duì)伍

與過(guò)去一味地卷大模型不同,周鴻祎更關(guān)注的是如何讓AI真正解決問(wèn)題,真正給用戶(hù)帶來(lái)價(jià)值。兩個(gè)月前,周鴻祎在提出“慢思考”的全新邏輯時(shí),也拿了出全新的解題思路—-多模型協(xié)同。

如何通過(guò)多模型協(xié)同來(lái)實(shí)現(xiàn)人類(lèi)的思維模式呢?

  • 首先是搭臺(tái)子——CoE。

以前MoE(Mixture-of-Experts,混合專(zhuān)家)架構(gòu)的稀疏混合專(zhuān)家模型都被認(rèn)為是Transformer之后大模型下一個(gè)發(fā)展趨勢(shì)。MoE模型可以只選擇某一專(zhuān)家模型來(lái)處理數(shù)據(jù),這使得模型在推理過(guò)程中更為高效,因?yàn)榇蟛糠謱?zhuān)家處于未激活狀態(tài),從而減少了不必要的計(jì)算,即所謂的快思考。而在7月底的ISC大會(huì)上,360推出了CoE(Collaboration-of-Experts,專(zhuān)家協(xié)同)技術(shù)架構(gòu),可以讓多個(gè)模型分工協(xié)作、并行作戰(zhàn),執(zhí)行多步推理,不同模型之間可以相互補(bǔ)充、相互校驗(yàn),確保面對(duì)復(fù)雜問(wèn)題可以有更穩(wěn)定的輸出,解決“AI幻覺(jué)”的弊端。可以預(yù)見(jiàn),未來(lái)CoE會(huì)替代MoE成為新趨勢(shì),開(kāi)啟多模型協(xié)同時(shí)代。

  • 其次是建班子——大模型聯(lián)盟。

由360牽頭,百度、騰訊、阿里巴巴、智譜AI、Minimax、月之暗面等16家國(guó)內(nèi)主流大模型廠商形成一個(gè)聯(lián)盟,將這些企業(yè)的54款大模型產(chǎn)品接入CoE,協(xié)同發(fā)揮作用。其實(shí),今年以來(lái),大模型企業(yè)之間的合作、聯(lián)手越來(lái)越多,只是360這次的聯(lián)盟聲勢(shì)比較大,并且將一些互聯(lián)網(wǎng)頭部企業(yè)都囊括進(jìn)來(lái),在市場(chǎng)上影響比較大。

據(jù)悉,CoE技術(shù)架構(gòu)不僅接入了“大模型”,還接入了很多十億甚至更小參數(shù)的專(zhuān)家模型,這使得整個(gè)系統(tǒng)更加智能。CoE架構(gòu)在實(shí)現(xiàn)“讓最強(qiáng)的模型回答最難的問(wèn)題”的同時(shí),還能在回答簡(jiǎn)單問(wèn)題時(shí)調(diào)用更精準(zhǔn)的“小模型”,在獲得高質(zhì)量回答的同時(shí),節(jié)約推理資源、提升響應(yīng)速度。

  • 第三是練隊(duì)伍——加速應(yīng)用落地。

有了技術(shù)架構(gòu),有了大模型,更重要的是要有應(yīng)用,通過(guò)應(yīng)用才能讓大模型更好用,大模型的協(xié)同效果才能得到驗(yàn)證。360在加速產(chǎn)品的AI化的同時(shí),在多個(gè)產(chǎn)品中都通過(guò)多模型協(xié)同實(shí)現(xiàn)產(chǎn)品的領(lǐng)先優(yōu)勢(shì)。

360AI搜索就是基于CoE技術(shù)架構(gòu),支持多模型協(xié)作重構(gòu)了搜索的底層鏈路,是一種真正意義上的“AI原生搜索引擎”。 360AI搜索“深入回答”模式,首先是構(gòu)建意圖分類(lèi)模型,然后打造任務(wù)路由模型對(duì)問(wèn)題進(jìn)行拆解,最后再構(gòu)建AI工作流,整個(gè)過(guò)程會(huì)涉及7-15次的大模型調(diào)用,這才能讓用戶(hù)獲得真正高質(zhì)量的回答。

在CoE技術(shù)架構(gòu)的加持下,360AI搜索僅用了八九個(gè)月的時(shí)間,就超越了Perplexity AI,蟬聯(lián)全球最大的AI原生搜索引擎;并且依然勢(shì)能強(qiáng)勁,以113%的月訪問(wèn)量增速,位列全球主要搜索引擎首位。

入駐360AI瀏覽器的AI助手(bot.360.com)的「多模型協(xié)作」能力,近期也成為了行業(yè)焦點(diǎn)。用戶(hù)可以從國(guó)內(nèi)主流16家廠商的54款LLMs中任意3款,分別做專(zhuān)家、反思者和總結(jié)者,直觀體驗(yàn)LLM領(lǐng)域的“三英戰(zhàn)呂布”。讓3款LLM協(xié)作起來(lái),組隊(duì)碾壓GPT-4o、媲美OpenAI o1。

由此可見(jiàn),作為國(guó)內(nèi)“AI教父”的周鴻祎,并不只是一個(gè)思考者,更是一個(gè)行動(dòng)者。他在洞察到大模型的諸多問(wèn)題之后,給出新的路徑;并且身體力行,通過(guò)搭臺(tái)子、建班子、練隊(duì)伍的方式,將這個(gè)路徑給驗(yàn)證了。這才是真正難得的地方。

跑得快,更要跑對(duì)方向

自從OpenAI掀起大模型浪潮之后,周鴻祎非?;钴S,在語(yǔ)言上和行動(dòng)上都是。一方面,他在各種場(chǎng)合交流對(duì)AI發(fā)展趨勢(shì)的見(jiàn)解;另一方面,迅速推動(dòng)公司所有產(chǎn)品的AI化,兩者相互促進(jìn)。

而這次,在大模型前進(jìn)道路上邁出的關(guān)鍵一步,周鴻祎和360不僅與OpenAI不謀而合,并且還快了一步,正是其在思考中實(shí)踐、在實(shí)踐中思考的結(jié)果。

周鴻祎的 “慢思考”快了OpenAI一步

如今,AI的發(fā)展還處于初級(jí)階段。最近,“慢思考”與“思維鏈”理念的提出,對(duì)AI的發(fā)展帶來(lái)三點(diǎn)啟示。

  • 第一,戰(zhàn)略高于戰(zhàn)術(shù),格局重于技術(shù)。

大模型火了之后,傳統(tǒng)互聯(lián)網(wǎng)大廠、創(chuàng)業(yè)者都進(jìn)來(lái)卷,但卷大模型的價(jià)值有那么大嗎?從終局來(lái)看,AI 不是被動(dòng)接受指令的工具,而是能夠自主“思考”、決策和行動(dòng)的智能伙伴。

周鴻祎在看到大模型強(qiáng)大的同時(shí),也很早就看到AI幻覺(jué)的問(wèn)題,并思考未來(lái)的發(fā)展方向。戰(zhàn)略方向比具體的戰(zhàn)術(shù)更重要,單點(diǎn)的技術(shù)創(chuàng)新是戰(zhàn)術(shù),而終局思維才是戰(zhàn)略方向,這是其“慢思考”的來(lái)源。

跑得快很重要,但是更重要的是在對(duì)的方向上跑得快。如果一味地卷大模型,其實(shí)是對(duì)產(chǎn)業(yè)資源的浪費(fèi)。

今天,“慢思考”與“思維鏈”也不是終局,只是在向終局的路上邁進(jìn)了一大步。

  • 第二,卷應(yīng)用比卷模型更有價(jià)值。

技術(shù)創(chuàng)新與用戶(hù)價(jià)值之間,往往隔著一道鴻溝,跨過(guò)這道鴻溝的企業(yè)比發(fā)明技術(shù)的企業(yè)更偉大。最早發(fā)明二維碼的不是微信,但是微信是二維碼最大的推動(dòng)者。新能源電池不是特斯拉發(fā)明的,但特斯拉確是新能源汽車(chē)產(chǎn)業(yè)的先行者。

大模型很酷,但如何能為用戶(hù)創(chuàng)造價(jià)值更重要。也就是說(shuō),卷應(yīng)用落地比卷大模型更有意義。360的產(chǎn)品全面AI化,目的就是讓小白用戶(hù)可以簡(jiǎn)單輕松地體驗(yàn)到AI帶來(lái)的好處。在應(yīng)用的落地方面,360走得很快,特別是在多模型協(xié)同上領(lǐng)先了OpenAI兩個(gè)月。

學(xué)習(xí)、辦公是最常見(jiàn)的應(yīng)用場(chǎng)景,為了推動(dòng)應(yīng)用了落地,360還推出了AI辦公,是一個(gè)一站式學(xué)習(xí)辦公工具,用戶(hù)可以體驗(yàn)到AI圖片、AI文檔、AI音視頻、AI PPT等超過(guò)200多個(gè)AI能力,幾乎覆蓋所有學(xué)習(xí)、辦公所需。

  • 第三,獨(dú)行不如眾行遠(yuǎn)。

AI的實(shí)現(xiàn),是一個(gè)非常復(fù)雜的系統(tǒng)工程,不是單個(gè)企業(yè)可以實(shí)現(xiàn)的。在業(yè)界有一個(gè)共識(shí),未來(lái)AI的競(jìng)爭(zhēng)是生態(tài)的競(jìng)爭(zhēng)。單個(gè)OpenAI可能很強(qiáng),但是通過(guò)協(xié)同作戰(zhàn),中國(guó)的大模型可以用全新的思路彎道超車(chē)。

經(jīng)測(cè)試,基于CoE架構(gòu)集各家所長(zhǎng)的混合大模型能力就超過(guò)了GPT-4o。該混合大模型在翻譯、寫(xiě)作等12項(xiàng)指標(biāo)的測(cè)試中取得了80.49分的綜合成績(jī),超越了GPT-4o的69.22分;而且除了代碼以外,其余11項(xiàng)指標(biāo)均優(yōu)于GPT-4o。特別是在“邏輯推理”、“多步推理”、“詩(shī)詞賞析”這類(lèi)比較具有中文特色的問(wèn)題上,CoE的領(lǐng)先優(yōu)勢(shì)更加明顯。

目前,360“多模型協(xié)作”在測(cè)試中,已經(jīng)打敗并遠(yuǎn)遠(yuǎn)甩開(kāi)GPT-4o,媲美o1-preview,這就是聯(lián)盟的力量,生態(tài)的威力。

【結(jié)束語(yǔ)】

AI發(fā)展初期,從大模型來(lái)看好像中國(guó)落后一步。如果跟在別人后面延著人家的軌跡追,差距只會(huì)越拉越遠(yuǎn)。以終局思維重新審視AI的發(fā)展路徑,技術(shù)創(chuàng)新的同時(shí)更要路徑創(chuàng)新?!奥伎肌迸c“思維鏈”的巧合,是中國(guó)AI發(fā)展趕超的新契機(jī)。

本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://allfloridahomeinspectors.com/cgo/model/124161.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2024-09-20 20:48
下一篇 2024-09-21 09:32

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論
特別提示:登陸使用搜索/分類(lèi)/最新內(nèi)容推送等功能?>>