大模型時代,「重識」云知聲

AI時代,新的主角

 

大模型時代,「重識」云知聲

 

在山海大模型發(fā)布會現(xiàn)場,黃偉有一句話令人印象深刻,“云知聲的過去十年,就是為山海而生。

作者| 皮爺

出品|產(chǎn)業(yè)家

 

“誰能做成中國最好的大模型?”在今年3月一個北京投資人的內(nèi)部分享會上,有人滿懷期待地提出這樣一個問題。但可惜,這個問題沒有答案,或者說沒人可以論證自己的答案。

在過去的幾個月時間里,伴隨著ChatGPT這款現(xiàn)象級產(chǎn)品的出現(xiàn),大模型的熱度只增不減,不論是互聯(lián)網(wǎng)大廠,還是新興的互聯(lián)網(wǎng)創(chuàng)業(yè)者,抑或是傳統(tǒng)AI企業(yè),推出的大模型如雨后春筍般出現(xiàn)在市場。

根據(jù)不完全統(tǒng)計,今年3月以來,中國市場已經(jīng)出現(xiàn)超過30款大模型產(chǎn)品,其覆蓋領域除了固有的通用大模型,更有專門面向細分賽道的中模型(產(chǎn)業(yè)模型),如低代碼、工業(yè)、能源等等。

但兩個月過去了,文章開篇的問題依舊沒有答案。

幾個最現(xiàn)實的問題是,伴隨著大模型數(shù)量的增加,市場對大模型產(chǎn)品本身抱有更現(xiàn)實,或者說更審慎的態(tài)度,即大模型究竟能解決什么問題?在智能對話、邏輯推理之外,大模型距離能落地到真實的產(chǎn)業(yè)場景,還有多遠的路要走?它需要多久才能轉(zhuǎn)化為真正的社會生產(chǎn)力?

問題背后,對應的不僅是市場對大模型產(chǎn)品的深度思考,也更是對當下中國數(shù)字化、智能化未來的方向探索。大模型產(chǎn)品背后的企業(yè)需要用更落地的動作,完成自證。

最近,產(chǎn)業(yè)家連線了云知聲創(chuàng)始人兼CTO梁家恩博士,從他的視角來理解這次大模型浪潮到底意味著什么,以及對云知聲,這家AI賽道的老兵而言,它正在交出的是一張怎樣的答卷。

在他和云知聲看來,變化和自證,已然在路上。

 

、云知聲,「交卷」

511分——這是在云知聲大模型發(fā)布現(xiàn)場,云知聲創(chuàng)始人黃偉公示的一個分數(shù)。它是云知聲山海大模型能在臨床執(zhí)業(yè)醫(yī)師醫(yī)學考試中拿到的分數(shù),這個考試總分是600分,而參加考試的考生平均分是365分。

大模型時代,「重識」云知聲

在醫(yī)療領域,MedQA評測也超過81分,這是一張超過GPT-4的成績單。

“我們想經(jīng)過領域增強訓練,讓大模型在專業(yè)領域從本科訓練到博士?!绷杭叶鞲嬖V產(chǎn)業(yè)家。而在醫(yī)療領域,這個想法正在落地。

這也正是這次云知聲山海大模型發(fā)布會的不同之處。即在市面上大模型現(xiàn)場展示的語言對話能力、邏輯推理能力之外,山海大模型傳出的聲音也更多在集中產(chǎn)業(yè)層面,比如醫(yī)療、家居、教育、汽車等多個產(chǎn)業(yè)領域。

以醫(yī)療領域為例,人們不僅可以基于某個病癥獲得準確的醫(yī)療答案,在臨床中,醫(yī)生更可以通過語音生成病歷關(guān)鍵詞,在山海大模型的輔助下,基于病歷輔助醫(yī)生生成完整的病歷方案;同時也更可以幫助患者和保險公司進行醫(yī)療相關(guān)的保險理賠。

再比如在物聯(lián)網(wǎng)領域,山海大模型可以實現(xiàn)主動智能、情感化回復以及多輪復雜對話等等,像鋼鐵俠里的“賈維斯”一樣幫助人們安排日程,成為智能物業(yè)管家。

此外,山海大模型還可以成為特定領域的“銷售專家”“知識管理專家”“口語專家”等等,基于大模型對特定的產(chǎn)業(yè)場景進行深度賦能。

“現(xiàn)在基本上OpenAI等機構(gòu)列出的開源英文語料類別和中文語料類別,我們都已經(jīng)進行了訓練,還增加了自己的中文和醫(yī)療數(shù)據(jù)?!?/strong>梁家恩告訴我們。

大模型時代,「重識」云知聲

根據(jù)云知聲的“U+X”戰(zhàn)略,山海大模型交出的這張答卷不僅在通用大模型的“肌肉”上,如常規(guī)的語言生成、語言理解、邏輯推理、數(shù)據(jù)和代碼能力、安全合規(guī)能力,也更在具體的產(chǎn)業(yè)落地上,即通過插件擴展、領域增強和企業(yè)定制,在專業(yè)的產(chǎn)業(yè)領域?qū)崿F(xiàn)更針對性的落地和適配。

這是一張怎樣的答卷?

 

、從專用到通用,路徑背后的AI TO B

“比如如果OpenAI通用能做到95分,但很多專業(yè)領域可靠性還達不到實用化要求;我們的通用基座可以做到90分,然后會優(yōu)先在不同領域分別進行強化,最終能在領域里落地?!绷杭叶鞅硎?。

伴隨著OpenAI的持續(xù)大火,在人們驚嘆AI迎來轉(zhuǎn)折點的同時,一些隱性的問題也更在出現(xiàn),比如對GPT模型而言,其目前更展現(xiàn)的價值點在通用板塊,如對語義的理解,邏輯推理等等能力,但在具體的產(chǎn)業(yè)側(cè),它必須要進行針對性的訓練才能滿足基本要求。

其中,醫(yī)療是當下人們談論最多的領域,作為一個“嚴肅”的學科和領域,其醫(yī)療對大模型在訓練過程中出現(xiàn)的“幻覺”現(xiàn)象可謂是零容忍,換言之,如果大模型想要在醫(yī)療領域落地,就必須進行足夠?qū)I(yè)的數(shù)據(jù)訓練和微調(diào),才能實現(xiàn)“產(chǎn)業(yè)化”。

也可以說,如果說金融行業(yè)是數(shù)據(jù)庫等國產(chǎn)廠商能力自證的高地,那么醫(yī)療作為復雜度和知識密度極高的行業(yè),恰可以看作是大模型具備產(chǎn)業(yè)賦能能力的最強磨刀石。

“在此之前,我們做了大量的醫(yī)療智能化案例,有大量的醫(yī)療數(shù)據(jù)積累,以及全面的知識圖譜能力,這是我們預先選擇醫(yī)療方向的基礎?!绷杭叶鞲嬖V我們。

這是云知聲一直選擇出擊的方向。以云知聲的「醫(yī)療語音錄入系統(tǒng)」為例,其可以讓醫(yī)生通過說話實時把文本錄入到希望輸入的地方,解決固有的“一邊交流,一邊記錄病歷”的問題,釋放醫(yī)生在病歷謄寫上的時間。

據(jù)了解,這套系統(tǒng)的語音識別準確率達到 95% 以上,尤其在神經(jīng)科、免疫內(nèi)科、血液科、普通內(nèi)科等疑難雜癥患者多的科室應用效果好,個別科室的語音識別率甚至超過 98%。

類似的醫(yī)療智能化案例在過去幾年是云知聲發(fā)力的主要方向之一,而這些智能化的解決方案和數(shù)據(jù)如今都被訓練到山海大模型中。據(jù)了解,接下來,山海大模型將在國內(nèi)頭部三甲醫(yī)院陸續(xù)落地。

和醫(yī)療類似,物聯(lián)網(wǎng)也是云知聲山海大模型重點落地的一個方向?;诖竽P偷哪芰?,云知聲可以在原有的AIOT生態(tài)基礎上做到智慧物聯(lián)3.0。同樣的,這項能力如今也已經(jīng)在部分智慧產(chǎn)業(yè)園區(qū)等場景中逐漸落地。

醫(yī)療、物聯(lián)網(wǎng)對應的方向也恰是云知聲在走的大模型路徑——由專用走向通用。即相較于在通用大模型的底座上不斷進行通用數(shù)據(jù)疊加,云知聲的做法是在底層通用底座的基礎上,直接到專用(產(chǎn)業(yè))領域進行針對化的訓練,“逐步把每個領域都做到博士水平”,最終反哺底座大模型實現(xiàn)更為準確的產(chǎn)業(yè)表達。

實際上,這恰是最符合當下產(chǎn)業(yè)落地的大模型路徑。即真正從產(chǎn)業(yè)的問題和實際情況出發(fā),進行相應的產(chǎn)業(yè)模型表達,通過一個個專業(yè)領域的模型能力沉淀,最終做到底座大模型的“通用化”和“專業(yè)可靠”。

大模型時代,「重識」云知聲

此外,伴隨著產(chǎn)業(yè)數(shù)據(jù)的不斷涌入,云知聲通過優(yōu)化后的框架和梳理過的高質(zhì)量數(shù)據(jù),保證大模型具備“抗臃腫”屬性的同時,實現(xiàn)模型的準確度和產(chǎn)業(yè)服務能力。

“數(shù)據(jù)并非越多越好,包括學術(shù)界大家也在討論,在達到一定的數(shù)據(jù)量后,模型的準確度和效果就不會隨著數(shù)據(jù)量的增加而不斷優(yōu)化,數(shù)據(jù)質(zhì)量和多樣性更關(guān)鍵?!绷杭叶鞲嬖V我們,“最終還是要回歸到框架和數(shù)據(jù)的優(yōu)化。”

如果把時間線往前翻,早在2016年,云知聲團隊就開始建立大規(guī)模超算平臺Atlas,在這個希臘神話里代表泰坦族擎天神的平臺之上,云知聲開始了如前文所說的醫(yī)療、物聯(lián)網(wǎng)等產(chǎn)業(yè)方向的AI賦能嘗試。

“所以,現(xiàn)在單純堆數(shù)據(jù)對云知聲來說是沒有任何難度的,難度在于在一個個具體的產(chǎn)業(yè)里能實現(xiàn)落地,可靠并且可用?!绷杭叶鞅硎?。

 

、大模型時代,被釋放的「AI力」

如果從更大視角來看云知聲選擇的路徑,會發(fā)現(xiàn)一切并非偶然,注重工程優(yōu)化和產(chǎn)業(yè)規(guī)模化能力是其突出特點,也更不是一條容易的路。

比如,2016年底層Atlas平臺建立時,云知聲還僅是一個成立4年的創(chuàng)業(yè)公司,“硅谷的專家甚至驚訝,一家成立四年的創(chuàng)業(yè)公司考慮這個問題還太早?!?/p>

比如,在Atlas平臺之上的數(shù)據(jù)中心模型優(yōu)化(DCML)層。在2016年云知聲開始進入醫(yī)療行業(yè)后,逐步意識到解決不同醫(yī)院和科室的數(shù)據(jù)差異性,是實現(xiàn)規(guī)?;瘧玫年P(guān)鍵,就開始構(gòu)建“統(tǒng)一模型架構(gòu)+數(shù)據(jù)迭代調(diào)優(yōu)”的開發(fā)模式,即將AI能力能夠更為標準化地應用到各個領域,進而實現(xiàn)AI能力的泛“標準化”,就是現(xiàn)在支撐山海大模型訓練的DCML平臺。

再比如,同樣是在2016年,云知聲將行業(yè)內(nèi)普遍認為的“靠GPU才能跑起來”的深度學習技術(shù),優(yōu)化到能在CPU甚至手機芯片上跑起來。同時期,他們甚至把模型做進了主頻只有200MHz、計算內(nèi)存只有200k的WiFi芯片中。

這些在當時看來“不合常理”“超前、費力”的布局,如今都在構(gòu)成著云知聲在這場新的大模型潮水中交出自己答卷的底氣。不論是醫(yī)療,還是家居,再或者是如今云知聲正在深入“教育”等行業(yè),山海大模型都能基于完整的技術(shù)支撐實現(xiàn)快速的適配和落地。

梁家恩告訴我們,現(xiàn)在山海大模型在本地部署,企業(yè)只需要使用“A10”級別的GPU,就可以達到使用“A100/A800”的推理效果,前者成本僅1萬人民幣左右,而后兩者成本均超過上萬美元,本地部署成本降低甚至可以超過80%,后續(xù)還可以進一步優(yōu)化。

在技術(shù)支撐之外,基于過往在醫(yī)療等行業(yè)服務的經(jīng)驗,云知聲可以更為迅速地在其它領域進行知識圖譜的搭建,配合大模型做到更專業(yè)的落地。這是所有AI企業(yè)都在實踐的路徑,當同時兼具大模型和知識圖譜能力的團隊并不多。

用梁家恩的話來說就是,“如今云知聲正在進行第三次技術(shù)升級。”如果說2016年,云知聲完成的是從“聲(感知)”到“知(認知)”的全棧技術(shù)體系升級,那么在2022年開始,這家AI企業(yè)正在完成的是從“專用AI走向通用AGI”的升級。

不過,今天又和2016年云知聲面臨的情況不同。

即盡管2016年云知聲不論是從底層超算平臺,還是上層的數(shù)據(jù)模型,再或者是基于醫(yī)療行業(yè)的深入,都在進行創(chuàng)新式的嘗試,并驗證了企業(yè)自身前進的路徑。但在當時的時間點,不論是AI能實現(xiàn)的功能和不同行業(yè)的復用性,還是人們對AI的認知,都停留在淺層面。

可以理解為,之前AI的生產(chǎn)價值更多的是“專用業(yè)務系統(tǒng)+標準AI零部件”的組裝模式,業(yè)務層的標準化和復用性相當不足,理解能力和靈活性上都有瓶頸;但現(xiàn)在伴隨著大模型的出現(xiàn),可以通過自然語言對接大部分任務,智商顯著提升,且能通過大模型調(diào)優(yōu)而非編程方式拓展業(yè)務能力,MaaS模式開始成為可能,它正在重新定義AI在企業(yè)數(shù)字化轉(zhuǎn)型中的位置和作用,更為具體化,也更為有實操性。對AI企業(yè)而言,其也對應的是更強大且能夠復用的產(chǎn)品技術(shù)價值。

換言之,大模型打破了市場對如云知聲這樣的AI企業(yè)設定的業(yè)務邊界和商業(yè)價值的認知壁,重新認識到整合語言、知識、推理、決策等認知能力的大模型,對業(yè)務智能化的核心價值和重要意義,它們能做的事情、未來能達到的想象空間,都在有了更新的界定。

而這些的基礎,也恰都建立在云知聲這樣的企業(yè)在過往多年的技術(shù)堅持和市場探索。在這個AI正在成為社會核心生產(chǎn)力的當下,云知聲們正在成為真正的主角。

在山海大模型發(fā)布會現(xiàn)場,黃偉有一句話,令人印象深刻,“云知聲的過去十年,就是為山海而生?!?/p>

 

寫在最后:

云知聲的大模型路徑可以總結(jié)為“產(chǎn)業(yè)AI”。即市面上不少大模型的路徑是,先進行大模型的底層訓練,訓練到一定數(shù)量級再去尋找能夠落地的產(chǎn)業(yè)場景和價值。

但云知聲的目的和方向都很明確,即初始方向就是在通用大模型的基礎上,實現(xiàn)某個專用(產(chǎn)業(yè))的模型能力增強和落地,并且先在醫(yī)療和物聯(lián)等優(yōu)勢產(chǎn)業(yè)驗證,再拓展不同應用場景分別進行訓練嘗試,衡量標準是模型是否能在產(chǎn)業(yè)內(nèi)可用、可靠、有價值。

從大模型沒有達到終局的現(xiàn)階段來看,雖然不能論路徑的對錯與否,但云知聲等企業(yè)的路徑更能讓大模型與真實世界產(chǎn)生交集和連接,并且由此一步步轉(zhuǎn)化為真實可見的生產(chǎn)力,不單純完成TO C的呈現(xiàn),更實現(xiàn)了在產(chǎn)業(yè)側(cè)的“非泡沫”論證,在具體的醫(yī)療產(chǎn)業(yè)側(cè),目前其效果和能力更是在超過GPT-4。

這是云知聲帶來我們的思考,也更是中國AI技術(shù)的一次新的自證。

本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/quan/98286.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-05-24 22:17
下一篇 2023-05-25 00:07

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復

登錄后才能評論