文/紀(jì)德
編輯/子夜
AI與內(nèi)容工具結(jié)合,早已不是新鮮事。
從漫畫、海報(bào)制作到影視等應(yīng)用領(lǐng)域,一系列AI產(chǎn)品崛起。大模型對于創(chuàng)作模式和生產(chǎn)方式的顛覆不斷發(fā)生,作家、自媒體人、電影人等多類型創(chuàng)作者,對此深有體會。
但當(dāng)下AI產(chǎn)業(yè)仍缺乏一個(gè)足以激發(fā)需求的超級應(yīng)用。為了讓技術(shù)落地,玩家不斷尋找著理想的落地場景,以百度、Open AI為代表的企業(yè),開始將AI大模型應(yīng)用到一個(gè)可以自由操作的自由畫布中。
在百度世界2024大會上,該產(chǎn)品被命名為“自由畫布”,首次正式亮相。介紹時(shí),李彥宏特別強(qiáng)調(diào),“因?yàn)樽杂僧嫴迹總€(gè)人都可以成為漫畫家、短視頻導(dǎo)演。這不是期貨,而是立即可用的現(xiàn)貨,是真正服務(wù)于創(chuàng)造的新質(zhì)生產(chǎn)力!”
與其他大模型的發(fā)展理念不同,百度用AI重塑自身業(yè)務(wù)時(shí),采用了互相支撐、融合的開發(fā)模式,自由畫布便是文庫和網(wǎng)盤兩大業(yè)務(wù)聯(lián)合推出的產(chǎn)品。
從用戶體驗(yàn)角度,自由畫布重塑了內(nèi)容創(chuàng)作的底層邏輯。AI生成對文字、圖片、音視頻內(nèi)容的影響,往往體現(xiàn)在內(nèi)容制作中一個(gè)個(gè)小的環(huán)節(jié)中,但自由畫布不僅容納了所有可以提升效率、激發(fā)創(chuàng)意的生產(chǎn)環(huán)節(jié),還顛覆了內(nèi)容創(chuàng)作的線性邏輯,讓內(nèi)容的輸入、編輯和修改都變得更自由。
發(fā)布會上,李彥宏還提及了AI生圖的幻覺問題。近年來,AI創(chuàng)作產(chǎn)品的內(nèi)容生成質(zhì)量有限,成為內(nèi)容創(chuàng)作者及行業(yè)面臨的痛點(diǎn)。
李彥宏認(rèn)為,“過去這24個(gè)月,AI行業(yè)的最大變化是大模型基本消除了幻覺?!逼渲?,百度在今年初自研了檢索增強(qiáng)的文生圖技術(shù)iRAG,能夠?yàn)橛脩籼峁┱鎸?shí)、準(zhǔn)確性高、無模型幻覺的生成圖片。
無論是推出自由畫布,還是自研iRAG技術(shù),百度代表的是數(shù)億用戶的高頻使用需求,但更值得關(guān)注的問題是:玩家使勁搞創(chuàng)新,廣大消費(fèi)者又是否愿意為之買單。
1、一張自由操作的AI畫布,能否滿足數(shù)億創(chuàng)作者的所有想象?
近年來,一種全新、直觀、可視的用戶交互界面——自由畫布,顛覆了人們對工作方式的想象和體驗(yàn)。
在國內(nèi),百度是搶先擁抱可視性畫布的先行者;在海外,Canvas火爆,以ChatGPT、OpenAI為代表的玩家正在不斷完善體驗(yàn)。
這個(gè)新玩意,究竟怎么用?相比于一張普通畫布,自由畫布的特殊性在于,它可以適配作家、自媒體人、教師、白領(lǐng)等幾乎所有人群的工作需求,并通過AI、大數(shù)據(jù)等技術(shù),在“一拖一圈”之間,賦予工作方式的智能化。
在模擬小紅書博主撰寫旅游攻略內(nèi)容時(shí),用戶可以借助百度自由畫布輕松完成內(nèi)容的輸入:只需直接拖入素材,如文本、圖片或視頻等人們?nèi)粘=佑|的多達(dá)100多種格式的內(nèi)容,都可以直接呈現(xiàn)在畫布上。
這種不受文件類型限制的自由輸入方式,簡化了復(fù)雜繁瑣的格式轉(zhuǎn)換過程,極大程度上減少了時(shí)間成本。
完成內(nèi)容輸入后,用戶則將進(jìn)入編輯環(huán)節(jié)。當(dāng)用戶提出撰寫文稿、設(shè)計(jì)排版或生成視頻等需求時(shí),往往只需要圈中一塊內(nèi)容,再按下對應(yīng)的功能按鈕,就能完成一次高效、高質(zhì)量的創(chuàng)作。
生成出一個(gè)大圣穿越到現(xiàn)代探險(xiǎn)的故事
自由畫布的交互方式,自由而非線性,機(jī)動(dòng)而非死板。大多用戶已經(jīng)習(xí)慣了AI創(chuàng)作中略顯僵硬的批量生產(chǎn),但自由畫布擁有高度的個(gè)性化編輯。
用戶修改內(nèi)容時(shí),瞬間變身一位“指揮家”,對局部內(nèi)容進(jìn)行輕松選擇和調(diào)用,快速完成文案、圖片的微調(diào),實(shí)現(xiàn)“指哪用哪,指哪改哪”。
大多數(shù)內(nèi)容創(chuàng)作者日常面臨高頻次的修改工作、多輪的內(nèi)容迭代,自由畫布帶來了更動(dòng)感和自由的交互,增強(qiáng)了用戶的參與感和內(nèi)容的個(gè)性化,從而使內(nèi)容創(chuàng)作者可以得到獨(dú)一無二的作品。
自由畫布不僅在內(nèi)容輸入和編輯環(huán)節(jié),擁有強(qiáng)大的協(xié)同能力,對于內(nèi)容分享的體驗(yàn),也極其重視。
無論是分享,還是查看和二次編輯,用戶可以僅通過一個(gè)鏈接完成。其中,二次編輯帶來的不同體驗(yàn)尤為突出。
傳統(tǒng)的內(nèi)容導(dǎo)出,一旦出錯(cuò)無法更正,重新發(fā)布的代價(jià)高,但很多時(shí)候,用戶還會有再次編輯的需求,自由畫布的二次編輯解決了用戶的痛點(diǎn)。
數(shù)年以來,AI技術(shù)對于內(nèi)容創(chuàng)作領(lǐng)域不斷產(chǎn)生影響,改進(jìn)了現(xiàn)有產(chǎn)品或服務(wù)。百度自由畫布,利用新技術(shù)滿足了內(nèi)容創(chuàng)作者對靈活、高效服務(wù)的需求,甚至讓每個(gè)人都能無門檻地涉足更多類型內(nèi)容的制作中。
自由畫布,不僅顛覆了傳統(tǒng)的內(nèi)容生產(chǎn)工具,也超越了現(xiàn)有的AI創(chuàng)作工具。
它是一個(gè)全新的生產(chǎn)力平臺,通過將Word、PPT、Excel等常見的辦公工具,放到一張自由畫布上,其成為一個(gè)涵蓋Office全家桶+Canvas的產(chǎn)品,不僅打破用戶苦惱已久的孤島問題,也將改變用戶的日常工作流程。
2、AI生圖進(jìn)入“超真實(shí)”時(shí)代,iRAG究竟有多強(qiáng)?
在生成式AI時(shí)代,AIGC的應(yīng)用范圍,從文本、圖片延伸至視頻場景。工作過程中,一句話的輸入、一次鼠標(biāo)的點(diǎn)擊,就能完成一次創(chuàng)作。
然而,真正的挑戰(zhàn)在于,用戶越來越不習(xí)慣于那股“AI味”,甚至是AI幻覺。
在大會上,李彥宏展示了一張北京天壇的生成照片——真正的天壇是3層建筑,該開源模型卻生成了4層。
他提及,幻覺問題是大模型廣泛應(yīng)用的最大限制之一,“要想基于大模型開發(fā)應(yīng)用,消除幻覺是必須的,如果這個(gè)模型總是一本正經(jīng)地胡說八道,就不會有人信你,就不會有應(yīng)用?!?/strong>
過去一段時(shí)間,用戶對AI工具的生成能力提出了更高需求,例如,更真誠走心的語言、更精細(xì)真實(shí)的圖片等。
而各個(gè)企業(yè)要做的就是,跨越技術(shù)的復(fù)雜性,提升用戶的滿意度。為了解決幻覺問題,今年初百度自研了iRAG技術(shù),這是一種結(jié)合檢索和生成的技術(shù)方法,更好地提升了生成內(nèi)容的可靠性和準(zhǔn)確性。
例如,用戶在體驗(yàn)文章的封面圖制作時(shí),可能會在文心一言的輸入框中寫下以下需求:幫我畫一張馬斯克和一只迅猛龍?jiān)诤髠湎淅飫兌菇恰?/p>
用戶會發(fā)現(xiàn),文心一言完美理解了提示詞,生成的圖像沒有漏掉任何一個(gè)人物或物體的特征,臉部或手部等細(xì)節(jié)處呈現(xiàn)得足夠精細(xì),還兼顧了圖片的構(gòu)圖和審美。
文心一言AI生圖
市面上較為成熟的大模型,往往具有強(qiáng)大的文本理解能力。作為重要的選手之一,百度擁有國內(nèi)最大的中文搜索引擎,以及全網(wǎng)最全的中文語料。
iRAG技術(shù)成功實(shí)現(xiàn)自研的基礎(chǔ),便是將百度搜索的億級中文語料、圖片資源,與強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,避免了事實(shí)錯(cuò)誤、推理失敗等“一眼假”問題,真正實(shí)現(xiàn)無幻覺、超真實(shí)。
用戶可以通過iRAG技術(shù),生成特定物品、特定人物與任意背景結(jié)合的圖片,這提升了生成效果的多樣性,也激發(fā)了用戶發(fā)揮自身想象,通過合理組合人物、構(gòu)架場景,創(chuàng)造出更豐富的AI生圖。
例如,用戶可以上傳保時(shí)捷帕拉梅拉的圖片,生成其在草原上行駛的畫面;生成一張比薩斜塔和自由女神像,同框出現(xiàn)在中心城區(qū)的照片;生成一張福建土樓出現(xiàn)在現(xiàn)代都市里的圖等。
生成保時(shí)捷帕拉梅拉在草原上行駛的圖片
文生圖技術(shù)的持續(xù)迭代,為內(nèi)容創(chuàng)作者和行業(yè)帶來了更多可能性。
當(dāng)iRAG技術(shù)能夠突破數(shù)據(jù)要求和計(jì)算難度,產(chǎn)出令人滿意的文生圖,也就意味著,可以順利幫助內(nèi)容創(chuàng)作者突破算力瓶頸,縮短內(nèi)容制作周期。同樣的作品,在更短的時(shí)間內(nèi)制造出來,且內(nèi)容精良程度還會大幅提升。
同時(shí),以更低的成本進(jìn)行內(nèi)容生產(chǎn),也是iRAG為行業(yè)帶來的直觀影響。在部分環(huán)境,iRAG技術(shù)可以將創(chuàng)作成本壓縮到幾乎為零。
“比如在品牌宣傳場景,以前拍這樣一組海報(bào)動(dòng)輒需要一二十萬,甚至大幾十萬,但是現(xiàn)在創(chuàng)作的成本接近于0。簡單說來,iRAG的商業(yè)價(jià)值體現(xiàn)在:無幻覺、超真實(shí)、沒成本,立等可取?!崩顝┖晏岬健?/p>
隨著百度不斷攻克技術(shù)難點(diǎn),iRAG的應(yīng)用場景也在不斷延伸,包括漫畫作品、連續(xù)畫本、海報(bào)制作、影視作品等應(yīng)用領(lǐng)域,iRAG為提高AI生成內(nèi)容的真實(shí)感和精細(xì)度,下足了功夫。
iRAG技術(shù)泛用到更多應(yīng)用空間,也為這些行業(yè)提供了短周期、低成本的解決方案。
3、百度再進(jìn)化:用AI連接一切業(yè)務(wù),重塑內(nèi)容生態(tài)鏈條?
作為生成式AI和大模型技術(shù)的領(lǐng)先玩家,近年來百度的技術(shù)進(jìn)階和應(yīng)用布局實(shí)現(xiàn)大幅進(jìn)步。
從深度學(xué)習(xí)框架“飛槳”的持續(xù)升級,到文心大模型性能的提升,再到內(nèi)部不斷重構(gòu)已有產(chǎn)品,百度已形成一個(gè)處于動(dòng)態(tài)且正向循環(huán)的AI商業(yè)生態(tài)。
無論是AI創(chuàng)作新物種自由畫布的橫空出世,還是AI生圖技術(shù)iRAG的能力躍遷,背后都離不開百度深厚的積累和實(shí)踐。
自由畫布的自由、靈活、高效,源于文心大模型的持續(xù)進(jìn)化。從創(chuàng)作自由度來看,文心大模型的跨模態(tài)能力,能夠支撐不同領(lǐng)域、不同模態(tài)的內(nèi)容生成,在提升效率的同時(shí),也為用戶提供了更好的使用體驗(yàn)。
而文心大模型的升級,也為iRAG技術(shù)的高質(zhì)量生成提供了技術(shù)可能。隨著百度對大模型性能的提升,今年6月份發(fā)布的文心大模型4.0 Turbo,比上一版速度更快、效果更好,理解、生成等基礎(chǔ)性能均有顯著提升。
在供給側(cè),百度不斷迭代出最強(qiáng)大的基礎(chǔ)大模型系列,包括文心大模型旗艦版ERNIE 3.5、4.0、4.0 Turbo,也提供可以免費(fèi)調(diào)用的輕量版ERNIE Speed、Lite、Tiny,降低了用戶的使用門檻。
截至11月初,百度文心大模型的日均調(diào)用量已經(jīng)超過15億,相較一年前首次披露的5000萬次,增長近30倍。
隨著AI技術(shù)能力不斷進(jìn)化,百度也在擴(kuò)大AI落地應(yīng)用的規(guī)模。
在重構(gòu)業(yè)務(wù)中,百度文庫的進(jìn)化效果顯著,其從一個(gè)文檔共享平臺進(jìn)化為內(nèi)容創(chuàng)作的“AI百寶箱”,將應(yīng)用場景拓展到了學(xué)習(xí)辦公、家庭教育、娛樂消費(fèi)等多個(gè)領(lǐng)域,推出了智能PPT、智能寫作、思維導(dǎo)圖等上百項(xiàng)AI能力。
如今,百度文庫AI月活用戶規(guī)模,已經(jīng)達(dá)到國內(nèi)第一梯隊(duì)。據(jù)其披露的數(shù)據(jù),百度文庫在智能PPT領(lǐng)域的市場份額已經(jīng)超過八成;截至2024年10月,百度文庫AI用戶數(shù)累計(jì)超過2.3億,AI功能累計(jì)使用次數(shù)超過28億。
百度的最終目標(biāo)是,在大模型時(shí)代形成由無數(shù)智能體構(gòu)成的智能生態(tài)。
李彥宏認(rèn)為,智能體是AI應(yīng)用的最主流形態(tài),即將迎來它的爆發(fā)點(diǎn)。“在模型之上構(gòu)建智能體是相當(dāng)方便的,這也是為什么今天每周都有上萬個(gè)新的智能體在文心平臺上被創(chuàng)造出來?!?/p>
AI搜索被認(rèn)為是智能體分發(fā)的入口。借助AI,百度的搜索引擎變得更懂用戶的細(xì)分需求,可以為用戶提供更準(zhǔn)確和直接的答案,也提升了開發(fā)者效率,開發(fā)者更容易創(chuàng)建出為用戶量身定制的智能體。用李彥宏的話說,生成式AI與搜索就是“天作之合”。
作為工具類智能體,自由畫布便是智能生態(tài)中各業(yè)務(wù)相互融合后形成的獨(dú)特產(chǎn)物。
它的能力來源于百度文庫與百度網(wǎng)盤,前者為其提供了海量的公域資料,后者則協(xié)助其從私域中提供素材。比如,文庫上公開的高質(zhì)量文檔或片段、網(wǎng)盤聽記上記錄的多場電話會議的音頻等,用戶全都可以用到自己的創(chuàng)作中。
兩大業(yè)務(wù)深度融合后,幫助自由畫布打通了過去公域與私域資料之間存在的限制,避免了AI應(yīng)用之間數(shù)據(jù)流通的孤島現(xiàn)象。用戶通過自由畫布可以不受阻礙地進(jìn)行內(nèi)容資源的消費(fèi)或運(yùn)用,以創(chuàng)作多元化和專業(yè)化的內(nèi)容。
而更高質(zhì)量的AI生成內(nèi)容,又可以豐富整個(gè)內(nèi)容生態(tài),進(jìn)一步改變用戶AI產(chǎn)品或工具的價(jià)值認(rèn)知,驅(qū)動(dòng)用戶擁抱被AI改寫的內(nèi)容消費(fèi)。
百度一直極為重視挖掘AI時(shí)代的增長潛力。李彥宏也曾在公開場合呼吁,“中國有數(shù)百個(gè)基礎(chǔ)模型,但人們越來越多地討論什么是AI時(shí)代的超級應(yīng)用”,行業(yè)參與者應(yīng)當(dāng)將精力放到AI應(yīng)用上。
事實(shí)上,百度已經(jīng)在大模型與AI應(yīng)用的相互配合之中,將技術(shù)優(yōu)勢轉(zhuǎn)化為具體的商業(yè)價(jià)值——越來越多創(chuàng)新產(chǎn)品可以為整個(gè)生態(tài)提供發(fā)展增量。
接下來的事情就要交給時(shí)間:持續(xù)保持在產(chǎn)品創(chuàng)新、市場推廣等方面的投入,提升用戶滿意度和產(chǎn)品的市場接受度,不斷穩(wěn)固其市場地位,并等待用戶需求爆發(fā)的那一刻。
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/cgo/model/126517.html