未來開發(fā)應(yīng)用像拍短視頻一樣簡單!李彥宏帶來三大AI開發(fā)工具,人人都是開發(fā)者

2024-04-16 11:59:10來源:威易網(wǎng)作者:

未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,用自己的創(chuàng)造力改變世界。

“未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,用自己的創(chuàng)造力改變世界。”

4月16日,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在Create 2024百度AI開發(fā)者大會上發(fā)表“人人都是開發(fā)者”的主題演講,他指出,“AI正在掀起一場創(chuàng)造力革命,未來開發(fā)應(yīng)用就像拍個(gè)短視頻一樣簡單,人人都是開發(fā)者,人人都是創(chuàng)造者。”

他表示,百度作為一家技術(shù)公司,定位是盡可能為大家提供所需的開發(fā)工具,提升社會創(chuàng)造力,這包括了1個(gè)強(qiáng)大的基礎(chǔ)模型系列和三大AI開發(fā)工具,它們組成了一個(gè)工具箱,支持開發(fā)者打包帶走,隨取隨用。

強(qiáng)大的基礎(chǔ)模型系列,也就是文心大模型系列,包括了:旗艦版的ERNIE3.5和4.0,和輕量版的ERNIE Speed、Lite、Tiny等;現(xiàn)場,李彥宏還正式發(fā)布了文心大模型4.0的工具版。文心一言發(fā)布一年多以來,用戶數(shù)已經(jīng)突破2億,目前,文心大模型已成為中國最領(lǐng)先、應(yīng)用最廣泛的AI基礎(chǔ)模型。

李彥宏強(qiáng)調(diào),通過強(qiáng)大的文心4.0降維裁剪出來的更小尺寸模型,要比直接拿開源調(diào)出來的模型,同等尺寸下效果明顯更好,同等效果下,成本明顯更低,“大家以前用開源覺得開源便宜,其實(shí)在大模型場景下,開源是最貴的。所以開源模型會越來越落后。”

同時(shí),百度還為大家做好了“開箱即用”的三大AI開發(fā)工具,包括智能體開發(fā)工具AgentBuilder、AI原生應(yīng)用開發(fā)工具AppBuilder、各種尺寸的模型定制工具M(jìn)odelBuilder。“這三個(gè)工具,都代表了先進(jìn)生產(chǎn)力。”

會上,李彥宏分享了百度基于大模型開發(fā)AI原生應(yīng)用的具體思路,指出MoE、小模型和智能體是值得關(guān)注的三個(gè)方向,“這是我們百度根據(jù)過去一年的實(shí)踐,踩了無數(shù)的坑,交了高昂的學(xué)費(fèi)換來的。”

以下是李彥宏《人人都是開發(fā)者》主題演講實(shí)錄:

你只要會說話,就可以成為一名開發(fā)者

大家好,歡迎參加Create 2024百度AI開發(fā)者大會,這是Create大會首次在粵港澳大灣區(qū)舉辦。今天現(xiàn)場來了5000多位開發(fā)者和科技愛好者。過去這一年,我跟很多創(chuàng)業(yè)者、開發(fā)者交流,感覺大家都處在一種“FOMO”狀態(tài),也就是Fear of Missing Out,既興奮、又害怕錯(cuò)過。確實(shí),大模型和生成式AI,將徹底改變開發(fā)者這個(gè)群體。

過去,開發(fā)者用代碼改變世界;未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,用自己的創(chuàng)造力改變世界。

\

這一天并不遙遠(yuǎn),我們看到,因?yàn)橛辛藦?qiáng)大的基礎(chǔ)大模型,有了很多低門檻,甚至零門檻的開發(fā)工具,開發(fā)者的生產(chǎn)力大大提高了。

比如,基于文心大模型的智能代碼助手Comate,不僅支持100多種語言和所有主流IDE平臺,可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優(yōu)化方案,還可以深度解讀代碼庫、關(guān)聯(lián)私域知識生成新的代碼。上崗一年多,Comate已經(jīng)走入了喜馬拉雅、三菱電梯、軟通動(dòng)力等上萬家企業(yè),生成的代碼采納率達(dá)到了46%,百度每天新增的代碼中,已經(jīng)有27%是由Comate生成的。

今天,你不會寫代碼,也可以做出一個(gè)AI應(yīng)用;不用編程,也可以做出一個(gè)智能體。AI正在掀起一場創(chuàng)造力革命,未來開發(fā)應(yīng)用就像拍個(gè)短視頻一樣簡單,人人都是開發(fā)者,人人都是創(chuàng)造者。

作為一家技術(shù)公司,百度的角色定位,就是盡可能地為大家提供所需的開發(fā)工具,不斷提升整個(gè)社會的創(chuàng)造力。具體來說,我們提供1個(gè)強(qiáng)大的基礎(chǔ)模型系列,就是文心大模型系列,這包括旗艦版的ERNIE3.5, ERNIE4.0, 也包括輕量版的ERNIE Speed、Lite、Tiny等等。

我們還提供基于大模型來開發(fā)各種應(yīng)用的工具,包括智能體開發(fā)工具AgentBuilder,AI原生應(yīng)用開發(fā)工具AppBuilder,以及各種尺寸的模型定制工具M(jìn)odelBuilder。這三個(gè)工具,都代表了先進(jìn)生產(chǎn)力。下面,我會給大家一一展示。

文心一言用戶超2億,文心大模型4.0工具版發(fā)布

首先講一下,文心一言和文心大模型的最新進(jìn)展:

文心一言從去年3月16日發(fā)布,到今天是一年零一個(gè)月的時(shí)間。我們的用戶數(shù)突破了2億,API日均調(diào)用量也突破了2億,服務(wù)的客戶數(shù)達(dá)到了8.5萬,利用千帆平臺開發(fā)的AI原生應(yīng)用數(shù)超過了19萬。

圖形用戶界面描述已自動(dòng)生成

我們看看,大家都在用文心一言做什么?

(詳見文心一言用戶采訪視頻)

視頻中的真人真事只是冰山一角。我們可以看到,文心一言正在改變更多人的工作和生活。

支撐文心一言的基座模型,就是文心大模型。過去一年,它經(jīng)歷了從3.0版本到3.5,再到4.0版本的進(jìn)化。文心4.0在理解、生成、邏輯、記憶四大能力方面,均達(dá)到了業(yè)界領(lǐng)軍水平。

近幾個(gè)月來,文心大模型在代碼生成、代碼解釋、代碼優(yōu)化等通用能力方面實(shí)現(xiàn)了進(jìn)一步的顯著提升,達(dá)到國際領(lǐng)先水平。

今天,我們正式發(fā)布文心大模型4.0的工具版,現(xiàn)在,大家可以在工具版上,體驗(yàn)代碼解釋器功能,通過自然語言交互,就能實(shí)現(xiàn)對復(fù)雜數(shù)據(jù)和文件的處理與分析,還可以生成圖表或文件,能夠快速洞察數(shù)據(jù)中的特點(diǎn)、分析變化趨勢、為后續(xù)的決策提供高效精準(zhǔn)的支撐。

文心大模型已經(jīng)成為了中國最領(lǐng)先、應(yīng)用最廣泛的AI基礎(chǔ)模型。

不僅如此,相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。

也就是說,客戶原來一天調(diào)用1萬次,同樣成本現(xiàn)在可以調(diào)用100萬次。媒體可能不會因?yàn)槌杀鞠陆?9%而興奮。但是企業(yè)也好,開發(fā)者也好,一旦用起來,最關(guān)注的就是效果和成本。

我們能在提升性能的同時(shí),把推理成本降到1%,正是因?yàn)榘俣仍谛酒、框架、模型、?yīng)用這四層架構(gòu)上有著全棧的布局,通過端到端優(yōu)化,不斷地把成本打下來,讓更多人都可以高效、低價(jià)地用大模型來做AI應(yīng)用。

毫無疑問,大模型相關(guān)的話題,在2024年依然會很熱,各類技術(shù)突破還會不斷涌現(xiàn)。媒體也會繼續(xù)熱衷于用“震撼發(fā)布”“史詩級更新”這樣的標(biāo)題進(jìn)行渲染。但我想強(qiáng)調(diào)的是,大模型本身并不直接創(chuàng)造價(jià)值,基于大模型開發(fā)出來的AI應(yīng)用才能滿足真實(shí)的市場需求。

分享開發(fā)AI原生應(yīng)用的具體思路和工具:“踩了無數(shù)的坑,交了高昂學(xué)費(fèi)”

今天我想跟大家分享的是一些基于大模型開發(fā)AI原生應(yīng)用的具體思路和工具。這是我們百度根據(jù)過去一年的實(shí)踐,踩了無數(shù)的坑,交了高昂的學(xué)費(fèi)換來的。

\

第一是MoE。未來大型的AI原生應(yīng)用基本都是MoE架構(gòu),這里所說的MoE不是一般的學(xué)術(shù)概念,而是大小模型的混用,不依賴一個(gè)模型來解決所有問題。但什么時(shí)候調(diào)用小模型、什么時(shí)候調(diào)用大模型、什么時(shí)候不調(diào)用模型,這都是有技術(shù)含量的,要針對應(yīng)用的不同場景做匹配。

第二是小模型。小模型推理成本低,響應(yīng)速度快,在一些特定場景中,經(jīng)過SFT精調(diào)后的小模型,它的使用效果可以媲美大模型。這就是我們發(fā)布Speed,Lite、Tiny三個(gè)輕量模型的原因。我們通過大模型,壓縮蒸餾出來一個(gè)基礎(chǔ)模型,然后再用數(shù)據(jù)去訓(xùn)練,這比從頭開始訓(xùn)小模型,效果要好很多,比基于開源模型訓(xùn)出來的模型效果更好,速度更快,成本更低。

第三是智能體。智能體是當(dāng)下很熱的一個(gè)話題,隨著智能體能力的提升,會不斷催生出大量新的應(yīng)用。智能體機(jī)制,包括理解、規(guī)劃、反思和進(jìn)化,它讓機(jī)器像人一樣思考和行動(dòng),可以自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)、實(shí)現(xiàn)自我迭代和進(jìn)化。在一些復(fù)雜系統(tǒng)中,我們還可以讓不同的智能體互動(dòng),相互協(xié)作,更高質(zhì)量地完成任務(wù)。這些智能體能力,反思、規(guī)劃、自我計(jì)劃的能力,我們已經(jīng)開發(fā)出來了,并且向開發(fā)者全面開放。

在MoE、小模型、智能體這三個(gè)方向上,百度都已經(jīng)給大家做好了“開箱即用”的工具。下面,我就給大家介紹三種不同的工具,分別是:智能體開發(fā)工具AgentBuilder、AI原生應(yīng)用開發(fā)工具AppBuilder、各種尺寸的模型定制工具M(jìn)odelBuilder。

智能體開發(fā)工具AgentBuilder:

智能體是里每個(gè)人最近、最主流的大模型使用方式

首先是智能體開發(fā)工具AgentBuilder。智能體可能是未來離每個(gè)人最近、最主流的大模型使用方式,基于強(qiáng)大的基礎(chǔ)模型,智能體可以批量生成,應(yīng)用在各種各樣的場景。

百度剛剛升級了文心智能體平臺。截至目前,已經(jīng)有3萬多個(gè)智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。我們的目標(biāo)是,讓每個(gè)人、每個(gè)組織都成為智能體的開發(fā)者,打造國內(nèi)最完整的智能體生態(tài)。

那如何實(shí)現(xiàn)這個(gè)目標(biāo)呢?就是給大家提供零門檻的智能體開發(fā)工具AgentBuilder。

下面我們就先以“新加坡旅游局”為例一起看看,一個(gè)智能體是如何做出來的。

(詳見【新加坡旅游局】demo)

首先,我們打開文心智能體平臺,創(chuàng)建頁面有著零代碼、低代碼兩種模式,新手可以直接選擇“零代碼模式”,用自然語言,幾句話就能創(chuàng)建一個(gè)智能體。 

我們先給智能體起名叫“新加坡旅游局”,然后在設(shè)定里寫明需要打造旅游方案、解答問題,提供酒店門票預(yù)訂服務(wù),這些設(shè)定都是用來指導(dǎo)智能體的,告訴它都能做什么。

如果只需要基礎(chǔ)智能體,平臺會自動(dòng)完成填寫。但我們希望“新加坡旅游局”是一個(gè)專業(yè)的智能體,所以要進(jìn)行高級配置。我可以把新加坡百科詞條和官網(wǎng)鏈接都添加到知識庫里,讓它每天更新。然后添加一些工具,如酒店查詢、景點(diǎn)門票購買等,增強(qiáng)它的服務(wù)能力。目前我們已經(jīng)跟攜程合作,提供了酒店、景點(diǎn)、票務(wù)等旅游服務(wù)工具。這樣,一個(gè)新加坡旅游局的智能體就做好了,可以進(jìn)一步預(yù)覽、調(diào)優(yōu)。

現(xiàn)在打開百度APP,搜索“什么時(shí)候去新加坡人最少”,因?yàn)榇蠹页鋈ヂ糜味枷氡荛_人潮。智能體會綜合多個(gè)來源的信息,生成一個(gè)答案,“1-3月人最少”。我們還可以點(diǎn)擊智能體,和它進(jìn)一步互動(dòng),比如去新加坡旅游的注意事項(xiàng),推薦新加坡排名前三的酒店,還能讓它直接預(yù)訂新加坡環(huán)球影城的門票,一站式解決需求,大大節(jié)省了用戶時(shí)間。

除了新加坡之外,大連、沈陽等文旅類智能體也都在文心智能體平臺上線,還有知識類、創(chuàng)作類、學(xué)習(xí)類、娛樂類等各式各樣的智能體,這些都是用AgentBuilder做出來的。

去年文心一言剛發(fā)布的時(shí)候,我就說過,文心一言會影響到每一家公司。因?yàn)樗鼜?qiáng)大的自然語言理解能力、表達(dá)能力、推理能力,可以使任何一個(gè)公司都離自己的客戶更近。

今天,每一個(gè)商家、每一個(gè)客戶,都能在百度擁有專屬的智能體。整個(gè)過程完全不需要編程,通過類似提示詞的信息輸入,和簡單的幾步操作調(diào)優(yōu),就能迅速生成一個(gè)智能體,成為7X24小時(shí)在線的金牌業(yè)務(wù)員。

我們來看一下,一個(gè)商家智能體是怎么做出來的。

(詳見【啟德教育】demo)

啟德教育是家知名教育企業(yè),在全國有60多家分支機(jī)構(gòu),還有很多海外分公司,覆蓋國家廣,對接待的話術(shù)要求很高。如何能全天24小時(shí)回復(fù)客戶的咨詢,并且提高接待水平、降低經(jīng)營成本呢?

啟德教育利用百度的AgentBuilder,打造了專屬的智能體。

我們來看看,如何打造一個(gè)具備基本能力的智能體。很簡單,在平臺上填寫智能體的頭像、名稱、經(jīng)營業(yè)務(wù)范圍和歡迎語,再設(shè)置一些需要用戶提供的信息,比如年齡、學(xué)歷。5分鐘、零門檻,一個(gè)智能體就做好了。

啟德教育還希望這個(gè)智能體是個(gè)懂業(yè)務(wù)、懂學(xué)生的留學(xué)顧問。它可以針對學(xué)生的不同情況,比如想去美國還是澳洲、是碩士還是學(xué)士、雅思和托?剂硕嗌俜值鹊龋龀鰧I(yè)分析,給出精準(zhǔn)回答。我們可以通過添加知識、角色、工具這幾大模塊,來打造一個(gè)更高級的智能體。

在知識模塊中,上傳私域知識,讓平臺實(shí)時(shí)解析,自動(dòng)生成對話語料;在角色模塊,把一些不在經(jīng)營范圍內(nèi)的留學(xué)國家,增加到過濾方案中,可以提高用戶線索的有效率;在工具模塊,加入預(yù)約到店等服務(wù)。通過這樣幾步簡單操作,一個(gè)擁有專業(yè)能力的啟德教育智能體就做好了。

現(xiàn)在,我們來搜索“澳洲留學(xué)申請條件”,可以看到智能體快速給出了需要的語言能力、專業(yè)選擇等七大必備條件,還給能出相應(yīng)的留學(xué)咨詢方案,對各種難題都有問必答、有求必應(yīng)。

啟德教育智能體非常的受歡迎,上線第一周,就成功分發(fā)了155萬次,與用戶交互了5.8萬次,線索轉(zhuǎn)化量直線增長、有效線索的轉(zhuǎn)化成本明顯降低,經(jīng)營效率大幅提升。

下面,我再給大家介紹一個(gè)家居行業(yè)的智能體。

(詳見【索菲亞】demo)

索菲亞是專注全屋定制的家居品牌。就像剛剛展示的,它也可以通過填寫極其簡單的信息,創(chuàng)建出一個(gè)基礎(chǔ)的商家智能體。但對于家居行業(yè),消費(fèi)者的線下體驗(yàn)更重要,所以索菲亞希望能在線上打造出一個(gè)金牌銷售,還原線下的接待體驗(yàn)。

因此在進(jìn)一步的設(shè)置中,它在角色模塊,選擇了數(shù)字人作為展示方式,然后給數(shù)字人選取了合適的背景和聲音,并且結(jié)合平臺的智能解析能力,自動(dòng)總結(jié)了一套銷售話術(shù)。最終打造出一位溫柔親切、話術(shù)專業(yè)的金牌銷售,她能24小時(shí)滿足用戶的各種需求,提供高水準(zhǔn)的服務(wù)體驗(yàn)。

當(dāng)百度搜索用戶有裝修訴求時(shí),索菲亞智能體會利用文心大模型的能力,優(yōu)先給出問題的答案。除此之外,她還會主動(dòng)與客戶確認(rèn)具體需求,如裝修類型、預(yù)算等,并推薦附近的線下門店。

索菲亞商家智能體上線以來,有效線索成本下降了30%。也就是說,它獲得一個(gè)有效客戶,如果過去的成本是100塊,現(xiàn)在只需要70塊了。

目前,已有超過1萬個(gè)百度的客戶擁有了商家智能體,涵蓋了教育培訓(xùn)、房產(chǎn)家居、機(jī)械設(shè)備、商務(wù)服務(wù)等超過30個(gè)行業(yè)。

上面,通過三個(gè)Demo,我展示了開發(fā)者和商家,如何利用AgentBuilder,制作不同行業(yè)智能體的過程。

現(xiàn)在,制作一個(gè)智能體,真的就是分分鐘的事。但問題來了!如果沒流量、沒分發(fā)、找不到、沒人用,那么開發(fā)者和商家就沒有收益,沒有收益就沒有動(dòng)力。怎么解決這個(gè)痛點(diǎn)呢?

我們的文心智能體平臺,為開發(fā)者們提供了流量變現(xiàn)的通路。除了百度搜索,百度生態(tài)的其他產(chǎn)品,如小度、地圖、貼吧、車機(jī)等,都能接入智能體的相關(guān)能力,為開發(fā)者解決流量分發(fā)的后顧之憂,獲得實(shí)打?qū)嵉氖找妗?o:p>

有分發(fā),就會有數(shù)據(jù)反饋;有數(shù)據(jù)反饋,飛輪轉(zhuǎn)起來,智能體就能夠自主迭代,越用越聰明。文心智能體平臺還上線了智能體的數(shù)據(jù)分析和問答調(diào)優(yōu)模塊,不久后還將有更多的新能力上線。文心智能體平臺將通過分發(fā)-診斷-收益的數(shù)據(jù)飛輪,驅(qū)動(dòng)智能體形成質(zhì)量更優(yōu)、流量更好、收益更大的正循環(huán)。

AppBuilder:自然語言三步就能開發(fā)一個(gè)應(yīng)用

下面,我給大家介紹第二個(gè)開發(fā)工具,AppBuilder。它是目前最好用的AI原生應(yīng)用開發(fā)工具。在AppBuilder上面,我們提前封裝和預(yù)置了開發(fā)AI原生應(yīng)用所需的各種組件和框架,大幅降低開發(fā)門檻。

圖形用戶界面, 應(yīng)用程序描述已自動(dòng)生成

最快只需三步,開發(fā)者就可以用自然語言開發(fā)出一個(gè)AI原生應(yīng)用,并且能夠便捷地發(fā)布、集成到各種各樣的業(yè)務(wù)環(huán)境中。我們來看幾個(gè)案例:

今年年初,我們搞過一期AI原生應(yīng)用開發(fā)挑戰(zhàn)賽,賽題是利用AppBuilder打造一款“游樂場排隊(duì)規(guī)劃助手”,幫助游客更好地了解游樂場排隊(duì)情況,設(shè)計(jì)個(gè)性化的游玩路線,在有限時(shí)間內(nèi)獲得最好的游玩體驗(yàn)。

這期比賽的冠軍選手,沒寫一行代碼,就開發(fā)出了應(yīng)用,拿到了百度提供的10萬元大獎(jiǎng)。這個(gè)題目如果會寫代碼的話,你寫一個(gè)并不難,但是你一行代碼都不寫還能做出來,那還是非常依賴基礎(chǔ)模型和AppBuilder這個(gè)工具的能力的。

(詳見【游樂場排隊(duì)規(guī)劃助手】demo)

我們來看下,怎么用AppBuilder,把這個(gè)AI應(yīng)用做出來。

我們先回顧一下賽題。它假定了“環(huán)球影城”各個(gè)項(xiàng)目的排隊(duì)時(shí)間和刺激指數(shù),那么在有限的時(shí)間內(nèi)獲得刺激指數(shù)最高的體驗(yàn),就是這期賽題要解決的問題。

首先,打開AppBuilder的開發(fā)界面,給應(yīng)用起名“游樂場排隊(duì)助手”;第二步,我們在角色指令中描述具體要求,包括調(diào)用代碼解釋器、算出在固定時(shí)間內(nèi)的最佳組合、輸出結(jié)果等;第三步就是到工具組件中,把代碼解釋器添加進(jìn)來,幫助運(yùn)算。

現(xiàn)在,我們來測下效果,在右側(cè)輸入問題“我有3個(gè)半小時(shí)時(shí)間,怎么玩最刺激?”,可以看到,代碼解釋器將這個(gè)問題翻譯成了代碼,再調(diào)用數(shù)據(jù)理解工具,對已知條件進(jìn)行分析。經(jīng)過一系列計(jì)算,得出將《哈利波特禁忌之旅》、《侏羅紀(jì)大冒險(xiǎn)》、《霸天虎過山車》、《大黃蜂回旋機(jī)》,這四個(gè)項(xiàng)目組合游玩,效果最佳。測試沒問題,點(diǎn)擊發(fā)布,在零代碼的情況下,一個(gè)應(yīng)用就生成了。

現(xiàn)在,AppBuilder又進(jìn)一步升級了,在創(chuàng)建的過程中,全部可以通過“AI優(yōu)化配置”功能,自動(dòng)幫助開發(fā)者優(yōu)化角色指令、組件配置等環(huán)節(jié),進(jìn)一步提高開發(fā)效率。

我們再看一個(gè)例子。

今年年初,華北電力大學(xué)提出,希望為全校師生提供智能化的專屬服務(wù);诎俣鹊腁ppBuilder,我們共同打造了一個(gè)華電AI助理,下面,我來給大家展示一下,華電AI助理是怎么做出來的:

(詳見【華北電力大學(xué)】demo)

第一步:打開AppBuilder,進(jìn)入創(chuàng)建頁面,點(diǎn)擊AI自動(dòng)生成配置。首先為應(yīng)用設(shè)置名稱、簡介、頭像等基本信息。

第二步:通過自然語言在角色指令中描述具體要求,包括任務(wù)、組件能力、要求與限制。

第三步:插入自定義的圖書借閱查詢、課表查詢、學(xué)生成績查詢等組件,讓校園助手能夠具備智能化服務(wù)的能力。之后再為校園助手添加一個(gè)開場白,這樣應(yīng)用就配置好了。

接下來,我們在預(yù)覽界面中,結(jié)合用戶提問,對助手進(jìn)行調(diào)試。比如詢問四六級考試的報(bào)名時(shí)間,測試各組件自動(dòng)調(diào)用的效果。

大家可以看到,通過這些簡單的操作,這個(gè)應(yīng)用就構(gòu)建完成了。目前已經(jīng)小規(guī)模測試上線,接入了查制度、查課程,充飯卡、借書籍等高頻場景,服務(wù)了學(xué)校廣大師生。后續(xù),我們將與華北電力大學(xué)一起,進(jìn)一步深化應(yīng)用合作,提供更為豐富便捷的服務(wù)。

百度在跨模態(tài)方面,也有著多年技術(shù)積累。在AppBuilder上面,我們也提供了一定的跨模態(tài)能力,你只需要給一段文字,或者幾句話,就可以快速創(chuàng)建繪畫類的應(yīng)用,像漫畫、兒童畫本等。

過程也很簡單:打開AppBuilder,點(diǎn)擊進(jìn)入“應(yīng)用創(chuàng)建”,輸入角色指令,選擇“添加文生圖”組件,再輸入三個(gè)推薦問題,就可以點(diǎn)擊發(fā)布了。應(yīng)用做好后,我們只需要輸入一個(gè)大概想要的角色或劇情,AppBuilder就可以自動(dòng)生成故事、輸出圖畫。

百度文庫最新推出的智能漫畫和畫本生成功能,就利用了AppBuilder上提供的這類組件。我們來看看,百度文庫的漫畫生成功能,是如何讓每一個(gè)有創(chuàng)想的人,都能做出好作品的。

咱們以經(jīng)典的《周處除三害》為例。

(詳見【百度文庫漫畫】demo)

打開百度文庫,輸入主題《周處除三害》,這在《晉書》和《世說新語》里都有寫到,文庫搜索后,會根據(jù)原文生成故事,我們也可以再對故事內(nèi)容進(jìn)行修改;然后點(diǎn)擊右側(cè)的AI工具欄,開始創(chuàng)建這篇漫畫。

進(jìn)入漫畫制作界面,文庫將根據(jù)故事情節(jié)為我們自動(dòng)生成漫畫分鏡;然后從光影、寫實(shí)、卡通等多種風(fēng)格中,選擇最貼合故事的漫畫風(fēng)格;最后根據(jù)角色選擇不同的人物形象,這樣就完成了漫畫的生成。

漫畫生成后,我們可以在百度文庫的智能漫畫編輯器里,瀏覽完整的漫畫。同時(shí),文庫支持對每一個(gè)畫面進(jìn)行編輯、修改和精調(diào),比如,在左側(cè)選中畫面“周處與白額虎”,點(diǎn)擊編輯,增加畫面描述“人物面容清晰,畫面明亮”,就能精調(diào)出更符合需求的漫畫。大家看到,百度文庫的漫畫功能在角色和場景的風(fēng)格一致性方面,都做得非常出色。

百度文庫的智能漫畫能力,極大地提高了創(chuàng)作漫畫的效率,降低了漫畫創(chuàng)作的成本和門檻,可以讓更多有想法、有創(chuàng)意的人實(shí)現(xiàn)自己的漫畫創(chuàng)作夢。

不止生成漫畫,百度文庫現(xiàn)在還可以幫助用戶零門檻的創(chuàng)作畫本。大家可能不知道,中國小孩一年的人均繪本閱讀量只有10本,而歐美國家是50本左右,F(xiàn)在,AI能夠讓完全沒有繪畫能力的父母,也可以為自己的孩子創(chuàng)作一個(gè)專屬的兒童畫本了。下面我們就來看一下這個(gè)圖文并茂的有聲畫本吧!

(詳見【百度文庫畫本】demo)

從去年開始,我們用AI重構(gòu)了百度文庫,使它成為用戶“內(nèi)容生產(chǎn)的起點(diǎn)”。如今,在AppBuilder的支持下,百度文庫新推出的智能漫畫和智能畫本功能,更是把場景延伸到了更加有趣的跨模態(tài)創(chuàng)作領(lǐng)域。

剛才我用三個(gè)案例,展示了如何用百度的AppBuilder,做出AI原生應(yīng)用。大家應(yīng)該能夠感受到AppBuilder的兩個(gè)明顯優(yōu)勢:

一是功能強(qiáng)大。依托文心4.0對指令的理解和遵循能力,我們的AppBuilder,能保證冷啟動(dòng)就能達(dá)到一個(gè)不錯(cuò)的水平,不會因?yàn)樾Ч睿倩ê荛L時(shí)間去調(diào)優(yōu),大大降低了開發(fā)門檻。依托檢索增強(qiáng)技術(shù)RAG,在知識問答等典型場景,我們的問答準(zhǔn)確率和友好回復(fù)程度都達(dá)到了95%以上,大幅超越其他同類產(chǎn)品。AppBuilder還提供豐富完整的組件工具,包括百度搜索等基于百度多年技術(shù)積累的AI能力組件、大模型能力組件,還有百度獨(dú)家開放的業(yè)務(wù)組件等55個(gè)組件。以及一些主流場景的第三方API,比如航班查詢、論文查詢等。我們還剛剛支持了自定義組件,客戶可以直接對接自己專有的任何工具和數(shù)據(jù)。這些豐富的組件,共同支撐起了AI原生應(yīng)用的高效開發(fā)。

二是簡單易用。使用AppBuilder,只需三步即可快速創(chuàng)建應(yīng)用、一鍵分發(fā)。我們也支持開源的SDK,方便大家進(jìn)行二次開發(fā)。

 

\

模型定制工具M(jìn)odelBuilder:高效低價(jià)生產(chǎn)模型

下面我再介紹一下更適合專業(yè)開發(fā)者使用的工具,那就是ModelBuilder,它可以根據(jù)開發(fā)者的需求定制任意尺寸的模型,并根據(jù)細(xì)分場景對模型進(jìn)一步精調(diào)SFT,這樣就能達(dá)到更好的效果。對開發(fā)者來說,用好大模型很重要的一件事兒,就是掌握模型精調(diào)的方法。

我們以教育行業(yè)的作文批改場景來舉例。因?yàn)樽魑呐挠忻鞔_的評分標(biāo)準(zhǔn),并且不同年級對作文的要求和打分標(biāo)準(zhǔn),也是不同的。這就需要模型精調(diào),讓大模型輸出的結(jié)果,更符合特定的要求。

我們就來看一下,ModelBuilder是如何實(shí)現(xiàn)作文批改的模型精調(diào)的。

(詳見【巨閑教育】demo)

第一步:創(chuàng)建數(shù)據(jù)集。模型精調(diào)的效果很大程度依賴我們的數(shù)據(jù)質(zhì)量。在這個(gè)案例中,原始數(shù)據(jù)只有180條,質(zhì)量也不夠高。我們就需要用到三個(gè)功能:數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注和數(shù)據(jù)增強(qiáng)。數(shù)據(jù)清洗,可以快速去除數(shù)據(jù)的空缺、亂碼等問題。數(shù)據(jù)標(biāo)注方面,我們對作文增加了更多維度,比如內(nèi)容深度、寫作手法等評價(jià)。數(shù)據(jù)增強(qiáng)功能,可以生成同類但不重復(fù)的數(shù)據(jù),進(jìn)行數(shù)據(jù)擴(kuò)充。擴(kuò)充后,ModelBuilder給我們生成了920條高質(zhì)量數(shù)據(jù)。

第二步,就進(jìn)入模型精調(diào)階段了。首先,我們需要選擇一個(gè)進(jìn)行精調(diào)的基礎(chǔ)模型,這里我們選擇了ERNIE Speed作為基礎(chǔ)模型。然后,我們根據(jù)平臺推薦值來配置參數(shù),這次數(shù)據(jù)接近1000條,按照推薦的迭代輪次,配置為10輪,然后就可以讓模型開始訓(xùn)練了。

第三步:把模型部署在平臺上,這樣整個(gè)精調(diào)過程就完成了。

我們來用一篇中學(xué)作文,測試下精調(diào)后的模型效果。作文題目是《期待長大》,題材不限,不少于800字。

我們將一篇學(xué)生的作文及批改格式要求,輸入到精調(diào)前后的兩個(gè)模型里。來看下,兩個(gè)模型及老師點(diǎn)評三者的對比?梢钥吹剑{(diào)后的大模型擁有了更加專業(yè)的老師點(diǎn)評思維、更好地做了格式遵循。原本老師需要較長時(shí)間才能完成的作文批改任務(wù),現(xiàn)在借助大模型,幾秒鐘就可以快速完成,大大地提升了給學(xué)生反饋的速度和效率。目前,這一類精調(diào)后的模型,已經(jīng)在多個(gè)教育行業(yè)的頭部企業(yè)中應(yīng)用起來了。

我前面談到大型AI原生應(yīng)用一般都是MoE。那么,該如何組合使用這些模型,獲得最好的性價(jià)比呢?下面,我就用小度來展示一個(gè)MoE模型路由的案例。我們首先來看看,有了大模型的加持,小度是不是變得更聰明了:

Robin:小度小度
小度:在呢

Robin:今天有什么新聞?

小度:小度播3-5條當(dāng)日新聞快訊


Robin:小度小度。聽說你最近長本事了?
小度:我不單能陪你聊天,還能做你的AI日程助手


Robin:那我要來考考你了。幫我安排一下日程,今天活動(dòng)結(jié)束后,我會和張總一起用晚餐,之后在酒店有個(gè)管理層的會議,大概需要1個(gè)半小時(shí),希望10點(diǎn)之前可以結(jié)束。明早我準(zhǔn)備晨跑,看看天氣如何,然后上午8點(diǎn)有個(gè)早會,請幫我安排好日程。
小度:根據(jù)您需求,小度給您制定最優(yōu)的日程安排如下

o   您與張總晚餐安排在18:00-19:30,結(jié)束后,您將在20:00參加管理層會議,21:30左右結(jié)束

o   明早6點(diǎn)鬧鐘將提醒您起床去晨跑,跑步時(shí)長控制在1個(gè)小時(shí)以內(nèi),確保明早8點(diǎn)早會不遲到

o   明早天氣晴朗,氣溫25度,建議您穿短袖外出,做好防曬

o   您看我能不能當(dāng)你的秘書,我還有更多新技能呢

Robin:挺好的,很棒(向小度豎起大拇指),把這些日程同步到我的手機(jī)上吧。

剛剛,我向小度提出了好幾個(gè)問題,其中既有簡單的新聞問詢,也有復(fù)雜的日程安排需求。看起來是跟同一個(gè)小度在交流,其實(shí)背后調(diào)用了不同的模型。當(dāng)它接受到我的問題后,先是由小模型ERNIE Tiny執(zhí)行了“模型路由”的工作;對于天氣問題,它根據(jù)天氣查詢的結(jié)果,調(diào)用基于ERNIE Lite打造的精調(diào)模型,也是經(jīng)過SFT的ERNIE Lite,給出了穿衣建議;對于更復(fù)雜的日程安排,則調(diào)用了性能最好的大模型——文心4.0,來計(jì)算出從今晚到明早的各項(xiàng)事項(xiàng)安排。

今天,我們提給小度的每個(gè)問題,都會這樣分配給不同模型來執(zhí)行,調(diào)用應(yīng)用的API接口時(shí),會用ERNIE Functions模型,給孩子講題時(shí),用文心大模型3.5或4.0,智能助理的打造則用了ERNIE Character模型,提高人設(shè)一致性、激發(fā)用戶聊天欲望。

通過這種大小模型的組合調(diào)度方式,小度不僅順利完成了“換腦行動(dòng)”,裝上了全新的AI原生操作系統(tǒng)DuerOS X,而且形成了效果、速度和成本的最優(yōu)組合,相比全部使用文心大模型的旗艦版,讓響應(yīng)速度提升2倍,成本下降了99%。剛才和我對話的這個(gè)小度添添AI平板機(jī)器人,昨天已經(jīng)在各大平臺全面開售,有興趣的朋友們可以即刻下單體驗(yàn)了。

這幾個(gè)關(guān)于ModelBuilder的例子,展示的是百度高效低價(jià)生產(chǎn)模型的能力。因?yàn)橛辛俗顝?qiáng)大的基礎(chǔ)模型文心4.0,我們可以根據(jù)需要,兼顧效果、響應(yīng)速度、推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,并且支持精調(diào)和post pretrain。這樣通過降維裁剪出來的模型,比直接拿開源調(diào)出來的模型,同等尺寸下,效果明顯更好,同等效果下,成本明顯更低。大家以前用開源覺得開源便宜,其實(shí)在大模型場景下,開源是最貴的。所以開源模型會越來越落后。

\

為了方便大家快速上手,ModelBuilder預(yù)置了最全面最豐富的大模型。包括了ERNIE3.5和ERNIE4.0,這是旗艦版的大模型,它適合通用的復(fù)雜場景,能力強(qiáng)大;還有三個(gè)輕量級的大模型, ERNIE Speed、Lite、Tiny;另外還有兩個(gè)垂直場景的模型,ERNIE Character適合角色扮演;ERNIE Functions適合對話或問答場景中的外部工具使用和業(yè)務(wù)函數(shù)調(diào)用。當(dāng)然ModelBuilder也支持國內(nèi)外第三方主流模型,總數(shù)量達(dá)到77個(gè),是國內(nèi)擁有大模型數(shù)量最多的開發(fā)平臺。

第二屆“文心杯”創(chuàng)業(yè)大賽正式啟動(dòng):設(shè)5000萬元特別大獎(jiǎng)

對于開發(fā)者,我們除了提供這些開發(fā)工具,還提供資金和資源方面的支持。

去年5月份,百度啟動(dòng)了“文心杯”創(chuàng)業(yè)大賽,希望推動(dòng)大模型生態(tài)繁榮,打造更有活力的生態(tài)系統(tǒng),幫助創(chuàng)業(yè)者、開發(fā)者開發(fā)各種AI原生應(yīng)用。第一屆“文心杯”創(chuàng)業(yè)大賽,我們收到了近1000支創(chuàng)業(yè)團(tuán)隊(duì)報(bào)名,百度為其中的15支優(yōu)勝團(tuán)隊(duì),提供了近億元的投資支持,并且在技術(shù)、團(tuán)隊(duì)和資源上持續(xù)提供全方位扶持。

今天我宣布,第二屆“文心杯”創(chuàng)業(yè)大賽正式啟動(dòng)。這次我們將擴(kuò)大項(xiàng)目篩選范圍、設(shè)置分賽場,面向全球市場及高校學(xué)子,招募創(chuàng)業(yè)創(chuàng)新團(tuán)隊(duì),只要你的創(chuàng)業(yè)方向是AI原生應(yīng)用,都可以在大賽官網(wǎng)報(bào)名參賽。同時(shí),我們也加大了對創(chuàng)業(yè)者的支持力度,提供更充足的投資資金、更豐富的業(yè)務(wù)資源,還首次設(shè)立了“特別大獎(jiǎng)”,特別優(yōu)秀的項(xiàng)目將有機(jī)會獲得最高5000萬人民幣的現(xiàn)金和資源支持。

中國的創(chuàng)業(yè)者和開發(fā)者,非常善于利用新技術(shù)來開發(fā)應(yīng)用。我相信,文心大模型將成為中國AI創(chuàng)業(yè)者和開發(fā)者的首選,越來越多的應(yīng)用會建立在文心大模型之上。我也期待,更多創(chuàng)業(yè)者和開發(fā)者加入我們,一起構(gòu)建繁榮的AI生態(tài)。

視覺大模型最大的應(yīng)用場景是自動(dòng)駕駛

前面我們談到的這些工具和案例,大部分都是基于大語言模型的。面向未來,我認(rèn)為多模態(tài)大模型,或者說文字、圖片、語音、視頻等多模態(tài)的融合,是基礎(chǔ)模型非常重要的長期發(fā)展方向,是通往AGI的必經(jīng)之路。百度在這些領(lǐng)域有著長期投入,并將及時(shí)更新技術(shù)進(jìn)展。

我有一個(gè)非常不一樣的判斷:視覺大模型最大的應(yīng)用場景是自動(dòng)駕駛。百度在這個(gè)方向上是最好的,是自動(dòng)駕駛的全球領(lǐng)導(dǎo)者,我們不只訓(xùn)練AI如何生成視頻,更訓(xùn)練AI理解真實(shí)世界發(fā)生的事情并預(yù)測未來。

基于超過1億公里的、中國復(fù)雜城市道路測試?yán)锍虜?shù)據(jù),百度訓(xùn)練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎(chǔ)能力。這讓百度擁有了更智能、適應(yīng)性更強(qiáng)、更安全的自動(dòng)駕駛方案。

百度地圖也率先將視覺感知大模型應(yīng)用到了制圖領(lǐng)域,F(xiàn)在,全球最大規(guī)模的車道級地圖數(shù)據(jù),已經(jīng)上線全國360座城市。只要百度地圖導(dǎo)航能去的地方,智駕就都能開。

今年春節(jié)后,百度的蘿卜快跑實(shí)現(xiàn)了萬里長江“第一跨”, 我們把服務(wù)從長江的北岸延伸到了南岸,在武漢的部分區(qū)域,我們已經(jīng)實(shí)現(xiàn)了7X24小時(shí)的全天候運(yùn)營,還計(jì)劃年內(nèi)在武漢部署1000臺無人駕駛車輛。

這是自動(dòng)駕駛走向真正商業(yè)化的一個(gè)標(biāo)志性事件,它不再僅僅是區(qū)域性的示范,而是進(jìn)入到了城市級應(yīng)用示范的新階段。蘿卜快跑在武漢覆蓋了3000多平方公里、770萬人口,是全球范圍內(nèi)最大規(guī)模的自動(dòng)駕駛運(yùn)營區(qū)域。

“打包帶走,隨取隨用”

剛才,我給大家展示了百度文心大模型系列,以及三個(gè)開發(fā)工具——AgentBuilder、AppBuilder、ModelBuilder,他們組成了一個(gè)工具箱,你們可以馬上打包帶走,隨取隨用。

此時(shí)此刻,我站在這里,其實(shí)也是一個(gè)開發(fā)者、一個(gè)創(chuàng)業(yè)者,跟大家一樣興奮。今天的中國,有10億互聯(lián)網(wǎng)用戶,有強(qiáng)大的基礎(chǔ)大模型,有足夠多的AI應(yīng)用場景,有全球最完備的產(chǎn)業(yè)體系,國家也在大力鼓勵(lì)和支持“人工智能+”行動(dòng),每一個(gè)人,每一家企業(yè),只需要充分利用這些工具,就可以釋放無限的創(chuàng)造力和生產(chǎn)力。

今天,人人都可以成為開發(fā)者。而未來,也必將是一個(gè)由開發(fā)者一起創(chuàng)造出來的未來!

謝謝大家!

關(guān)鍵詞:李彥宏百度AI