李開復(fù):要允許大模型一本正經(jīng)地“胡說八道”

        作者: 來源: 濟(jì)南時(shí)報(bào) 2023-05-30 23:25:56

         

        在5月28日舉行的2023中關(guān)村論壇上,創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)發(fā)表了主題為“AI1.0到AI2.0的新機(jī)遇”的演講。他表示,在所有APP里面,AI first(人工智能優(yōu)先)將是最重要的應(yīng)用,過去,移動互聯(lián)網(wǎng)是Mobile first(移動優(yōu)先),今天要在人工智能領(lǐng)域創(chuàng)業(yè)或投資,那一定要做非有人工智能不可的APP。


        【資料圖】

        “大模型真的不只是一個(gè)問答引擎,它改變了所有APP的生態(tài),它會讓我們今天用的每一個(gè)生態(tài)通通改寫一次”,李開復(fù)坦言,要允許今天的大模型一本正經(jīng)地“胡說八道”,如果把它胡說八道的能力全部降至零,它也就不具備推理能力了。李開復(fù)認(rèn)為,一直以來都是人類學(xué)習(xí)計(jì)算機(jī)的語言,大模型時(shí)代將是計(jì)算機(jī)學(xué)習(xí)人類的語言。未來,用戶只需要向AI描述目的就會達(dá)到期待。

        李開復(fù)還就“大模型公司太多”“只有頭部公司才有機(jī)會”等論調(diào)談了自己的看法,他指出,國內(nèi)外的文化習(xí)慣、法律法規(guī)都不一樣,拿海外訓(xùn)練出來的大模型在國內(nèi)做微調(diào)是非常危險(xiǎn)的,在大模型領(lǐng)域,大家都還有機(jī)會,應(yīng)該鼓勵(lì)各種不同的模式去探索。

        以下為李開復(fù)在“人工智能大模型發(fā)展論壇”的演講內(nèi)容,經(jīng)新黃河記者整理:

        近年來,看到整個(gè)AI2.0和大模型的啟動,創(chuàng)新工廠的投資團(tuán)隊(duì)、科技團(tuán)隊(duì)都在研究這個(gè)領(lǐng)域,為此也到美國去了解一些新態(tài)勢。今天我介紹的不是創(chuàng)新工場投資的公司或者業(yè)務(wù),而是對于最近關(guān)于AI2.0和大模型做一個(gè)比較通俗的分享,希望對大家有幫助。

        AI1.0時(shí)代每個(gè)應(yīng)用都是一個(gè)孤島

        AI 1.0是AlphaGo(阿爾法圍棋)之后發(fā)生的深度學(xué)習(xí),也就是在八九年前開始,進(jìn)入各行各業(yè),這是我們都熟悉的。到一兩年前碰到了一些瓶頸,而這些瓶頸,正好是AI2.0和大模型能夠解決的。AI1.0遇到的瓶頸是什么呢?當(dāng)時(shí)還沒有大模型,我們要做一個(gè)領(lǐng)域的AI應(yīng)用,要到該領(lǐng)域去收集、清洗、標(biāo)注數(shù)據(jù),再拿去調(diào)整模型,這個(gè)過程成本是非常昂貴的,對于互聯(lián)網(wǎng)巨頭來說沒有問題,因?yàn)樗麄兪占臄?shù)據(jù)實(shí)在太多,用來賺錢的機(jī)會也很多,但是如果一家工廠想讓AI應(yīng)用落地,就會面臨著非常昂貴的成本。

        大模型是人類智慧的累積,有一個(gè)很大的特點(diǎn),就是我們可以一次性訓(xùn)練一個(gè)大模型,當(dāng)要應(yīng)用的時(shí)候可以做一個(gè)遷移學(xué)習(xí)或者微調(diào),也就是說之前AI1.0時(shí)代,每個(gè)應(yīng)用都是一個(gè)孤島,有大模型之后,用海量的數(shù)據(jù)一次性訓(xùn)練一個(gè)基礎(chǔ)大模型,那么再以這個(gè)模型作為基礎(chǔ)去做微調(diào),就具備非常大的威力。比如,像音響類似的產(chǎn)品,過去跟它講話的時(shí)候,一旦跳出了它懂的領(lǐng)域就蒙了,做不了很多事情。當(dāng)放一個(gè)類似ChatGPT的東西進(jìn)去,它的知識就會被激活,只要調(diào)整對話,它就會成為一個(gè)非常好用的機(jī)器人,如果需要它在另外的領(lǐng)域完成其他事情,我們可以把這個(gè)大模型再微調(diào),使其進(jìn)入對應(yīng)的應(yīng)用場景。

        有些領(lǐng)域可以容忍大模型的不完美

        今天的大模型還會一本正經(jīng)地“胡說八道”,這個(gè)問題非常難解決,因?yàn)樗耐评砟芰Γ瞾碜杂谕瑯拥睦碛伞H绻阉暮f八道全部降到了接近零,那它的推理能力幾乎也沒有了,所以那些讓它聰明的理由也是讓它胡說八道的理由,但是我們未來還是可以解決的。

        我們要先接受大模型是非完美的、會胡說八道的,即便一個(gè)非完美的大模型還是有相當(dāng)大的商業(yè)價(jià)值。例如,不管記者用AI來寫作,或者律師用AI來寫訴訟,最后負(fù)責(zé)的還是人類,律師或者記者會很清晰地知道AI可能會犯錯(cuò),我們不是把它拿來做一個(gè)終極的應(yīng)用。在娛樂領(lǐng)域的應(yīng)用,是可以允許AI犯一些錯(cuò)誤,比如游戲里面的英雄胡子長了一點(diǎn)短了一點(diǎn),這都無傷大雅。此外,還有很多領(lǐng)域是可以容忍大模型的不完美,基于這個(gè)事實(shí),今天大模型的商機(jī)已經(jīng)存在。

        當(dāng)然我們還要繼續(xù)努力,讓它降低胡說八道的習(xí)慣。比如,從預(yù)訓(xùn)練的數(shù)據(jù)到訓(xùn)練對齊,再到之后的后處理,還有一些預(yù)警和快速修正的方法,這些需要結(jié)合在一起,提高大模型的處理能力。需要重視的是,有些領(lǐng)域是非常關(guān)鍵和嚴(yán)肅的,比如說新聞、政府網(wǎng)站、醫(yī)療、教育,這些就不容易做,未來需要化解這些問題。

        AI大模型能帶來應(yīng)用的爆發(fā)

        大模型的價(jià)值絕對不只是有一個(gè)很聰明的AI引擎,而是能帶來應(yīng)用的爆發(fā)。

        用AI寫稿子、寫訴訟、畫圖、摳圖等都是應(yīng)用層的,還存在一個(gè)中間層,中間層包括兩部分,第一個(gè)部分是從模型里面往外提供功能,比如說模型做得很大,針對某一個(gè)領(lǐng)域,能否把一個(gè)大模型變成一個(gè)小模型,這是從模型往上的。另一個(gè)部分是從應(yīng)用往下的,用大模型做的很多產(chǎn)品需要去中間化。比如,過去由平面設(shè)計(jì)師來設(shè)計(jì)圖,以后市場總監(jiān)用語言就能直接把圖做出來。當(dāng)然這個(gè)過程不是一天兩天能實(shí)現(xiàn)的,但長期來看,相對重復(fù)性的工作是可以被技術(shù)取代的,同時(shí)會產(chǎn)生非常大的經(jīng)濟(jì)價(jià)值,這樣的情況之下才能讓應(yīng)用的數(shù)量變多,形成應(yīng)用帶來更多用戶,用戶帶來更多應(yīng)用的良性循環(huán)。

        AI.2.0平臺和應(yīng)用將顛覆許多行業(yè)。簡單舉個(gè)例子,比如制造游戲的時(shí)候,所有角色、背景、道具、衣服、故事的產(chǎn)生,甚至所有的代碼最終都會用AI來寫。很可能以后一些小朋友會把他想玩的游戲?qū)懗鰜恚蠹冶舜擞梦淖肿鲆粋€(gè)游戲介紹,幾秒鐘以后就可以玩了,這跟今天的游戲制作就有巨大的差別。所以,大模型真的不只是一個(gè)問答引擎,它改變了所有APP的生態(tài),它會讓我們今天用的每一個(gè)生態(tài)通通改寫一次。

        從Mobile first到AI first

        在所有的應(yīng)用里面AI first(人工智能優(yōu)先)將是最重要的應(yīng)用,什么叫AI first?就是說這個(gè)應(yīng)用沒有AI就不成立。過去移動互聯(lián)網(wǎng)是Mobile first(移動優(yōu)先),比如,在PC時(shí)代打車軟件滴滴是沒有用的,因?yàn)槟汶S時(shí)可能在不同的地方,當(dāng)年如果要選擇在移動互聯(lián)網(wǎng)創(chuàng)業(yè)或者投資,那一定要選那些非有移動不可的APP,所以今天要在人工智能領(lǐng)域創(chuàng)業(yè)或投資,那一定要做非有人工智能不可的APP。簡單地說,當(dāng)我們把大模型抽掉,這個(gè)應(yīng)用就完全癱瘓,那這個(gè)應(yīng)用就特別需要做而且應(yīng)該做。當(dāng)然,這個(gè)過程中,我們還有很多的挑戰(zhàn),需要監(jiān)管和技術(shù)同時(shí)發(fā)揮作用去解決。

        最近有幾個(gè)比較大的聲音,如“使用海外的開源大模型就可以做出中國版的openAI”“大模型耗錢且耗人,只有巨頭才有入場券”“大模型公司太多了”“不用開發(fā)大模型,開發(fā)小模型就夠用了”等說法。

        開源是非常非常重要的,高校和創(chuàng)業(yè)者沒有開源很難得到啟動力量,但“使用海外的開源大模型就可以做出中國版的openAI”的說法是絕對錯(cuò)誤的。開源模型本身有一定局限性,如果直接使用海外的開源大模型,你的天花板決定了永遠(yuǎn)做不出達(dá)到或者超越ChatGPT4.0。很多人做開源大模型訓(xùn)練的時(shí)候用ChatGPT4.0來訓(xùn)練,真的不敢保證ChatGPT4.0會讓人人都能拿去使用,從商業(yè)的角度也沒有理由讓你占這個(gè)便宜,再就是它對有些國家可能也會限制。拿海外訓(xùn)練出來的大模型,在國內(nèi)來做微調(diào)是非常危險(xiǎn)的,國內(nèi)外的文化習(xí)慣、法律法規(guī)都不一樣,每個(gè)國家處理方法都不一樣,自主創(chuàng)新做大模型是有必要的。

        當(dāng)然,未來不可能有50家大模型公司存在,會收斂到一個(gè)小的數(shù)字上。比如,美國的搜索引擎,剛開始的時(shí)候有十來家,最后變成五六家。不過,在大模型這個(gè)領(lǐng)域,大家都還有機(jī)會,我們還在追趕,應(yīng)該鼓勵(lì)各種不同的模式去做。

        中國公司急需趕超全球一線公司

        大語言模型分三步演進(jìn),第一步是中等規(guī)模的大型語言模型,第二步是跨越“涌現(xiàn)”(備注:涌現(xiàn)在大模型領(lǐng)域指的是當(dāng)模型突破某個(gè)規(guī)模時(shí)性能顯著提升)門檻,成為主流大型語言模型,第三步是領(lǐng)先的大型語言模型。目前ChatGPT和谷歌的大語言模型PaLM處于第三階段。中國有些公司當(dāng)然有野心,也可能自認(rèn)為接近了,但是我覺得主要還是在一個(gè)比較中等規(guī)模的水平,基本可以工作,但是它可能“涌現(xiàn)”不一定特別強(qiáng)大。這不是說中國公司做得不好,而是起步時(shí)間較短,再就是中文的數(shù)據(jù)質(zhì)量還不足夠。

        大模型訓(xùn)練質(zhì)量跟數(shù)量都重要,但是相比來說質(zhì)量是不可犧牲的。我覺得有國家力量來推動收集更多更高質(zhì)量的數(shù)據(jù)非常重要,要不然的話追趕會比較難。中國這個(gè)階段的經(jīng)濟(jì)發(fā)展,并沒有足夠多的人為了公益來把很多好的內(nèi)容匯集起來,中美以后的差距可能就體現(xiàn)在數(shù)據(jù)上面。

        多年來,人類需要學(xué)習(xí)計(jì)算機(jī)的語言,現(xiàn)在倒過來,計(jì)算機(jī)學(xué)習(xí)人類的語言,這會大大把人類解放出來。我們只要把想要做一件事情的目的告訴未來的AI,它就會幫我們完成,不用告訴它如何一步一步去解決。比如我跟未來的智能助手說,明天是我太太的生日,需要鮮花、蛋糕、禮物,它就通通幫我搞定,這就節(jié)省大量的時(shí)間,現(xiàn)在還沒有這樣的智能助手,我可能要花幾個(gè)小時(shí)搜索,再逐個(gè)下單。

        未來最偉大的應(yīng)用是必須要有AI大模型,拿掉大模型它就不工作。大模型就是委派式的,用戶描述目的就可以達(dá)到期望,當(dāng)然要解決隱私的問題,不能把我們每一個(gè)要求都傳到云端。最終這天到來的時(shí)候,商業(yè)模式也會發(fā)生變化,當(dāng)我跟AI說幫我買蛋糕、鮮花、禮物的時(shí)候,它會直接把電商當(dāng)做倉庫一樣地去幫我搭配。當(dāng)然,這方面的應(yīng)用可能還比較長遠(yuǎn),需要學(xué)術(shù)界跟產(chǎn)業(yè)的合作。

        AI大模型是中國絕對不能錯(cuò)過的歷史機(jī)遇,這是有史以來最大的一個(gè)平臺革命。它會讓每個(gè)應(yīng)用都改寫,重構(gòu)人類的工作,讓我們的聰明才智被放大10倍或更多。在人才方面,可能頂級的一些人才還在美國,但中國有非常巨大的人才優(yōu)勢,數(shù)量非常多,而且很多年輕的科學(xué)家都非常厲害。

        最后我想提一句話,來自硅谷頂級投資人對這個(gè)領(lǐng)域的預(yù)測:這個(gè)市場的潛在規(guī)模難以把握 ——它將介于所有軟件和所有人類的努力之間。

        新黃河記者:王立奎整理報(bào)道

        編輯:常萌

         

        關(guān)鍵詞


        相關(guān)文章