
李星
CERNET網絡中心副主任、清華大學教授(shou)
對于(yu)人工智能領域來說,ChatGPT是一(yi)個嶄新的起點。雖然它(ta)給出(chu)的內容對錯(cuo)參半(ban),但是它(ta)可以幫助我們拓寬思(si)路,給予(yu)我們新的靈感。ChatGPT的成(cheng)功無疑(yi)是巨大的,那么它(ta)為什么成(cheng)功,我們能從中學到點什么,理(li)解出(chu)什么,都值得進一(yi)步(bu)分析(xi)。
ChatGPT的理論基礎與“無限猴子定理”
ChatGPT是一(yi)個(ge)大語(yu)言(yan)模(mo)(mo)型(Large Language Model)。一(yi)般來說(shuo),語(yu)言(yan)模(mo)(mo)型有兩種(zhong),分別(bie)是next token prediction和masked language modeling。Next token prediction指單向(xiang)推(tui)(tui)導,即知道最(zui)(zui)前面的(de)話,一(yi)步步推(tui)(tui)導出(chu)后面的(de)話,每次推(tui)(tui)導時(shi)都找最(zui)(zui)有道理(li)的(de)一(yi)個(ge)字,從而遞歸(gui)串出(chu)一(yi)整句話。另一(yi)種(zhong)則是先(xian)確定開(kai)頭結尾的(de)內(nei)容,據此去推(tui)(tui)測(ce)中間(jian)的(de)內(nei)容。
有一個定(ding)理(li)叫做“無限猴子(zi)定(ding)理(li)”,而ChatGPT可以(yi)說就是(shi)一只升級(ji)版(ban)的、講邏輯、懂道理(li)的猴子(zi)。
“無(wu)限猴(hou)(hou)子(zi)(zi)(zi)定(ding)理”認為,讓一只猴(hou)(hou)子(zi)(zi)(zi)在打字機上隨機地按(an)(an)鍵(jian),當按(an)(an)鍵(jian)時間達(da)到無(wu)窮(qiong)時,猴(hou)(hou)子(zi)(zi)(zi)幾乎必然能(neng)夠(gou)打出任(ren)何(he)給(gei)定(ding)的(de)(de)(de)文字,比(bi)如莎(sha)士比(bi)亞(ya)(ya)的(de)(de)(de)全套著作,也曾有人用電腦(nao)虛擬的(de)(de)(de)猴(hou)(hou)子(zi)(zi)(zi)來模擬執行(xing)這一定(ding)理。2004年8月4日,電腦(nao)模擬的(de)(de)(de)猴(hou)(hou)子(zi)(zi)(zi)在經過(guo)4.21625×10^28個(ge)猴(hou)(hou)年之后,打出了以下內容“VALENTINE.Ceasetoldor:eFLPOFRjWK78aXzVOw- m)-;8t......”而這胡(hu)亂敲打出的(de)(de)(de)前十六個(ge)字母,正(zheng)屬于莎(sha)士比(bi)亞(ya)(ya)的(de)(de)(de)劇作《維洛那二紳士》的(de)(de)(de)第一行(xing):VALENTINE: Cease to persuade, my loving Proteus.
如果說(shuo)猴(hou)子的選擇(ze)來自于(yu)純粹的巧(qiao)合、運(yun)氣與概率,那么ChatGPT的選擇(ze)則是基于(yu)模型運(yun)算,把(ba)大概率有(you)用的字(zi)詞(ci)留下,無用的字(zi)詞(ci)撇去(qu),從而得到(dao)一(yi)句(ju)符合人類(lei)邏輯的話。
沒有試錯就沒有ChatGPT
人(ren)工(gong)(gong)智能(neng)(neng)的(de)發(fa)展歷程大(da)概可(ke)(ke)分為(wei)三個階段。1950年圖靈最早提出了(le)人(ren)工(gong)(gong)智能(neng)(neng)的(de)概念,他在論文中直(zhi)截了(le)當地提問,“機(ji)器是否可(ke)(ke)能(neng)(neng)具有人(ren)類智能(neng)(neng)?”開(kai)創了(le)人(ren)工(gong)(gong)智能(neng)(neng)領域的(de)先河。
1997年,IBM的(de)(de)(de)超級(ji)計算機(ji)“深藍(lan)”(Deep Blue)以2勝(sheng)1負3平的(de)(de)(de)成績戰(zhan)勝(sheng)了當時世界排名第一(yi)的(de)(de)(de)國(guo)際(ji)象棋大師加里(li)·卡斯帕羅夫,一(yi)時間(jian)轟動全球。但是(shi)(shi)(shi),“深藍(lan)”還算不上(shang)足(zu)夠智能(neng),因為它(ta)的(de)(de)(de)算法(fa)(fa)核心是(shi)(shi)(shi)暴力搜索(suo),換言(yan)之,它(ta)每走(zou)一(yi)步,都是(shi)(shi)(shi)在窮舉后續所有可能(neng)的(de)(de)(de)情(qing)況下再(zai)做(zuo)出決策。再(zai)后來,機(ji)器學習(xi)算法(fa)(fa)如雨后春筍般涌(yong)現,包括線性回(hui)歸法(fa)(fa)、邏輯回(hui)歸法(fa)(fa)、決策樹(shu)法(fa)(fa)、隨(sui)機(ji)森(sen)林法(fa)(fa)、最近鄰居法(fa)(fa)、貝葉斯法(fa)(fa)、支持向量(liang)機(ji)法(fa)(fa)、 k 平均法(fa)(fa)、強化學習(xi)法(fa)(fa)等,每一(yi)個新算法(fa)(fa)都是(shi)(shi)(shi)對(dui)舊(jiu)算法(fa)(fa)的(de)(de)(de)改進(jin)與提升(sheng)。

艾倫·圖(tu)靈與(yu)其論(lun)文

深藍打敗象(xiang)棋大師加(jia)里·卡(ka)斯帕羅夫(fu)

機(ji)器學(xue)習的常見方法
最(zui)簡單的方法(fa)是線性(xing)回(hui)(hui)歸,如(ru)(ru)果對數(shu)據進行線性(xing)回(hui)(hui)歸后發現(xian)依(yi)然(ran)有問題(ti),那(nei)就在(zai)此基(ji)礎上做邏輯(ji)回(hui)(hui)歸;但選項也可能不止A、B兩種,此時我們就構造(zao)決(jue)策(ce)樹呈現(xian)出(chu)多種選擇(ze);但決(jue)策(ce)樹是一門走過去,如(ru)(ru)果決(jue)策(ce)錯了怎么(me)辦?于是就出(chu)現(xian)了隨機森林算法(fa),用多棵隨機生(sheng)成的決(jue)策(ce)樹來生(sheng)成最(zui)后的輸出(chu)結(jie)果。
所以說每一個(ge)理論、算法都(dou)是研(yan)究(jiu)人員(yuan)在前人的基(ji)礎上探索、摸索而(er)來,是一代代人不斷在已有的基(ji)礎上創新、更新,思考下一步(bu)如何做得更好,而(er)非一開始就(jiu)設計、錨(mao)定了最(zui)終結(jie)果(guo)。
機(ji)器學(xue)(xue)習(xi)(xi)(xi)(xi)中主要有(you)三類學(xue)(xue)習(xi)(xi)(xi)(xi)的(de)(de)方式,分(fen)別是(shi)監(jian)(jian)(jian)督(du)(du)式學(xue)(xue)習(xi)(xi)(xi)(xi)、非監(jian)(jian)(jian)督(du)(du)式學(xue)(xue)習(xi)(xi)(xi)(xi)和強化(hua)學(xue)(xue)習(xi)(xi)(xi)(xi)。監(jian)(jian)(jian)督(du)(du)學(xue)(xue)習(xi)(xi)(xi)(xi)是(shi)從外部(bu)監(jian)(jian)(jian)督(du)(du)者提(ti)供的(de)(de)帶標注(zhu)訓練集中進行學(xue)(xue)習(xi)(xi)(xi)(xi)(任務驅動(dong)型(xing)(xing)(xing))。非監(jian)(jian)(jian)督(du)(du)學(xue)(xue)習(xi)(xi)(xi)(xi)則是(shi)一(yi)個典型(xing)(xing)(xing)的(de)(de)尋(xun)找未(wei)標注(zhu)數(shu)據中隱(yin)含結構的(de)(de)過程(數(shu)據驅動(dong)型(xing)(xing)(xing))。強化(hua)學(xue)(xue)習(xi)(xi)(xi)(xi)則會告訴模(mo)型(xing)(xing)(xing)自身好(hao)不好(hao),給予模(mo)型(xing)(xing)(xing)更大的(de)(de)探索自由,從而突破監(jian)(jian)(jian)督(du)(du)學(xue)(xue)習(xi)(xi)(xi)(xi)的(de)(de)天花板。
三(san)者之間也(ye)是(shi)漸(jian)進(jin)式前進(jin)的關(guan)系(xi),為了應對更多問題,人們總(zong)是(shi)基于一個(ge)(ge)已有的方(fang)(fang)法(fa),想方(fang)(fang)設法(fa)找出(chu)一個(ge)(ge)更一般性的方(fang)(fang)法(fa)進(jin)行超(chao)(chao)越(yue),超(chao)(chao)越(yue)完成(cheng)后自然進(jin)入(ru)下一個(ge)(ge)階段。
隨著數據(ju)量的(de)增加(jia),傳統(tong)的(de)機(ji)器學習(xi)方(fang)法表(biao)現得(de)不(bu)盡(jin)人意。在監督式學習(xi)下就出現了一個(ge)嶄(zhan)新的(de)分支——深度(du)學習(xi)。深度(du)學習(xi)的(de)基礎是(shi)神經網(wang)絡(luo),即通過(guo)模擬人的(de)神經元系統(tong)做出判斷(duan)。神經網(wang)絡(luo)有輸入(ru)層、輸出層和隱藏層,輸入(ru)通過(guo)非(fei)線性函(han)數的(de)加(jia)權后得(de)到了最終的(de)輸出,而我們要做的(de)就是(shi)根據(ju)誤差準則(ze)調(diao)整權重參數,不(bu)需(xu)要,也不(bu)可(ke)能完(wan)全(quan)知道這些參數選(xuan)擇的(de)具體(ti)原因(yin)。

神經網絡模型示意圖
什么叫(jiao)深(shen)度(du)學(xue)習(xi)(xi)?神經(jing)網(wang)(wang)絡的(de)層(ceng)數(shu)直接(jie)決定(ding)了它對(dui)現實的(de)刻畫(hua)能(neng)(neng)力,但是原(yuan)來(lai)(lai)(lai)隱含層(ceng)只有(you)(you)一(yi)層(ceng),對(dui)稍微復雜一(yi)些的(de)函數(shu)都無能(neng)(neng)為(wei)力。為(wei)此,就(jiu)可以多加一(yi)些隱含層(ceng),深(shen)度(du)學(xue)習(xi)(xi)由此誕生。早期的(de)深(shen)度(du)學(xue)習(xi)(xi)又有(you)(you)兩(liang)個常用(yong)的(de)方法,即(ji)卷積神經(jing)網(wang)(wang)絡(CNN)與(yu)循環神經(jing)網(wang)(wang)絡(RNN),前者專(zhuan)門(men)解決圖像(xiang)(xiang)問題,最大利用(yong)圖像(xiang)(xiang)的(de)局(ju)部信息,將局(ju)部特征拼接(jie)起(qi)來(lai)(lai)(lai),從而得到整幅圖的(de)特征,類似于通過拼圖來(lai)(lai)(lai)還(huan)原(yuan)圖像(xiang)(xiang);后(hou)者則(ze)專(zhuan)門(men)解決時間序(xu)列問題,用(yong)來(lai)(lai)(lai)提取時間序(xu)列信息,其最重要(yao)的(de)特征是具有(you)(you)時間“記憶(yi)”的(de)能(neng)(neng)力,就(jiu)像(xiang)(xiang)人只有(you)(you)記住前面的(de)對(dui)話內容,才能(neng)(neng)決定(ding)之(zhi)后(hou)該說什么一(yi)樣。
此外,生成(cheng)(cheng)模(mo)型也是(shi)(shi)深度(du)學(xue)習(xi)(xi)領(ling)域內較(jiao)為重要的(de)(de)一類模(mo)型。生成(cheng)(cheng)對抗(kang)網(wang)絡(GAN)是(shi)(shi)一種讓(rang)兩(liang)個(ge)神經網(wang)絡相互(hu)博(bo)弈(yi)從而(er)完成(cheng)(cheng)學(xue)習(xi)(xi)的(de)(de)生成(cheng)(cheng)模(mo)型,其由(you)一個(ge)生成(cheng)(cheng)器(qi)(qi)(qi)(qi)和(he)一個(ge)判(pan)(pan)別(bie)(bie)器(qi)(qi)(qi)(qi)組成(cheng)(cheng)。比(bi)如說,生成(cheng)(cheng)器(qi)(qi)(qi)(qi)生成(cheng)(cheng)了一只(zhi)虛擬(ni)狗,判(pan)(pan)別(bie)(bie)器(qi)(qi)(qi)(qi)需(xu)要將其與真實世(shi)界(jie)中的(de)(de)狗作對比(bi),并判(pan)(pan)斷虛擬(ni)狗是(shi)(shi)否(fou)“過關”,生成(cheng)(cheng)器(qi)(qi)(qi)(qi)和(he)判(pan)(pan)別(bie)(bie)器(qi)(qi)(qi)(qi)相互(hu)對抗(kang)、不斷學(xue)習(xi)(xi),最終目的(de)(de)是(shi)(shi)使虛擬(ni)狗無限接近于真實的(de)(de)狗,讓(rang)它通過判(pan)(pan)別(bie)(bie)器(qi)(qi)(qi)(qi)的(de)(de)檢驗(yan)。
自此,三大模(mo)型流(liu)(liu)派形成—— CNN,RNN和GAN,語言模(mo)型屬于(yu)RNN模(mo)型之流(liu)(liu)。但RNN模(mo)型依舊(jiu)有(you)其(qi)缺陷(xian),對(dui)于(yu)相隔越久的(de)信(xin)息,它(ta)(ta)(ta)的(de)記(ji)憶力就越差,那(nei)么對(dui)于(yu)過去很(hen)久但有(you)用的(de)信(xin)息,它(ta)(ta)(ta)就很(hen)容易遺漏。為了提高RNN的(de)記(ji)憶力,人們又開發了Self-attention自注(zhu)意(yi)力模(mo)型,運用抓大放小的(de)思(si)想(xiang),不管重要的(de)東西在(zai)哪,都更注(zhu)重對(dui)它(ta)(ta)(ta)的(de)加權,強化對(dui)它(ta)(ta)(ta)的(de)注(zhu)意(yi)力,讓模(mo)型牢牢將(jiang)其(qi)印入“腦(nao)海”。
在上述各(ge)類模型的(de)基(ji)礎上,ChatGPT的(de)核心(xin)結構(gou)——Transformer模型橫空出(chu)世,中文翻譯也(ye)很恰切,譯為(wei)變形金剛。
那什么是變形金剛?簡單來說,它就(jiu)像是一個黑盒子,在(zai)做文本(ben)翻(fan)譯任務時,我們(men)輸入一個中文,經過這個黑盒子,就(jiu)得到了翻(fan)譯后的英文。
如(ru)果我們探秘(mi)黑(hei)(hei)盒中的(de)內容,可以看到(dao)黑(hei)(hei)盒由若干個編碼(ma)器(Encoder)和解碼(ma)器(Decoder)組成(cheng),同時盒子里還具(ju)備并行(Multi-headed)和自注意力(li)(Self-attention)機(ji)制,自注意力(li)機(ji)制負(fu)責(ze)挑(tiao)選出(chu)重要的(de)有用的(de)信息,并行機(ji)制則負(fu)責(ze)對(dui)這些信息進(jin)行并發(fa)處理(li),有了這兩大特性,變形金剛(gang)也就可以同成(cheng)千上萬人同時對(dui)話,奠定(ding)了商業化的(de)基礎(chu)與可能。
回溯人(ren)工(gong)智能的(de)(de)歷(li)史(shi),可以(yi)發(fa)現模型的(de)(de)成(cheng)功歸(gui)根結(jie)底來源于(yu)試(shi)錯。一開(kai)始(shi)是簡單的(de)(de)人(ren)工(gong)神(shen)(shen)經(jing)網絡(luo),后來是卷積神(shen)(shen)經(jing)網絡(luo)、遞歸(gui)神(shen)(shen)經(jing)網絡(luo),每一步都使我們對(dui)模型的(de)(de)理解(jie)愈(yu)發(fa)深入。而在用其解(jie)決(jue)問題的(de)(de)過程中,一旦發(fa)現現有方法的(de)(de)不足,研(yan)究人(ren)員(yuan)就會想方設法在原(yuan)有基(ji)礎(chu)上改進,從而開(kai)發(fa)出新的(de)(de)模型。
雖然我(wo)們(men)看到(dao)了(le)成(cheng)功的(de)CNN、RNN模型(xing),但(dan)在我(wo)們(men)的(de)視野(ye)之外,可能還會有別的(de)模型(xing)沉寂于歷(li)史長河中。但(dan)是,看不到(dao)不意味著不重要。如果沒(mei)有那些失敗(bai)的(de)嘗試幫助我(wo)們(men)排除了(le)錯誤的(de)技術路線,就不會有CNN、RNN的(de)成(cheng)功,變形金剛的(de)成(cheng)功和ChatGPT的(de)出現更無從談起。
所(suo)以創(chuang)新(xin)(xin)、創(chuang)造都是在(zai)不(bu)斷試(shi)(shi)錯(cuo)、迭(die)代中出現,不(bu)可能預(yu)先設計好路(lu)線,一蹴(cu)而就(jiu)。因(yin)此,若想有(you)創(chuang)新(xin)(xin),就(jiu)必須有(you)配(pei)套(tao)機(ji)制,允許科(ke)研人(ren)員大(da)量(liang)試(shi)(shi)錯(cuo),盡快(kuai)改進。只要(yao)有(you)成熟的(de)機(ji)制,能快(kuai)速迭(die)代、改進,科(ke)研人(ren)員就(jiu)不(bu)怕(pa)犯錯(cuo),不(bu)怕(pa)冒險,不(bu)怕(pa)沒(mei)有(you)成果,也就(jiu)不(bu)怕(pa)再接(jie)再厲、不(bu)停嘗(chang)試(shi)(shi)。因(yin)此,要(yao)鼓勵大(da)膽思(si)考(kao),大(da)膽試(shi)(shi)驗,即便(bian)失敗了(le)也要(yao)表揚、肯定(ding)。否(fou)則就(jiu)會形成“喪事當喜事辦的(de)壞習(xi)慣”,創(chuang)新(xin)(xin)也就(jiu)沒(mei)戲唱。
創新與機制密不可分 失敗也是創新成功的基礎
ChatGPT是(shi)初創(chuang)公(gong)(gong)司(si)(si)的(de)(de)(de)產物,不(bu)是(shi)大(da)公(gong)(gong)司(si)(si),更不(bu)是(shi)國企,這其中(zhong)有(you)一定的(de)(de)(de)必然性。大(da)公(gong)(gong)司(si)(si)激(ji)(ji)勵(li)(li)機制(zhi)的(de)(de)(de)依(yi)據是(shi)職(zhi)工(gong)的(de)(de)(de)KPI,但小公(gong)(gong)司(si)(si)是(shi)創(chuang)業公(gong)(gong)司(si)(si),一旦做出了(le)大(da)的(de)(de)(de)成果(guo),公(gong)(gong)司(si)(si)就可(ke)以上(shang)市或(huo)者收到巨大(da)的(de)(de)(de)市場(chang)效益(yi),這種激(ji)(ji)勵(li)(li)舉足輕重。如(ru)果(guo)激(ji)(ji)勵(li)(li)機制(zhi)不(bu)合適(shi),比(bi)如(ru)所(suo)有(you)人都是(shi)低工(gong)資,那么人們的(de)(de)(de)積(ji)極(ji)性就會降低;所(suo)有(you)人都是(shi)高工(gong)資,也無法(fa)激(ji)(ji)發進(jin)取(qu)心(xin)與積(ji)極(ji)性。只有(you)科研人員的(de)(de)(de)投入、興趣與其回報(bao)成正比(bi)才能(neng)激(ji)(ji)勵(li)(li)人們全力以赴(fu)。
德(de)(de)國(guo)(guo)、日(ri)(ri)本(ben)的(de)工業(ye)很發達,但是德(de)(de)國(guo)(guo)、日(ri)(ri)本(ben)的(de)創新程度依(yi)舊不(bu)及美(mei)國(guo)(guo),這是因為它們的(de)激勵機制不(bu)同。美(mei)國(guo)(guo)的(de)產業(ye)是高度市場化的(de),資金籌(chou)集來自于風(feng)險投(tou)資,而(er)德(de)(de)國(guo)(guo)、日(ri)(ri)本(ben)依(yi)舊依(yi)靠大銀行資助。
真正的(de)(de)(de)(de)(de)顛覆性的(de)(de)(de)(de)(de)創(chuang)新(xin)(xin),一(yi)(yi)(yi)定(ding)來自于市場驅動的(de)(de)(de)(de)(de)機(ji)制(zhi)(zhi)。風險投資(zi)一(yi)(yi)(yi)百(bai)個公司,可(ke)能九十幾個都失敗(bai)了,成(cheng)功(gong)(gong)的(de)(de)(de)(de)(de)只(zhi)有(you)(you)一(yi)(yi)(yi)兩個,但(dan)只(zhi)要有(you)(you)一(yi)(yi)(yi)個成(cheng)功(gong)(gong)了,回報就(jiu)是(shi)成(cheng)千上(shang)百(bai)倍的(de)(de)(de)(de)(de)。雖(sui)然(ran)德(de)國、日(ri)本也可(ke)以做一(yi)(yi)(yi)些(xie)輔(fu)助性的(de)(de)(de)(de)(de)創(chuang)新(xin)(xin),但(dan)是(shi)它們(men)(men)的(de)(de)(de)(de)(de)創(chuang)造很難具有(you)(you)完(wan)全的(de)(de)(de)(de)(de)革命性,因為(wei)在它們(men)(men)的(de)(de)(de)(de)(de)激勵機(ji)制(zhi)(zhi)下,投資(zi)方對(dui)成(cheng)果(guo)、回報有(you)(you)要求(qiu),創(chuang)造者就(jiu)要為(wei)錯誤負(fu)責,那(nei)么(me)人們(men)(men)就(jiu)會(hui)害(hai)怕犯(fan)錯,小心翼翼不敢輕舉(ju)妄動,只(zhi)敢在“安全區”內做一(yi)(yi)(yi)些(xie)小成(cheng)果(guo)。而這也再次證明,創(chuang)新(xin)(xin)是(shi)一(yi)(yi)(yi)種可(ke)能,帶有(you)(you)必然(ran)的(de)(de)(de)(de)(de)風險,如(ru)果(guo)要求(qiu)資(zi)金投入一(yi)(yi)(yi)定(ding)有(you)(you)相應(ying)成(cheng)果(guo),那(nei)么(me)一(yi)(yi)(yi)定(ding)會(hui)扼殺創(chuang)新(xin)(xin)的(de)(de)(de)(de)(de)空(kong)間。
此外(wai),很多人沒有(you)意識到的(de)(de)是(shi)(shi),當我們發(fa)現一個東(dong)西錯了,錯誤本(ben)身(shen)就是(shi)(shi)一個非常大的(de)(de)成(cheng)果,雖然(ran)投入的(de)(de)成(cheng)本(ben)泡湯了,但是(shi)(shi)這個路子不用蹚了,錯誤選擇被排除了,那么(me)我們離最終的(de)(de)成(cheng)功一定是(shi)(shi)更(geng)近了。
我曾有個機會(hui)去美(mei)國國家科學基(ji)金會(hui)(NSF),那里的(de)(de)人(ren)給我看了他們之前資助過的(de)(de)項(xiang)目,其中一些項(xiang)目好像(xiang)還有些道理,但是有的(de)(de)看上(shang)去就天馬行(xing)空(kong),似乎(hu)是胡說(shuo)八道。他們卻表示,美(mei)國NSF資助的(de)(de)項(xiang)目只會(hui)成功不(bu)會(hui)失敗(bai),這(zhe)是為什(shen)么呢?
NSF的(de)(de)人給出了兩條解釋(shi):第一(yi)(yi),真正的(de)(de)創新(xin)項(xiang)目(mu)(mu)可能看上(shang)(shang)去(qu)(qu)就是(shi)胡說八(ba)道(dao),如果都是(shi)自圓其(qi)說、在(zai)我們(men)理解范圍內的(de)(de)東(dong)西,那就說明還不(bu)(bu)夠新(xin),所以我們(men)必須要容忍(ren)看上(shang)(shang)去(qu)(qu)胡說八(ba)道(dao)或不(bu)(bu)靠譜的(de)(de)項(xiang)目(mu)(mu),說不(bu)(bu)定(ding)它們(men)就是(shi)大成果的(de)(de)孵(fu)化器(qi);第二,此類項(xiang)目(mu)(mu)一(yi)(yi)般是(shi)由教授和(he)他們(men)指導的(de)(de)研究生去(qu)(qu)承擔。實(shi)際上(shang)(shang),一(yi)(yi)個(ge)研究生完成了一(yi)(yi)個(ge)失(shi)敗項(xiang)目(mu)(mu),他本人的(de)(de)收獲和(he)對(dui)于社會進步的(de)(de)貢獻一(yi)(yi)定(ding)比做一(yi)(yi)個(ge)成功的(de)(de)項(xiang)目(mu)(mu)更大。而(er)且在(zai)美國,即使項(xiang)目(mu)(mu)沒有正向(xiang)成果,對(dui)失(shi)敗原因進行(xing)有效總結(jie)后也可以拿到學位。
這(zhe)兩條解釋(shi)可以說(shuo)意(yi)味深長(chang)、引人深思,尤其是(shi)(shi)(shi)第二(er)條。第二(er)條正是(shi)(shi)(shi)在(zai)(zai)說(shuo)明,我們必(bi)須要(yao)允(yun)許(xu)人失(shi)敗、犯錯,因為(wei)犯錯之后(hou),就會(hui)收獲相應的(de)(de)教訓、經驗,將(jiang)來就不會(hui)再(zai)(zai)犯相同(tong)的(de)(de)錯誤,后(hou)來者也不會(hui)再(zai)(zai)犯同(tong)樣的(de)(de)錯誤,因此犯錯也是(shi)(shi)(shi)一種(zhong)貢獻(xian),甚至可能(neng)比成功(gong)的(de)(de)貢獻(xian)更大(da)。創(chuang)新(xin)正是(shi)(shi)(shi)在(zai)(zai)千千萬(wan)萬(wan)次(ci)嘗試與犯錯后(hou)修正路線、逼(bi)近(jin)成功(gong),這(zhe)是(shi)(shi)(shi)個(ge)人成長(chang)和創(chuang)新(xin)出現的(de)(de)必(bi)然(ran)且(qie)科學的(de)(de)過程,這(zhe)也是(shi)(shi)(shi)為(wei)什么我們必(bi)須要(yao)有允(yun)許(xu)犯錯的(de)(de)體制(zhi)機制(zhi)。
ChatGPT后,教育何為?
ChatGPT可以(yi)把海量的(de)(de)(de)(de)信息(xi)和數(shu)據匯(hui)集起來,非常(chang)全面,在這一層面上,人類難(nan)以(yi)望其項背。既然ChatGPT能回(hui)答(da)各式各樣(yang)稀奇(qi)古怪、刁鉆、偏僻的(de)(de)(de)(de)問題(ti),那我(wo)們(men)就(jiu)要思考,人的(de)(de)(de)(de)價值(zhi)(zhi)是(shi)什么?如(ru)果我(wo)們(men)的(de)(de)(de)(de)教(jiao)(jiao)育(yu)(yu)最終讓人回(hui)答(da)出了與ChatGPT同樣(yang)的(de)(de)(de)(de)答(da)案,那么教(jiao)(jiao)育(yu)(yu)還有何意義?如(ru)果要我(wo)回(hui)答(da),教(jiao)(jiao)育(yu)(yu)的(de)(de)(de)(de)價值(zhi)(zhi)就(jiu)應當(dang)是(shi)培養學生(sheng)想出不同于ChatGPT的(de)(de)(de)(de)答(da)案的(de)(de)(de)(de)能力,未來教(jiao)(jiao)育(yu)(yu)的(de)(de)(de)(de)目(mu)標也應當(dang)如(ru)此。
因此,未來的(de)教育,應當(dang)注(zhu)意培養批判性思維、邏輯能力(li),并且允許年(nian)輕人(ren)暢所(suo)欲(yu)言、自(zi)由思想(xiang),再給予(yu)他們充(chong)分的(de)試錯(cuo)空(kong)間。
首先,要(yao)培養孩子的(de)(de)(de)批判(pan)性思維。有些(xie)國家對孩子的(de)(de)(de)教育是,誰(shui)說的(de)(de)(de)話都可以被挑戰、質疑(yi)。而且(qie)孩子必須講不(bu)同于(yu)老(lao)師(shi)的(de)(de)(de)話,而不(bu)是對老(lao)師(shi)的(de)(de)(de)觀點全盤(pan)接(jie)受、信(xin)以為(wei)真(zhen)。在這種教育理念下,孩子們(men)更傾向于(yu)擁有自己的(de)(de)(de)判(pan)斷,相信(xin)自己的(de)(de)(de)判(pan)斷,勇于(yu)質疑(yi)。
其次,要培(pei)養(yang)孩子們(men)的(de)(de)邏輯(ji)能(neng)(neng)(neng)力(li),ChatGPT的(de)(de)回(hui)答基(ji)本(ben)符合人(ren)類邏輯(ji),一(yi)言一(yi)語都有因果關聯(lian),都是(shi)由(you)(you)前推后、由(you)(you)此及(ji)彼,所(suo)以(yi)它的(de)(de)回(hui)答有意義,也(ye)能(neng)(neng)(neng)解(jie)決(jue)(jue)我們(men)提出(chu)的(de)(de)問題。而我們(men)培(pei)養(yang)孩子的(de)(de)思(si)考能(neng)(neng)(neng)力(li)、邏輯(ji)能(neng)(neng)(neng)力(li),就是(shi)培(pei)養(yang)他們(men)真正解(jie)決(jue)(jue)現實(shi)問題的(de)(de)能(neng)(neng)(neng)力(li)。
第三(san),要(yao)有探(tan)(tan)索(suo)的(de)空間,否則無法創新。為(wei)什么 ChatGPT 由(you)初創公司而非大(da)(da)公司創造而成?除激勵機(ji)制外,還(huan)因(yin)為(wei)社會對(dui)它們的(de)容(rong)忍度更(geng)高(gao),所以(yi)初創公司的(de)自(zi)由(you)度更(geng)高(gao),即便發表了錯誤、出格的(de)內容(rong)大(da)(da)家也并不(bu)在意。但對(dui)于微(wei)軟、谷(gu)歌等大(da)(da)公司來說,“小(xiao)心駛得萬年(nian)船(chuan)”才(cai)是(shi)值(zhi)得恪守的(de)原則,萬一出現錯誤,就(jiu)難免對(dui)名譽造成巨(ju)大(da)(da)影響,公司效益也會因(yin)而受損。因(yin)此,做 AI、 前沿科技的(de)一定(ding)是(shi)小(xiao)公司,小(xiao)公司的(de)自(zi)由(you)度更(geng)高(gao),不(bu)怕犯錯,探(tan)(tan)索(suo)空間就(jiu)更(geng)大(da)(da),而這也證明(ming)只有言(yan)論自(zi)由(you)、思想自(zi)由(you)后,探(tan)(tan)索(suo)才(cai)能(neng)自(zi)由(you),探(tan)(tan)索(suo)自(zi)由(you)后,創新才(cai)能(neng)生根發芽。
未來教育的目標
未(wei)來教育的(de)目標是,年輕人會(hui)提出正(zheng)確的(de)問(wen)題,并(bing)(bing)且判(pan)斷答案是否合理,中間(jian)的(de)過程就是人和(he)機(ji)器的(de)交互,讓機(ji)器、人工(gong)智能幫(bang)助我們去完成很多工(gong)作。但這并(bing)(bing)不(bu)代表人與(yu)人之間(jian)無需再有(you)交流,相反,人和(he)人的(de)交互依然需要,而且更加重要。
知(zhi)(zhi)名組(zu)織理論家羅素·艾(ai)可夫曾提(ti)出由數據(ju)、信息(xi)(xi)、知(zhi)(zhi)識(shi)、智(zhi)慧組(zu)成(cheng)的(de)(de)知(zhi)(zhi)識(shi)金(jin)字(zi)塔。在(zai)知(zhi)(zhi)識(shi)金(jin)字(zi)塔中,每一(yi)層都比下一(yi)層多擁(yong)有一(yi)些特質。數據(ju)來源(yuan)于我(wo)們(men)的(de)(de)原始(shi)觀(guan)察(cha)與度量,信息(xi)(xi)來源(yuan)于我(wo)們(men)對數據(ju)的(de)(de)篩選、整理與分析,知(zhi)(zhi)識(shi)則來源(yuan)于我(wo)們(men)對信息(xi)(xi)的(de)(de)加工、提(ti)取(qu)與評價,而智(zhi)慧作為我(wo)們(men)獨有的(de)(de)能力,意味著我(wo)們(men)可以收集、加工、應用、傳播(bo)知(zhi)(zhi)識(shi),以及預測事(shi)物的(de)(de)發(fa)展與未來走向。
ChatGPT之后,甚至在其(qi)出現(xian)以前,計(ji)(ji)算機對于數據處理、信(xin)息處理以及知(zhi)(zhi)識處理都已經非(fei)常在行。雖然(ran)機器(qi)和人(ren)工智能(neng)并不“懂”知(zhi)(zhi)識,但是(shi)它可以存儲、調用知(zhi)(zhi)識,可以在特定的情(qing)境里與人(ren)交互,給出的答案也(ye)合乎情(qing)理。因此,未(wei)來(lai)的教育應當(dang)是(shi)教人(ren)擁有(you)智慧(hui),而(er)不僅僅是(shi)擁有(you)知(zhi)(zhi)識、信(xin)息與技(ji)(ji)能(neng)。智慧(hui)是(shi)設計(ji)(ji)體系結(jie)構的能(neng)力,而(er)技(ji)(ji)能(neng)僅僅是(shi)依照設計(ji)(ji)搬磚添瓦的能(neng)力,智慧(hui)與思維是(shi)創新真正(zheng)的來(lai)源,而(er)知(zhi)(zhi)識與技(ji)(ji)能(neng)則(ze)相當(dang)次要。

知識金字塔
有些大(da)學(xue)為防(fang)止(zhi)學(xue)生作(zuo)弊而禁止(zhi)其(qi)使用(yong)(yong)ChatGPT,我覺(jue)得此舉值得商(shang)榷。ChatGPT是個工(gong)具,是種(zhong)技(ji)術(shu),而技(ji)術(shu)是道德(de)中立的(de),關鍵在于老(lao)師(shi)應改變傳統的(de)考核方式(shi)以適應它的(de)出現。斯坦福大(da)學(xue)曾統計,50% 的(de)學(xue)生做(zuo)學(xue)期(qi)論文時都用(yong)(yong)到了ChatGPT。因此在這種(zhong)趨勢下,老(lao)師(shi)必須學(xue)會如何考核。
一個可用(yong)的(de)(de)(de)考(kao)核方(fang)式是:學(xue)(xue)生(sheng)用(yong)ChatGPT完(wan)成一道題(ti)后(hou),必須能(neng)給別人(ren)講清楚答(da)案(an)中(zhong)哪(na)些是對的(de)(de)(de),又有哪(na)些是錯的(de)(de)(de)。可能(neng)學(xue)(xue)生(sheng)又會(hui)把(ba)這個問題(ti)拋回給ChatGPT,再采用(yong)它的(de)(de)(de)答(da)案(an),但關鍵(jian)是,如果(guo)你問得太深入(ru),ChatGPT自己就(jiu)會(hui)“崩潰”,答(da)案(an)也會(hui)漏洞百出。在這種(zhong)情況下,學(xue)(xue)生(sheng)就(jiu)必須要(yao)動腦子,要(yao)靠自己找(zhao)到最初答(da)案(an)的(de)(de)(de)漏洞。而老師正可以對這一點做考(kao)察,看(kan)學(xue)(xue)生(sheng)能(neng)否(fou)找(zhao)到ChatGPT的(de)(de)(de)漏洞,能(neng)找(zhao)到,就(jiu)說(shuo)明學(xue)(xue)生(sheng)已(yi)將知(zhi)識(shi)掌(zhang)握透徹。
我們(men)這一(yi)代(dai)人(ren)是(shi)(shi)“數(shu)字移(yi)民(min)”,新一(yi)代(dai)的孩子是(shi)(shi)“數(shu)字原住民(min)”,所(suo)以我們(men)一(yi)定要(yao)為(wei)他(ta)們(men)創造自由的空間,而不是(shi)(shi)讓(rang)他(ta)們(men)因循守舊、依(yi)照傳統行事。
科研的層次與大學的包容
科研必須要區分(fen)層(ceng)次。大(da)型項(xiang)(xiang)目是(shi)國(guo)(guo)家(jia)發展、社(she)會(hui)前進(jin)的(de)根本,例如美國(guo)(guo)NASA牽(qian)頭的(de)各類航天、物理(li)項(xiang)(xiang)目,中國(guo)(guo)舉(ju)國(guo)(guo)體(ti)制(zhi)支持的(de)各種重大(da)項(xiang)(xiang)目,這些目的(de)明確、規模投入巨大(da)的(de)項(xiang)(xiang)目是(shi)不可或缺的(de)。
但與(yu)此同時,小(xiao)型的(de)(de)、看(kan)上(shang)去(qu)“沒用(yong)”的(de)(de)項目(mu)也必須(xu)(xu)存在。因為科研是一(yi)種探(tan)索未知的(de)(de)活動,未來哪個(ge)項目(mu)能開花(hua)結果,哪個(ge)能“冒泡”,我(wo)們(men)當(dang)下都(dou)是霧里(li)看(kan)花(hua),看(kan)不真切。所以我(wo)們(men)必須(xu)(xu)要(yao)包容(rong)一(yi)些(xie)人(ren),去(qu)做一(yi)些(xie)可(ke)能毫無用(yong)處的(de)(de)東西,或者是有點(dian)出格、方向冷僻的(de)(de)東西,我(wo)們(men)必須(xu)(xu)要(yao)讓這些(xie)人(ren)生存,讓一(yi)些(xie)可(ke)能存在。
如(ru)果大學的(de)(de)考(kao)核制度(du)過于嚴苛,青年教師(shi)們只能(neng)為(wei)了保住自己的(de)(de)工作去做“短(duan)平快(kuai)”、功(gong)利性的(de)(de)研(yan)究,那(nei)么優秀的(de)(de)人無法靜心思考(kao)真正的(de)(de)問題,只能(neng)為(wei)科(ke)研(yan)而科(ke)研(yan),只做實用性強的(de)(de)科(ke)研(yan),這對于科(ke)研(yan)是一(yi)種實質性的(de)(de)損害。
所以我(wo)(wo)也(ye)有(you)個理論:大學(xue),要培養精神境界高的(de)、有(you)教養的(de)人,還要包容一(yi)些特立獨行的(de)看(kan)似是在(zai)胡思亂想的(de)“無用(yong)的(de)人”的(de)存在(zai)。有(you)些研究(jiu)當下(xia)看(kan)似沒有(you)一(yi)點用(yong)處,但可能(neng)百年之(zhi)后就有(you)了(le)大用(yong),這都是我(wo)(wo)們(men)預料(liao)之(zhi)外的(de)事。
有(you)(you)(you)些(xie)全球頂尖大(da)學就會保留不同類型的(de)(de)(de)人才,把(ba)一(yi)些(xie)聰明、能(neng)干但怪異(yi)、另類的(de)(de)(de)人養(yang)在大(da)學里。未(wei)來,我們也可以嘗(chang)試包容各式各樣的(de)(de)(de)人才,讓他們做些(xie)有(you)(you)(you)意思的(de)(de)(de)、胡思亂想的(de)(de)(de)、短期(qi)內沒有(you)(you)(you)結果(guo)甚至沒用的(de)(de)(de)東西,或許(xu)現(xian)在的(de)(de)(de)無心插柳,在未(wei)來就變成了夏日炎(yan)炎(yan)里茂密濃(nong)郁(yu)的(de)(de)(de)柳蔭(yin)。
本文根據CERNET網絡(luo)中心副主任、清華大學電子(zi)工程(cheng)系李星教授報(bao)告、訪談整理。
① 凡本(ben)站(zhan)注(zhu)(zhu)明“稿(gao)件(jian)(jian)來源(yuan):中國教育在線(xian)”的(de)所有文字(zi)、圖片和音(yin)視頻稿(gao)件(jian)(jian),版權均屬(shu)本(ben)網所有,任何媒體、網站(zhan)或(huo)個人未(wei)經本(ben)網協(xie)議授權不得轉載(zai)、鏈接(jie)、轉貼或(huo)以其他方式復制(zhi)發(fa)表。已經本(ben)站(zhan)協(xie)議授權的(de)媒體、網站(zhan),在下載(zai)使用(yong)時必須注(zhu)(zhu)明“稿(gao)件(jian)(jian)來源(yuan):中國教育在線(xian)”,違(wei)者本(ben)站(zhan)將依法追究責任。
② 本站注明稿(gao)(gao)件來源(yuan)為其(qi)他媒體的文/圖等稿(gao)(gao)件均為轉(zhuan)載稿(gao)(gao),本站轉(zhuan)載出于(yu)非商業性(xing)的教育和科研之目的,并(bing)不意(yi)味著贊(zan)同其(qi)觀點或證(zheng)實其(qi)內容的真實性(xing)。如轉(zhuan)載稿(gao)(gao)涉及版權(quan)等問(wen)題,請作者在兩周內速來電或來函聯系。




中國教育在線
