在國內自主(zhu)研(yan)發大(da)模型的(de)企業中
由(you)清華大學計算機系知(zhi)識工程(cheng)實驗室
轉化而來的“智譜”
無疑是(shi)一抹亮眼的(de)存在
其研發的大(da)模型(xing)GLM-4
多項(xiang)性能比肩大(da)模型(xing)GPT-4
系(xi)列(lie)開源模型全(quan)球下(xia)載量超2000萬
是目前(qian)下(xia)載(zai)量和開源影響力(li)
最高的國(guo)產大(da)模(mo)型之一
從“實(shi)驗”走(zou)向“市(shi)場”
“智譜”面向公眾上線
生(sheng)成式(shi)視頻功能“清影(ying)”
具(ju)備視頻通話功(gong)能的軟件“清言”
將前沿的科(ke)學(xue)技術轉化成為
人人可用的AI助手

“智譜”公(gong)司的CEO
正(zheng)是清華(hua)大學計(ji)算機系
1998級本科、2002級碩(shuo)士校友
張鵬
讓我們一起走近
“報國清華人”系(xi)列報道
共(gong)同(tong)感受(shou)清華人在各(ge)行(xing)各(ge)業
服務國家(jia)和人(ren)民(min)的拳拳報國志!
翻越技術的圍墻
“中國要有自己的預訓練模型框架”
1998年
來自湖北的張鵬
考入清華大學計(ji)算機系
通過深度參與實驗室課(ke)題項目
他很快(kuai)找(zhao)到(dao)了自己(ji)的研究方向
“文本數據挖掘和語義分析(xi)”

爬山時的張鵬
在校期間
他先后發(fa)表10余篇(pian)頂會文章(zhang)
設計了國內首個
中英文(wen)平衡的(de)跨語言知(zhi)識圖譜系統(tong)
畢業后張鵬選擇加入
清華大(da)學計算機系知識(shi)工程(cheng)實驗室
繼續探索前沿科技
2006 年起
實(shi)驗室開(kai)始研究大(da)數(shu)據挖掘與(yu)知識圖譜
孵化了
科技情報大數據挖掘與(yu)服務系(xi)統(tong)平臺(tai)
—— AMiner系統
隨著系統的不斷成熟
團隊開始考慮商業化
在2019年6月將AMiner單(dan)獨拆分(fen)出來
成立新公司“智譜”
2020年,Open AI發布
參數(shu)規(gui)模達1750億(yi)的GPT-3模型
吸引世界關注
在國(guo)外人(ren)工智(zhi)能產品的(de)沖擊下
“中國要有自己的預訓練模(mo)型框架”
成為一種共識

張鵬參加中國計算機大會
GPT、BERT、T5
都是(shi)西方科學家提(ti)出的(de)底層技(ji)術
沿著已有路徑走無疑(yi)最省力
然而
“核心的技術是求不(bu)來(lai)也買不(bu)來(lai)的”
作為清華人
要(yao)為(wei)國(guo)家、民族和(he)社(she)會做(zuo)點事情
想(xiang)要掌握前沿(yan)領域(yu)的先進技術
有些圍墻必須越過
張(zhang)鵬和(he)團隊成員走(zou)上了
艱難(nan)但可靠的自主研(yan)發道路(lu)
在大語言(yan)模型(LLM)浪潮(chao)中
團隊驚喜地發現
自(zi)研的預訓練(lian)框架——GLM
對(dui)人類輸入意圖以及一些常(chang)識(shi)
或(huo)者知(zhi)識類信(xin)息理解(jie)能力
有著意想不到的表現
打破國外壟斷
實現“彎道(dao)超(chao)車(che)”有了希望
團隊當即決定
投身到GLM預訓練框架研發中
訓練成本高、人(ren)力投入(ru)大、過程不穩(wen)定
面對行業公認的難題
張鵬認為
“雖然局面復雜困難
但我們(men)想做一(yi)些自己的事情”
通過不斷對算法(fa)優化、量(liang)化
在(zai)保證精度和(he)推理速度情(qing)況下
1300億(yi)參數規模的雙(shuang)語預訓練模型
GLM-130B
最(zui)終運行(xing)成(cheng)本降低75%
同時
堅持自主研究
還(huan)帶來(lai)適配(pei)國產化硬件的優勢
從(cong)源(yuan)頭杜絕(jue)信息泄露(lu)的(de)可能(neng)
為國(guo)內信息(xi)安全上(shang)了一把(ba)“安全鎖(suo)”
2022年11月
斯(si)坦(tan)福大學大模型中心
對全(quan)球30個主流大模型(xing)進行(xing)全(quan)方位(wei)評測(ce)
團隊研發的GLM-130B
作為(wei)亞洲唯一入選的大模型
在魯棒性(xing)、校準誤差和無(wu)偏性(xing)方面(mian)
取得了亮眼的成績
“在同等或更(geng)小(xiao)規(gui)模上
我們能達到世界頂(ding)尖水平
甚至(zhi)在某些(xie)指標(biao)上更為(wei)領先”
張鵬介紹
AI大模型飛入尋常百姓家
“我們的技術要去解決一些實際的問題”
在清華大學計算機系
“貫天、接地、通(tong)心、樹人”理念影響下
張(zhang)鵬對(dui)“科技服務(wu)于人”
有著深刻理解
北京2022年冬(dong)奧會吸引著世界(jie)目光(guang)
冰上運動隨(sui)之走入(ru)千家萬戶
各種專業術語
和新聞主播200余字(zi)/分鐘(zhong)的(de)語速
總讓手語老師“手忙腳亂”
如何更好地滿足
聽障(zhang)朋友了解比賽需求?
此刻
正是“大模型”在(zai)社會服務方面(mian)
發揮作用的關鍵時刻

團隊研發的手語播報數字人
通(tong)過“大模型”理解音頻語義
利用(yong)語(yu)義蒸餾模(mo)型(xing)、手語(yu)翻譯模(mo)型(xing)
團隊將(jiang)語(yu)音轉化為手語(yu)
結合肌(ji)肉綁定(ding)技術驅動(dong)實(shi)現面部采集
最后
出現在北(bei)京衛視舞臺上的(de)數字人
以流(liu)暢自然(ran)的手語翻譯
為千千萬萬聽障朋友
帶來高效(xiao)、精準的實時解說(shuo)
北京2022年冬奧會圓滿結(jie)束
“翻(fan)譯官”卻沒有“下班”
扎實的技術帶(dai)來長久效應
團隊研(yan)發的手語播報(bao)數字(zi)人
至今活躍在電視(shi)臺(tai)、網(wang)絡平臺(tai)
景區與公共服務廳
持續(xu)為聽(ting)障朋友(you)們提供無障礙(ai)服務
前進!邁向通用人工智能
“讓機器像人一樣思考”
科技的世界你追我趕
先進的技術迭代升級
2023年8月31日
基于(yu)ChatGLM研發的產品
“智譜清言”上線
為用戶實時提供
通用問答、虛擬對話、代(dai)碼生成
創意寫(xie)作等(deng)多方面服務(wu)
前沿科學技術
成為(wei)人人可用的AI助手
2024年1月16日
團隊發布新一代基(ji)座大模(mo)型GLM-4
與上一代相比
GLM-4有著(zhu)更(geng)為亮眼(yan)的數據(ju)
性能全面提升60%
達到比肩GPT-4的(de)水平
升級之后的大模型
能夠根據(ju)用戶意圖理解、規劃復雜指(zhi)令
自主調用網頁瀏覽器
Code Interpreter代碼解釋器(qi)
文生圖CogView3模型等
工具完成復雜任務
單次處理(li)的文本達300頁
2024年7月
“智譜”上線生成式視頻功能(neng)“清(qing)影(ying)”
僅(jin)需一段話,或(huo)一張圖
30秒就能自主生成
一(yi)段1440×960清晰度(du)的高質量視頻(pin)
“智譜(pu)清(qing)言”面(mian)向所有用戶開放

視頻通話功能在辦公場景的應用
2024年8月30日
“智譜(pu)清言”再次(ci)進行重大升級
上線了國內首個
面向客戶(hu)端(duan)開放的視頻通話功能
用戶只需打開視(shi)頻通(tong)話界面
便能享受到
如同與AI“面(mian)對面(mian)”的交流體驗
智譜大模型實現了
從語言文字、圖片
再到視頻的模態跨越
面向人工智能國(guo)際(ji)先(xian)進(jin)水(shui)平的模型矩陣
初具規模
“讓機器像人(ren)一樣思考”
在技術進步中(zhong)探索未來的無限可能
人工智能(neng)在解放生產(chan)力同時
也為科技創新留下了更多發展空間
從將(jiang)清華實驗(yan)室研究成果轉化
到(dao)百億、千(qian)億模型發布(bu)
再(zai)到細分領域(yu)AICG模型
及產品矩陣搭建
腳踏實地
致力于產品研發升級
張(zhang)鵬和團隊每(mei)一步都走得穩扎穩打

張鵬
“未來,大模型能幫大家做(zuo)很多事情”
在張鵬(peng)和團隊的夢想中
大模型之后
是實(shi)現通用人(ren)工智能(neng)的最(zui)終(zhong)目標
圍墻之外的探索還(huan)在繼續
新的路(lu)徑將會通往何(he)方?
通(tong)用人工智能的(de)愿景何時能夠(gou)實現(xian)?
清華人張鵬(peng)和智譜團隊
繼續步履不停
在一步(bu)步(bu)探索前進中(zhong)尋找答案
更多報國清華人的成長故事
我們將繼(ji)續為你(ni)講述……
① 凡本(ben)站(zhan)(zhan)(zhan)注(zhu)明“稿(gao)件來(lai)(lai)源:中國(guo)教(jiao)育(yu)在線”的所(suo)有文字、圖片和音視頻稿(gao)件,版權(quan)均屬本(ben)網所(suo)有,任何(he)媒體、網站(zhan)(zhan)(zhan)或(huo)(huo)個人未經本(ben)網協(xie)議(yi)授權(quan)不得(de)轉載、鏈接、轉貼或(huo)(huo)以其他方式復制發表。已(yi)經本(ben)站(zhan)(zhan)(zhan)協(xie)議(yi)授權(quan)的媒體、網站(zhan)(zhan)(zhan),在下載使用時(shi)必須注(zhu)明“稿(gao)件來(lai)(lai)源:中國(guo)教(jiao)育(yu)在線”,違(wei)者本(ben)站(zhan)(zhan)(zhan)將依法追究責任。
② 本(ben)站(zhan)注明稿件來源為其他(ta)媒體的文/圖等(deng)稿件均(jun)為轉載稿,本(ben)站(zhan)轉載出于非商業性(xing)的教育和科(ke)研(yan)之目的,并不(bu)意味著贊同其觀點或(huo)證實其內容的真實性(xing)。如轉載稿涉及(ji)版權等(deng)問題,請(qing)作者在兩(liang)周內速(su)來電或(huo)來函(han)聯系。




中國教育在線
