中國日?qǐng)?bào)網(wǎng)5月19日電 5月18日,中國日?qǐng)?bào)社聯(lián)合天津市委宣傳部在線上成功舉辦主題為“智行天下 能動(dòng)未來”的“新時(shí)代大講堂”活動(dòng)。來也科技創(chuàng)新業(yè)務(wù)負(fù)責(zé)人皮埃爾·帕基在會(huì)上發(fā)表演講,介紹了大語言模型作為一種全新的深度學(xué)習(xí)模型如何模仿人類思維,我們?nèi)绾闻c之交互,以及這種交互意味著什么。
帕基稱,通過描述性訓(xùn)練,可以訓(xùn)練新的深度學(xué)習(xí)模型,這就像給人布置任務(wù)一樣,只需用自然語言描述任務(wù)或者最多給出一兩個(gè)例子。與常見的監(jiān)督學(xué)習(xí)相比,這種機(jī)器學(xué)習(xí)方法改變了開發(fā)人工智能技術(shù)和訓(xùn)練新任務(wù)所需的時(shí)間。
以智能文檔處理為例,要想批量從發(fā)票中提取發(fā)貨日期、供應(yīng)商地址和供應(yīng)商名稱,必須向模型提供數(shù)千張發(fā)票,開發(fā)者會(huì)在數(shù)千個(gè)文檔上精確定位信息,進(jìn)行成百上千次點(diǎn)擊才能真正訓(xùn)練此模型。而通過描述性訓(xùn)練,只需用通俗易懂的語言描述想要的內(nèi)容,就可以精確定位提取信息。
帕基表示,大語言模型可以比人提供更多的細(xì)節(jié),需要調(diào)整預(yù)期并非常清晰地界定自己需要的內(nèi)容。如果想要極高的準(zhǔn)確率,必須明確定義所需的數(shù)據(jù)類型。為了獲得更好的模型輸出,需要對(duì)提示進(jìn)行調(diào)整,這與過去研究人工智能的方式有很大不同。
帕基稱,大型語言模型也存在局限性,如果想要非常準(zhǔn)確的結(jié)果,就要花時(shí)間思考如何明確提示,并留給模型足夠的時(shí)間和空間思考。他認(rèn)為,大語言模型幾乎可以立即學(xué)習(xí)新任務(wù),這是我們?cè)谌斯ぶ悄茴I(lǐng)域看到的最激動(dòng)人心的事情之一。
“新時(shí)代大講堂”由中國日?qǐng)?bào)社于2018年初創(chuàng)辦,利用自身國際化、全媒體、多語種、多平臺(tái)優(yōu)勢(shì),創(chuàng)新敘事方式,打造新時(shí)代向世界傳播中國聲音的新平臺(tái),此前已在北京、天津、杭州、澳門、蘭州、嘉興等城市以及美國紐約、英國倫敦、南非約翰內(nèi)斯堡等地成功舉辦25期。