人工智能能否解開《圣經(jīng)》中最大的謎團之一?一組研究人員使用 AI 驅(qū)動的統(tǒng)計建模來分析希伯來圣經(jīng)的作者身份,并對古代敘事有了驚人的發(fā)現(xiàn)。信用: 存在Shutterstock
一個多學(xué)科研究團隊正在使用人工智能來解開希伯來圣經(jīng)最早書籍的作者身份。
人工智能正在徹底改變從醫(yī)療保健到電影制作再到金融的方方面面。那么,為什么不把它應(yīng)用到歷史上最古老和最有影響力的書之一——圣經(jīng)呢?
這正是一個國際研究團隊的初衷。杜克大學(xué)數(shù)學(xué)助理研究教授 Shira Faigenbaum-Golovin 就是其中之一。他們一起使用了人工智能、統(tǒng)計建模和語言分析的組合,解決了圣經(jīng)學(xué)術(shù)中最大的謎團之一:究竟是誰寫了圣經(jīng)?
通過仔細(xì)檢查文本中單詞選擇的細(xì)微差異,該團隊確定了希伯來圣經(jīng)前九卷書(稱為 Enneateuch)中的三種不同的抄寫傳統(tǒng)或?qū)懽黠L(fēng)格。然后,他們使用相同的 AI 模型來分析其他章節(jié)并估計最有可能的作者。更妙的是,該模型還解釋了它是如何得出結(jié)論的。
但是這位數(shù)學(xué)家是怎么來到這里的呢?
從陶器到摩西五經(jīng)
2010 年,F(xiàn)aigenbaum-Golovin 開始與海法大學(xué)考古學(xué)和海洋文化學(xué)院院長 Israel Finkelstein 合作,使用數(shù)學(xué)和統(tǒng)計工具,通過比較每個碎片上刻有字母的樣式和形狀,確定公元前 600 年陶器碎片上發(fā)現(xiàn)的字體的作者。
“我們得出的結(jié)論是,這些銘文中的發(fā)現(xiàn)可以為舊約文本的年代確定日期提供有價值的線索,”Faigenbaum-Golovin 說?!澳菚r我們開始組建我們現(xiàn)在的團隊,他們可以幫助我們分析這些圣經(jīng)文本?!?/p>
團隊結(jié)果的圖形表示。通過比較單詞用法和句型,他們基于 AI 的統(tǒng)計模型確定了三種不同的書寫風(fēng)格或抄寫傳統(tǒng),此處以黃色、藍(lán)色和綠色顯示。圖片來源:Faigenbaum-Golovin 等人。
這項多學(xué)科工作由兩部分組成。首先,F(xiàn)aigenbaum-Golovin 和 Finkelstein 的團隊——Alon Kipnis(賴希曼大學(xué))、Axel Bühler(巴黎新教神學(xué)院)、Eli Piasetzky(特拉維夫大學(xué))和 Thomas R?mer(法蘭西學(xué)院)——由考古學(xué)家、圣經(jīng)學(xué)者、物理學(xué)家、數(shù)學(xué)家和計算機科學(xué)家組成。該團隊使用一種基于人工智能的新型統(tǒng)計模型來分析圣經(jīng)三個主要部分的語言模式。他們研究了圣經(jīng)的前五本書:申命記、從約書亞記到列王紀(jì)的所謂申命記歷史,以及摩西五經(jīng)中的祭司著作。
結(jié)果顯示,申命記和歷史書彼此更相似,而不是祭司文本,這已經(jīng)是圣經(jīng)學(xué)者的共識。
逐字區(qū)分
“我們發(fā)現(xiàn)每組作者都有不同的風(fēng)格——令人驚訝的是,即使是在簡單和常見的詞方面,如'不'、'哪個'或'國王'。我們的方法準(zhǔn)確地識別了這些差異,“R?mer 說。
為了測試這個模型,該團隊從圣經(jīng)的前九卷書中選擇了 50 章,每一章都已經(jīng)被圣經(jīng)學(xué)者分配給上述寫作風(fēng)格之一?!霸撃P捅容^了這些章節(jié),并提出了一個定量公式,將每章分配給三種寫作風(fēng)格中的一種,”Faigenbaum-Golovin 說。
在研究的第二部分,該團隊將他們的模型應(yīng)用于圣經(jīng)中作者關(guān)系爭論更激烈的章節(jié)。通過將這些章節(jié)與三種寫作風(fēng)格中的每一種進(jìn)行比較,該模型能夠確定哪組作者更有可能寫過它們。更棒的是:該模型還解釋了它為什么要進(jìn)行這些調(diào)用。
“該方法的主要優(yōu)點之一是它能夠解釋分析結(jié)果——也就是說,指定導(dǎo)致將給定章節(jié)分配給特定寫作風(fēng)格的單詞或短語,”Kipnis 說。
由于圣經(jīng)中的文本已經(jīng)被多次編輯和重新編輯,該團隊在尋找保留原始措辭和語言的片段方面面臨著巨大的挑戰(zhàn)。一旦找到,這些圣經(jīng)文本通常非常短——有時只有幾節(jié)經(jīng)文——這使得大多數(shù)標(biāo)準(zhǔn)統(tǒng)計方法和傳統(tǒng)機器學(xué)習(xí)不適合進(jìn)行分析。他們必須開發(fā)一種可以處理如此有限數(shù)據(jù)的自定義方法。
深度學(xué)習(xí)中的詞根
有限的數(shù)據(jù)通常會帶來對不準(zhǔn)確的擔(dān)憂?!拔覀兓撕芏鄷r間說服自己,我們得到的結(jié)果不僅僅是垃圾,”Faigenbaum-Golovin 說?!拔覀儽仨毥^對確定統(tǒng)計意義?!?/p>
為了規(guī)避這個問題,研究人員沒有使用需要大量訓(xùn)練數(shù)據(jù)的傳統(tǒng)機器學(xué)習(xí),而是使用了一種更簡單、更直接的方法。他們比較了句型以及某些單詞或詞根(詞根)在不同文本中出現(xiàn)的頻率,以查看它們是否可能由同一組作者撰寫。
一個令人驚訝的發(fā)現(xiàn)?研究小組發(fā)現(xiàn),雖然撒母耳記中方舟敘述的兩個部分涉及相同的主題,有時被視為單一敘述的一部分,但撒母耳記上的文本與三個語料庫中的任何一個都不一致,而撒母耳記下的章節(jié)則顯示出與申命記歷史(約書亞記到列王紀(jì))的相似之處。
展望未來,F(xiàn)aigenbaum-Golovin 表示,同樣的技術(shù)可以用于其他歷史文獻(xiàn)?!袄纾绻阏诓榭次募?,以確定它們是否是亞伯拉罕·林肯 (Abraham Lincoln) 撰寫的,這種方法可以幫助確定它們是真實的還是只是偽造的?!?/p>
“這項研究引入了分析古代文本的新范式,”Finkelstein 總結(jié)道。
Faigenbaum-Golovin 和她的團隊現(xiàn)在正在考慮使用相同的方法來挖掘有關(guān)其他古代文本的新發(fā)現(xiàn),例如死海古卷。她強調(diào)她非常喜歡這種長期的跨學(xué)科伙伴關(guān)系。
“這是科學(xué)與人文學(xué)科之間如此獨特的合作,”她說?!斑@是一種令人驚訝的共生關(guān)系,我很幸運能與利用創(chuàng)新研究突破界限的人一起工作?!?/p>
參考資料:Shira Faigenbaum-Golovin、Alon Kipnis、Axel Bühler、Eli Piasetzky、Thomas R?mer 和 Israel Finkelstein 于 2025 年 6 月 3 日發(fā)表的“通過詞頻分析進(jìn)行批判性圣經(jīng)研究:揭開文本作者身份”,PLOS ONE.DOI
:10.1371/journal.pone.0322905
資金: Alon Kipnis 得到了 Koret 基金會和 BSF 第 2022124 號資助的部分支持。Shira Faigenbaum-Golovin 感謝 Eric 和 Wendy Schmidt 戰(zhàn)略創(chuàng)新基金、Zuckerman-CHE STEM 計劃、Grant Math+X 400837下的 Simons 基金會以及杜克大學(xué)對她的研究的支持。