谷歌刚刚发布了一款AI工具,帮助历史学家填补古罗马铭文中缺失的词语
人工智能,邂逅古罗马。
谷歌DeepMind开发的一款全新人工智能工具,能够帮助学者填补古代铭文中缺失的词语,并估算这些文本文物的历史数据,通过语境和相似铭文进行有根据的猜测。该工具名为“埃涅阿斯”(Aeneas),取自罗马神话中在特洛伊战争期间保卫城市抵抗希腊人的英雄之名。
学者们利用古代铭文来加深我们对罗马世界的理解,但这些铭文并非总是易于破译。为了理解它们,历史学家经常求助于“平行文本”(parallels),即那些词语、句法或出处相似的其他文本。
埃涅阿斯的开发旨在加速这项工作。根据谷歌DeepMind的一份声明,该工具“能够对数千份拉丁语铭文进行推理,在几秒钟内检索出文本和语境上的平行文本,从而使历史学家能够解释并进一步利用该模型的研究结果。”
根据本周发表在《自然》杂志上的一篇关于该模型的论文,每年大约有1500份古罗马铭文被发现。
英国诺丁汉大学历史学家西娅·索默斯柴尔德(Thea Sommerschield)与谷歌合作开发了埃涅阿斯,她告诉《卫报》的伊恩·桑普(Ian Sample):“这些铭文的独特之处在于,它们是由古代各个社会阶层的人们亲手书写的。”“这不仅仅是胜利者书写的历史。”
为了帮助历史学家解读这些文本,埃涅阿斯在一些最大的拉丁语铭文数据库上进行了训练,例如罗马铭文数据库(Epigraphic Database Roma)、海德堡铭文数据库(Epigraphic Database Heidelberg)和克劳斯-斯拉比铭文数据库(Epigraphik-Datenbank Clauss-Slaby)。由人工智能研究员亚尼斯·阿萨尔(Yannis Assael)领导的谷歌DeepMind团队,将这些记录集合编译成一个单一的数据集,其中包含来自罗马世界各地的17.6万多份拉丁语铭文。当给定一份新铭文时,该模型会根据文本和出处检索出相似铭文列表,然后利用这些相似铭文来猜测可能缺失的内容。
研究人员得出结论,当多达十个拉丁字符缺失时,埃涅阿斯能够以73%的准确率修复受损铭文。当缺失部分的长度未知时,准确率降至58%。
该模型还能以72%的准确率将一份铭文归因于62个古罗马行省中的一个,并且能够将文本的日期猜测误差控制在13年以内。
在一项测试中,埃涅阿斯分析了最著名的罗马铭文之一:《奥古斯都的功业》(Res Gestae Divi Augusti),这是一份由奥古斯都大帝亲自撰写的第一人称记述。该铭文的确切日期至今仍是历史学家们争论的焦点。埃涅阿斯没有提供单一的日期范围,而是提供了一个可能的日期分布,其中包括两个峰值:一个在公元10年至20年之间,另一个在公元前10年至公元前1年之间。这些范围与目前主流的学术假设相符。
“那些时刻让我们目瞪口呆,”索默斯柴尔德告诉《卫报》。
剑桥大学历史学家玛丽·比尔德(Mary Beard)表示,埃涅阿斯的潜力对学者而言可能是“变革性的”。
比尔德在诺丁汉大学的一份声明中说:“在这个非常困难的领域,突破往往依赖于个体学者的记忆、主观判断以及直觉/猜测,并辅以传统的、百科全书式的数据库。”“埃涅阿斯开启了全新的视野。”
合著者、牛津大学古代历史学家乔纳森·普拉格(Jonathan Prag)表示,埃涅阿斯可以允许更多人从事现有铭文的研究工作。但他告诫说,该工具应谨慎使用。
“如果没有这样的工具,你唯一能做的就是积累大量的个人知识,或者查阅巨大的图书馆,”普拉格告诉《卫报》,“但你确实需要能够批判性地使用它。”
埃涅阿斯是基于一个名为“伊萨卡”(Ithaca)的项目构建的,该项目是谷歌的一项倡议,利用人工智能帮助解读希腊铭文。埃涅阿斯的交互式版本可在predictingthepast.com免费获取,其代码和数据集均已开源。