一項由馬丁·路德大學哈勒-維滕貝格(MLU)、約翰內斯·古騰堡大學邁因茨分校和邁因茨應用科學大學團隊開發的新型人工智能軟件如今能夠解讀難以辨認的楔形文字。與以往依賴照片的方法不同,該AI系統利用楔形文字片的3D模型,傳遞的結果比先前的方法更加可靠。這使得能夠通過比較多個片上的內容進行搜索,為全新的研究問題鋪平道路。
在這一新的研究方法中,研究人員使用近2000塊楔形文字片的3D模型,其中包括MLU收藏的約50塊。據估計,全球仍然存在著大約一百萬塊這樣的片,其中許多都有5000多年的歷史,是人類最古老的文字記錄之一。它們涵蓋廣泛的主題,從購物清單到法院裁決,為人類幾千年前的過去提供一瞥。然而,由於這些楔形文字片是未經燒制的泥塊,上面壓入文字,它們變得非常難以辨認,即使對於訓練有素的眼睛也是如此。
圖片由AI生成,圖片授權服務商Midjourney
為解決這個問題,MLU的Hubert Mara助理教授提出開發基於3D模型的人工智能系統的想法。新系統比以前的方法更好地解密文字。原理上,這個AI系統的工作方式類似於光學字符識別(OCR)軟件,它將文字和文本的圖像轉換為機器可讀的文本。這有很多優勢,一旦轉換為計算機文本,文字就可以更容易地閱讀或搜索。
MLU的Ernst Stötzner解釋說:“OCR通常使用照片或掃描。對於紙上或羊皮紙上的墨水來說,這沒有問題。然而,在楔形文字片的情況下,情況更加復雜,因為光線和觀察角度會極大地影響某些字符的識別效果。”他開發這個新的AI系統,作為他的碩士論文的一部分。團隊使用三維掃描和其他數據對新的AI軟件進行訓練,其中大部分數據由邁因茨應用科學大學提供,該大學負責3D模型的大規模項目。
該AI系統隨後成功地識別片上的符號。研究人員驚訝地發現,該系統甚至在實質上較差的圖像材料(如照片)上也能夠良好地運行。哈勒和邁因茨的研究人員的工作為迄今為止相對獨傢的材料提供新的訪問途徑,並打開許多新的研究方向。目前它隻是一個能夠可靠識別兩種語言符號的原型,然而已知存在總共十二種楔形文字語言。未來,該軟件還可能有助於解讀受損的銘文,例如在墓地中的三維楔形文字。