DNA數據存儲聯盟本周推出首個基於DNA的數據存儲規范。該規范概述一種在DNA數據檔案中編碼基本信息的方法,這對於開發和商業化可互操作的存儲生態系統至關重要。
DNA 數據存儲使用稱為寡核苷酸 (oligos) 的短脫氧核糖核酸 (DNA) 串,它們通常混合在一起,沒有特定的物理排序方案。 這種存儲介質缺乏專用控制器和組織手段來解一個介質子組件與另一個介質子組件的接近程度。 DNA 存儲與磁帶、HDD 和 SSD 等傳統介質有很大不同,後者具有固定的結構和控制器,可以從結構化介質讀取和寫入數據。 DNA 缺乏物理結構,需要采用獨特的方法來啟動數據檢索,這帶來其標準化方面的特殊性。
為解決這個問題,SNIA DNA Archive Rosetta Stone (DARS) 工作組(DNA 數據存儲聯盟的一部分)制定兩個規范:“零區”和“一區”,以促進啟動 DNA 檔案的過程。
零扇區作為起點,為檔案閱讀器提供所需的最少詳細信息,以識別負責合成 DNA 的實體(例如 Dell、Microsoft、Twist Bioscience)以及用於編碼第一扇區的 CODEC(例如 Super Codec、Hyper 編解碼器,Jimbob 的編解碼器)。 零扇區由 70 個堿基組成:前 35 個堿基標識供應商,後 35 個堿基標識編解碼器。 扇區零中的信息使得能夠訪問和解碼存儲在扇區一中的數據。 SZ 中存儲的數據量很小,適合單個寡核苷酸。
第一扇區對此進行擴展,包括內容描述、文件表以及將數據傳輸到定序器所需的參數。 該規范確保檔案的主體是可訪問和可讀的,為數據檢索鋪平道路。 第一區正好包含 150 個堿基,並將跨越多個寡核苷酸。
DNA 數據存儲聯盟董事會的 Dave Landsman 表示:“DNA 數據存儲聯盟的一個主要目標是制定和發佈規范和標準,以促進可互操作的 DNA 數據存儲生態系統的發展。隨著聯盟第一個規范的發佈,我們在實現這一目標方面邁出重要的一步。零區和一區現已公開,允許該領域的公司采用和實施。”
DNA 數據存儲聯盟由 Catalog Technologies, Inc.、Quantum Corporation、Twist Bioscience Corporation 和 Western Digital 領導(盡管我們不確定 Western Digital 的 NAND 還是 HDD 部門負責制定該規范)。 同時,包括微軟在內的眾多行業巨頭也支持DNA數據存儲聯盟。