Nature重磅:AI提前7天預測洪水 每年挽救數千人生命


升級洪水預警系統,每年可以挽救數千人的生命。洪水是最常見的自然災害類型,全球有近15億人(約占世界人口的19%)直接面臨嚴重洪水事件的巨大風險。洪水還造成巨大的物質損失,每年造成全球經濟損失約500億美元。

近年來,人類造成的氣候變化進一步增加一些地區的洪水頻率。然而,目前的預報方法主要依賴沿河而建的觀測站,其在全球的分佈並不均勻,這就導致未經測量的河流更難預報,其負面影響主要體現在發展中國傢。升級預警系統,使這些人群能夠獲得準確、及時的信息,每年可以挽救數千人的生命。

那麼,如何在全球范圍內進行可靠的洪水預報?人工智能(AI)模型或許大有可為。

如今,來自 Google Research 洪水預測團隊的 Grey Nearing 及其同事開發的人工智能模型,通過利用現有的 5680 個測量儀進行訓練,可預測未測量流域在 7 天預測期內的日徑流。

隨後,他們將該人工智能模型與全球領先的短期和長期洪水預測軟件——全球洪水預警系統(GloFAS)進行對比測試。結果顯示,該模型同日預測準確率與當前系統相當甚至更高。

此外,該模型在預測重現窗口(return window)期為五年的極端天氣事件時,其準確性與 GloFAS 預測重現窗口期為一年的事件時的準確性相當或更高。

相關研究論文以“Global prediction of extreme floods in ungauged watersheds”為題,已發表在權威科學期刊 Nature 上。


研究團隊表示,該模型能對未測流盆地的小規模和極端洪水事件做出預警,且預警期比之前的方法都更長,並可提高發展中地區獲得可靠洪水預報的機會。

提前7天,AI是如何做到的?

那麼,這一人工智能模型如何能給出可靠的洪水預報呢?

據論文描述,該研究使用一種叫做長短期記憶(LSTM)網絡的人工智能模型來進行河流流量的預測。這個模型的設計有點像我們的大腦,它可以從一系列的氣象數據中學習並預測未來的河流流量,分為編碼器和解碼器兩部分。


圖|基於 LSTM 的河流預報模型架構。兩個 LSTM 依次應用,一個接收歷史天氣數據,另一個接收預測天氣數據。模型輸出為每個預報時間步的流量概率分佈參數。

首先,編碼器負責從上一段時間內的氣象數據中提取信息,它從過去的天氣情況中理解河流流量的變化情況。它將歷史氣象數據轉化為可供解碼器使用的信息形式的作用。通過學習氣象數據中的特征和時間模式,模型對過去氣象情況形成抽象理解,為後續的流量預測提供關鍵性的輸入。

編碼器則通過接收一系列氣象數據(比如降水量、溫度、輻射等)作為輸入,學習如何提取這些數據中的關鍵特征信息。這些特征信息可能包括季節性變化、氣象事件(如暴雨、高溫等)以及它們對河流流量的影響。

同時,編碼器能夠捕獲氣象數據之間的時間依賴關系。這意味著它不僅僅考慮當前時刻的氣象情況,還考慮之前一段時間內的氣象變化趨勢。通過對歷史數據的學習,編碼器能夠理解氣象數據的時間序列模式,並將其納入到模型中。

在編碼器中,LSTM 網絡被用來處理時間序列數據。LSTM 具有內部記憶單元,可以記住過去的信息,並根據當前的輸入來更新內部狀態。這使得編碼器能夠在處理長期依賴關系時表現優異,並在建模過程中保留重要的歷史信息。

最終,編碼器將歷史氣象數據轉化為一個潛在的表示形式,這個表示形式包含對過去氣象情況的理解和總結。這個表示形式是編碼器的輸出,並傳遞給解碼器,用於未來流量的預測。

然後,解碼器部分使用這些信息來預測未來幾天的河流流量。它考慮當前的氣象預報,以及過去的天氣對未來流量的影響。這樣,就可以得到未來一周的流量預測。


解碼器在模型中負責將歷史氣象信息和未來預測結合起來,生成對未來河流流量的預測,並輸出相應的流量概率分佈。

解碼器首先接收來自編碼器的潛在表示形式,這個表示形式包含歷史氣象數據的抽象理解。解碼器利用這些信息來理解過去的氣象條件對河流流量的影響,並建立起歷史數據與未來預測之間的聯系。

解碼器同時接收未來的氣象預測數據作為輸入。這些預測數據通常包括未來幾天的降水量、溫度等氣象指標。解碼器將歷史信息和未來預測結合起來,通過學習它們之間的關系來預測未來的河流流量。

在理解歷史氣象條件和未來預測之後,解碼器通過一個獨立的 LSTM 網絡來生成對未來河流流量的預測。這個網絡可以理解為一個時間序列的生成器,根據過去的信息和未來的預測來生成流量序列。

解碼器不僅僅預測未來的河流流量值,還輸出一個概率分佈。具體來說,模型使用一個單邊拉普拉斯分佈來描述流量的不確定性,預測每個時間步的流量值時,輸出一個單邊拉普拉斯分佈的參數,而不是一個確定的值。這使得模型能夠考慮到流量預測的不確定性,為決策提供更多的信息。

最終的流量預測結果是通過集成多個解碼器模型的輸出得到的。模型使用三個獨立訓練的解碼器 LSTM 網絡,然後將它們的預測結果取中值,從而減少預測的方差並提高預測的穩定性。

真實效果怎麼樣?

研究人員收集大量的氣象數據和河流流量數據,來訓練這一模型。這些數據來自於不同的數據源,包括氣象預報、歷史記錄和地理信息。通過將數據標準化處理,模型得以正確理解它們。

然後,數據分成兩種類型:訓練集和測試集。訓練集用於訓練模型,而測試集則用於評估模型的性能。研究人員使用一種“交叉驗證”的方法,以確保模型在不同的時間和地點都能夠有效地工作。

最後,研究團隊評估模型的性能,並與現有的流量預測模型進行比較。

研究團隊采用常見的誤差指標來量化模型預測值與實際觀測值之間的差異。由於模型預測的不隻是未來流量的具體數值,而且還給出流量預測的不確定性,因此他們使用概率積分變換(PIT)圖來評估預測分佈的準確性。

研究團隊還通過與其他流量預測模型的對比來評估所提出模型的性能。這包括傳統的物理模型和其他機器學習模型。通過比較不同模型的誤差指標,可以直觀地展示所提模型在準確性和可靠性上的優勢。

另外,研究團隊還采用特定的流域或河流作為案例研究,應用模型於實際情境中,並詳細分析模型在不同季節、不同氣候條件下的預測性能。這有助於評估模型在實際應用中的可行性和穩定性。

除量化指標,研究團隊也還對模型預測的不確定性進行深入分析。這包括評估不同來源的不確定性(如輸入數據的不確定性、模型結構的不確定性等)對預測結果的影響,以及模型如何在存在不確定性的情況下仍然提供有用的預測。

結果顯示,模型展現較高的精確度和召回率,尤其是對於短期回報周期的事件。這意味著模型能夠準確地識別出洪水事件,並且錯過的事件較少。

結合精確度和召回率,模型在不同回報周期的事件上獲得較高的F1 score,表明其在準確性和全面性之間取得良好的平衡。


此外,通過雙側 Wilcoxon 符號秩檢驗,模型的預測結果在統計上顯著優於基準模型。這證明模型在洪水預測方面的有效性。

Cohen's d 指標顯示,模型性能改進的效果是顯著的,這進一步驗證模型相對於傳統方法的優勢。

在 Nash–Sutcliffe 效率和 Kling-Gupta 效率等水文指標上,模型同樣顯示良好的預測精度和對水文過程變化的敏感性。

不足與展望

然而,該研究也存在一些局限性。

例如,實驗采用的樣本可能較小,限制研究結果的普遍適用性和統計功效。研究所用的數據集的多樣性存在不足,這可能影響模型的泛化能力。采用的模型復雜度較高,可能導致計算成本增加並限制其可解釋性和便捷性。

另外,研究聚焦於特定任務或領域,可能限制方法的廣泛應用;這個方法缺乏長期影響的評估,使得對模型隨時間變化的表現理解不足,評估標準可能無法全面反映模型性能;且對現有技術的改進程度可能相對有限。

對此,研究團隊表示,未來的工作需要進一步將洪水預報的覆蓋范圍擴大到全球更多地點,以及其他類型的洪水相關事件和災害,包括山洪和城市洪水。人工智能技術也將繼續發揮關鍵作用,幫助推動科學研究,促進氣候行動。


相關推薦

2023-11-15

究人員在Google研究成果的基礎上所展示的那樣:https://www.nature.com/articles/s41586-023-06184-4#Abs1)。這個模型就是一個例子,說明當一個系統對天氣如何發生並不解時,它能做出多麼準確的天氣預測。氣象學傢可以告訴你,當這種氣

2023-05-07

的方法,可以用AI從大腦信號中提取視頻畫面。論文已登Nature,卻遭網友瘋狂‘打假’。現在,AI不僅會讀腦,還會預測下一個畫面!利用AI,一個研究團隊‘看見’老鼠眼中的電影世界。更神奇的是,這種機器學習算法,還能揭

2022-06-27

目標之一。現在,清華大學在該領域一項突破性成果登上Nature:團隊首次發現一種“神奇藥水”,能把小鼠細胞重編程為一種全能幹細胞。全能幹細胞具有無限分化潛力,可以培養出任意一種器官或組織細胞。也就是不需要精子

2024-03-06

早期預警挽救無數生命,WMO提供的季節性預報有助於各國提前做好準備,減少農業、水資源和衛生等部門受到的損害。WMO還警告稱,今年晚些時候有可能出現拉尼娜現象——一種赤道太平洋東部和中部海表溫度大范圍持續異常變

2022-07-05

測COVID-19患者病情發展至危重概率的研究成果,並發表於Nature子刊。目前,騰訊正在將計算機視覺、機器學習、深度學習等技術與醫學跨界融合,輔助醫生進行疾病篩查、診斷和治療,提高臨床醫生的診斷準確率,挽救更多患者

2023-03-08

抱怨。此外,知情人士說,一些員工表示擔心,如果他們提前失業,他們是否能收到定於本月發放年終獎。Meta一輪接一輪的裁員,除科技公司大環境糟糕外,與其自身業績的不佳也有相當關系。近日對Meta的一個打擊是,其對大

2022-09-21

段本可以預防這場令人心碎的車禍,技術也可以防止美國每年發生的數以萬計因駕駛不當和超速所導致的死亡事故。我們現在就應該實施這些技術,從而挽救生命。”圖片來源:NTSBNTSB建議美國高速公路交通安全管理局(NHTSA)

2024-02-20

行業繼續減少勞動力支出的趨勢。報道稱,此次裁員波及數千名員工。與此同時,谷歌母公司Alphabet在1月底公佈創紀錄的利潤。該公司去年第四季度的凈利潤為204億美元。另外,根據財報,谷歌2023年累計裁員超過12000人。 廣告

2022-08-22

8月應該是我國南方的豐水期,但鄱陽湖、洞庭湖等湖泊提前百日進入枯水期,為有記錄以來最早的一次。這意味著湖泊已經提前降到秋冬時間的水平,而氣象專傢對於秋冬季的降雨情況並沒有抱特別樂觀的態度。重慶城區江面

2023-09-23

10天全球天氣的預測。此前,國際頂級學術期刊《自然》(Nature)雜志正刊發表華為雲盤古大模型研發團隊研究成果《三維神經網絡用於精準中期預報全球天氣》(《Accurate medium-range global weather forecasting with 3D neural networks》)。這

2022-10-12

場,芯片巨頭英特爾公司計劃大規模裁員,人數可能達到數千人。知情人士稱,英特爾最早將於本月宣佈裁員計劃,該公司計劃在10月27日發佈第三季度財報時公佈這一決定。包括英特爾銷售和營銷部門在內的一些部門將成為重

2022-07-22

“誤報”。通常情況下,在很多國傢和地區熱浪最早可以提前 10 天預測。但是對於極端熱浪的預測是並不準確的,可能導致的結果是要麼熱浪沒有預期的那麼熱,要麼會轉移到其他地區,那麼在警告方面可能會失去公信力。此

2022-10-21

有報道稱,由於個人電腦(PC)市場放緩,英特爾計劃裁員數千人。截至2022年7月,總部位於美國加州聖克拉拉的英特爾雇傭113700名員工。值得一提的是,英特爾將於10月27日美股盤後公佈第三季度財報。此外,本周早些時候,英特

2022-11-07

模裁員,據說其裁員數量可能遠超其他科技巨頭,將影響數千名員工。Meta CEO紮克伯格曾在公司的財報會議上表示,他預計元宇宙需要10年的時間才能能夠取得成果,在這期間他需要凍結招聘、關閉項目、縮減團隊以減少成本。