Google 發佈神經天氣模型,幾秒鐘預測整個美國的降水量
準確預測未來幾分鐘到幾周的天氣是一項基本的科學挑戰,它可以對社會的許多方面產生廣泛影響。
很多氣象機構目前採用的預報是基於大氣的物理模型。儘管在過去幾十年有很大的改進,但這些模型本身受到計算要求的限制。並且,它們對物理定律的近似值非常敏感。
另一種能夠克服這些限制的天氣預報方法是使用深神經網絡(DNNs)。DNNs 在強大的專用硬件(如 GPU 和 TPU)上使用並行計算,發現數據中的模式,並學習從輸入到所需輸出的複雜轉換。
近日,在先前對降水量預報的研究基礎上,Google 提出了 MetNet,這是一種用於降水預報的神經天氣模型。這種 DNN 能夠在未來 8 小時內以 1km 的分辨率預報降水量,時間間隔為 2 分鐘。MetNet 的預測時間比 NOAA 目前使用的最先進的基於物理的模型提前了 7-8 小時。它可以在幾秒鐘內對整個美國的降水量進行預測,而 NOAA 需要花費一小時。
網絡的輸入來自雷達站和衞星網絡,無需人工標註。模型輸出是一個概率分佈,Google 用它來推斷每個地理區域的降水率和相關的不確定性。下圖提供了該網絡對美國大陸的預測示例。
MetNet 模型預測結果與 NOAA 多雷達/多傳感器系統(MRMS)測量的地面真實值進行了比較。MetNet 模型(上圖頂部)顯示了從 2 分鐘到 480 分鐘前預測的每小時 1 毫米降水的概率,而 MRMS 數據(上圖底部)顯示了在同一時間段內接收到至少每小時 1 毫米降水的區域。
神經天氣模型
MetNet 不依賴於大氣動力學領域的物理定律,它是通過反向傳播學習,直接從觀測數據中預測天氣。該網絡使用由多雷達/多傳感器系統(MRMS)組成的地面雷達站,以及提供大氣中雲層自頂向下的視圖的衞星系統測量得出的降水量估計值。這兩個數據源均覆蓋美國大陸,並提供可由網絡有效處理的圖像類輸入。
該模型每 64km*64km 執行一次,覆蓋整個美國,其分辨率為 1 km。然而,與這些輸出區域相比,輸入數據的實際物理覆蓋範圍要大得多,因為它必須考慮到在進行預測的時間段內雲和降水場的可能運動。
例如,假設雲以每小時 60km 的速度移動,為了作出可靠的預測,捕捉到 8 小時前的大氣時間動態,模型需要 60*8=480km 的全方位空間背景。因此,要達到這個程度,需要 1024km*1024km 區域中的信息來對中心 64km*64km 補丁進行預測。
包含衞星和雷達圖像(1024 *1024 平方公里)的輸入補丁和輸出預測雷達圖像(64*64 平方公里)
由於以全分辨率處理 1024km*1024km 的區域需要大量內存,因此研究人員使用空間下采樣器,通過減少輸入面片的空間維度來減少內存消耗。同時,在輸入中查找並保留相關的天氣模式。然後沿降採樣輸入數據的時間維度應用時間編碼器,對 90 分鐘輸入數據的 7 個快照進行編碼,編碼片段長度為 15 分鐘。時間編碼器採用卷積 LSTM 實現,該卷積 LSTM 特別適合於圖像序列。
然後,時間編碼器的輸出被傳遞到空間聚集器,空間聚集器使用軸向自關注,有效地捕獲數據中的長距離空間依賴性,並基於輸入目標時間使用可變數量的上下文,以在 64km*64km 的輸出上進行預測。
這種結構的輸出是一個離散的概率分佈,估計美國大陸每平方公里的給定降水率的概率。
神經氣象模型 MetNet 的結構
結果
研究人員根據一個降水率預測基準對 MetNet 進行評估,並將結果與兩個基線進行比較:NOAA 高分辨率快速刷新 HRRR 系統,這是目前在美國運行的物理天氣預測模型;一個估計降水場運動(即光流)的基線模型,它是一種在預測時間少於 2 小時時,表現也很好的方法。
Google 的神經天氣模型的一個顯著優點是,它是為密集並行計算而優化的,並且非常適合在專用硬件(如 TPU)上運行。無論是針對紐約市這樣的特定地點還是針對整個美國,預測可以在幾秒鐘內並行進行。而像 HRRR 這樣的物理模型在超級計算機上的運行時間約為一小時。
在下面的圖表中,研究人員量化了 MetNet、HRRR 和光流基線模型之間的性能差異。這裏展示了這三個模型所取得的性能,在降水率閾值為 1.0mm/h(相當於小雨)時使用 F1 分數進行評估。MetNet 神經天氣模型能夠在 8 小時內超過 NOAA-HRRR 系統,並且始終優於基於流量的模型。
1.0 mm/h 降水率(越高越好)下的 F1 得分評估性能。神經天氣模型(MetNet)比目前在美國運行的基於物理的模型(HRRR)的時間尺度要提前 8 小時。
由於大氣的隨機性,未來天氣狀況的不確定性隨着預測時間的延長而增加。
MetNet 是一個概率模型,隨着預測時間的延長,預測的不確定性在可視化中表現為預測的日益平滑。相反,HRRR 並不直接進行概率預測,而是會對未來的降水情況進行單一的預測。下圖比較了 MetNet 模型和 HRRR 模型的輸出。
從 NOAA MRMS 系統獲得的 MetNet(上)和 HRRR(下)到地面真值(中)的輸出之間的比較。注意,雖然 HRRR 模型預測的結構似乎更接近於基本事實,但預測的結構可能嚴重錯誤。
與 MetNet 模型相比,HRRR 物理模型的預測更清晰、更結構化。但其結構,特別是預測結構的準確時間和位置的精度較低。這是由於初始情況和模型參數的不確定性造成的。
HRRR(左)從許多可能的結果中預測單個潛在的未來結果(紅色),而 MetNet(右)通過分配未來結果的概率直接解釋不確定性。
研究人員對 HRRR 和 MetNet模型之間進行了比較,感興趣的可以打開視頻觀看:https://youtu.be/-dAvqroX7ZI
未來方向
Google 正在積極研究如何改進全球天氣預報模型,尤其是在氣候快速變化很大的地區的準確性。雖然上文展示了美國大陸目前的 MetNet 模型,但它可以擴展到任何有足夠雷達和光學衞星數據的地區。本文提出的工作是這一努力的一個小小的墊腳石,Google 希望通過今後與氣象界的合作,能夠帶來更大的改進。
via:https://ai.googleblog.com/2020/03/a-neural-weather-model-for-eight-hour.html
雷鋒網雷鋒網雷鋒網(公眾號:雷鋒網)
雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。
資料來源:雷鋒網
作者/編輯:skura
很多氣象機構目前採用的預報是基於大氣的物理模型。儘管在過去幾十年有很大的改進,但這些模型本身受到計算要求的限制。並且,它們對物理定律的近似值非常敏感。
另一種能夠克服這些限制的天氣預報方法是使用深神經網絡(DNNs)。DNNs 在強大的專用硬件(如 GPU 和 TPU)上使用並行計算,發現數據中的模式,並學習從輸入到所需輸出的複雜轉換。
近日,在先前對降水量預報的研究基礎上,Google 提出了 MetNet,這是一種用於降水預報的神經天氣模型。這種 DNN 能夠在未來 8 小時內以 1km 的分辨率預報降水量,時間間隔為 2 分鐘。MetNet 的預測時間比 NOAA 目前使用的最先進的基於物理的模型提前了 7-8 小時。它可以在幾秒鐘內對整個美國的降水量進行預測,而 NOAA 需要花費一小時。
網絡的輸入來自雷達站和衞星網絡,無需人工標註。模型輸出是一個概率分佈,Google 用它來推斷每個地理區域的降水率和相關的不確定性。下圖提供了該網絡對美國大陸的預測示例。
MetNet 模型預測結果與 NOAA 多雷達/多傳感器系統(MRMS)測量的地面真實值進行了比較。MetNet 模型(上圖頂部)顯示了從 2 分鐘到 480 分鐘前預測的每小時 1 毫米降水的概率,而 MRMS 數據(上圖底部)顯示了在同一時間段內接收到至少每小時 1 毫米降水的區域。
神經天氣模型
MetNet 不依賴於大氣動力學領域的物理定律,它是通過反向傳播學習,直接從觀測數據中預測天氣。該網絡使用由多雷達/多傳感器系統(MRMS)組成的地面雷達站,以及提供大氣中雲層自頂向下的視圖的衞星系統測量得出的降水量估計值。這兩個數據源均覆蓋美國大陸,並提供可由網絡有效處理的圖像類輸入。
該模型每 64km*64km 執行一次,覆蓋整個美國,其分辨率為 1 km。然而,與這些輸出區域相比,輸入數據的實際物理覆蓋範圍要大得多,因為它必須考慮到在進行預測的時間段內雲和降水場的可能運動。
例如,假設雲以每小時 60km 的速度移動,為了作出可靠的預測,捕捉到 8 小時前的大氣時間動態,模型需要 60*8=480km 的全方位空間背景。因此,要達到這個程度,需要 1024km*1024km 區域中的信息來對中心 64km*64km 補丁進行預測。
包含衞星和雷達圖像(1024 *1024 平方公里)的輸入補丁和輸出預測雷達圖像(64*64 平方公里)
由於以全分辨率處理 1024km*1024km 的區域需要大量內存,因此研究人員使用空間下采樣器,通過減少輸入面片的空間維度來減少內存消耗。同時,在輸入中查找並保留相關的天氣模式。然後沿降採樣輸入數據的時間維度應用時間編碼器,對 90 分鐘輸入數據的 7 個快照進行編碼,編碼片段長度為 15 分鐘。時間編碼器採用卷積 LSTM 實現,該卷積 LSTM 特別適合於圖像序列。
然後,時間編碼器的輸出被傳遞到空間聚集器,空間聚集器使用軸向自關注,有效地捕獲數據中的長距離空間依賴性,並基於輸入目標時間使用可變數量的上下文,以在 64km*64km 的輸出上進行預測。
這種結構的輸出是一個離散的概率分佈,估計美國大陸每平方公里的給定降水率的概率。
神經氣象模型 MetNet 的結構
結果
研究人員根據一個降水率預測基準對 MetNet 進行評估,並將結果與兩個基線進行比較:NOAA 高分辨率快速刷新 HRRR 系統,這是目前在美國運行的物理天氣預測模型;一個估計降水場運動(即光流)的基線模型,它是一種在預測時間少於 2 小時時,表現也很好的方法。
Google 的神經天氣模型的一個顯著優點是,它是為密集並行計算而優化的,並且非常適合在專用硬件(如 TPU)上運行。無論是針對紐約市這樣的特定地點還是針對整個美國,預測可以在幾秒鐘內並行進行。而像 HRRR 這樣的物理模型在超級計算機上的運行時間約為一小時。
在下面的圖表中,研究人員量化了 MetNet、HRRR 和光流基線模型之間的性能差異。這裏展示了這三個模型所取得的性能,在降水率閾值為 1.0mm/h(相當於小雨)時使用 F1 分數進行評估。MetNet 神經天氣模型能夠在 8 小時內超過 NOAA-HRRR 系統,並且始終優於基於流量的模型。
1.0 mm/h 降水率(越高越好)下的 F1 得分評估性能。神經天氣模型(MetNet)比目前在美國運行的基於物理的模型(HRRR)的時間尺度要提前 8 小時。
由於大氣的隨機性,未來天氣狀況的不確定性隨着預測時間的延長而增加。
MetNet 是一個概率模型,隨着預測時間的延長,預測的不確定性在可視化中表現為預測的日益平滑。相反,HRRR 並不直接進行概率預測,而是會對未來的降水情況進行單一的預測。下圖比較了 MetNet 模型和 HRRR 模型的輸出。
從 NOAA MRMS 系統獲得的 MetNet(上)和 HRRR(下)到地面真值(中)的輸出之間的比較。注意,雖然 HRRR 模型預測的結構似乎更接近於基本事實,但預測的結構可能嚴重錯誤。
與 MetNet 模型相比,HRRR 物理模型的預測更清晰、更結構化。但其結構,特別是預測結構的準確時間和位置的精度較低。這是由於初始情況和模型參數的不確定性造成的。
HRRR(左)從許多可能的結果中預測單個潛在的未來結果(紅色),而 MetNet(右)通過分配未來結果的概率直接解釋不確定性。
研究人員對 HRRR 和 MetNet模型之間進行了比較,感興趣的可以打開視頻觀看:https://youtu.be/-dAvqroX7ZI
未來方向
Google 正在積極研究如何改進全球天氣預報模型,尤其是在氣候快速變化很大的地區的準確性。雖然上文展示了美國大陸目前的 MetNet 模型,但它可以擴展到任何有足夠雷達和光學衞星數據的地區。本文提出的工作是這一努力的一個小小的墊腳石,Google 希望通過今後與氣象界的合作,能夠帶來更大的改進。
via:https://ai.googleblog.com/2020/03/a-neural-weather-model-for-eight-hour.html
雷鋒網雷鋒網雷鋒網(公眾號:雷鋒網)
雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。
資料來源:雷鋒網
作者/編輯:skura