GISAID平台上匯聚分享的全球新冠基因組測序數據已破百萬大關

作為一個流行的線上數據分享平台,GISAID 匯聚了全球諸多科研團隊的 COVID-19 溯源努力。最新消息是,其已拿到了來自全球 172 個國家和地區、超過 120 萬組的 SARS-CoV-2 基因序列。Nature 指出,這些數據對科學家們追溯新冠病毒起源、COVID-19 爆發的流行病學研究、以及相關變異毒株的全球傳播都有著至關重要的作用。

GISAID平台上匯聚分享的全球新冠基因組測序數據已破百萬大關

(來自:GISAID)

非營利組織「全球禽流感數據共享倡議」(簡稱 GISAID)科學顧問、來自新加坡的 Sebastian Maurer-Stroh 表示:

根據世界各地提交的最新數據,我們可以構建出一套追溯新冠病毒如何在全球范圍內傳播的監測系統,以了解相關防疫措施和疫苗是否仍然有效。

早在 2006 年,科學界就已經提出了 GISAID 的倡議。起初許多地方政府都出於各種原因(比如單純的利益考量),而未選擇向外界分享禽流感的基因組信息。

直到兩年後,隨著政府與科學家們完成了艱苦的數據共享協議談判,GISAID 項目才得以正式啟動。

盡管 GISAID 不是唯一用於基因組序列分享的資料庫,但它依然在 COVID-19 大流行時期發揮了重要的作用。

截止上周末,GISAID 上分享的 SARS-CoV-2 基因組序列已經超過了百萬份。

Maruer-Stroh 指出,當 COVID-19 開始傳播時,GISAID 團隊立即與世界各地的研究人員和有關部門取得了聯系,以掃除獲取分享 SARS-CoV-2 基因組數據的相關障礙。

之後當西非地區的研究人員告知其缺乏生物學信息培訓時,塞內加爾的一名 GISAID 科學家就伸出了援手。

在高質量數據的支持下,通過比較當地流行毒株與其它地方 SARS-CoV-2 之間的關系,就能夠及時發現有哪些新的編譯。

其中某些已開發國家 / 地區上傳了大量的新冠基因組序列,並在資料庫中占據了相當大的份額。截止 4 月 20 日的時候,美國和英國就分別貢獻了 303359 / 379510 份序列。

即便如此,GISAID 的資料庫遠未完善,比如坦尚尼亞就一直在否認新冠流行(為上傳分享任何序列)。

此外幾個大爆發的國家的檢測能力也狠狠地拖了後腿,比如薩爾瓦多(678541 例 / 僅上傳 6 個序列)和黎巴嫩(513006 例 / 僅上傳 49 個序列)。

來源:cnBeta