早安健康NEWS

維基百科也能追蹤流感疫情

維基百科也可以追蹤流感?你可以先停下來想一想可能性,底下會告訴你答案。

相信維基百科是許多人的最愛,尤其是需要做書面報告的學生。不過維基百科不單是寫報告的資料庫與懶人包的來源,它還可以追蹤現實世界流感疫情。用的方式也很簡單,只要計算與流感相關詞條的點閱數。這項研究刊登在美國公共科學圖書館計算生物學(PLOS Computational Biology)期刊網站。

這項研究關注的詞條跟流感有關,但不限於只有流感,而是包含了類似其他類似症狀的詞條。這項研究之所以有意義,在於資料彙整比傳統方法要快速。以美國來說,疾病管制中心要花兩個星期的時間,從各地醫院收集資料、分析,才能得到流感疫情發展的確切結論,但兩個星期實在有點久,要做好疫情控制,時間上必須更快才行。

團隊選擇了 35 個詞條為目標,包括 InfluenzaCommon_cold。此外,他們也參考了維基百科首頁或 CDC 的條目做為背景資料。負責這項計畫的哈佛醫學院研究員 David Mclver 說,這有助於演算過程更為精確,這在 2009 年豬流感流行期間已獲得驗證。


▲Google 流感趨勢利用網路搜尋相關關鍵字計算疫情,但被批評不夠準確。(圖片來源:Google)

除了這項研究以外,Google 流感趨勢則是另一個從網路上搜集資料進行流感疫情追蹤的工具,只不過這個工具飽受批評,主要在於 2009 年豬流感流行期間,Google 流感趨勢過於高估了疫情,使得媒體也跟著過度報導,事實上,Google 流感趨勢是以一般搜尋結果做為演算時的資料,這個做法正好就會被使用者因為看到媒體的報導而強化,形成惡性循環。

雖然也有論文指出 Google 流感趨勢在不斷增加新資料的情形下將會更為精確,不過 Google 流感趨勢並沒有公開他們的演算法,而是視為商業機密,因此 Mclver 認為他們將自己的研究公開是正確的做法。

不過 Mclver 的演算法還是有侷限。因為維基百科只提供以國家為單位的資料,使得他們無法做跨境的彙整。演算法也假設一個使用者不會多次造訪同一個詞條,同時也無法了解造訪的目的究竟是因為他得了流感,或是純粹只是想學點什麼。Mclver 表示,他們的目的不是要取代傳統的疫情評估方法,而是希望兩者能相輔相成。

延伸閱讀

相關資訊