當谷歌遇上流感:透視網絡技術監測傳染病優劣
今年流感在美國的暴發比往年要早,在肆虐的流感面前,一項用來監測流感暴發的技術也暴露出了自身的缺陷。和傳統監測系統的對比數據顯示,通過和流感相關的互聯網搜索,來估計流感傳播狀況的谷歌流感趨勢系統(Google Flu Trends),大大高估了流感的峰值水平。專家說,對于這項具有前景的戰略來說,這次的故障不僅僅是一個暫時的挫折,更意味著谷歌需要改善它的算法系統。由于流感跟蹤技術是基于網絡數據挖掘和社會媒體擴散,谷歌發生的這個插曲也是個適時的提醒:如今的技術并不能*取代傳統的流行病學檢測網絡,它們只能起到補充作用。
挑戰傳統
法國監控網絡創始人、巴黎第六大學的流行病學家Alain-Jacques Valleron說:“脫離現有的系統是無法進行疾病檢測的。新系統的運行在很大程度上依賴于過去的檢測系統。”
自2003年以來,今年是美國流感暴發zui早的一年,從2012年11月起流感開始蔓延,圣誕節剛過似乎就直逼上限。這也導致了更多嚴重的疾病和死亡案例,尤其是對老年人的殺傷力更大。因為正如2003年一樣,今年引發流感的病毒也是H3N2——它是3個主要季節性流感病毒中zui致命的一種。
傳統的流感監測在一定程度上取決于來自內科醫生所報告的病例。他們通過國內網絡報告疑似流感病例(ILI)。這類病人通常具有一系列癥狀,例如高燒。這些病征可用來確診是否罹患流感。這種監測在隨后得到了改進:通過檢測一定數量具有類似癥狀的群體,來確定哪些人患有流感,哪些人不是。
自從1984年建立起監控網絡以來,法國成為*個開展電腦化監控的國家。之后許多國家也開發了類似的網絡:例如由位于亞特蘭大的疾病控制和預防中心(CDC)監控的美國系統包括2700個醫療中心,每年約發現3000萬例患者。
然而,當今幾乎覆蓋的互聯網和迅速發展的社交媒體平臺(例如推特)讓人們看到了希望:這些技術可以更容易、更快速地估評ILI,并覆蓋更廣泛的人群。
這些新系統源自谷歌在2008年推出的技術。基于谷歌和CDC的研究,新系統依賴數據挖掘記錄和計算機模型的結合,谷歌搜索引擎會顯示與流感相關的搜索字詞。該系統得出數據的準確性和CDC自身的監測數據不相上下,而且它的速度比CDC快,可以提前CDC數日發布數據。該系統已被推廣到29個國家,并被拓廣到監測另外一種疾病——登革熱。