貝小戎
5月2日,我在昆明機場(chǎng)候機,隨手撿了一本別人遺留下來(lái)的People雜志翻了翻。一位同伴說(shuō):“你也不怕甲型H1N1流感?”因為他這一問(wèn),回家后我上網(wǎng)搜索了一下甲型H1N1流感的傳播途徑。也許我這一搜還為疫情預測作了貢獻。5月3日,《紐約時(shí)報》的一篇報道說(shuō),上周,“甲型H1N1流感”取代“美國偶像”,成為Yahoo上最熱門(mén)的搜索關(guān)鍵詞。維基百科上“甲型H1N1流感”的頁(yè)面在周三和周四的訪(fǎng)問(wèn)量達130萬(wàn)。Twitter上每天提到甲型H1N1流感的更新估計有125000條,占總量的1%。Facebook上有一幅美國地圖,展示用戶(hù)在自我介紹頁(yè)面上提到“甲型H1N1流感”的頻率,提到“甲型H1N1流感”的用戶(hù)所在的州被用深藍色加以標注。網(wǎng)絡(luò )提供了一條前所未有的途徑,供我們了解人們關(guān)心什么。
跟用網(wǎng)絡(luò )搜索頻率預測“美國偶像”的比賽結果不同,預測季節性流感什么時(shí)候達到高峰(通常是在11月到次年4月之間)能夠拯救很多人的生命,當局可以據此計劃接種疫苗的時(shí)間、增加醫院的人手和有序地提供治療措施。
艾奧瓦州大學(xué)副教授菲利普·博格林研究了雅虎的搜索數據能否用來(lái)預測流感的暴發(fā)。2月的《自然》雜志上有一篇文章,金斯伯格和他的五位共同作者描述了兩組信息,一組是五年內政府記錄的病人報告流感癥狀的頻率,一組是谷歌的搜索數據,然后試著(zhù)找出兩組信息的重疊之處,以此來(lái)判斷人們搜索最好的體溫計和離家最近的急診室是否意味著(zhù)更多有流感癥狀的人去醫院就診。
這種關(guān)聯(lián)必須反復出現。如果結果表明在流感暴發(fā)前,人們對速凍樹(shù)莓有一種神秘的食欲,谷歌的流感趨勢報告就會(huì )把這種研究添加至算法中。
過(guò)去,流感監測是觀(guān)察藥房里感冒藥的銷(xiāo)量何時(shí)達到最高。傳統的和網(wǎng)絡(luò )時(shí)代疫情監測共同面臨的挑戰是要忽略掉“雜音”,集中于真正有意義的現象。傳統監測中的雜音,比如感冒藥打折優(yōu)惠銷(xiāo)售,導致銷(xiāo)量陡增,這跟人們的健康狀況無(wú)關(guān)。而在網(wǎng)上,雜音無(wú)處不在。所以,如果想通過(guò)分析Twitter來(lái)預測流感何時(shí)暴發(fā),就不能搜索甲型H1N1流感一詞,應該搜索相關(guān)癥狀。但Twitter確實(shí)提供了一種獨一無(wú)二的途徑。人們更有可能在Twitter上說(shuō)自己感到不舒服,而不是說(shuō)去看醫生。人們在社交網(wǎng)站上非常坦誠,所以對公共衛生機構來(lái)說(shuō)是一種重要的工具。
十年來(lái),網(wǎng)絡(luò )使衛生機構能夠更早地監測到病毒的出現:地方公共衛生機構把報告貼到網(wǎng)上,隨后關(guān)鍵詞掃描程序能夠收集到這些數據。美國西北大學(xué)復雜系統研究所的一個(gè)計算機模型通過(guò)跟蹤美元的流通預測流感疫情。截至5月3日,根據這個(gè)模型的預測,到月底美國只會(huì )出現2000例感染,大部分在紐約、洛杉磯、邁阿密和休斯敦。該模型的預測結果跟疾病控制中心的統計數據大致吻合,計算機模型預測的是150至170例,疾控中心確認的是226例。
這個(gè)計算機模型依據的是一個(gè)名叫“喬治在哪里?”的網(wǎng)站中的數據。這個(gè)網(wǎng)站是程序員漢斯·艾斯金十多年前建的,他在他拿到的每張美鈔上請求下一個(gè)拿到這張美鈔的人去這個(gè)網(wǎng)站輸入其序列號,并留下郵政編碼。他只是想看看美鈔流通有多快、能流通到多遠的地方。到2006年,這個(gè)網(wǎng)站已經(jīng)記錄了1億美元美鈔的流通情況。
從德國訪(fǎng)問(wèn)這個(gè)網(wǎng)站的布洛克曼博士無(wú)意間聽(tīng)說(shuō)了這個(gè)網(wǎng)站,意識到這正是他需要的東西:一個(gè)面對面交易的地圖,跟流感的傳播類(lèi)似。
印第安納大學(xué)的計算機模型依據的是全美的航空和公共交通網(wǎng)絡(luò )。它跟西北大學(xué)的計算機模型有一些類(lèi)似的假設,比如,每個(gè)感染者會(huì )傳染給1.7至2.8人。布洛克曼說(shuō)平均數不能說(shuō)明多少問(wèn)題,可能一名學(xué)生會(huì )傳染給15名同學(xué),但在有的學(xué)校傳染率只有0.1,這就好比把比爾·蓋茨放在埃塞俄比亞,然后說(shuō)該國的人均收入非常高。但有一件事是確定的:“人們對大數有著(zhù)奇怪的感知。如果一個(gè)3億人的國家有2000人感染了病毒,大部分人會(huì )認為他們將成為這2000人之一,而不是余下的299998000人中的一個(gè)?!?/p>
相關(guān)閱讀