Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了

大資料文摘發表於2020-04-06

Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了

大資料文摘出品

作者:曹培信


噴子年年有,疫情期間特別多。


3月9日,Fast.ai創始人Jeremy Howard和Rachel Thomas在官方部落格上更新了一篇文章。這篇文章與AI技術無關,而是在呼籲大家重視COVID-2019疫情,文章的題目是“新型冠狀病毒,社會與你——資料科學家的視角(Covid-19, your community, and you — a data science perspective)”。


兩位創始人稱,為了呼籲民眾重視疫情,兩人難得聯合發文,都推掉了原有的日程,花費了整整兩天的時間整合資料、分析資料,希望從更科學的角度提醒美國和全球民眾,如何正確對待疫情。


這篇文章不僅在部落格和Twitter上免費,作為全球的人工智慧領導者,Jeremy還很貼心的在fast.ai官網表示,歡迎各國技術從業者將這篇文章翻譯成你們的語言釋出,在熱心網友的幫助下,目前這篇文章也已經有提供了包括中文在內的,各國語言的翻譯版本。


這篇文章釋出後,並沒有得到應有的認可,反而有不少人跑到Jeremy Howard和Rachel Thomas的Twitter上“攻擊”他們,稱“作為AI領域的KOL不務正業,安心寫寫技術不好麼?


部分留言甚至進行了人身攻擊,稱兩位作者是在“蹭社會熱點做內容營銷,故意引發恐慌。


Jeremy在Twitter上呼籲了好幾天,提醒大家重視起來,但是看到那些攻擊言論,Jeremy表示“絕望了”。


 Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了

Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了

“我有點迷失了。我不可能每次嘗試做些好事的時候都一直要整理被各種人攻擊的情緒。我們放棄了整個週末,並且免費做這些事情,Racheal甚至分享了自己很私人的疾病史嘗試啟發大家。我在用生命嘗試幫助別人。”


他在twitter的最後不禁問道:“為什麼有的人就是想傷害(別人)?


而在同時,疫情擴散的速度絲毫未減弱。截止3月11日,美國累計新冠肺炎確診病例已達1281例。據美國有線電視新聞網(CNN)報導,24個州和華盛頓特區已宣佈進入緊急狀態。世界衛生組織總幹事譚德塞表示,新冠肺炎疫情從特徵上可稱為大流行,這也是首個冠狀病毒傳播引發的全球大流行。


人工智慧圈傳奇人物,最火爆深度學習課程創始人


這位被噴到絕望的人工智慧先驅Jeremy Howard,是當今技術圈的傳奇人物,對於人工智慧和大資料領域的從業者們來說,幾乎無人不知無人不曉。


他是Enlitic、FastMail、Optimal Decisions Group三家科技公司的創始人兼CEO,是大資料競賽平臺Kaggle的前主席和首席科學家,美國奇點大學(Singularity University)最年輕的教職工,是在2014達沃斯論壇上發表主題演講的全球青年領袖,他在 TED 上的演講 《The wonderful and terrifying implications of computers that can learn》收穫了近200萬的點選。


顯然,他是一個閒不住的人。為了讓深度學習技術被更多的人理解和使用,Jeremy Howard一直致力於免費推廣技術內容。他創辦的深度學習課程fast.ai目前已經成為了深度學習領域最受歡迎的課程,並且持續免費向全球釋出。大資料文摘曾有幸向Jeremy申請獲取課程的內容進行中文漢化,也得到了Jeremy非常迅速友好的肯定回饋。


這次兩位創始人聯合釋出的這篇文章,對傳染病、疫情和新冠病毒進行了非常詳細的背景梳理,也從資料分析的角度給出了看待病毒和疫情的新觀點,非常值得一讀。


大資料文摘也將fast.ai網站上提供的中文免費翻譯版本附在這裡,作者:Jeremy Howard和Rachel Thomas,翻譯者為楊文翔。


原文題目:《新型冠狀病毒,社會與你——資料科學家的視角》


原文地址:

中文地址連結:


我們亟需一個有效的醫療系統


就在2年前,我們中的一個成員(瑞秋)感染了腦部疾病,這種死亡率的死亡率大約1/4,並使1/3的人得上永久性認知障礙。許多其他人最終會永久性視力和聽力受損。瑞秋爬過醫院停車場時感到很瘋狂。她很幸運能夠得到及時的護理,診斷和治療。直到事件發生前不久,瑞秋身體狀況良好。迅速進入急診室幾乎可以肯定挽救了她的生命。


現在,讓我們討論一下新冠病毒,以及在未來幾周和幾個月內,處於瑞秋這樣的局勢中的人們可能會發生什麼。發現感染新冠病毒的人數每3至6天翻一番。以三天的速度增加一倍,這意味著發現被感染的人數可以在三週內增加100倍(實際上並不是那麼簡單,但是不要被技術細節所分散)。十分之一的感染者需要住院治療數週,其中大多數需要氧氣。儘管這種病毒還處於初期,但已經有一些地區的醫院完全被超支,人們不再能夠獲得所需的治療(不僅針對新冠病毒,而且還針對其他任何疾病,例如Rachel所需要的拯救生命的護理)。例如,在一週前的義大利官員說一切都很好的情況下,現在已經有1600萬人被封鎖(更新:釋出此訊息後6個小時,義大利將整個國家封鎖),並建立了這樣的帳篷來幫助患者湧入:


Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了


義大利重災區的區域危機應對部門負責人Antonio Pesenti博士說:“我們現在被迫在走廊、手術室、恢復室等地方設定緊急監護室。倫巴第是世界上最好的衛生系統之一,而今距崩潰只有一步之遙。


冠狀病毒和流感是不同的


流感的死亡率約為感染的0.1%。哈佛大學傳染病動力學中心主任馬克·利普西奇(Marc Lipsitch)估計,對於新冠病毒,這一比例為1-2%。最新的流行病學模型發現,2月份中國的死亡率為1.6%,比流感高出16倍(但是,這可能是一個相當保守的數字,因為當醫療系統無法應對時,患病率會大大提高)。根據目前的最佳估計,新冠病毒造成的死亡人數今年將比流感多10倍(而且Airbnb前資料科學總監Elena Grewal進行的建模顯示,在最壞的情況下,死亡人數可能會多100倍)。這還尚未考慮前面所描述的對醫療系統的巨大影響。可以理解有些人試圖說服自己這不是什麼新東西,就像流感一樣的疾病,因為接受一個根本不熟悉的現實是非常不容易的。


理解被感染人數的指數型增長並不是我們的大腦的直覺擅長的。因此,我們必須以科學家的身份對此進行分析,而不是憑直覺。


Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了


平均而言,每個感染流感的人都會感染1.3個其他人。稱為流感的“ R0”。如果R0小於1.0,則感染停止傳播並終結。如果超過1.0,則會擴散。對於中國境外的新冠病毒,R0當前為2-3。這個範圍聽起來很小,但是在20個“世代”感染者繼續感染後,R0為1.3將導致146例感染,而R0為2.5將導致3600萬感染!(當然,這是非常粗略的,忽略了許多現實世界的影響,但這是合理的說明了新冠病毒與流感在所有其他條件相同的情況下的相對差異)。


注意,R0不是疾病的某些基本屬性。它在很大程度上取決於響應,並且可以隨時間變化。最值得注意的是,在中國,針對新冠病毒的R0大幅下降,目前已接近1.0!你問怎麼做到的?透過大規模實施在美國這樣的國家難以想象措施,例如,完全封鎖了許多大城市,並開發了一種測試程式,每週可以對一百萬以上的人進行測試。


社交媒體(包括來自諸如埃隆·馬斯克(Elon Musk)等有大量粉絲的帳戶)上大量出現的一個問題是對數增長和指數增長之間差異的誤解。對數增長是指實際中流行病傳播的“S形”增長模式。顯然,指數增長不可能永遠持續下去,不然受感染的人數將超過世界上的人數!因此,最終感染率必然降低,導致隨時間推移呈S形(稱為Sigmoid)增長速度。但是,減少增長只是出於某種原因而不是魔法。主要原因是:

  • 大規模的有效的社會響應;
  • 大多數人被感染,以致可被感染的健康人減少。

因此,將對數增長模式作為“控制”大流行的一種方式是沒有道理的。

很難直觀地瞭解新冠病毒對社會的影響的另一件事是,感染和住院之間存在非常顯著的延遲——通常在11天左右。這段時間似乎並不長,但是將其與那段時間的感染人數進行比較,則意味著當你注意到醫院的病床已滿時,總感染人數已經比就診人數的增加了5-10倍

請注意,有一些早期跡象表明,對您所在地區的影響至少在某種程度上取決於氣候。論文Temperature and latitude analysis to predict potential spread and seasonality for COVID-19指出,該疾病迄今已在溫和的氣候中傳播(對我們而言,不幸的是,我們居住的舊金山的溫度範圍恰在該範圍內;它還涵蓋了歐洲的主要人口中心,包括倫敦。

“不要驚慌,保持冷靜。”毫無用處

我們在社交媒體上看到的一種普遍的回應是,人們指出了引起關注的原因,即“不要驚慌”或“保持冷靜”。至少可以說,這沒有幫助。沒有人暗示恐慌是一種適當的應對措施。但是,出於某些原因,“保持冷靜”在某些圈子中是一種非常普遍的反應(但在任何流行病學家中,其工作就是追蹤這些事情)。也許“保持鎮定”可以使某些人對自己的無所作為感到更好,或者使他們覺得比他們想象中的無頭雞跑來跑去的人優越。

但是“保持冷靜”很容易導致準備和響應失敗。在中國,數以千萬計的人被封鎖,並在達到美國目前的統計數字時建造了兩家新醫院。義大利等待時間太長,僅在今天(3月8日星期日),他們就報告了1492例新病例和133例新死亡,儘管鎖定了1600萬人。根據我們目前可以確定的最佳資訊,就感染統計資料而言,僅在2-3周前,義大利與美國和英國在今天的位置相同。

請注意,在此階段,幾乎所有關於新冠病毒的事情都懸而未決。我們真的不知道它的感染速度或死亡率,我們不知道它在表面上保持活躍的時間,我們也不知道它是否可以在溫暖的條件下生存和傳播。我們擁有的一切都是基於人們能夠彙總的最佳資訊的最新最佳猜測。請記住,這些資訊的絕大部分都在中國。目前,瞭解迄今為止中國現狀的最好方法是閱讀Report of the WHO-China Joint Mission on Coronavirus Disease 2019由中國,德國,日本,韓國,奈及利亞,俄羅斯,新加坡,美國和世界衛生組織(WHO)的聯合任務得來。

當存在不確定性時,也許這將不會是全球性的大流行,並且可能在沒有醫院系統崩潰的情況下一切都過去了,這並不意味著正確的應對措施是不採取任何行動。在任何威脅建模情況下,這都是極大的推測,而不是最佳的響應。像義大利和中國這樣的國家也無緣無故地有效關閉其大部分經濟體,這似乎也極不可能。這也與我們在受感染地區實地看到的實際影響不一致,因為那裡的醫療系統無法應對(例如,義大利正在使用462頂帳篷進行“預分診”,並且仍然需要從受感染的地區轉移ICU患者)。

相反,周到,合理的應對措施是遵循專家建議的步驟,以避免傳播感染:
  • 避免大群人群
  • 取消活動
  • 儘可能在家工作
  • 出門在外時要洗手,出門時要經常洗手
  • 避免觸控您的臉,尤其是在您出門在外時(不容易!)
  • 消毒表面和包裝(病毒可能會在表面上保持活躍9天,儘管至今仍無法確定)。

不只是關於你

如果您未滿50歲,並且沒有諸如免疫系統受損,心血管疾病,既往吸菸史或其他慢性病之類的風險因素,那麼您可以放心新冠病毒不太可能殺死您。但是您的反應方式仍然非常重要。您仍然有被感染的機會,如果被感染,也有被他人感染的機會。平均而言,每個感染者再感染兩個以上的人,並且在感染之前他們表現出症狀。如果您有自己關心的父母或祖父母,並計劃與他們共度時光,後來發現您有責任以新冠病毒感染他們,那將是一個沉重的負擔。

即使您未與50歲以上的人接觸,也可能有更多的同事和熟人認識慢性病。研究表明,有些人會因為害怕歧視而在工作場所隱瞞自己的健康狀況。我們倆都屬於高風險類別,但我們經常與之互動的許多人可能不知道這一點。

當然,這不僅與您周圍的人有關。這是一個非常重要的道德問題。每個竭盡全力為控制病毒傳播做出貢獻的人都在幫助他們的整個社會減慢感染速度。正如Zeynep Tufekci在《科學美國人》中寫道:“為這種病毒幾乎不可避免的全球傳播做準備……是您可以做的最親社會,無私的事情之一”。她繼續說:
我們應該做好準備,而不是因為我們可能會感到個人處於危險之中,而是為了幫助我們降低所有人的風險。我們不應該做準備,不是因為我們面臨無法控制的世界末日場景,而是因為我們可以改變社會所面臨的這一風險的方方面面。沒錯,您應該做好準備,因為您的鄰居需要您進行準備,尤其是您的年長鄰居,在醫院工作的鄰居,患有慢性疾病的鄰居以及由於缺乏精神而沒有準備或時間準備的鄰居資源或時間。


這對我們個人造成了影響。我們在fast.ai建立的最大,最重要的課程代表了我們多年的工作成果,計劃於一周內在舊金山大學開始。上週三(3月4日),我們決定將整個產品向線上轉移。我們是最早進入線上課程的大型課程之一。我們為什麼這樣做?因為我們上週初意識到,如果我們進行此課程,我們就隱含地鼓勵數百人在一個封閉的空間中聚會,這需要持續數週時間。將小組聚集在封閉的空間中是一件最糟糕的事情。在道德上,我們有責任確保至少在這種情況下不會發生這種情況。這是一個令人心碎的決定。我們與學生直接合作所花費的時間一直是每年最大的樂趣和最豐盛的時期之一。我們有計劃從世界各地飛來的學生,我們真的不想讓他們失望。

但我們知道這是正確的做法,因為否則我們可能會增加疾病在我們社會中的傳播。

我們需要壓平曲線

這是非常重要的,因為如果我們可以減慢社會中的感染速度,那麼我們將為該社會中的醫院提供時間來處理被感染的患者以及需要處理的常規患者負擔。這被描述為“使曲線變平”,並且在此說明圖中清楚顯示:

Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了
停留在虛線下意味著一切

前國家衛生IT協調員Farzad Mostashari解釋說:
每天都在發現新的病例,這些病例沒有旅行史,也沒有與已知病例的聯絡,我們知道,這些只是冰山一角,因為測試延遲。這意味著在接下來的兩週內,被診斷出的病例數量將爆炸……在社會呈指數蔓延的情況下嘗試進行收容,就像專注於在房屋著火時撲滅火花一樣。發生這種情況時,我們需要將策略轉變為緩解措施,採取保護措施以減緩傳播並減少對醫療保健的峰值影響。”如果我們能夠將疾病的傳播控制在足夠低的水平,以使我們的醫院可以負擔得起,那麼人們就可以接受治療。但是,如果案件來得太快,那麼那些需要住院的人就無法得到。


根據Liz Specht的說法,數字可能是這樣的:
美國每1000人擁有約2.8張病床。人口3.3億,這是大約100萬張床。在任何給定時間,這些床中的65%已被佔用。這樣一來,全國約有33萬張病床(在每年的流感季節等時候,這個時候可能會少一些)。讓我們相信義大利的數字,並假設大約10%的病例足夠嚴重,需要住院治療。(請記住,對於許多患者而言,住院治療要持續數週,換句話說,當床位上堆滿COVID19患者時,週轉速度將非常緩慢)。


社會的反應決定一切

正如我們已經討論過的那樣,這種數學方法還不是確定的。中國已經表明,採取極端措施可以降低利差。越南成功做出反應的另一個很好的例子是越南,除其他外,在全國範圍內開展了一次廣告宣傳活動(包括一首流行的歌曲!),迅速動員了社會的反應並確保人們適當地調整了自己的行為。

這不僅是一種假設情況,還清楚地顯示在1918年的流感大流行中。在美國,兩個城市對這種大流行表現出截然不同的反應:費城進行了200,000人的巨型遊行,以幫助為戰爭籌集資金。但是聖路易斯實施了精心設計的流程,以最大程度地減少社交接觸,從而減少病毒傳播並取消所有大型事件。根據《美國國家科學院院刊》的記錄,這是每個城市的死亡人數:

Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了 
費城的局勢變得極為嚴峻,甚至到了沒有足夠的葬禮棺材或太平間足以應付大量因流感而死的人的地步。

理查德·貝瑟(Richard Besser)在2009年H1N1大流行期間曾擔任疾病控制與預防中心的代理主任,他說:“在美國,暴露的風險和保護自己及家人的能力取決於收入,獲得醫療保健以及移民身份等等。”他指出:

當老年人和殘疾人的日常生活和支援系統受到干擾時,他們面臨的風險尤其大。那些難以獲得醫療服務的人,包括農村和土著社會,在需要時可能會面臨艱鉅的距離。正如我們在華盛頓州已經看到的那樣,居住在近處的人們(無論是在公共住房,療養院,監獄,庇護所,甚至是街頭無家可歸者中)可能會遭受海浪的折磨。低工資零工經濟的脆弱性,無薪的工人和不穩定的工作時間表,將在這場危機中向所有人公開。詢問每小時支付的60%的美國勞動力,在有需要的時候請假有多容易。

美國勞工統計局顯示,在收入最低的階層中,只有不到三分之一的人可以享受帶薪病假

Fast.ai兩創始人聯合發文,用資料科學解讀新冠,被噴蹭熱度,Jeremy:我絕望了

在美國,資訊不通暢

在美國,最大的問題之一是很少進行測試,並且測試結果沒有正確共享,這意味著我們不知道實際發生了什麼。先前的FDA專員Scott Gottlieb解釋說,在西雅圖進行了更好的測試,而且我們在那裡看到了感染:“我們之所以很早就知道西雅圖新冠病毒的爆發是因為獨立科學家進行了前哨監視工作。在其他城市,這種監視從未完全進行。因此,其他美國熱點可能尚未被完全檢測到。”據《大西洋報》報導,副總統邁克·彭斯(Mike Pence)承諾本週將進行“大約150萬次測試”,但目前在美國各地只有不到2,000人接受了測試。來自COVID跟蹤專案,《大西洋報》的Robinson Meyer和Alexis Madrigal說:

我們收集的資料表明,美國人對新冠病毒及其引起的疾病新冠病毒的反應十分緩慢,特別是與其他已開發國家相比。疾病預防控制中心八天前證實,該病毒正在美國社會傳播-它正在感染既未出國旅行也未與其他人接觸的美國人。在韓國,第一例社會傳播病例在一週內接受了超過66,650人的測試,並且很快就可以每天測試10,000人。

問題的一部分在於,這已經成為一個政治問題。特別是,唐納德·川普總統已明確表示,他希望看到“人數”(即美國的受感染人數)保持較低水平。這是個最佳化指標干擾在實踐中取得好結果的例子。(有關此問題的更多資訊,請參閱《資料科學倫理》論文《度量標準的問題是人工智慧的基本問題》)。Google的AI負責人Jeff Dean在推特上釋出了他對政治化虛假資訊問題的關注:
在世衛組織工作時,我參加了全球愛滋病規劃(現為愛滋病規劃署),旨在幫助世界應對愛滋病毒/愛滋病的大流行。那裡的員工都是敬業的醫生和科學家,他們全神貫注於幫助解決這一危機。在危機時期,清晰,準確的資訊對於幫助每個人(國家,州和地方政府,公司,非政府組織,學校,家庭和個人)做出正確而明智的決定至關重要。有了正確的資訊和政策來聆聽最好的醫學和科學專家的意見,我們所有人都將面臨諸如愛滋病毒/愛滋病或新冠病毒所面臨的挑戰。由於政治利益驅使虛假資訊,存在面對現實的風險,那就是面對大流行病時不能迅速果斷地採取行動,並積極鼓勵實際上會更快傳播疾病的行為,從而使事情變得更糟。整個情況難以觀察。


在透明度方面,似乎沒有改變的政治意願。據《連線》報導,衛生和公共服務部長亞歷克斯·阿扎爾(Alex Azar)開始談論醫護人員用來確定某人是否感染了新冠狀病毒的測試。這些工具的缺乏意味著危險的缺乏有關該病在美國的傳播和嚴重程度的流行病學資訊,而政府方面的不透明加劇了這一情況。zar試圖說,還有更多測試正在進行中,等待質量控制。”但是,他們繼續說,然後川普切斷了阿扎爾:
重要的是,我認為,無論現在還是昨天,任何需要測試的人都可以得到測試。他們在那裡,他們有測試,測試很漂亮。任何需要測試的人都會得到測試,”川普說。這是不正確的。彭斯副總統星期四對記者說,美國沒有足夠的測試套件來滿足需求。


其他國家的反應比美國快得多,而且反應明顯得多。東南亞的許多國家/地區都顯示出了不錯的成績,其中包括臺灣,R0現在已降至0.3,以及新加坡,其被提議為新冠病毒響應模型。雖然不只是在亞洲,例如,在法國,禁止任何超過1000人的聚會,並且現在在三個地區關閉了學校。

結論

新冠病毒是一個重要的社會問題,我們可以而且應該都努力減少疾病的傳播。這表示:
  • 避免大批人群
  • 取消活動
  • 儘可能在家工作
  • 出門在外時要洗手,出門時要洗手
  • 避免觸控臉部,尤其是在出門在外時。

注意:由於急需解決這個問題,我們沒有像平時一樣謹慎地引用和讚揚我們所依賴的工作。如果我們錯過了任何事情,請告訴我們。

感謝Sylvain Gugger和Alexis Gallagher的反饋和評論。

腳註

流行病學家是研究疾病傳播的人。事實證明,估計死亡率和R0之類的東西實際上是非常困難的,因此有一個專門研究此方面的領域。我們警告那些使用簡單比率和統計資料來告訴您新冠病毒表現如何的人。相反,請看流行病學家所做的建模。

好吧,從技術上講並非如此。嚴格來說,“ R0”是指沒有反應時的感染率。但這並不是我們真正關心的事情,因此讓我們在這裡對我們的定義有所草率。

自從做出此決定以來,我們一直在努力尋找一種方法來執行虛擬課程,我們希望它將比面對面的版本更好。我們已經向全世界的所有人開放了它,並且將每天執行虛擬研究和專案組。

我們還對生活方式進行了許多其他較小的更改,包括在家中鍛鍊而不是去健身房,將所有會議移至視訊會議以及跳過我們期待已久的夜間活動。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2680041/,如需轉載,請註明出處,否則將追究法律責任。

相關文章