AI前線一週新聞盤點:谷歌提供免費K80 GPU; AI診斷成功率超過皮膚科醫生

AI前線發表於2019-03-03

本文由 「AI前線」原創,原文連結:AI前線一週新聞盤點:谷歌提供免費K80 GPU; AI診斷成功率超過皮膚科醫生
作者|Jack Clark
譯者|核子可樂
編輯|Natalie,Emily

AI 前線導讀:

  • 深度神經網路在甲癬診斷成功率上達到甚至超越大部分皮膚科醫生
  • 美國最新發布國防戰略備忘錄,呼籲政府投資 AI 與機器人技術
  • Fast.ai 推出微調語言模型,文字分類任務錯誤率下降約 20%
  • 谷歌 Kaggle 提供免費 K80 GPU 以實現線上編碼服務
  • 研究人員提出 SparseNet,能夠在不增加大量引數的前提下擴大網路規模
  • 阿里巴巴 AAAI 2018 錄用論文:基於對抗學習的眾包標註用於中文命名實體識別
  • 中國研究人員公開紅外熱成像視訊資料集,並對 9 款熱紅外行人追蹤(簡稱 TIR)工具進行評估
  • OpenAI 將 Kubernetes 擴充套件至 2500 個節點

以下新聞均來自 Import.AI,內容翻譯獲得獨家授權,未經許可,禁止轉載!

AI 擊敗由 42 名皮膚科醫生組成的專家小組,能夠更準確地發現特定皮膚疾病症狀:

…R-CNN + 大規模資料集超越擁有數百年曆史的綜合醫學教育…

科學家們已經收集到包含大量指甲與趾甲圖片的大規模醫學級資料集,並利用其訓練神經網路,旨在實現高於專家小組的甲癬症狀判斷能力。該方法採用最初由微軟研究小組打造的物件分類器 R-CNN 以及可實現 resnet-152 模型(同樣由微軟研究小組開發完成)的卷積神經網路。通過這一案例,再次證明至少在認知領域,在擁有充分的資料與計算資源之後,我們將能夠立足特定任務設計出足以匹敵甚至超越人類能力的 AI 系統。

資料清潔工作:研究人員們還提供了一套包含近 5 萬張指甲圖片的資料集供進一步研究使用。這篇論文詳細介紹了其如何構建並清潔資料內容,從而實現這套資料集——在過程當中,研究人員訓練出一套物件定位系統,從而自動裁剪圖片以確保僅保留指甲特徵(最初,該網路會錯誤地將牙齒或疣痣視為指甲)。

結果: 他們以綜合性方式測試了具備不同技術的不同人群(包括護士、臨床醫生乃至皮膚科專家教授等)在診斷能力方面與人工神經網路間的差異。在所有診斷場景下,基於人工智慧技術的神經網路都能夠達到或者超越大部分醫學診斷專家。研究人員們寫道,“只有一位皮膚科醫生的表現優於利用 A1 資料集訓練完成的整體模型,且具體比例僅為三分之一。”

未來前景: 人工智慧在醫療用例方面的一大承諾,在於顯著降低對特定症狀進行初步分析的實際成本。此次實驗再次支援了這一觀點。除了收集資料集以及開發 AI 技術之外,科學家們還開發出一套基於網路與智慧手機的平臺,用於對更多醫療資料進行收集以及分類。他們寫道,“這項研究的結果表明,本項研究當中開發出的 CNN 與我們開發的智慧手機平臺很可能在未來的遠端醫療環境當中發揮重要作用,而皮膚科醫生在這樣的環境下則將失去用武之地。”

– 瞭解更多: 深度神經網路在甲癬診斷工作中達到甚至超越大部分皮膚科醫生:利用基於區域的卷積深層神經網路(PLOS One)自動構建甲癬資料集。

journals.plos.org/plosone/art…

美國國防機構投資 AI 與機器人技術:

…新的國防戰略備忘錄中提及 AI 技術…

美國最新發布的國防戰略備忘錄呼籲政府應“廣泛加大對自動化、人工智慧以及機器學習技術在軍事領域內相關應用的投入,同時快速引入各類商業性突破成果。”

此項備忘錄還暗示稱,人工智慧與其它技術可能帶來令人不安的負面用途。“安全環境也將受到技術快速發展與戰爭性質變化的影響。新技術的發展動力將持續存在,並擴充套件至更多缺少技術背景的操縱者手中以加快其行動速度。此類新型技術包括先進計算、‘大資料’分析、人工智慧、自主技術、機器人、定向能量、超音速以及生物技術——這些技術將確保我們能夠在未來的戰爭當中獲取勝利。”

– 瞭解更多: 2018 年美利堅合眾國國防戰略摘要(PDF 格式)。

www.defense.gov/Portals/1/D…

來自 Fast.ai 的可移動語言建模技術:

…校準、校準,還是校準…

Fast.ai 與 Avlient 公司的研究人員們已經公佈了其微調語言模型(簡稱 FitLaM)的更多細節資訊。這是一套遷移學習方法,用於對特定領域內的語言模型進行優化。本篇論文與 DeepMind 近期公佈的“彩虹”演算法類似,雙方研究人員在各自領域(分別為語言建模與強化學習)當中皆整合了一系列近期創新成果,從而構建起“以實用性為中心”的模型,從而取得了良好的實際效能。

結果: FitLaM 在五種不同類別的文字分類任務當中創造了新的最高分——而且在大多數資料集中,其錯誤率下降達 18% 到 24%。

工作原理: FitLaMa 模型由一套 RNN 與個或者多個任務特定線性層構成,此外還包括一項負責在網路較高層級下進行資料操縱的細調技術,旨在儲存收集自通用型語言建模的資訊。除此之外,作者們還開發出一系列不同技術,希望更進一步促進遷移學習能力,具體請參閱論文原文。

遷移學習: 為了實現遷移學習,研究人員們在一套大型文字語料庫上預編了一套語言模型——其實驗性示例選擇了 Wikitext,其中包含超過 2 萬 8 千篇經過預處理的維基百科文章。他們使用的其它技術還包括在重新訓練期間對神經網路層進行“梯度解凍”、利用餘弦退火進行微調以及使用逆向退火機制。 測試領域: 情感分析(兩套獨立資料集)、問題分類、主題分類(兩套資料集)。

– 瞭解更多: 對語言模型進行微調以實現文字分類 (Arxiv)。 arxiv.org/abs/1801.06…

谷歌 Kaggle 新增免費 GPU 以實現線上編碼服務:

…提供免費 GPU,且幾乎不設任何使用限制…

谷歌公司表示,其實時編碼混搭服務 Colaboratory(類似於 Jupyter 記事本加 Google Doc 的組合)的使用者將迎來免費 GPU 資源。谷歌公司一位與 Michael Piatek 往來密切的人士表示,使用者現在將能夠編寫程式碼片段並訪問配備有 13 GB 記憶體的雙 vCPU 以及一塊英偉達 K80 GPU。

– Access Colaboratory here.

colab.research.google.com/notebook#fi…

先是 ResNets、而後是 DenseNets,現在又有……SparseNets?

…研究人員們以奇異的方式將網路連線起來,希望獲得最先進的研發成果…

神經網路可以被看作是一套能夠針對不同資料集進行運算的機器,亦可用於發現各資料集間的關聯轉換方式。研究人員已經開發出多種能夠將不同視覺現象內細化特徵關聯進行轉換的方法(Residual Networks 與 DenseNets),同時確保將盡可能多的資訊從網路中的一層傳播至另一層。

如今,西蒙弗雷澤大學的研究人員們開始嘗試從 ResNets 與 DenseNets 當中提取最佳特徵,並將其綜合至 SparseNets 當中。這是一種更為出色的網路構建方法,能夠“聚合前一層的特徵,且每一層僅提取與之存在指數偏移的層中的特徵……在利用 CIFAR-10 與 CIFAR-100 資料集進行實驗測試後,結果顯示 SparseNets 能夠實現與當前最先進的模型相媲美的效能,且引數數量明顯減少。”

低成本網路: 那麼,為什麼要以這種方式構建網路?具體來講,如果能夠通過這種方式在不增加大量引數的前提下擴大網路規模,那麼最終這樣的效率優勢將可用於構建規模更為龐大的網路體系。SparseNet 在實驗當中表明,這樣的網路構建方法能夠保持與 ResNet 以及 DenseNets 等同的精確度,但引數計算需求卻比二者低得多。

– 瞭解更多: 稀疏關聯型卷積網路。arxiv.org/abs/1801.05…

利用神經網路提升資料質量:

…中國研究人員嘗試利用 AI 擴充套件資料生成能力…

蘇州大學、阿里巴巴集團、深圳高威機器人有限公司以及黑龍江大學的研究人員們已經開發出一套系統,通過生成低質量資料並通過對抗訓練提升其質量,從而顯著改善中國名稱實體識別(簡稱 NER)技術的成效。NER 系統旨在利用智慧系統發現語句中的關鍵部分,並將其連結至更為巨集觀的基礎知識體系當中。NER 方法的改進將能夠被快速轉化為面向消費者或面向監控場景的 AI 系統,包括實現個人助理或被用於分析大規模語言資料庫。

技術解析: 研究人員們利用外包註釋者標記的特定資料集——包括對話及電子商務場景中的資料集,並配合各類基於神經網路的系統以分析各應用內文字樣本在不同 NER 標籤之間的共性與差異。由此生成的系統將能夠以更高的精度實現內容分類,且仍可使用同樣的訓練資料集,並達到或超越由研究人員建立的其它基準指標。

– 瞭解更多: 中國利用眾包註釋資訊實現 NER 的對抗性學習 (Arxiv)。arxiv.org/abs/1801.05…

中國研究人員收集行人追蹤資料集並評估其中九款追蹤工具:

…看到你了!就是你,手心出汗那位!…

中國研究人員選擇了 60 段利用紅外熱成像儀拍攝的視訊,並將其整理成一套資料集,用以評估熱紅外行人追蹤(簡稱 TIR)技術的實際成效。

資料集: 這 60 條熱量序列包含來自各類裝置(例如監控攝像機、手持攝像機、車載攝像頭以及無人機)的素材,亦可混合不同比例的場景、攝像頭位置及視訊視角。

追蹤工具評估: 研究人員評估了九款採用不同實現方法的行人追蹤工具,包括支援向量機、相關性與迴歸過濾器、深度學習方法(HDT 與 MCFTS)等。SRDC——即空間正則化鑑別相關過濾器——優勢明顯,其在一系列不同測試當中獲得了最為可靠的出色表現。

令人驚訝的強大深度學習表現: 神經網路方法 HDT 與 MCFTS)同樣擁有出色的排名。研究人員們寫道,“我們建議,如果擁有充足的熱成像圖片用於訓練,那麼基於深層特徵的追蹤工具有可能獲得更理想的成效。”

成本高昂: 深度學習方法的實現擁有高昂的成本,其中深度學習系統(HDT 與 MCFTS)在部署於採用英偉達 1080 GPU 與 32 GB 記憶體的英特爾 PC 上時,幀率分別為每秒 10.60 幀與 4.73 幀。相比之下,SRDCF 對資源的依賴性相對較低,FPS 為 12.29。

– 瞭解更多: PTB-TIR: 熱紅外行追蹤基準 (Arxiv)。arxiv.org/abs/1801.05…

OpenAI 點滴:

將 Kubernetes 擴充套件至 2500 節點:

探討我們在擴大自身大規模 AI 基礎設施時遇到的一些問題,以及我們所設計的解決辦法。

– 瞭解更多: 將 Kubernetes 擴充套件至 2500 節點 (OpenAI 部落格)。blog.openai.com/scaling-kub…

作者 Jack Clark 有話對 AI 前線的讀者說:我們對中國的無人機研究非常感興趣,如果您想要在我們的週報裡看到更多有趣的內容,請傳送郵件至:jack@jack-clark.net。

原文連結:

jack-clark.net/

更多幹貨內容,可關注AI前線,ID:ai-front,後臺回覆「AI」、「TF」、「大資料」可獲得《AI前線》系列PDF迷你書和技能圖譜。

相關文章