蘋果釋出機器學習部落格,分享公司研究成果

微胖發表於2017-07-21

資訊

Google Glass「復活」,面向工業改進硬體


前天,Google Glass 釋出了企業版本(Enterprise Edition)Glass EE,並給出了在製造、物流和醫療領域的四家公司的四個用例。這是該團隊自 2015 年 1 月宣佈停止生產當期版本的 Google Glass 後的第一次重大發布。「我們一直沒閒著」Glass 的首頁標題如是說。

誕生於谷歌創始人謝爾蓋·布林的一個興趣專案的 Google Glass 原本被定位成一款消費產品,而本次 Glass EE 的更新主要針對如何能讓 Google Glass 更好服務於企業級客戶。硬體方面的更新包括升級處理器、將相機模組從 500 萬畫素提升到 800 萬畫素、提高電池壽命、新增錄影指示燈和提高 Wi-Fi 速度。然而最重要的更新還是 Glass EE 模組與整合鏡架的完全剝離,這意味著 Glass EE 能夠被部署到現有的任何鏡架,尤其是工業用護目鏡上。

在谷歌給出的企業用例中,擁有 800 餘名員工的大型農機制造商 AGCO 用 Glass EE 代替了傳統的膝上型電腦,使得員工不需要終止操作流程,走 15 米,看電腦指示,再回來繼續工作。Glass EE 能夠放大特點部分,告訴工人需要何種螺栓,指定某一種扳手並計算所需的扭矩,工人可以透過掃眼鏡邊緣或者透過語音指令進入下一步。

蘋果釋出機器學習部落格,分享公司研究成果

以神秘著稱的蘋果開博了,名為「蘋果機器學習期刊」的部落格讓蘋果的工程師來講述如何將機器學習技術應用在他們的工作中,為全世界成千上萬的使用者構建創新產品。部落格主要面向機器學習研究者、學生、工程師和開發人員。第一篇博文中,技術人員介紹了改善合成影像(synthetic images)質量的方法,合成影像技術主要被用於低成本、高效率的大型標註資料集的構建。

此舉被視為蘋果獲取關注與吸引人才的手段。近來,並沒有新「爆款」釋出的蘋果被普遍視為在人工智慧領域「先發後至」,已經落後其競爭對手一個身位。而開放技術部落格,定期討論最前沿的、令人興奮的新研究無疑是攫取公眾注意的好辦法。而在新部落格首頁下方的「向部落格提問」、「職位資訊」和「開發者專案」三個連結,則展現了蘋果不遺餘力吸引行業人才與公司進行交流的思路。

聯想舉辦第三屆 Tech World,首次公佈 AI 戰略佈局

今天上午,聯想集團第三屆 Tech World 在上海世博中心舉行,首次對外公佈了其在人工智慧領域的戰略和佈局。聯想集團高階副總裁兼技術長芮勇博士表示,未來聯想將重點發力在「裝置+雲」和「設施+雲」兩大領域,在智慧裝置、智慧雲平臺和智慧服務三個技術方向加強投入。作為技術支援,聯想還將在中國北京、美國莫里斯維爾、德國斯圖加特三地設立 AI 創新中心。

聯想在現場展示了多款基於不同場景的 AI 應用,包括智慧心電衣 Smart Vest、智慧音響 SmartCast+、智慧眼鏡晨星(daystAR)、虛擬智慧助手咔哇(CAVA)等。其中 Smart Vest 是全球首款 12 導聯的無線智慧心電衣,可實現對人體心臟活動的 360 度立體式感知與健康監控。此外,聯想還宣佈與京東合作打造 AI 大資料平臺,與蔚來汽車聯合開發智慧汽車計算平臺。

富士通加入深度學習硬體大軍

深度學習熱潮裡對 GPU 的高需求讓英偉達的收入和股價一同飆升,而谷歌的 TPU、英特爾即將公佈的 Lake Crest 深度學習專用晶片和 AMD 的 Vega 顯示卡也紛紛瞄準深度學習發力。日前,日本半導體和電腦製造商富士通也公佈了其建立人工智慧處理器的計劃,正式「跳坑」深度學習硬體。

據悉,富士通將在 2018 財年(2018 年 3 月至 2019 年 3 月)開發名為 DLU(Deep Learning Unit)的人工智慧處理器,富士通 AI 平臺事業部高階主管丸山稱,DLU 晶片將在單位耗電量效能方面提高十倍的提升。


室內自動駕駛機器人公司 Brain Corp 獲 1.14 億美元 C 輪投資

來自聖地亞哥的自動駕駛機器人公司 Brain Corp 獲得了軟銀 Vision 基金領投、高通風投跟投的 1.14 億美元 C 輪融資。公司的主要產品為 BrainOS 機器人作業系統平臺,旨在讓開發者能夠透過開架的硬體和感測器搭建商用自動駕駛機器人。BrainOS 平臺包括專用於室內的自動駕駛 AI 技術和避障模組,平臺以 SaaS 的形式銷售其平臺,客戶繳納訂閱費並將技術用於自己的機器人。公司認為,在未來,機器人會「像電腦和手機一樣普遍」。


應用


AI 3D 模型繫結:幫動畫工程師完成 90% 的工作

3D 動畫以耗時和昂貴著稱,只有迪斯尼、皮克斯這樣的大公司能夠支撐足夠多動畫工程師花費大量時間開發相關係統。開發中最複雜的過程之一叫做「繫結」(rigging),即給一個擁有幾百萬乃至上千萬面的人物模型建立骨骼、控制點,而後進行蒙皮,確定每個控制點對肌肉和骨骼的影響程度,進而透過動作捕捉或人為引數設定控制整個模型的活動。近期,在深度學習,尤其是生成模型方面的進步,給動畫創作提供了更多可能性。

例如 Mixamo,一家在 2015 年被 Adobe 收購的公司,開發了一款自動繫結工具,讓使用者能夠上傳 3D 模型,打好控制點之後一鍵進行皮膚引數計算。更進一步,一家由 Absentia 公司開發的,名為 Norah AI 的動畫軟體連想象與創作的工作都幫你做好了。Norah 的訓練集包含了超過 50 萬幀動畫,學習了各種可以想象到到的動作。而你可以利用「風格轉移工具」將已有的動畫片斷重新組合,生成一段新的,構建一個無限大的片段庫。而「AutoRig」則幫助動畫工程師從骨骼和肌肉引數開始生成動畫——連控制點都不用打。「Motion Editor」讓使用者可以生成無窮的動作變換,並把原來的幀到幀手動平滑過程交給了機器完成。

簡言之,動畫設計的視野與流程在深度學習時代都變得不同,隨著動畫製作的技術壁壘進一步降低,對創意的要求會越來越高。

AI 確診:你的頭疼起因於 20 年前的腦震盪

蒙特利爾大學、麥吉爾大學和 Ludmer 神經資訊學研究中心在《歐洲神經科學雜誌》上發表了一項研究,旨在用人工智慧技術分析心理測試、基因型、結構神經成像、核磁共振掃描圖等多種資料,檢測腦震盪的長期影響。

美國每年有 160 萬至 380 萬起腦震盪病歷,短期內,醫生可以透過腦出血等顯性症狀進行診斷,然而對於可能持續數年的長期影響,醫學上卻缺乏將臨床症狀與腦震盪直接聯絡起來的方法。因此,科學家們招募了年齡在 51 到 75 歲的前冰球與橄欖球運動員,分成了患病組與對照組,收集了多種資料並建立深度學習模型進行檢測,達到了 90% 的準確率。研究人員希望在今後能夠擴大樣本和檢測手段,並與其他神經系統疾病進行對照,找到腦震盪的確切識別標誌,以幫助醫生進行腦震盪的長期診斷。

觀點


AI 對世界戰略格局的影響不亞於核武器

科技評論員 Tom Simonite 昨日於 WIRED 發文,列舉了人工智慧可能對戰爭產生的影響。他援引了華盛頓特區無黨派智囊團 Center for New American Security 的報告,將人工智慧技術與一戰前被世界各國聯名禁止軍用的飛機技術,以及至今仍被限制於少數國家的核武器類比,稱這是一類「不可抗拒」的技術,並將需要更多的國際條約約束。

無人機、機器駭客、能夠生成以假亂真影片的模型都會對國防安全提出新挑戰。AI 和相關技術能夠讓較小的國家與組織能夠更輕易地獲得威脅超級大國、破壞國際權力平衡的能力。如同核武器一樣具有殺傷力的技術正在免費而快速的傳播,ISIS 已經開始用商用四旋翼投擲手榴彈了。

另一方面,自動武器的研發則觸發了一個道德敏感點:機器是否能夠決定人的生死。2015 年,超過 3000 名來自谷歌、微軟等公司的科學家和管理人員向奧巴馬政府發出了聯名信,要求禁止自動武器。美國國防部在 2012 年釋出的要求「人必須參與致命武力的使用決定」的臨時政策在今年 5 月成為了永久政策。哈佛大學的一份報告建議,國家安全委員會、國防部和國務院等機構從現在開始著手進行國際上的聯合人工智慧軍事條約制定。牛津大學研究人工智慧對社會影響的學者 Miles Brundage 認為,以 AI 為內容進行的合作和對話外交將是極為有效的。

自動駕駛行業監管的「鑰匙」已落入大公司手中

當地時間 19 號,美國眾議院電子商務和消費者保護委員會舉行了聽證會,審定與自動駕駛相關的一系列法案。這些法案將允許汽車製造商和科技公司無需遵循現行安全標準而部署數十萬輛自動駕駛汽車上路。令人驚訝的是民主黨和共和黨議員對此項政策表現出了難得一致地支援態度。政策分析師、評論家紛紛發聲反對,認為這一行為將危害消費者的安全和知情權。

多次在相關聽證會上作證的前海軍飛行員、杜克大學人類學與自動化實驗室負責人 Missy Cummings 表示,「進行自動駕駛研發的公司為安全性做出的投入太少了,這讓我十分擔憂。」例如,國會正在權衡是否要取消對於自動駕駛車輛事故資料的強制披露,並且將重新審查期定為 5 年。「整整五年時間裡,大公司都無需遵守嚴格的測試要求、質量要求,就能把一百萬輛自動駕駛車輛開到公眾面前。」

評論家 John Simpson 的觀點更為激進:「公共高速公路將成為大公司的私人實驗室,我們只能祈禱他們大發慈悲,考慮一下我們的安全。」

自動駕駛汽車的安全性仍有待證明,而在此之前,美國政府機構似乎已經對相關公司敞開懷抱了。

圖說


舉個例子幫你分清人工智慧、機器學習、深度學習

             蘋果釋出機器學習部落格,分享公司研究成果

ARK 投資公司在一份分析 IBM Watson 技術儲備的報告中將人工智慧領域經常被提及的技術進行了分類,今天我們借用這張圖區分一下「人工智慧、機器學習、深度學習」這幾個經常被錯誤混用概念。

簡而言之,機器學習是人工智慧的子集、深度學習是機器學習的子集。

「人工智慧」泛指以機器模擬人的「認知」功能的做法,然而模擬方法不拘於「學習」:在死記硬背了足夠多的規則之後,一臺淵博的機器也可以在解決特定問題上獲得類似人的能力。在「不涉及機器學習的人工智慧」這個類別裡,知名的例子有擊敗了國際象棋世界冠軍的電腦「深藍」,它基於規則每秒鐘完成 2 億步棋的搜尋。編碼了超過 320 萬條規則的 Cyc 始於上世紀 80 年代,它可以根據「每棵樹都是植物」,「植物最終都會死亡」推斷出「樹會死亡」。

「機器學習」是「人工智慧」的子集,它的「學習」能力體現在不需要嚴格設定好的靜態指令,也可以基於資料尋找規律並進行預測與決策。因此機器學習演算法需要進行「訓練」過程來尋找這樣的規律。傳統機器學習尋找規律的方法是人類給出的,常見的方法包括決策樹、聚類等等。在「不涉及深度學習的機器學習」這個領域裡面的例子有 IBM Watson,它是一個問答系統,當你對它提出一個問題,Watson 首先對自己的知識庫進行檢索找出一些可能的答案,進而檢索證據庫對可能的答案進行打分,最後透過整合和排序,給出答案。這個類別中的技術還有谷歌的 PageRank 搜尋排序技術、垃圾郵件檢測器、Netflix 的推薦系統等。

「深度學習」是「機器學習」的子集,它專指利用了「深度神經網路」的技術,它和傳統機器學習最大的區別在於不需要人來告訴機器如何尋找規律,而是給出機器儘可能多的例子讓它們自行「找不同」,事實證明,擁有足夠強大計算能力的機器在「找不同」事業上確實勝過人。然而完全放手給機器的壞處是,我們雖然可以利用這種能力,卻無法理解它——起碼現在,科學家們還沒找到辦法讓機器告訴我們「為什麼這張圖是貓而不是狗」,以及「為什麼這步棋要下在這兒」。「深度學習」子集中的典型案例包括下圍棋的 AlphaGo、能夠找出照片裡有哪些人的 Google Photos 以及會跟車也會變道的特斯拉 AutoPilot 等。蘋果釋出機器學習部落格,分享公司研究成果

相關文章