每週AI應用方案精選:智慧試衣間;機器學習惡意軟體防範等

AIBigbull2050發表於2020-01-02
2019-12-31 17:59:04

每週三期,詳解人工智慧產業解決方案,讓AI離你更近一步。

解決方案均選自機器之心Pro行業資料庫。

方案1:全球人口分佈地圖和密度系統

每週AI應用方案精選:智慧試衣間;機器學習惡意軟體防範等

解決方案簡介

該系統利用深度學習分析衛星影像資料,目標是打造全球人口分佈的地圖,以此指導公司的無人機專案,幫助更多的人接入網際網路。以相對較少的照片(約 8,000 張在印度上空拍攝的圖片)的資訊訓練其模型,訓練得到的神經網路能鑑別出拍攝自其它 20 個國家的照片中人類生活的證據。

解決方案詳解:

目前,該系統已總共分析了代表 2,160 萬平方千米地球土地的 1,560 萬張圖片。識別人造物的錯誤率低於 10%。之後打算再結合其它資料,生成準確的人口密度系統。

專案由 Facebook 工程師兼光學物理學家Tobias Tiecke 及 Facebook Connectivity Lab 負責人 Yael Maguire 牽頭。

研究者僅簡單判斷樣本照片中是否有人居住並進行標註,將標註後的圖訓練神經網路,只在「是與否」之間進行簡單的二選一,而不用標註房屋、汽車等人造物證據。訓練結束後,能得到一個簡單的分類器(Classifier),此時該系統被部署,它自動分析地表的衛星影像,判斷影像中是否有人造物地痕跡,再結合普查等資料進行分析,最終能生成較為準確的人口密度圖。


方案2:大資料清理軟體服務

每週AI應用方案精選:智慧試衣間;機器學習惡意軟體防範等

解決方案簡介:

自動進行資料清理的資料轉換平臺,可建立可供多個不同平臺(傳統的關係式資料庫、Hadoop 叢集)使用的介面。Trifacta 可以建立可在多個實體資料儲存及處理系統上執行的 SQL 查詢或 map reduce 程式碼。

該平臺是在底層設計時考慮到使用者的體驗,提供的服務能讓資料科學家從資料淨化的髒累活中解脫出來,讓資料分析師能專注於資料的處理,而無需開發複雜的管道去清理資料和把它們放入資料倉儲。是第一家是將後端資料技術與直觀的前端使用者視覺化介面成功結合起來的大資料公司。

解決方案詳解:

從大資料集中自動化取樣資料,使用視覺化的方式讓分析師在很短的時間發現有趣的模式。

應用機器學習演算法為重新組織資訊和整理提供建議。分析師可以將資料集分組為資訊的邏輯部分,每次將其規範化,並在其工作過程中以友好的介面方式顯示。歸納概括整個資料集合是最後一個步驟,這將最終形成半結構化的資料集並最終成形。

Trifacta 有超過 50 個企業使用者,其中包括思科、運動相機廠商 GoPro、Juniper、醫療保健系統集保險公司 Kaiser Permanente、供給、資訊和保健管理產品及服務供應商麥克森(McKesson)、百事公司、輝瑞製藥公司( Pfizer)和寶潔公司等知名大公司。Trifacta 的收費標準是按機構的資料體量計算的,費用從 10 萬美元到 15 萬美元不等。

2015 年 10 月份,Trifacta 還推出了一款免費的簡化版大資料清理軟體,這款免費軟體目前擁有超過 5,000 個使用者,遍佈全球 105 個國家的 3,000 家公司裡。

方案3:智慧試衣間

每週AI應用方案精選:智慧試衣間;機器學習惡意軟體防範等

解決方案簡介:

智慧試衣間通過帶觸控式螢幕的鏡子及燈光調整,幫助使用者找到適合自己尺碼、顏色和消費場景的服裝。主要希望通過智慧化的手段和親身體驗效果,來提升線下實體店服務的體驗,建立線下服務相對於線上電商的差異化競爭力。

解決方案詳解:

消費者進入商店,通過鏡子瀏覽店鋪中所有商品,提交試穿申請,衣服就會被導購員擺放在試衣間。顧客可以調整燈光亮度和顏色模擬使用場景,鏡子感應衣服上的 RFID 標籤並顯示在螢幕上,然後鏡子給出搭配建議。

如果需要試其他顏色或尺碼的衣服,也能通過螢幕下指令,讓導購員送來。

當顧客試穿滿意後,可以直接在鏡子上通過 Paypal 付款,試穿過的衣服會儲存在個人賬戶中。試衣間裡還安裝了 Kinect,可以記錄追蹤試衣者的動作。


方案4:惡意軟體防範軟體—CylancePROTECT 系列

每週AI應用方案精選:智慧試衣間;機器學習惡意軟體防範等

解決方案簡介:

現有的網路威脅旨在繞開已有的保護措施,而簡單的事後檢測難以保障安全。該公司利用數學模型為每個檔案給出其風險因素,基於該風險因素,通過機器學習演算法辨別「好」檔案與「壞」檔案。使用可擴充套件的大資料架構,從中識別檔案模式。

解決方案適用於不同行業,比如關鍵基礎設施、教育、能源、金融、健康、零售、聯邦政府等。

解決方案詳解:

機器學習共需要四階段過程:收集、提取、學習和分類。
1. 學習利用各行業的涵蓋各種格式、作者的檔案進行手動訓練,檔案被分成已知且驗證有效、已知且驗證惡意、未知三部分,這些檔案的分類需要保證正確,否則會帶來偏差;
2. 提取利用機器的計算能力和資料處理技術來識別檔案的最有可能的特徵集。 根據其檔案型別(.exe、.dll、.com、.pdf、.java、.doc、.xls、.ppt等)提取檔案的唯一特徵。消除手動分類的偏差。使用成千上萬個特徵來確定惡意檔案,這大大提升了惡意軟體製作者的成本;
3. 學習屬性被蒐集,歸一化後,利用向量化和機器學習排除其中不甚相干的特徵,以加快分析速度,數學家根據分類效果建立統計模型,計算每個檔案風險因素;
4. 分類基於統計模型得到的檔案風險因素對其進行判斷,對檔案所屬的使用者得到可信度的分析,實現優化。


方案5:資料建模平臺——DataBrain


每週AI應用方案精選:智慧試衣間;機器學習惡意軟體防範等

解決方案簡介:

DataBrain 資料建模平臺包含了機器學習技術,根據其資料分析服務體系,建立了資料科學工作流,幫助資料分析師、資料工程師、業務分析師提升建模能力。

平臺提供適用於信用風控、精準營銷、個性化推薦、定投策略、客戶分群等模型,可幫助銀行、金融機構管理業務,提高運營效率。

解決方案詳解:

DataBrain 資料分析體系共分以下七步:

1. 問題定義:選擇適合用資料模型解決的問題,將特殊的業務問題轉化為資料科學問題;

2. 資料準備:從多個資料來源抽取關鍵資料,對關鍵資料進行清洗、處理和加工;

3. 演算法調優:選擇適用於特定資料的演算法,自動尋找最優引數,建立高效率的資料模型;

4. 知識發現:將資料模型轉化為決策依據,從資料中發現業務經驗以外的新知識;

5. 效果分析:基於不同的效果衡量指標分析模型效果及計算效率,評估模型的業務價值;

6. 線上部署:規範模型輸入輸出+,讓模型與業務系統無縫對接,從海量資料中自動學習;

7. 模型更新:監控模型穩定性、模型效果、模型邏輯與資料變化,收集反饋資料,持續更新模型。

而資料建模平臺內建了自動化調參機器人 Atom,在建模時會去尋找不同演算法對應的引數,找到最優的演算法和引數組合,提高調參的效率,Atom 通過分散式計算,把調引數及挑演算法的任務自動分發到多臺計算節點上,大幅縮短計算時間,並實時監控模型效果並線上迭代。此外,平臺還能從多個資料來源自動提取資料特徵,將資料分析結果轉化為業務知識,為客戶決策提供依據。



https://www.toutiao.com/i6776540749019218445/



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2671635/,如需轉載,請註明出處,否則將追究法律責任。

相關文章