52 個有用的機器學習與預測介面盤點

王下邀月熊發表於2017-03-08

隨著基於人工智慧與機器學習的應用如雨後春筍般不斷湧現,我們也看到有很多提供類似功能的 API 悄悄登上了舞臺。 API 是用於構建軟體應用的程式、協議以及工具的組合;本文是對2015 中這個列表的修正與完善,移除了部分被廢棄的 API ;我們也新增了最近由 IBM、Google、Microsoft 這些大廠釋出的 API 。所有的 API 可以根據應用場景進行分組:

  • 人臉與圖片識別。
  • 文字分析,自然語言處理以及情感分析。
  • 語言翻譯。
  • 預測以及其他的機器學習演算法。

在具體的每個分組內,我們根據首字母順序排序; API 的描述資訊源自截止到 2017 年 2 月 3 日對應主頁上的描述。如果你發現存在未被收錄的流行的 API 可以在評論中留言,我們會將其增補到列表中。

人臉與圖片識別

  1. Animetrics Face Recognition: 該 API 能夠用於圖片中的人臉檢測,並且將其與已知的部分人臉進行匹配分析;該 API 還支援從某個待搜尋的集合中新增或者移除某個分類,或者從某個分類中新增或者刪除某張人臉圖片。
  2. Betaface: 同樣是提供人臉識別與檢測的線上服務。它支援多人臉檢測、人臉裁剪、123 個人臉特徵點提取、人臉驗證、識別以及大型資料庫中的相似性搜尋提取。
  3. Eyedea Recognition: 致力於提供高階的計算機視覺解決方案,主要包括物件檢測與識別。其識別服務提供了常見的眼部、人臉、車輛、版權以及果盤識別,該 API 主要的價值在於對於物件、使用者以及行為的快速識別。
  4. Face++: 為應用提供面部的檢測、識別以及分析服務,使用者可以通過 API 呼叫訓練模型,進行人臉檢測、人臉識別、人臉分類、影像修正、建立人臉分組等等服務。
  5. FaceMark: 提供了能夠在正面照片中檢測 68 個特徵點以及側面照片中檢測 35 個特徵點的服務。
  6. FaceRect: 提供了非常強力與完整的面部檢測的 API ,包括在正面照片與側面照片中檢測面部以及在單張照片中提取多個面部的功能;它還能將結果以 JSON 格式輸出,包括檢測到的眼睛、鼻子、嘴等等面部特徵。
  7. Google Cloud Vision API: 架構於著名的 TensorFlow 之上,能夠高效地學習與預測圖片中的內容。它能夠有助於使用者搜尋最愛的圖片,並且獲取圖片中豐富的註釋。它還能將圖片按照船、獅子、艾菲爾鐵塔等等不同的類別進行分類,並且對照片中不同表情的面部進行識別,除此之外它還能將圖片中不同國家的語言列印出來。
  8. IBM Watson Visual Recognition: 該 API 能夠輔助理解圖片內容,包括圖片標記、人臉識別、年齡估計以及性別判斷,還能根據人臉相似度進行搜尋。開發者能夠在該服務的基礎上結合自身業務特點定製出各式各樣奇妙的產品。
  9. Kairos: 該平臺方便開發者快速新增 情感分析 與 人臉識別 的功能到應用與服務中。
  10. Microsoft Cognitive Service – Computer Vision: 該 API 能夠根據使用者輸入與使用者選擇分析視覺化內容。譬如根據內容來標記圖片、進行圖片分類、人類識別並且返回他們的相似性、進行領域相關的內容識別、建立圖片的內容描述、定點陣圖片中的文字、對圖片內容進行成人分級等。
  11. Rekognition: 該 API 能夠根據社交圖片應用的特點提供快速麵部識別與場景識別。譬如基於人眼、嘴、面部以及鼻子等等特徵進行性別、年齡以及情緒預測。
  12. Skybiometry Face Detection and Recognition: 該 API 提供人臉檢測與識別服務,新版本的 API 還提供了深色微分功能。

文字分析,自然語言處理,情感分析

  1. Bitext 提供了目前市場上來說幾乎最準確的基於情感的多主題識別,目前包括四個語義服務:實體與概念抽取、情感分析與文字分類;該 API 總共支援 8 種不同的語言。
  2. Diffbot Analyze: 為開發者提供了從任何網頁中識別、分析以及提取主要內容與區塊的功能。
  3. Free Natural Language Processing Service: 提供了包括情感分析、內容提取以及語言檢測等功能。它同樣是 mashape.com 這個大型雲 API 市場中的暢銷產品之一。
  4. Google Cloud Natural Language API: 該 API 提供了對於文件的架構與含義進行分析的功能,包括情感分析、實體識別以及文字標註等。
  5. IBM Watson Alchemy Language: 該 API 能夠輔助電腦學習如何閱讀以及進行一些文字分析任務。譬如將非結構化資料按照領域模型轉化為結構化資料,使其能夠服務於社交媒體監測、商業智慧、內容推薦、商業交易以及定向廣告等等服務。
  6. MeaningCloud Text Classification: 該 API 提供了部分預分類的功能:文字提取、分詞、停用詞設定以及同義詞提取等等。
  7. Microsoft Azure Text Analytics API 基於 Azure Machine Learning 實現的一系列文字分析服務。該 API 能夠用於情感分析、關鍵語句提取、語言檢測以及主題識別這些非結構化文字的處理任務。該 API 並不需要使用者提供相關的訓練資料,能夠大大降低使用門檻。
  8. Microsoft Cognitive Service – Text Analytics: 提供了情感檢測、關鍵語句提取、主題以及語言分析等功能。該分組中其他的 API 還包括 Bing 拼寫檢測語言理解文字分析Web 語言模型等等。
  9. nlpTools: 簡單的採用 JSON 傳輸格式的提供了自然語言處理功能的 HTTP RESTful 服務。它能夠提供對於線上媒體的情感分析與文字分類等服務。
  10. Semantic Biomedical Tagger: 能夠利用文字分析技術提取出文件中的 133 個生物醫藥學相關的實體詞彙並且將它們連結到知識庫中。
  11. Thomson Reuters Open Calais™: Calais 基於自然語言處理與機器學習技術,能夠分類與關聯文件中的實體資訊(人名、地名、組織名等)、事實資訊(員工 x 為公司 y 工作)、事件資訊(員工 z 在 x 日被任命為 y 公司的主席) 。
  12. Yactraq Speech2Topics 提供了基於語音識別與自然語言處理技術的將語音內容轉化為主題資料的雲服務。

語言翻譯

  1. Google Cloud Translation: 能夠在數以千計的語言之間完成文字翻譯工作。該 API 允許網頁或者程式方便地接入這些翻譯服務。
  2. IBM Watson Language Translator: 能夠在不同語言之間進行文字翻譯,該服務允許開發者基於獨特的領域術語與語言特性進行自定義模型開發。
  3. LangId: 能夠快速地從多語言中檢索結果的服務,並不需要使用者指定哪種語言,並且能夠返回結果對應的語言型別。
  4. Microsoft Cognitive Service – Translator: 能夠自動地在翻譯之前進行語言型別檢測,支援 9 種語言的語音翻譯以及 60 種語言的文字翻譯。
  5. MotaWord: 快速地人工翻譯平臺,提供了超過 70 種語言支援。該 API 同樣允許開發者查詢翻譯報價、上傳帶有文件說明與樣式指南的翻譯專案請求、自動追蹤翻譯進度以及進行實時反饋等。
  6. WritePath Translation: API 允許開發者將 WritePath 功能整合到自定義應用中,包括字數檢索、提交文字翻譯任務、以及獲取翻譯資訊等等。

預測與其他機器學習 API

  1. Amazon Machine Learning: 尋找資料中的隱藏模式資訊,典型的用法包括詐騙檢測、天氣預報、市場營銷以及點選預測等。
  2. BigML: 提供基於雲的機器學習與資料分析服務,允許使用者以 HTTP 請求的方式自己建立資料來源以及選擇合適的模型來處理有監督或者無監督的機器學習任務。
  3. Ersatz: 基於 GPU 支援的深度神經網路提供的預測服務,允許使用者以 API 方式進行互動。Ersatz 中還利用增強學習來合併不同的神經網路模型來提升整體的效果。
  4. Google Cloud Prediction: 提供了用於構建機器學習模型的 RESTful API 。這些工具能夠通過分析資料來提取出應用中資料的不同特徵,譬如使用者情感、垃圾資訊檢測、推薦系統等等。
  5. Google Cloud Speech API: 能夠提供超過 80 種語言的快速與準確的語音識別以及轉化服務。
  6. Guesswork.co: 能夠為電商網站提供產品推薦引擎,Guesswork 可以通過基於 Google 預測 API 構建的語義化引擎來對使用者行為進行預測。
  7. Hu:toma: 幫助世界各地的開發者構建商用級別的深度學習聊天機器人。
  8. IBM Watson Conversation : 幫助構建可以部署在多個訊息平臺或者網頁上的,能夠理解自然語言的聊天機器人。其他類似的 API 還包括 DialogNatural Language ClassifierPersonality InsightsDocument Conversion以及 Tone Analyzer.
  9. IBM Watson Speech : 包含了 語音到文字 以及 文字到語音 之間的轉化功能(譬如建立語音控制的應用)。
  10. IBM Watson Data Insights: 該系列的服務包含了三個 API :AlchemyData News、Discovery 以及 Tradeoff Analytics。AlchemyData 提供了對於大量的新聞、部落格內容的高階別定向搜尋與趨勢分析的服務。Tradeoff Analytics 則是幫助使用者在多目標優化時進行有效抉擇。
  11. IBM Watson Retrieve and Rank: 開發者可以將自定義資料匯入到服務中,並且使用相關的關聯發演算法來訓練機器學習模型。服務的輸出包括了一系列相關的文件與後設資料,譬如某個聯絡中心的代理能夠基於該服務提高呼叫的平均處理時間。
  12. Imagga: 能夠為你的圖片自動打標籤,從而允許你的圖片可以被關聯搜尋到。
  13. indico: 提供了文字分析(情感分析、Twitter 參與度、表情分析等)以及 圖片分析(面部表情識別、面部定位)。indico 的 API 可以免費試用並且不需要任何的訓練資料。
  14. Microsoft Azure Cognitive Service API : 基於預測分析提供機器學習推薦服務,譬如個性化產品推薦等,可以用來代替傳統的 Azure Machine Learning Recommendations 服務。新版本提供了批處理支援,更好地 API 檢索服務、更清晰的 API 使用介面以及更好的註冊與賬單介面等。
  15. Microsoft Azure Anomaly Detection API : 能夠在序列資料中檢測出異常資料,譬如檢測記憶體使用過程中是否存在記憶體洩露的情況。
  16. Microsoft Cognitive Service – QnA Maker: 將資訊提取為會話式的、易於瀏覽的資料形式。其他類似的 API 還包括 Academic KnowledgeEntity LinkingKnowledge Exploration以及Recommendations
  17. Microsoft Cognitive Service – Speaker Recognition: 幫助應用來分析檢測出當前的發言者。其他的類似於的 API 還包括Bing Speech (將語音轉化為文字並且理解其大致含義)、 Custom Recognition 等等。
  18. NuPIC : 由 NuPIC 社群執行與維護的開源專案,其基於 Python/C++ 實現了 Numenta’s Cortical Learning 演算法並對外提供 API 服務。該 API 允許開發者能夠使用基本演算法或者分層演算法,也可以選擇使用其他的平臺功能。
  19. PredicSis: 能夠通過預測分析與大資料技術提供市場營銷的效用與收益。
  20. PredictionIO: 基於 Apache Spark、HBase 以及 Spray 這些著名的開源專案搭建的開源機器學習服務。典型的 API 包括了建立與管理使用者資訊及其行為記錄、檢索專案與內容、基於使用者進行個性推薦等等。
  21. RxNLP – Cluster Sentences and Short Texts: 提供了文字挖掘與自然語言處理的服務。其中語句聚類 API 能夠將不同的語句進行分類,譬如將不同新聞文章中的語句或者 Twitter、Facebook 上提取出來的短文字劃分到不同的分組中。
  22. Sightcorp F.A.C.E.: 該 API 能夠幫助第三方應用來更好地理解使用者行為,並且根據年齡、性別、面部表情、頭部姿勢以及種族劃分來進行相似面部的分析與搜尋。

相關文章