【AI開發第一步】微軟認知服務API應用

周見智發表於2016-04-24

目錄

點選直接看乾貨

 

介紹

從3月份Google家的阿爾法狗打敗韓國圍棋冠軍選手李世石,到之後微軟Build2016大會宣佈的“智慧機器人”戰略。種種跡象表明未來慢慢會進入“人工智慧”時代,人工智慧不再像以前那樣聽起來高大上,普通的碼農屌絲也能開發出具備人類智慧的APP。聽起來是不是很叼?

以前是這樣的:

You:吳博士,您研究的主要方向是撒?

吳博士:人工智慧。

You:挖槽,好叼。你覺得未來機器人會不會控制人類呢?

吳博士:......

現在是這樣的:

You:博士來來來,看看我這個App(將‘高富帥’才會用的腎8遞過去)。

吳博士:嗯,很普通嘛。有什麼特別的嗎?

You:用它自拍一下試試...

吳博士:(拍完照)。窩草,它怎麼認識我姓Wu?年齡顯示也太大了吧,我才42啊!

You:博士,這是一個具備'人類意識'的App額...博士你聽,它從你臉色判斷出你常年腎透支啊...

吳博士:......

 

借用微軟認知服務官網上的一段話:

Give your Apps a human side 

Knock down barriers between you and your ideas. Enable natural and contextual interaction with tools that augment users' experiences via the power of machine-based AI. Plug them in and bring your ideas to life.

翻譯過來大概是:

讓你的應用擁有人的智慧

你的想法不再只是想法。基於機器學習的人工智慧使自然的和基於語境的人機互動變為可能,為你的應用增強使用者體驗。現在你就可以在你的應用中接入這些智慧,把你的想法變成現實。

微軟已經公開了“認知服務”的一些API,用起來特別簡單,NuGet上有現成的Package。主要分為5大類:

 

API分類

 

 

 

 

 

 

以上5大類中,每類API都可以免費試用,當然有次數限制。對於那種想體驗一下的童鞋完全夠用,如果想要大範圍商用,花錢買也行。

 

使用“視覺”類API完成的demo

廢話說太多,還是要上點乾貨。

空餘時間利用“視覺”類API做了一個Demo。具備以下功能:

  • 圖片分析。描述圖片、給圖片貼Tags、判斷圖片是否涉黃、找出圖片中的人臉等等;
  • 人臉分析。判斷人臉年齡、性別(跟How-Old顏值相機類似);
  • 人臉情緒分析。判斷每張臉的表情,是否‘生氣’、‘高興’、‘驚訝’...

可以說功能強大,呵呵,至少比how-old顏值相機功能大一點 :)

原始碼下載(幹活):

https://github.com/sherlockchou86/ComputerVision.UWP

手機上也可以執行,圖片有三種方式:URL網路圖片、本地上傳、以及相機拍照。都有對應的API。沒有做成App上傳到Store,感覺介面並不太友好,只適合開發人員看看而已。

 

下面是截圖:

【1】人臉識別

 

 【2】情緒分析

【3】圖片描述(注意description中的內容,直接可以識別圖中人物為川普)

【4】判斷圖片是否涉黃(雖然圖中adult content為false,但是racy content為true,說明露得不是很多)

【5】給圖片打標籤(分類),可以看到,非常準確

 

本文僅介紹了跟“視覺”有關的API使用方法,大概就相當於人類的“眼睛”。其他諸如“嘴巴說話”、“大腦分析語音”、“理解文字”以及“掌握知識”等一系列API暫未涉及到。本文僅是開端,大家可以試試其他:)

開源有益,多謝點贊!

 

相關文章