【機器學習】關於機器學習那些你不知道的“民間智慧”

產業智慧官發表於2018-03-02

機器學習演算法可以通過從例子中推廣來弄清楚如何執行重要的任務。

本文總結了機器學習研究人員和從業人員學到的8個關鍵經驗教訓,包括要避免的陷阱,重點問題並回答了一些常見的問題。在本文中分享了這些經驗教訓,因為在考慮機器學習問題時,它們非常有用。

1 - 學習=表示+評估+優化

所有的機器學習演算法通常由3個元件組成:

表示法:分類器必須用計算機可以處理的一些正式語言表示。相反地,為學習者選擇一個表示式就等於選擇它可能學習的一組分類器。這個集合被稱為學習者的假設空間。如果一個分類器不在假設空間,就不能被學習到。一個相關的問題是如何表示輸入,即使用哪些功能。

評估:需要一個評估函式來區分好的分類器和壞的分類器。該演算法在內部使用的評估函式可能與我們希望分類器優化、簡化優化以及下一節討論的問題不同。

優化:最後,我們需要一種方法來在語言中的分類器中搜尋得分最高的分類器。優化技術的選擇對於學習者的效率是關鍵的,並且如果評估函式具有多個最優值,則有助於確定所產生的分類器。新學習者開始使用現成的優化器(後來被定製設計的優化器替代)是很常見的。  

【機器學習】關於機器學習那些你不知道的“民間智慧”

2 - 泛化很重要

機器學習的基本目標是在訓練集範例之外進行泛化。這是因為,無論我們有多少資料,我們都不太可能在測試時再次看到這些確切的例子。做好訓練集很容易。機器學習初學者最常犯的錯誤就是對訓練資料進行測試,並有成功的幻覺。

如果選擇的分類器在新的資料上進行測試,通常不會比隨機猜測更好。所以,如果你僱人去建立分類器,一定要保留一些資料給你自己,並測試他們給你的分類器。相反,如果你被僱傭來建立一個分類器,要把一些資料從一開始就放在一邊,只用它來測試你選擇的分類器,然後在整個資料上學習最終的分類器。

【機器學習】關於機器學習那些你不知道的“民間智慧”

3 - 資料是不夠的

泛化是目標同時還有另外一個重要的後果:不管你擁有多少資料,那都是不夠的。

這似乎是一個令人沮喪的訊息。那麼我們怎麼能學到東西?幸運的是,我們想要在現實世界中學習的功能並不是從所有數學上可能的功能集合中統一得出的!事實上,舉一個非常普遍的假設,比如平滑性,類似的例子,有限的依賴性或者有限的複雜性,往往足以做得很好,這也是機器學習如此成功的很大一部分原因。就像演繹一樣,歸納(學習者所做的)就是知識槓桿:將少量的輸入知識轉化為大量的輸出知識。感應是一個比演繹強大得多的槓桿,需要更少的輸入知識來產生有用的結果,但是它仍然需要超過零的輸入知識來工作。而且,就像任何一個槓桿一樣,我們投入得越多,我們就越能走出去。

【機器學習】關於機器學習那些你不知道的“民間智慧”

回想起來,學習知識的需求不應該令人驚訝。機器學習不是魔術,它不能從無到有。它所做的是從更少獲得更多。像所有的工程一樣,程式設計有很多工作:我們必須從頭開始構建所有的東西。學習更像是農業,讓大自然完成大部分的工作。農民將種子與營養物質結合起來種植作物。學習者將知識與資料結合起來,開展專案。

4 - 有許多面臨過度擬合

如果我們擁有的知識和資料不足以完全確定正確的分類器呢?那麼我們就冒著對分類器(或其中的一部分)產生幻覺的風險,這些分類器並不是基於現實,而只是簡單地編碼資料中的隨機物。這個問題被稱為過度擬合,是機器學習的怪圈。當你的學習者輸出的分類器在訓練資料上是100%準確的,但在測試資料上只有50%準確的時候,實際上它可以輸出一個75%準確度的分類器,那麼,這時候它就可能顯得有些過度了。

機器學習中的每個人都知道過度擬合,但它有很多形式,並不是很明顯。理解過度擬合的一種方法是將泛化誤差分解為偏差和方差。偏見是學習者不斷學習同樣錯誤的東西的傾向,不管真實的訊號如何,方差是傾向於學習隨機事物。線性學習者有很高的偏見,因為當兩個類之間的邊界不是一個超平面時,學習者無法誘導它。決策樹卻不存在這個問題,因為它們可以表示任何布林函式,但是另一方面它們可能遭受高度的方差:由相同現象產生的不同訓練集上學習的決策樹通常是非常不同的,事實上它們應該是相同的。

【機器學習】關於機器學習那些你不知道的“民間智慧”

交叉驗證可以幫助對抗過度擬合,例如通過使用交叉驗證來選擇決策樹的最佳尺寸來學習。但這不是萬能的,因為如果我們用它來做太多的引數選擇,它本身就會開始過度適應。

除了交叉驗證之外,還有很多方法可以解決過度擬合的問題。最流行的是給評價函式增加一個正則化術語。例如,這可以懲罰更多結構的分類器,從而有利於較小的分類器,只需較少的裝配空間。另一種方法是在新增新的結構之前,進行像卡方這樣的統計顯著性檢驗,以確定類別的分佈是否真的不同於這種結構。當資料非常稀少時,這些技術特別有用。儘管如此,你應該對某種技術“解決”過度擬合問題的說法持懷疑態度。通過落入相反的偏差(偏差),很容易避免過度擬合(方差)。同時避免這兩種情況都需要學習一個完美的分類器。

5 - 直覺在高維度失敗

過度擬合之後,機器學習中最大的問題就是維度的問題。這個表示式是由Bellman在1961年提出的,指的是當輸入是高維時,許多在低維度上工作正常的演算法變得棘手。但是在機器學習中,它指的是更多。隨著示例的維數(特徵數量)的增長,泛化正確變得越來越難,因為固定大小的訓練集覆蓋了輸入空間的一小部分。

【機器學習】關於機器學習那些你不知道的“民間智慧”

高維的一般問題是,我們來自三維世界的直覺通常不適用於高維空間。在高維度中,多元高斯分佈的大部分質量並不接近平均值,而是在其周圍越來越遠的“殼”中;而高維度橙色的大部分是在皮膚中,而不是紙漿。如果恆定數量的例子在高維超立方體中均勻分佈,那麼超越某個維度,大多數例子更接近於超立方體的一個面,而不是最近鄰。如果我們通過將它寫入超立方體來近似超球面,那麼在高維度下,超立方體的幾乎所有體積都在超球面之外。這對於機器學習來說是個壞訊息,一種型別的形狀常常被另一種形狀所逼近。

建立二維或三維分類器很容易,我們可以通過視覺檢查詢出不同類別的例子之間的合理邊界。但是在高維度上很難理解正在發生的事情。這反過來又使設計一個好的分類器變得困難。天真地說,人們可能會認為收集更多的功能從來不會受到傷害,因為在最壞的情況下,他們不會提供有關類的新資訊。但事實上,維度的詛咒可能超過了他們的利益。

6 - 理論上的保證不是他們所看到的那樣

機器學習論文充滿了理論上的保證。最常見的型別是確保良好泛化所需的示例數量的界限。你應該怎樣做到這些保證?首先,它們是可能的。歸納傳統上與演繹相對照:在推論中你可以保證結論是正確的;在歸納中,所有投注都是關閉的。或者這是許多世紀的傳統智慧。近幾十年來的一個主要發展是認識到,事實上,我們可以對歸納的結果有所保證,特別是如果我們願意為概率保證提供解決的話。

我們必須小心這是什麼意思。例如,如果你的學習者返回了一個與某個特定訓練集一致的假設,那麼這個假設就沒有這麼說。現在說的是,給定一個足夠大的訓練集,很有可能你的學習者要麼返回一個推廣的假設,要麼找不到一致的假設。約束也沒有說如何選擇一個好的假設空間。它只告訴我們,如果假設空間包含真實的分類器,那麼學習者輸出一個不好的分類器的概率隨著訓練集的大小而減少。如果我們縮小假設空間,邊界就會改善,但是包含真實分類器的機會也會縮小。

【機器學習】關於機器學習那些你不知道的“民間智慧”

另一種常見的理論保證型別是漸近的:給定無限的資料,保證學習者輸出正確的分類器。這是令人放心的,但是由於其漸近的保證,選擇一個學習者而不是另一個學習者會是一件輕率的事情。在實踐中,我們很少處於漸近狀態(也被稱為“asymptopia”)。而且,由於上面討論的偏差 - 方差權衡,如果學習者A比給定無限資料的學習者B好,則B往往比給定的有限資料好。

理論保證在機器學習中的主要作用不是作為實際決策的標準,而是作為演算法設計的理解和推動力量的來源。在這方面,他們相當有用。事實上,理論與實踐的密切相互作用是機器學習多年來取得如此巨大進步的主要原因之一。但要注意:學習是一個複雜的現象,只是因為學習者有一個理論上的正當理由,而且在實際工作中並不意味著前者是後者的原因。

7 - 更多資料能擊敗更聰明的演算法

在大多數電腦科學中,這兩種主要的有限資源是時間和記憶。在機器學習中,還有第三個:訓練資料。哪一個瓶頸已經從十年變為十年了,在八十年代,這往往是資料,在今天往往是時間。大量的資料是可用的,但沒有足夠的時間來處理它,所以它沒有被使用。這導致了一個矛盾:即使原則上有更多的資料意味著可以學習更復雜的分類器,但實際上更簡單的分類器被使用,因為複雜的分類器需要很長的時間學習。部分答案是想出快速學習複雜分類器的方法,而且在這方面的確有了顯顯著的進展。

使用更聰明的演算法的部分原因是有一個比你所期望的更小的回報,第一個近似,他們是一樣的,當你認為表述與規則集和神經網路不同時,這是令人驚訝的。但事實上,命題規則很容易被編碼為神經網路,其他表徵之間也存在類似的關係。所有學習者本質上都是通過將附近的例子分組到同一個類來工作的,關鍵的區別在於“附近”的含義。在非均勻分佈的資料下,學習者可以產生廣泛不同的邊界,同時在重要的區域(即具有大量訓練示例的那些區域)中也做出相同的預測,大多數文字示例可能會出現)。這也有助於解釋為什麼強大的學習可能是不穩定的,但仍然準確。

通常,首先嚐試最簡單的學習者(例如,邏輯迴歸之前的樸素貝葉斯,支援向量機之前的k-最近鄰居)是值得的。更復雜的學習者是誘人的,但他們通常也更難使用,因為他們有更多的旋鈕,你需要轉向獲得好的結果,因為他們的內部是更不透明的)。

【機器學習】關於機器學習那些你不知道的“民間智慧”

學習者可以分為兩大類:表示具有固定大小的線性分類器,以及可以隨資料一起增長的表示式,如決策樹。固定大小的學習者只能利用這麼多的資料。原則上可變大小的學習者可以在給定足夠資料的情況下學習任何函式,但實際上由於演算法或計算成本的限制,他們可能不會。而且,由於維度的詛咒,不存在大量的資料可能就足夠了。由於這些原因,聰明的演算法,那些充分利用資料和計算資源的演算法,如果你願意付出努力的話,往往會得到回報。設計學習者和學習分類器之間沒有尖銳的邊界,相反,任何給定的知識都可以在學習者中編碼或從資料中學習。所以機器學習專案往往會成為學習者設計的重要組成部分,當然,從業者需要具備一定的專業知識。

8 - 學習許多模型,不侷限於一個

在機器學習的早期,每個人都有自己喜歡的學習者,並有一些先驗的理由相信它的優越性。大部分努力嘗試了很多變化,並選擇最好的一個。然後系統的經驗比較表明,最好的學習者因應用而異,包含許多不同學習者的系統開始出現。現在努力嘗試許多學習者的變化,仍然選擇最好的一個。隨後研究人員注意到,如果不是選擇找到的最佳變體,我們結合了許多變體,結果會更好 - 通常要好得多 - 而且對使用者來說沒有額外的工作量。

【機器學習】關於機器學習那些你不知道的“民間智慧”

現在建立這樣的模型集是標準的。在最簡單的技術中,稱為bagging,我們通過重取樣簡單地生成訓練集的隨機變化,分別學習一個分類器,並通過投票結果結合。這是有效的,因為它大大降低了方差,而只是在提高的過程中稍微增加偏差,訓練樣例有權重,而且這些都是不同的,所以每個新的分類器都集中在前面那些往往會出錯的例子上。在堆疊中,單個分類器的輸出成為了“高階”學習者的輸入,這個學習者能計算出如何最好地組合它們。

結論

像任何學科一樣,機器學習有許多難以實現的“民間智慧”,但對成功至關重要。多明戈斯教授的論文總結了一些你需要知道的最重要的內容。



機器學習?人工智慧?還在傻傻分不清楚?

人工智慧並不是一個新的術語,它已經有幾十年的歷史了,大約從80年代初開始,電腦科學家們開始設計可以學習和模仿人類行為的演算法。

【機器學習】關於機器學習那些你不知道的“民間智慧”

在演算法方面,最重要的演算法是神經網路,由於過擬合而不是很成功(模型太強大,但資料不足)。儘管如此,在一些更具體的任務中,使用資料來適應功能的想法已經取得了顯著的成功,並且這也構成了當今機器學習的基礎。

在模仿方面,人工智慧專注於影像識別,語音識別和自然語言處理。人工智慧專家們花費了大量的時間來建立諸如邊緣檢測,顏色配置檔案,N-gram,語法樹等。不過,這些進步還不足以達到我們的需求。

傳統的機器學習

機器學習(ML)技術在預測中發揮了重要的作用,ML經歷了多代的發展,形成了具有豐富的模型結構,例如:

1.線性迴歸。
      2.邏輯迴歸。
      3.決策樹。
      4.支援向量機。
      5.貝葉斯模型。
      6.正則化模型。
      7.模型整合(ensemble)。
      8.神經網路。

這些預測模型中的每一個都基於特定的演算法結構,引數都是可調的。訓練預測模型涉及以下步驟:

1. 選擇一個模型結構(例如邏輯迴歸,隨機森林等)。
2. 用訓練資料(輸入和輸出)輸入模型。
3. 學習演算法將輸出最優模型(即具有使訓練錯誤最小化的特定引數的模型)。

每種模式都有自己的特點,在一些任務中表現不錯,但在其他方面表現不佳。但總的來說,我們可以把它們分成低功耗(簡單)模型和高功耗(複雜)模型。選擇不同的模型是一個非常棘手的問題。

由於以下原因,使用低功率/簡單模型是優於使用高功率/複雜模型:

在我們擁有強大的處理能力之前,訓練高功率模型將需要很長的時間。

在我們擁有大量資料之前,訓練高功率模型會導致過度擬合問題(因為高功率模型具有豐富的引數並且可以適應廣泛的資料形狀,所以我們最終可能訓練一個適合於特定到當前的訓練資料,而不是推廣到足以對未來的資料做好預測)。

然而,選擇一個低功率的模型會遇到所謂的“欠擬合”的問題,模型結構太簡單,如果它複雜,就無法適應訓練資料。(想象一下,基礎資料有一個二次方關係:y = 5 * x ^ 2;你無法適應線性迴歸:y = a * x + b,不管我們選擇什麼樣的a和b。

為了緩解“不適合的問題”,資料科學家通常會運用他們的“領域知識”來提出“輸入特徵”,這與輸出關係更為直接。(例如,返回二次關係y = 5 * square(x),如果建立了一個特徵z = x ^ 2,則可以擬合線性迴歸:y = a * z + b,通過選擇a = 5和b = 0)。

機器學習的主要障礙是特徵工程這個步驟,這需要領域專家在進入訓練過程之前就要找到非常重要的特徵。特徵工程步驟是要靠手動完成的,而且需要大量領域專業知識,因此它成為當今大多數機器學習任務的主要瓶頸。

換句話說,如果我們沒有足夠的處理能力和足夠的資料,那麼我們必須使用低功耗/更簡單的模型,這就需要我們花費大量的時間和精力來建立合適的輸入特徵。這是大多數資料科學家今天花時間去做的地方。

神經網路的迴歸:

在大資料時代,雲端計算和大規模並行處理基礎架構的共同發展,使得機器處理能力在二十一世紀初得到了極大的提升。我們不再侷限於低功耗/簡單的模型。例如,當今最流行的兩種主流機器學習模型是隨機森林和梯度提升樹。儘管如此,兩者都非常強大,並且提供了非線性模型擬合的訓練資料,但資料科學家仍然需要仔細地建立特徵以獲得良好的效能。

與此同時,電腦科學家重新使用神經網路的許多層來完成這些人類模仿的任務。這給DNN(深度神經網路)帶來了新的生機,並在影像分類和語音識別任務方面提供了重大突破。DNN的主要區別在於,你可以將原始訊號(例如RGB畫素值)直接輸入DNN,而不需要建立任何域特定的輸入功能。通過多層神經元(這就是為什麼它被稱為“深度”神經網路),DNN可以“自動”通過每一層產生適當的特徵,最後提供一個非常好的預測。這極大地消除了尋找“特徵工程”的麻煩,這是資料科學家們最喜歡看到的。

DNN也演變成許多不同的網路拓撲結構,所以有CNN(卷積神經網路),RNN(遞迴神經網路),LSTM(長期短期記憶),GAN(生成敵對網路),轉移學習,注意模型(attention model)所有的這些被統稱為深度學習(Deep Learning),它正在引起整個機器學習界的關注。

強化學習:

另一個關鍵組成部分是關於如何模仿一個人(或動物)的學習,設想感知/行為/獎勵迴圈的非常自然的動物行為。一個人或者一個動物首先會通過感知他或者她所處的狀態來了解環境。在此基礎上,他或者她會選擇一個“動作”,將他或者她帶到另一個“狀態”。那麼他或她將獲得“獎勵”,迴圈重複,直到他或她消失。這種學習方式(稱為強化學習)與傳統監督機器學習的曲線擬合方法有很大不同。尤其是,強化學習學習得非常快,因為每一個新的反饋(例如執行一個行動並獲得獎勵)都被立即傳送到影響隨後的決定。

強化學習也提供了預測和優化的平滑整合,因為它在採取不同的行動時保持當前狀態的信念和可能的轉換概率,然後做出決定哪些行動可以導致最佳結果。

深度學習+強化學習= AI

與經典的ML技術相比,DL提供了一個更強大的預測模型,通常可以產生良好的預測結果。與經典優化模型相比,強化學習提供了更快的學習機制,並且更適應環境的變化。




超全AI產品清單,分分鐘搞定你的難題!

作者:Liam Hänel 

來源:大資料文摘

編譯:趙逸雲、蔣寶尚、錢天培

本文為大家盤點已實現產品化的商用AI,看看他們在業界都搞出些什麼名堂。


人工智慧席捲各行各業早已是不爭的事實。


一邊是大把人擔心AI搶走自己的飯碗,另一邊又是人工智障事故頻出、難在業界落地。


AI在業界的應用程度到底如何,恐怕還得從已有的商用AI看起。


今天,我們就來盤點一下已實現產品化的商用AI,看看它們在業界都能搞出些什麼名堂。


如果你真怕被AI搶走飯碗,所謂知己知彼,趕緊要來了解AI在業界的具體應用。


如果你是企業負責人,更是別錯過這張清單——或許你的生產運轉難題就可以被其中的某一個AI應用解決!


語音


Capio — 語言轉錄和識別

Deepgram — 電話、錄影和線上內容的轉錄

Gridspace — 探索更多的顧客和職員的對話

MindMeld — 強化對話介面的高階AI

Nexidia — 把使用者的互動轉化為有價值的理解

Pop Up Archive — 使音訊變為可搜尋文件

TalkIQ — 關於客戶對話的重要見解

Twilio — 給網頁和APP新增資訊、聲音和視訊模組

 

商業智慧&分析


Arago/HIRO — IT的優化和自動化以及商業運作

Arimo —針對IoT(物聯網)的行為AI

Ayasdi — 針對企業的一套智慧應用軟體

DataRobot —系列改進企業產品的產品

Dataminr — 在新聞公佈之前發掘事件和資訊

Electra by Lore — 幫助您回答關於您業務的問題

Einstein — 更智慧的Salesforce

Fuzzy AI — 在網頁和移動應用程式上新增智慧決策

Logz.io — 幫您索引、搜尋、視覺化和分析您的資料

NXT AI — 時間模式識別和預測的框架

Paxata — 將原始資料自動轉換為有用的資訊
Poweredby.ai — 幫助您監視伺服器的錯誤

Sundown — 自動處理您的業務中的重複性任務
UBIX — 使複雜的資料科學易於企業使用

Ruths.ai — 幫助您最大限度地使用您的資料
Exchange.ai — 分析市場
Owl.ai — 捕獲、分類和提取您所有資料中的關鍵資訊
AnswerRocket — 基於搜尋的快速資料洞察
iSeek.ai — 更快、更好、更低成本地解決大資料問題
Ecosystem.AI — 在複雜的人類和商業生態系統中找到隱藏價值
Prix — 助您優化定價

 

核心AI

Algorithmia —許多演算法、函式和模型的通用API(Application Programming Interface,應用程式程式設計介面)
Arya —神經網路的工作臺

CognitiveScale — 針對企業的特定領域的高階ML(機器學習)
Digital Reasoning — 針對企業的高階機器學習
Fluid AI — 針對企業的高階機器學習
H2O.ai — 開源的機器學習和深度學習平臺
Loop AI Labs — 針對企業的高階機器學習
Nervana — 計算系統的深度學習
Petuum —  針對企業的高階機器學習
Scaled Inference —  針對企業的高階機器學習
Sentient — 有關金融、電子商務和數字市場的一系列AI產品
Skymind — Java虛擬機器上針對企業的開源深度學習和ETL
(資料倉儲技術)
Vicarious —  針對企業的高階機器學習
Loom Systems — 針對企業的日誌分析

PipelineAI—大規模解決ML(機器學習)和AI產品的問題
Ogma— 使用神經科學建立AI


資料捕獲


Amazon Mechanical Turk — 能使簡單流程自動化的人力市場
CrowdAI — 大規模自動發掘目標
Datalogue — 自動準備好隨時都能立即使用的合適的資料
DataSift — 幫助構建從社交媒體到部落格的資料
Diffbot —自動將網頁提取為結構化資料
Import.io —從幾乎任何網站提取資料

Playment — 針對企業的資料訓練、影像標註等等
WorkFusion — 運營團隊使業務流程自動化的工具

 

資料科學


BigML — 所有預測用例的單個平臺

譯者注(支援跨雲匯入資料的管理平臺)

CrowdFlower — 為機器學習團隊訓練資料,標註影像
Dataiku —適用於大規模資料初始化、部署和執行的資料科學平臺
DataScience — 用來研究、開發和生產的企業級資料科學平臺
Domino Data Lab — 用來協作、構建和部署的平臺
Exploratory — 使分析人員可以使用開源演算法來訪問DS
Kaggle —幫助您學習、工作和玩機器學習模型
RapidMiner — 使得資料科學團隊更加高效
Seldon — 幫助DS團隊將機器學習模型投入生產
SherlockML  一個構建,測試和部署AI演算法的平臺
Spark —研究能夠發掘複雜資料模式的引擎
Tamr — 整合離散資料來源
Trifacta — 使資料的結構更有助於分析
Yhat — 使資料科學家能夠快速部署和更新預測模型
Yseop — 自動編寫報告,網站,電子郵件,文章等等

 

發展


AnOdot — 檢測業務事件
Bonsai — 開發適應性更強、可信度更高和可程式設計的AI模型

Deckard.ai — 幫助預測專案時間表
Fuzzy.ai — 在網頁和移動應用程式上新增智慧決策
Gigster — 將專案與正確的團隊聯絡起來
Kite — 用可獲得的網頁知識來強化程式設計環境
Layer 6 AI — 用於預測和個性化的深度學習平臺
Morph — 使得開發適合您業務的聊天機器人更加容易
Ozz — 幫助聊天機器人自我學習,會使其更加聰明
RainforestQA —快速的網頁和移動應用測試
SignifAI —增加伺服器正常執行時間以及預測停機時間
Turtle —專案管理以及易於團隊使用的聊天軟體

Improve.ai — 自動優化APP內容、設計和定價等
Gesture.ai — 開發者的手勢識別
Cognitive Toolkit — 訓練深度學習演算法使能像人腦一樣學習
Bonsai — 提取出複雜的機器學習庫例如TensorFlow,以便更高效地管理AI模型

譯者注(Bonsai總部位於加州伯克利(Berkeley),是一個軟體開發平臺,允許所有開發者搭建、訓練、使用智慧模型。不需要複雜的AI演算法和技術,Bonsai人工智慧引擎能讓開發人員更高效地編碼,以更好地控制和優化硬體和軟體。)
Tangle — 幫助設計者,工程師和領導者做決定
Imandra — 幫助分析演算法


內部資料


Alation — 幫助您協同工作、提高生產力和資料索引
Cycorp — 系列不同的企業級AI產品
Databricks — 去除叢集管理的弊病,讓我們專注於DS(數字服務)

(譯者注;該產品背後的理念是提供處理資料的單獨空間,不受託管環境和 Hadoop 叢集管理的影響,整個過程在雲中完成。)
Deckard.ai —幫助預測專案時間表
Gavagi — 線上趨勢的洞察和其他文字分析工具
IBM Watson — 商用AI平臺
Kyndi — 幫助知識工作者處理大量的資訊
One Factor — 針對風險管理和運營的SaaS AI
Probot — 使您的業務軟體更加智慧
Sapho — 幫助員工完成任務以及使用微型APP訪問資料
Sofia —更好的網站分析

eContext —使非結構化資料結構化
Hayley — 建立人、裝置和資料間的智慧互動
RelativeInsight深入洞察客戶和內部資料
Rainbird —大規模自動化決策

 

機器學習


Bonsai — 發展適應性更強、可信度更高和可程式設計的AI模型Cycorp — 一系列不同的企業級AI產品
Datacratic — 幫助您將數字廣告定位於您的目標人群
deepsense.io — 以影像,語音,文字和視訊的形式分析資料
Geometric Intelligence — 目前是Uber人工智慧實驗室的一部分
HyperScience —能夠處理瑣事,為員工節省時間
Nara Logics —統一資料以獲取更優推薦的平臺
SigOpt — 將機器學習模型的速度提高了100倍

Amazon Machine Learn — 機器學習是其中一項服務
Providence —匯入預測模型並無限縮放以回答存在的問題


感測器(物聯網/工業物聯網)


Alluvium — 該平臺實時監控工廠的生產狀況 
Black —瞭解您商店裡購物者的行為
C3 IoT — 幫助統一應用程式開發和資料科學
KONUX — 結合智慧感測器及人工智慧對資料進行分析
Imubit — 針對製造工藝優化的機器學習
Maana —系列關於燃料和工業的工作流程優化產品
Predix — 幫助您開發、部署和運營工業應用程式
Planet OS —幫助可再生能源公司更好地利用其資料
Sight Machine — 製造業分析
Sentenai — 使資料科學裡的資料工程自動化
Snips —給您連線的產品新增一個語音助手
ThingWorx — 管理您的物聯網應用的開發平臺
Uptake —重點工業的一個預測平臺
Verdigris — 商業建築的智慧建築管理


文字分析/生成


Agolo — 從您的文字和資訊裡實時建立摘要
AYLIEN — 從您的文字和視覺資料中提取含義
Compreno — 不需要任何訓練的文字分析和挖掘工作
Cortical.io — 高階語言處理
fido.ai —自動從文字中獲取知識
IntroSpect by Lore — 建立使用者的個人資料並更好地瞭解他們
Lexalytics — 可擴充套件的文字分析軟體
Luminoso —捕獲、衡量消費者行為並根據消費者反饋採取行動
MonkeyLearn — 針對自動分類文字的可擴充套件API
Narrative Science —針對您的資料解釋出更多有用的資訊
Qeep — 幫助您找出文件裡的錯誤和不精確之處
spaCy — 基於Python的免費開源自然語言處理庫
Salient — 自動化資訊的提取、管理和分析
Stride — 使文字資料可理解
Textio — 幫助您提高招聘廣告的撰寫方式
Yseop — 自動編寫報告、網站、電子郵件、文章等等

 

視覺


ABBYY — 新增即時文字捕獲功能至移動應用程式等
Achron — 具有視覺和判斷能力的自動無人機
Affectiva — 分析微妙的面部表情來識別人的情緒
Algocian — 使世界上每一臺相機智慧化
Angus.ai— 幫助相機檢測分析視訊饋送

(譯者注;Angus.ai是將您現有的安全攝像機轉變為新一代監控和警報工具的最佳軟體平臺。)
Birds.ai — 找出風力渦輪機的缺陷
Captricity — 從手寫和輸入的表格中提取和轉換資料
Clarifai —幫助您組織媒體庫
Cortica —醫療和運輸行業的視覺化分析
Deepomatic — 針對一系列用途和行業的影像檢測
DeepVision — 品牌及臉部識別
Descartes Labs — 使得衛星影像有用
Flixsense — 第一個智慧雲視訊平臺
FotoNation —用於汽車和人體檢測的計算機視覺
GrokStyle — 匹配相似的物品並給出組合建議
Haystack —面部識別
HireVue — 使用面部識別幫助您選擇求職者
Lunit Inc. — 醫療資料的分析和解釋
Matroid —識別不同的物件和事物
Netra —專注於社交網路的品牌識別
Orbital Insight — 衛星影像分析
Pilot AI Labs — 基於計算機視覺平臺的深度學習
Planet — 使用衛星影像進行行星監測與分析
Spaceknow — 衛星影像分析
Sticky.ai — 眼神和情緒追蹤平臺
Valossa — 理解並描述視訊內容
Vidi —主要用於工業目的的影像分析

CloudSight — 數秒內對影像的高質量理解
Irvine Sensors — 外來和有意放置物體的安全監測
Pilot.ai — 系列的智慧計算機視覺技術


對話平臺、聊天機器人


API.ai —用於構建對話式使用者介面的 高階工具

Chatfuel —無需編碼建立一個Facebook聊天機器人 

Comm.ai — 為網站和應用增添語音和聊天應用介面

Conversica — 幫助達成更多銷售的聊天介面

EDDI — 創立、測試、部署聊天機器人

FPT AI Platform — 與終端使用者進行自動化互動

Golem.ai — 供開發者使用的自然語言理解工具

Gong —分析、提升銷售談話與客戶訪問電話的質量

Kasisto — 金融行業的會話式AI平臺

KITT.AI — 利用一個可視介面建立會話代理人

Maluuba —教會機器如何思考、推理與溝通 

Massively — 搭建商業用途的聊天機器人

Meya —在一個平臺上 建立、培訓和託管機器人

MindMeld — Siri的升級版本

Mobvoi —語音整合的智慧手錶 

Motion AI — 聊天機器人讓你事半功倍

msg.ai — 帶有管理儀表盤的聊天機器人

Octane AI —幫助實現營銷自動化 的訊息回覆軟體

OpenAI Gym — 適用於強化學習任務的開源使用者介面

Orbit — 可以將會話式人工智慧自動化的工具

Pool — 幫助你完成更多工作的私人助理

Recast — 一個可以建立、培訓、部署智慧機器人的協作平臺

Reply.ai — 可以建立並管理你的會話策略的平臺

Semantic Machines — 用於工作、旅行、購物及娛樂的會話AI

Snips — 在你的互聯裝置上增加一個語音助理

Servo — 全端機器人以及整合現有系統的語音

Smartly.ai— 一站式語音和聊天機器人平臺

UNU.ai — 使用了叢集智慧(Swarm Intelligence)的聊天機器人

Unify — 電子商務聊天機器人

uTu — 多渠道機器人分析及資料管理

Wit.ai —為指定平臺輕鬆建立基於文字或語音 的機器人

Wysh — 支援支付功能的企業級規模聊天機器人

Zero AI —有助於理解意義、目的和事件背景的 語音介面

Pez.AI — 支援基於語音聊天的業務

Nucleus.ai — 針對會話式AI的白標方案

Myra — 在網站上提供即時的客戶服務

Ivy.ai — 高等教育領域的客戶服務聊天機器人

Init.ai — 通過對話改善客戶體驗

Hatch — 通過Facebook Messenger實現自動化電子商務

Clinc —企業級AI會話平臺

Botco.ai — 在大多數訊息傳送渠道上使用聊天機器人

Boost.ai —堅實可靠的虛擬商務 夥伴

Bitbot.ai — 建立Facebook聊天機器人

NLU Lab — 建立不同型別的聊天機器人

Converse — 創造智慧型聊天機器人

Basket —電子商務購物 聊天機器人

IBM Watson NLP —適用於 高階文字分析的自然語言處理

Brndstr — 聊天機器人開發者工作室

Artificial Solutions —實現企業級別的自然語言處理與分析 

Botsify — 無需編寫程式即可建立聊天機器人

Hound —通過語言處理 來實現產品語音功能(譯者注:智慧語音助手)

Kriya.ai —幫助你按需僱傭人才

Pandorabots — 快速建立聊天機器人


客戶關係管理


DataFox — 更好的客戶關係管理

Dynamic Yield — 一站式電子商務個性化平臺

Jetlore —將消費者行為匹配至結構化的可行動資料 

Kasisto — 金融行業對話式AI平臺

Reifier — 管理客戶、供應商及產品的主資料

Rep.ai — 跨平臺的所有客戶資料的中央樞紐

Takt —幫助你更全面地瞭解客戶

Dynamo — 即時生成關於所有客戶賬戶的見解

Augur —幫助識別使用不同裝置的各類顧客

Audience.ai — 利用公開的社交媒體資料,幫助擴充受眾群體

OpenDNA —生成和構建使用者的心理圖表和行為圖譜 

Maia — 去除了大資料的麻煩

Cogito — 在電話中偵查人類資訊,提供線上的行為指導,以促進每一次互動的質量。


客戶研究


Remesh — 通過規模化的對話與客戶構建連線

Tanjo —以動畫形式實時展現人物角色以及對客戶進行細分


客戶支援


Aaron — 客戶服務機器人

ActionIQ — 一個幫助市場營銷人員分析資料的平臺

Brain —一個聊天機器人管理套件

Clarabridge —根據文字和反饋資訊生成可執行的消費者洞察

DigitalGenius —在你的聯絡中心新增一層AI層(譯者注;結合人工與智慧的客服平臺)

Eloquent Labs —將自助支援頁面轉化為對話形式,以減少工作量

Presence AI — 一個可以幫助處理顧客訊息的、便捷的儀表盤

Spin — 保密的顧客反饋

Smith — 真實的接待員+基於機器學習過濾垃圾郵件、銷售、不受歡迎的致電

Rep.ai — 跨平臺的所有客戶資料的中心樞紐

Wise.io — 減少票務、縮短回覆時間,為代理人騰出更多時間

Zendesk — 建立有助於客戶關係發展的軟體

NEVA — 自動化客戶服務與支援

Alterra.ai — 藉助虛擬助理來增強聯絡中心話務員的能力

Agent.ai — 將客戶支援工具以及資料庫中心化


市場研究


Bottlenose — 以更少的時間管理資料、花更多的時間獲取洞見

CB Insights — 為決策過程提供支援的預測行為

Enigma — 整合內外部資料

Intelligent Layer — 通過利用未發掘資料促進商業運營

Mattermark —幫助你在正確的公司裡找到合適人選

Predata — 幫助你將媒體資訊轉化為投資的風險評估與預測

Premise —促使大公司做更有影響力的投資 

Quid — 對市場規模、增長、投資首選機會的鳥瞰

Tracxn —幫助VC記錄不同行業的初創企業所在的生態系統 

Appier — 通過交叉螢幕營銷提高營收

Dataminr — 即時發現有重大影響力的事件和新聞


市場營銷


AirPR —幫助管理PR工作及媒體活動 

Albert — 幫助你更好地開展市場營銷活動

Amplero — AI驅動的B2C市場營銷平臺

Automat — 個性化、一對一地與批量客戶交談

BrightFunnel — 優化全流程客戶體驗之旅

CogniCor — 自動化產品查詢、客戶賬戶建立以及更多

Crystal — 為你的社交媒體和內容營銷提供實時建議

Datorama — 機器學習驅動的資料整合以及AI驅動的營銷情報

Lattice — 促使你發現未開發市場和潛在客戶

LiftIgniter — 針對每一個使用者的網頁內容和電子商務進行個性化

Lucep — 幫助銷售代表管理銷售線索

Maik — 優化你的營銷活動

ManyChat — 為你的市場、銷售及支援活動建立Facebook Messenger機器人

Mintigo — 幫助預測銷售機會並促進銷售額增長

msg.ai — 一塊用於管理社交平臺訊息顯示的單一展示皮膚

Persado — 一個生成語言的內容平臺,其語言具有激發行為的特性

Questions — 更快速、非侵入式的問卷調研

Radius — 幫助你在社交渠道上尋找潛在客戶,與其互動,並轉化為買家

ReSci — 幫助客戶維護

Rock Fuel — 帶來個性化廣告的預測性市場活動

Prizma — 媒介內容的優化、受眾分析

Creativity.ai — 360度的產品概覽

Cosmos — 幫助你更好地瞭解客戶

ATP — 提高營銷績效並簡化工作流程的市場工具

Purple — 通過使用者的wifi使用情況更多地瞭解你的客戶

Boxever — 幫助生成內容並且在正確的時刻給到客戶


銷售


6sense — 為客戶清單新增一層預測性的關於行為方面的洞見(譯者注:通過分析人群的高時效性的行為資料,辨別潛在客戶,同時針對既有客戶群按照購買意願做出分級,藉此協助商戶優化銷售和市場事務,增長銷售額)

Aviso — 做出可以促進銷售增長的知情決策

BloomReach — 提供對線上購買者的見解(譯者注:BloomReach 出品的SNAP軟體把使用者心儀的商品直接推送到電商主頁)

Chorus.ai — 記錄、總結線上會議以幫助完成專案結尾

Clari —精準預測並告知銷售團隊應該聚焦何處來達成目標

Collective[i] —幫助獲取更高銷售績效的預測性AI

Enquire — 更好的電子商務搜尋

Fusemachines — 自動勘探潛在客戶、選擇機會,以及更多

Eye.ai — 得到關於如何提高你的網站UX/UI設計的建議

InsideSales — 獲取更相關的銷售機會

Nova AI — 幫助你從客戶身上獲得有意義的、有用的洞見

One.ai— 由AI驅動的、基於雲的CRM軟體

People.ai —給予銷售部門領導關於銷售活動及其績效的分析

Personify.ai — 輕鬆建立機器人

Roof AI — 生成房地產銷售機會的聊天機器人

Salesforce Einstein —優化商業流程和促進客戶互動

Sales Decision Engine — AI驅動的銷售支援工具套裝

Sudo —從客戶資料中尋找有意義的訊號

Spin — 保密的客戶反饋

Tethr — 從客戶電話交談記錄獲取洞見

TACT — 再也不需要登入一款客戶關係管理軟體

Transformation —跟蹤、匹配、理解使用者體驗

xiQ — 幫助加速銷售增長,監控競爭活動,以及更多

Zensight — 針對專業銷售人士的AI

Init.ai —  通過對話改善客戶體驗

Hydra.ai — 幫助銷售領導者以最佳狀態運營他們的團隊

Hatch — 通過Facebook Messenger實現自動化電子商務

Pathlight — 永遠聯機、基於資料的,對銷售運營團隊的分析

Conversica — 從郵箱和其他溝通渠道里發現你的最佳銷售機會

Sentient —自動調整網站設計以提高ROI


智慧招聘


Entelo —整合來源於不同網站的職位候選人資訊,並從中推薦合適候選人

Glider — 自動檢索,匹配,評估

HiQ —提供如何與員工互動的見解和建議

HireVue — 使用面部識別來幫助你挑選合適候選人

Olivia — 優化的求職及招聘體驗

Rai —幫助你聯絡並招募到合適候選人

Rey —將你介紹給你真正需要認識的人(工作與娛樂)

Talent Sonar — 使用一系列AI和包含其他相關手段的招聘平臺

Textio — 幫助優化你的招聘廣告的書寫

Uncommon — 一個優化了的候選人搜尋及廣告建立平臺

Wade & Wendy — 幫助你找尋合適的工作和人選

Recruiting.AI—幫助招聘

 

團隊協作


Aviva — 使得工作場所的溝通條理化

Butter.ai — 讓你的全部公司知識觸手可及

Cyclops — 視訊會議,包括書寫白板

Deckard.ai — 幫助預測專案進度

Howdy — 一個友善的、可培訓的,能幫助Slack團隊工作的機器人

Knowmail — 一個可以幫助你聰明地管理收件箱的郵箱助理

Plato — 團隊協作平臺

Talla — 自動化內部問題,管理員工需求並進行優先排序

Soapbox — 通向組織群體智慧的入口

x.ai — 會議議程規劃助理

Yva.ai — 幫助你跟蹤管理重要工作任務的私人助理

Entropy —幫助測量、提升員工的情商

ConferAI —促使員工對專案與會議有效性給出反饋

Collaboration.ai —幫助提高團隊協作與績效

Cerb — 幫助管理共享收件箱

Butterfly.ai —將員工反饋意見轉化為個性化的管理者領導力培訓

Butter.ai — 讓你的全部公司知識變得觸手可及

Brand.ai — 消除在設計與開發工作流程中的通訊費用與版本衝突


原文連結:

https://medium.com/imlyra/a-list-of-artificial-intelligence-tools-you-can-use-today-for-businesses-2-3-continued-21bf14280250

https://medium.com/imlyra/a-list-of-artificial-intelligence-tools-you-can-use-today-for-personal-use-1-3-7f1b60b6c94f

【機器學習】關於機器學習那些你不知道的“民間智慧”

人工智慧賽博物理作業系統

AI-CPS OS

人工智慧賽博物理作業系統新一代技術+商業作業系統“AI-CPS OS:雲端計算+大資料+物聯網+區塊鏈+人工智慧)分支用來的今天,企業領導者必須瞭解如何將“技術”全面滲入整個公司、產品等“商業”場景中,利用AI-CPS OS形成數字化+智慧化力量,實現行業的重新佈局、企業的重新構建和自我的煥然新生。


AI-CPS OS的真正價值並不來自構成技術或功能,而是要以一種傳遞獨特競爭優勢的方式將自動化+資訊化、智造+產品+服務資料+分析一體化,這種整合方式能夠釋放新的業務和運營模式。如果不能實現跨功能的更大規模融合,沒有顛覆現狀的意願,這些將不可能實現。


領導者無法依靠某種單一戰略方法來應對多維度的數字化變革。面對新一代技術+商業作業系統AI-CPS OS顛覆性的數字化+智慧化力量,領導者必須在行業、企業與個人這三個層面都保持領先地位:

  1. 重新行業佈局:你的世界觀要怎樣改變才算足夠?你必須對行業典範進行怎樣的反思?

  2. 重新構建企業:你的企業需要做出什麼樣的變化?你準備如何重新定義你的公司?

  3. 重新打造自己:你需要成為怎樣的人?要重塑自己並在數字化+智慧化時代保有領先地位,你必須如何去做?

AI-CPS OS是數字化智慧化創新平臺,設計思路是將大資料、物聯網、區塊鏈和人工智慧等無縫整合在雲端,可以幫助企業將創新成果融入自身業務體系,實現各個前沿技術在雲端的優勢協同。AI-CPS OS形成的字化+智慧化力量與行業、企業及個人三個層面的交叉,形成了領導力模式,使數字化融入到領導者所在企業與領導方式的核心位置:

  1. 精細種力量能夠使人在更加真實、細緻的層面觀察與感知現實世界和數字化世界正在發生的一切,進而理解和更加精細地進行產品個性化控制、微觀業務場景事件和結果控制。

  2. 智慧:模型隨著時間(資料)的變化而變化,整個系統就具備了智慧(自學習)的能力。

  3. 高效:企業需要建立實時或者準實時的資料採集傳輸、模型預測和響應決策能力,這樣智慧就從批量性、階段性的行為變成一個可以實時觸達的行為。

  4. 不確定性:數字化變更顛覆和改變了領導者曾經仰仗的思維方式、結構和實踐經驗,其結果就是形成了複合不確定性這種顛覆性力量。主要的不確定性蘊含於三個領域:技術、文化、制度。

  5. 邊界模糊:數字世界與現實世界的不斷融合成CPS不僅讓人們所知行業的核心產品、經濟學定理和可能性都產生了變化,還模糊了不同行業間的界限。這種效應正在向生態系統、企業、客戶、產品快速蔓延。

AI-CPS OS形成的數字化+智慧化力量通過三個方式激發經濟增長:

  1. 創造虛擬勞動力,承擔需要適應性和敏捷性的複雜任務,即“智慧自動化”,以區別於傳統的自動化解決方案;

  2. 對現有勞動力和實物資產進行有利的補充和提升,提高資本效率

  3. 人工智慧的普及,將推動多行業的相關創新,開闢嶄新的經濟增長空間


給決策制定者和商業領袖的建議:

  1. 超越自動化,開啟新創新模式:利用具有自主學習和自我控制能力的動態機器智慧,為企業創造新商機;

  2. 迎接新一代資訊科技,迎接人工智慧:無縫整合人類智慧與機器智慧,重新

    評估未來的知識和技能型別;

  3. 制定道德規範:切實為人工智慧生態系統制定道德準則,並在智慧機器的開

    發過程中確定更加明晰的標準和最佳實踐;

  4. 重視再分配效應:對人工智慧可能帶來的衝擊做好準備,制定戰略幫助面臨

    較高失業風險的人群;

  5. 開發數字化+智慧化企業所需新能力:員工團隊需要積極掌握判斷、溝通及想象力和創造力等人類所特有的重要能力。對於中國企業來說,創造兼具包容性和多樣性的文化也非常重要。


子曰:“君子和而不同,小人同而不和。”  《論語·子路》雲端計算、大資料、物聯網、區塊鏈和 人工智慧,像君子一般融合,一起體現科技就是生產力。


如果說上一次哥倫布地理大發現,擴充的是人類的物理空間。那麼這一次地理大發現,擴充的就是人們的數字空間。在數學空間,建立新的商業文明,從而發現新的創富模式,為人類社會帶來新的財富空間。雲端計算,大資料、物聯網和區塊鏈,是進入這個數字空間的船,而人工智慧就是那船上的帆,哥倫布之帆!


新一代技術+商業的人工智慧賽博物理作業系統AI-CPS OS作為新一輪產業變革的核心驅動力,將進一步釋放歷次科技革命和產業變革積蓄的巨大能量,並創造新的強大引擎。重構生產、分配、交換、消費等經濟活動各環節,形成從巨集觀到微觀各領域的智慧化新需求,催生新技術、新產品、新產業、新業態、新模式。引發經濟結構重大變革,深刻改變人類生產生活方式和思維模式,實現社會生產力的整體躍升。



產業智慧官  AI-CPS


用“人工智慧賽博物理作業系統新一代技術+商業作業系統“AI-CPS OS”:雲端計算+大資料+物聯網+區塊鏈+人工智慧)在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧;實現產業轉型升級、DT驅動業務、價值創新創造的產業互聯生態鏈


【機器學習】關於機器學習那些你不知道的“民間智慧”

【機器學習】關於機器學習那些你不知道的“民間智慧”

長按上方二維碼關注微信公眾號: AI-CPS,更多資訊回覆:


新技術“雲端計算”、“大資料”、“物聯網”、“區塊鏈”、“人工智慧新產業:智慧製造”、智慧金融”、“智慧零售”、“智慧駕駛”、智慧城市新模式:“財富空間“工業網際網路”、“資料科學家”、“賽博物理系統CPS”、“供應鏈金融”


官方網站:AI-CPS.NET


本文系“產業智慧官”(公眾號ID:AI-CPS)收集整理,轉載請註明出處!



版權宣告產業智慧官(公眾號ID:AI-CPS推薦的文章,除非確實無法確認,我們都會註明作者和來源。部分文章推送時未能與原作者取得聯絡。若涉及版權問題,煩請原作者聯絡我們,與您共同協商解決。聯絡、投稿郵箱:erp_vip@hotmail.com




相關文章