解密阿里雲 ET:在人工智慧領域,阿里巴巴在業務上是全球第一丨資料工匠簡報(Apr. 10)...

weixin_33866037發表於2017-04-10

解密阿里雲 ET:在人工智慧領域,「阿里巴巴在業務上是全球第一

1818544-8bcc596368ee56ab.jpg

當時鍾剛剛駛入 2016 年 4 月 9 日的時候,《我是歌手》第四季總決賽在湖南衛視落下帷幕,賽前被廣泛看好的 CoCo 李玟奪得了總冠軍。但當天,我們在記住了李玟的歌聲以外,還被另一個意外出現的事件所吸引,那就是阿里雲小 Ai。

賽前,高曉鬆等人就放出了有關阿里雲小 Ai 的預熱,稱其有很大機率預測到最後的冠軍。即使「黑幕說」不可避免,但這個點還是成為了當天晚上除比賽之外的一個關鍵詞。

「其實這個事當時是一個偶然,當時大家都覺得挑戰非常大。第一,電視直播你錯了就錯,出醜就大了;第二,這個事情本身是非常難的,因為像音樂鑑賞這個事兒本身就沒有客觀標準,是非常主觀的行為,沒有標尺可選」,這個專案的負責人閔萬里說道。

事實似乎也證明了他的說法,在賽前,它給出的預測結果宣稱韓國歌手黃致列將會奪冠,這與最後的結果並不相符。不過還好,隨著比賽的激烈進行,各種資料和資訊都在發生著變化,在第一輪淘汰之後的幾次預測中,阿里雲小 Ai 都表現出了比較精準的結果,並且在最終的三選一中成功預測到了李玟的奪冠。

1818544-f7c88e31d039701f.png

人工智慧背後的人

1818544-eaf9a4ff42b8eab1.png

在大部分人看來,人工智慧是個有些「科幻」的詞彙,代表小說電影中和人類長相相似、或溫柔或冷酷的機器人。

稍微熟悉一點,這份印象又變成冷冰冰的 GPU 陣列、複雜多層的神經網路和一大串佶屈聱牙的專有名詞。能接觸它們的除了工程師,就是科學家。

也許這份印象需要再度重新整理一次——人工智慧,真的需要不少「人工」。

1818544-f9687f6a1329d64a.png

圖解堆演算法、連結串列、棧與佇列

1818544-2475300db9026605.png

堆(heap),是一類特殊的資料結構的統稱。它通常被看作一棵樹的陣列物件。在佇列中,排程程式反覆提取佇列中的第一個作業並執行,因為實際情況中某些時間較短的任務卻可能需要等待很長時間才能開始執行,或者某些不短小、但很重要的作業,同樣應當擁有優先權。而堆就是為了解決此類問題而設計的資料結構。

二叉堆是一種特殊的堆,二叉堆是完全二叉樹或者近似完全二叉樹,二叉堆滿足堆特性:父節點的鍵值總是保持固定的序關係於任何一個子節點的鍵值,且每個節點的左子樹和右子樹都是一個二叉堆。

當父節點的鍵值總是大於任何一個子節點的鍵值時為最大堆,當父節點的鍵值總是小於或等於任何一個子節點的鍵值時為最小堆。

為了更加形象,我們常用帶數字的圓圈和線條來表示二叉堆等,但其實都是用陣列來表示的。如果根節點在陣列中的位置是1,第n個位置的子節點則分別在2n和2n+1位置上。

1818544-181f643cd488bf9b.png

以上簡訊由資料工匠提供,感興趣的小夥伴可以通過掃描簡報後的二維碼連結原文,更多資料科學資訊盡在資料工匠,掃碼關注 Datartisan 資料工匠公眾號!如果你看到什麼與“資料科學”有關的好文或者資訊科技優質的文章,可以隨手轉發給我們,讓更多熱愛資料科學的小夥伴一起成長!


1818544-214c0dad8fd22a0c.png

相關文章