讀演算法的陷阱:超級平臺、演算法壟斷與場景欺騙筆記02_大資料

躺柒發表於2024-03-06

1. 大資料分析

1.1. 隨著“大資料軍備競賽”與定價演算法的廣泛應用,線上購物平臺與實體商鋪的界限也變得越來越模糊

1.2. 在沃爾瑪瘋狂擴張的時代,它給地區性商業帶來的傷害不亞於一場地震

1.2.1. 當地的小型商鋪往往只能繳械,貢獻出自己的銷售額,而主街的繁華就此凋零

1.2.2. 如果有誰想要挫敗沃爾瑪進軍美國各大城市的擴張野心,那麼這簡直是要激化社會底層矛盾

1.3. 威脅並非來自人們的口誅筆伐,而是網際網路電商的節節高歌擊潰了它的擴張夢想

1.3.1. 面對電商對實體店的深度衝擊,人們在實體店內消費的機率正在不斷下降

1.4. 沃爾瑪那為人稱道的運營效率實難為大資料分析與動態定價模型輸血

1.5. 亞馬遜

1.5.1. 亞馬遜的產品分類與倉儲規模要遠大於實體商鋪

1.5.1.1. 有近百個門類、上百萬種商品在亞馬遜網站上銷售

1.5.1.2. 賣出的書籍總數遠超任何一家實體書店

1.5.1.3. 2017年,亞馬遜成為最大的線上服裝類商品零售商

1.5.2. 隨著零售商貨架上的產品類別越來越豐富,手動調整價格的方式也將變得越發困難

1.5.2.1. 給所有門店裡的食品罐頭更換價格標籤這種簡單的行為,也將耗費一位工人數月的時間

1.5.2.2. 對亞馬遜而言,這些工作量根本不值一提

1.5.2.2.1. 亞馬遜在調整商品價格方面的確相當主動,它有時甚至會為了打擊競爭對手而在一天之中兩次調價
1.5.2.2.2. 如果不是定價演算法的迅速反應,亞馬遜很難及時將市場行情的變動反映到當前商品價格中

1.5.2.3. 在亞馬遜網站上出售的絕大多數商品都可以做到每隔15分鐘調整一次價格

1.5.2.3.1. Boomerang

Commerce開發的定價演算法軟體可以每分鐘檢索100 ~ 150個資料點,並適時調整價格

1.5.2.3.2. 價格動態最佳化軟體

1.5.2.4. 對商品價格與使用者體驗進行實時的調整

1.5.3. 為了確保自己不在這一輪營銷競賽中落敗,它們都會競相將定價演算法技術納入自己的資訊科技支援部門,而亞馬遜在該領域的開拓可以被看成是“大資料軍備競賽”的縮影

1.5.4. 線上零售商無法單純依靠開了一家網店而坐等銷量暴漲

1.5.4.1. 資料,特別是掌握相當規模的資料才是成功的關鍵

1.5.4.1.1. 亞馬遜掌握的使用者資料數量要遠遠超過其他零售商的資料儲備
1.5.4.1.2. 海量的使用者資料支援著亞馬遜進行各種營銷實驗,而它所能提供的商品的價格水平也將在動態調整中更加貼合不同消費者的消費偏好
1.5.4.1.3. 線上商品價格調整的頻率將增加,而產品推薦頁面也將改造成更好迎合不同消費者個人喜好的個性化樣式

1.5.4.2. 具備控制並迅速分析這些個人資料的能力將給他們帶來顯著的競爭優勢

1.5.4.3. 演算法模型已經找到了在不同維度的衡量標準下特定人群的消費模式

1.5.5. 亞馬遜演算法的競爭對手已不再是實體店裡手工調整價格的櫃員,它們要超越的是其他同型別定價演算法

1.5.5.1. 當整個行業的企業都採用演算法來確定商品售價時,透過不斷學習,演算法能更好地預測並回應對方演算法的行動

1.5.6. 線上購物的一些缺陷正在得到改進

1.5.6.1. 如果你交納一定年費成為亞馬遜會員,那麼就可以享受亞馬遜Prime服務(包括免郵與優先送達服務)

1.5.6.2. 得益於高效的物流鏈條,那些想要節約採購時間的人們大可在網上購買生鮮食品

1.5.6.3. 除了物流提速,有些電商還選擇開設實體店鋪,以便更好地配合線上營銷策略

1.6. 亞馬遜成為史上以最快速度突破1,000億美元銷售大關的企業

2. 大資料與量化分析工具

2.1. 個人資料是指“與一個可確認身份的個體有關的所有資訊”

2.2. 量化分析工具,指的是可以處理並分析海量資訊的演算法模型

2.3. 大資料的特點可以用“4V理論”概括

2.3.1. 資料的規模(volume)

2.3.2. 資料收集、運用、傳播的速度(velocity)

2.3.3. 聚合資料的多樣性(variety)

2.3.4. 資料所蘊含的價值(value)

2.4. IBM“沃森”不僅震驚了世界,還彰顯了自己強大的深度學習能力

2.4.1. 利用計算機系統在機器學習、大規模並行計劃、語義處理等領域的非凡進展,“沃森”可以在反覆測試與反饋中最佳化自己的解題策略,並理解人類的自然語言

2.5. 由谷歌(Google)公司研發的DQN(即Deep Q Network)

2.5.1. “谷歌大腦”(Google Brain)

2.5.2. DQN需要在玩的過程中自學,找到取勝之道

2.5.3. DQN的演算法模型靈感取自人腦的中樞神經系統,並且可以在實踐的基礎上強化自身模擬神經網路的強度

2.6. 目前演算法已經可以做到理解並翻譯各種語言、識別影像、撰寫文章以及分析醫療資料

2.6.1. 股票交易市場,量化分析與大資料早已成為貢獻豐厚回報的利器

2.6.2. 機器學習技能的增進也需要大量資料的支撐

2.7. 如果簡單的演算法公式能夠獲取大量資料,那麼它的表現將最終超越那些掌握了很少資料的複雜演算法

2.7.1. 演算法學習能力的提升有賴於反覆測試

2.7.2. 大資料中資料的相關性也能在演算法的學習過程中提供輔助

3. 不完美資訊博弈

3.1. 人工智慧領域的另一項突破性進展體現在計算機系統在有限資訊條件下問題處理能力的提升

3.2. 早在20世紀末,計算機演算法就已經能夠在完美資訊博弈(perfect

information games)條件下處理各類問題

3.3. 直到2015年,人工智慧終於在不完美資訊博弈層面取得重要進展

3.4. 在撲克遊戲裡,由於牌面並不明朗,玩家無法掌握整個牌局的全部資訊

3.4.1. 導致求解撲克遊戲的複雜程度要遠比國際象棋高得多

3.4.2. 從統計學的意義上講,這種新型演算法計算出的出牌策略已經可以讓自己在一局雙人限注德州撲克遊戲中立於不敗之地

3.4.3. 在面對真實世界中的資訊不完全狀況時,計算機已展現出它可以進行“類人”式互動與決策的潛質

4. 雲端計算與物聯網

4.1. 隨著資料質量與廣度的提升,機器學習與大資料之間的正反饋迴路也將加速提擋

4.1.1. 實現這一目標的重要貢獻因素是雲端計算與物聯網(Internet of Things)

4.2. 谷歌和微軟同樣也在雲端計算服務中增添了擁有自學習能力的演算法模型,用來分析資料並預測客戶未來的銷售結果

4.2.1. 尤其是隨著資料規模的遞增,這種發揮預測功能模型的準確性也會提高

4.3. 物聯網實際上是網際網路的延伸與擴充,是將通訊感知工具植入日常物品的一項新興技術

4.3.1. 這項技術可以實現機器通訊(machine-to-machine communication),並且利用通訊感知工具收集資訊,分析這些資料

4.4. 在2015年,亞馬遜啟動了它的物聯網雲平臺(IoT

platform)

4.5. 眾多科技企業都在下大籌碼,抓緊佈局物聯網領域

4.5.1. 谷歌

4.5.2. 英特爾公司(Intel Corp)

4.5.3. 思科(Cisco Systems)

4.5.4. 三星電子(Samsung Electronics)

4.5.5. 主流電信商魏瑞森(Verizon)

4.5.6. 主流電信商沃達豐(Vodafone)

4.6. 物聯網的普及將為演算法的升級提供更豐富的資料

5. 未來發展趨勢

5.1. 人們已無法再忽視實時資料所能發揮的重要作用

5.1.1. 真實的世界與線上的虛擬環境正在發生融合

5.1.2. 從出生到死亡,數字化的個人資訊將記錄下我們成長的腳印與生活的痕跡

5.2. 一個顯著的趨勢是人們開始由在實體店消費轉變為網上購物,電子商務銷量在零售業總體規模中的佔比穩步提升

5.3. 當線上市場開始在商業活動中發揮越來越重要的作用時,另一個值得關注的趨勢就是大資料與量化分析為企業帶來的傲人競爭優勢

5.3.1. 為了在競爭中不至落敗,他們需要更好地理解資料背後的含義

5.4. 在這種資料驅動的商業模式下,為了換取寶貴的個人資料(用來協助廣告主投放線上行為定向廣告),企業願意向顧客提供免費服務

5.5. 伴隨著資料價值的提升,企業之間會為了爭取競爭優勢而競相收集各種資料,而它們在演算法領域的投入也將是一筆龐大的開支

5.6. 當企業開始競相採用人工智慧與定價演算法為商品定價時,演算法之間的競爭將主宰商品市價的走向

5.6.1. 線上與線下市場的定價邊界將變得模糊,甚至最終混為一談,不分彼此

5.7. 當整個行業都開始採用定價演算法,具備自學習能力的演算法將有效預測競爭對手演算法的行動,並對其做出回應

5.7.1. 利用動態的、差別化定價策略,商家同樣可以線上上交易平臺對市場進行分割

相關文章