機器學習專案 - 使用 Apache Spark 建立電影推薦引擎

banq發表於2021-12-24

在這個專案中，我們將為每個使用者生成前 10 名電影推薦，併為每部電影生成前 10 名使用者推薦。
無論年齡、性別、種族、膚色或地理位置如何，每個人都喜歡電影。推薦系統是一個過濾程式，其主要目標是預測使用者對特定領域專案或專案的“評級”或“偏好”。推薦系統包含一類可以向使用者建議“相關”專案的技術和演算法。他們透過多種技術根據過去的資料預測未來的行為。

屬性資訊或資料集詳細資訊：

使用者身份
電影ID
評分
時間戳

使用的技術

Apache Spark
Spark SQL
Apache Spark MLLib
Scala
DataFrame-based API
Databricks Notebook

使用 Apache Spark 機器學習建立電影推薦引擎的專案，使用 Databricks 平臺社群版伺服器，它允許您執行您的 Spark 程式碼，只需透過電子郵件 ID 註冊即可在他們的伺服器上免費執行。
在這個專案中，我們探索了 Databricks 平臺上的 Apache Spark 和機器學習。
我們將看看如何設定 Spark Cluster 並開始使用它。然後我們將看看我們如何使用 Spark Cluster 來獲取進入 Spark Cluster 的資料，這是一個使用機器學習模型處理資料的過程，並以預測的形式生成某種輸出。這幾乎就是我們將要了解的有關預測模型的內容。
在這個專案中，我們將建立電影推薦引擎，該引擎將為每個使用者生成前 10 名電影推薦，併為每部電影生成前 10 名使用者推薦。
我們將學習：

準備處理資料。
本課程介紹 Apache Spark 中的資料流、載入資料和處理資料的基礎知識，向您展示 Apache Spark 如何非常適合機器學習工作。
透過註冊免費社群版伺服器來學習 Databricks notebook 的基礎知識
定義機器學習管道
訓練機器學習模型
測試機器學習模型
評估機器學習模型（即檢查預測值和實際值）
目標是為您提供實用的工具，這些工具將在未來對您有益。這樣做時，您將開發一個具有實際使用機會的模型。

詳細點選標題

spark機器學習：使用ALS完成商品推薦
2024-11-28
Spark機器學習
推薦 | 機器學習開源專案 Top 10
2019-02-21
機器學習
在 Apache Spark 中使用機器學習進行客戶細分
2021-12-23
ApacheSpark機器學習
如何建立複雜的機器學習專案？
2019-02-10
機器學習
機器學習必看書籍推薦
2020-12-03
機器學習
【大資料 Spark】利用電影觀看記錄資料,進行電影推薦
2020-05-10
大資料Spark
機器學習/深度學習書單推薦及學習方法
2018-04-12
機器學習深度學習
Spark機器學習實戰 (十一) - 文字情感分類專案實戰
2019-04-19
Spark機器學習
Spotify 每週推薦功能：基於機器學習的音樂推薦
2019-02-27
機器學習
用Spark學習矩陣分解推薦演算法
2018-09-30
Spark矩陣演算法
快速學習丨使用Azure DevOps建立專案
2022-01-20
dev
推薦閱讀《21個專案玩轉深度學習》
2019-12-17
深度學習
電影推薦－萬箭穿心
2018-05-20
機器學習知識體系 (強烈推薦)
2018-06-14
機器學習
【推薦】最常用的Python機器學習及深度學習庫合集！
2022-11-23
Python機器學習深度學習
10 個機器學習教程彙總，愛可可推薦！
2019-10-08
機器學習
機器學習完整資源推薦（持續更新中）
2020-12-13
機器學習
奈飛使用機器學習建立媒體
2022-11-15
機器學習
做機器學習專案的checklist
2020-01-21
機器學習
[譯] 機器學習專案清單
2019-02-18
機器學習
黑科技：使用AI和機器學習將Android專案秒變IOS專案
2019-11-12
AI機器學習AndroidiOS
業務專案管理軟體使用推薦
2023-04-12
專案管理
推薦一些值得學習的開源專案和框架
2024-11-21
框架
機器學習和資料科學領域，推薦幾本學習書單
2019-03-23
機器學習資料科學
吳恩達機器學習筆記 —— 17 推薦系統
2018-08-01
吳恩達機器學習筆記
metarank: 推薦排名類的低程式碼機器學習工具
2022-04-01
機器學習
開源專案推薦 - 巨鯨任務排程平臺（Spark、Flink）
2020-07-26
Spark
舉兩個栗子：如何正確建立個人的機器學習專案集
2018-12-13
機器學習
【好書推薦】推薦一份從入門到進階的機器學習書單
2021-03-27
機器學習
Apache頂級開源專案——機器學習庫MADlib簡介與應用例項
2018-04-19
Apache機器學習
【乾貨分享】嵌入式學習路線公開！（書籍推薦+視訊推薦+練手專案）
2021-10-21
機器學習 | 基於機器學習的推薦系統客戶購買可能性預測分析
2020-12-07
機器學習
機器學習專案經歷的若干感想
2021-07-05
機器學習
專案管理軟體推薦
2023-04-18
專案管理
Bootstrap相關專案推薦
2018-03-28
boot
『學習資料推薦』撩課學院最新WEB前端全程專案驅動教程
2019-01-14
Web前端
Office Depot使用Apache Spark和Analytics Zoo上的分散式Keras實現實時產品推薦
2019-09-03
ApacheSpark分散式Keras
學習Django的推薦
2021-06-12
Django

機器學習專案 - 使用 Apache Spark 建立電影推薦引擎

相關文章