機器學習專案 - 使用 Apache Spark 建立電影推薦引擎
在這個專案中,我們將為每個使用者生成前 10 名電影推薦,併為每部電影生成前 10 名使用者推薦。
無論年齡、性別、種族、膚色或地理位置如何,每個人都喜歡電影。推薦系統是一個過濾程式,其主要目標是預測使用者對特定領域專案或專案的“評級”或“偏好”。推薦系統包含一類可以向使用者建議“相關”專案的技術和演算法。他們透過多種技術根據過去的資料預測未來的行為。
屬性資訊或資料集詳細資訊:
- 使用者身份
- 電影ID
- 評分
- 時間戳
使用的技術
- Apache Spark
- Spark SQL
- Apache Spark MLLib
- Scala
- DataFrame-based API
- Databricks Notebook
使用 Apache Spark 機器學習建立電影推薦引擎的專案,使用 Databricks 平臺社群版伺服器,它允許您執行您的 Spark 程式碼,只需透過電子郵件 ID 註冊即可在他們的伺服器上免費執行。
在這個專案中,我們探索了 Databricks 平臺上的 Apache Spark 和機器學習。
我們將看看如何設定 Spark Cluster 並開始使用它。然後我們將看看我們如何使用 Spark Cluster 來獲取進入 Spark Cluster 的資料,這是一個使用機器學習模型處理資料的過程,並以預測的形式生成某種輸出。這幾乎就是我們將要了解的有關預測模型的內容。
在這個專案中,我們將建立電影推薦引擎,該引擎將為每個使用者生成前 10 名電影推薦,併為每部電影生成前 10 名使用者推薦。
我們將學習:
- 準備處理資料。
- 本課程介紹 Apache Spark 中的資料流、載入資料和處理資料的基礎知識,向您展示 Apache Spark 如何非常適合機器學習工作。
- 透過註冊免費社群版伺服器來學習 Databricks notebook 的基礎知識
- 定義機器學習管道
- 訓練機器學習模型
- 測試機器學習模型
- 評估機器學習模型(即檢查預測值和實際值)
- 目標是為您提供實用的工具,這些工具將在未來對您有益。這樣做時,您將開發一個具有實際使用機會的模型。
詳細點選標題
相關文章
- spark機器學習:使用ALS完成商品推薦Spark機器學習
- 推薦 | 機器學習開源專案 Top 10機器學習
- 在 Apache Spark 中使用機器學習進行客戶細分ApacheSpark機器學習
- 如何建立複雜的機器學習專案?機器學習
- 機器學習必看書籍推薦機器學習
- 【大資料 Spark】利用電影觀看記錄資料,進行電影推薦大資料Spark
- 機器學習/深度學習書單推薦及學習方法機器學習深度學習
- Spark機器學習實戰 (十一) - 文字情感分類專案實戰Spark機器學習
- Spotify 每週推薦功能:基於機器學習的音樂推薦機器學習
- 用Spark學習矩陣分解推薦演算法Spark矩陣演算法
- 快速學習丨使用Azure DevOps建立專案dev
- 推薦閱讀《21個專案玩轉深度學習》深度學習
- 電影推薦-萬箭穿心
- 機器學習知識體系 (強烈推薦)機器學習
- 【推薦】最常用的Python機器學習及深度學習庫合集!Python機器學習深度學習
- 10 個機器學習教程彙總,愛可可推薦!機器學習
- 機器學習完整資源推薦(持續更新中)機器學習
- 奈飛使用機器學習建立媒體機器學習
- 做機器學習專案的checklist機器學習
- [譯] 機器學習專案清單機器學習
- 黑科技:使用AI和機器學習將Android專案秒變IOS專案AI機器學習AndroidiOS
- 推薦一些值得學習的開源專案和框架框架
- 業務專案管理軟體使用推薦專案管理
- 機器學習和資料科學領域,推薦幾本學習書單機器學習資料科學
- metarank: 推薦排名類的低程式碼機器學習工具機器學習
- 吳恩達機器學習筆記 —— 17 推薦系統吳恩達機器學習筆記
- 開源專案推薦 - 巨鯨任務排程平臺(Spark、Flink)Spark
- 舉兩個栗子:如何正確建立個人的機器學習專案集機器學習
- 【好書推薦】推薦一份從入門到進階的機器學習書單機器學習
- Apache頂級開源專案——機器學習庫MADlib簡介與應用例項Apache機器學習
- 【乾貨分享】嵌入式學習路線公開!(書籍推薦+視訊推薦+練手專案)
- 機器學習 | 基於機器學習的推薦系統客戶購買可能性預測分析機器學習
- 機器學習專案經歷的若干感想機器學習
- 專案管理軟體推薦專案管理
- Bootstrap相關專案推薦boot
- 『學習資料推薦』撩課學院最新WEB前端全程專案驅動教程Web前端
- 學習Django的推薦Django
- Office Depot使用Apache Spark和Analytics Zoo上的分散式Keras實現實時產品推薦ApacheSpark分散式Keras