10大Python資料科學原始碼教程

banq發表於2022-03-30

這裡提供您開始下一個資料科學專案所需的一切,包括資料集連結、教程以及如何最終將它們變成您自己的想法。
 
1.構建音樂推薦引擎

百萬歌曲資料集是一個龐大的當代音樂資料庫,包含一百萬首歌曲的音訊特徵和後設資料。使用 Python,您可以利用此資料集構建推薦引擎。

從 Ajinkya Khobragade的這個有用的教程開始,它向您展示瞭如何構建一個協作過濾推薦引擎。
使用百萬歌曲資料庫,你可以追求很多不同的推薦系統專案。一種可能的選擇是使用LightFM Python 實現來快速構建推薦引擎。
 
2. 使用 Python 檢測垃圾郵件
這是一個很棒的初學者 Python 資料科學專案,有大量的電子郵件資料集可供初學者垃圾郵件過濾專案使用。
最好的之一是Enron-Spam Corpus,其中包含 35,000 多條垃圾郵件和非垃圾郵件。
教程深入介紹瞭如何使用 Python 和 Scikit-learn 構建垃圾郵件過濾器。
  
3. 使用 Python 進行房價預測
網上有大量的住房資料,你可以使用這些資料用 Python 做很多很酷的事情。這是來自聰明程式設計師 Aman Kharwal 的有用教程,它利用加州人口普查資料集來預測房價。
這是一個很棒的初學者 Python 資料科學專案。您可以使用加利福尼亞資料集,或將其切換為預測二手車和機票等價格。
 
4. 使用 Python 進行 NBA 分析
專案分析從籃球參考中抓取的資料,以確定籃球中的 2 換 1 比賽是否真的提供了優勢。如果您對體育或 NBA 資料科學專案感興趣,一定要再看看這個專案。
看看GitHub 上的原始碼。您可以抓取和分析的體育統計資料確實無窮無盡。
 
5. 影評情感分析
 如果您對 NLP 感興趣,可以嘗試許多情緒分析和文字分析專案。一個可靠的初學者到中級情緒分析專案可能涉及根據現有電影評論對情緒進行分類或預測。
一個有用的例子是使用這個包含50,000 多個 IMDB 電影評論的資料集(你也可以在這個Kaggle 筆記本中找到一些有用的提示)。
 
6. 用 Python 和 OpenCV 換臉
如果您想知道 Instagram 如何讓換臉變得如此簡單,請檢視這個計算機視覺專案。在 Pysource 上,Sergio Canu 建立了一個關於如何使用 Python 和 OpenCV構建面部交換應用程式的非常有用的教程。
這是一個可靠的中高階 CV 專案,也是使用 OpenCV 庫的絕佳實踐。本教程將引導您完成所有步驟(包括原始碼),例如位置對映。
 CelebFaces資料集非常適合這樣的專案。
 
7. 用 Python 檢測假新聞
對如何使用 Python 檢測假新聞感興趣?檢視Manthan Bhikadiya 的 Medium 上的本教程,它將引導您完成整個過程
 
8. 從零開始構建聊天機器人
Python 是建立聊天機器人的有用工具。如果您想親自嘗試,請檢視此DataFlair 聊天機器人教程,其中介紹瞭如何使用自然語言工具包、Keras 和 Python。這是一個很好的教程,可以幫助您使用所有這三個工具,它包括所有原始碼。
 
9. 預測森林火災損失
對哪些條件會影響森林火災的嚴重程度感興趣?看看Kaggle 上的這個資料集,你可以用它來預測火災的燃燒面積。
然後,您進入迴歸或分類分析以進行預測。
 
10. 在 Craigslist 上尋找廉價住房
Craigslist 是查詢資料的最佳場所之一——從二手車價格到出租公寓。這個專案也來自 Jay,並模擬了從 Craigslist 上抓取的舊金山住房資料。
對於使用 Python 框架 Scrapy,這是一個特別有用的專案。請檢視此處的原始碼,以深入瞭解如何為您的專案自定義 Scrapy 實現。

 

相關文章