10大Python資料科學原始碼教程
這裡提供您開始下一個資料科學專案所需的一切,包括資料集連結、教程以及如何最終將它們變成您自己的想法。
1.構建音樂推薦引擎
百萬歌曲資料集是一個龐大的當代音樂資料庫,包含一百萬首歌曲的音訊特徵和後設資料。使用 Python,您可以利用此資料集構建推薦引擎。
從 Ajinkya Khobragade的這個有用的教程開始,它向您展示瞭如何構建一個協作過濾推薦引擎。
使用百萬歌曲資料庫,你可以追求很多不同的推薦系統專案。一種可能的選擇是使用LightFM Python 實現來快速構建推薦引擎。
2. 使用 Python 檢測垃圾郵件
這是一個很棒的初學者 Python 資料科學專案,有大量的電子郵件資料集可供初學者垃圾郵件過濾專案使用。
最好的之一是Enron-Spam Corpus,其中包含 35,000 多條垃圾郵件和非垃圾郵件。
本教程深入介紹瞭如何使用 Python 和 Scikit-learn 構建垃圾郵件過濾器。
3. 使用 Python 進行房價預測
網上有大量的住房資料,你可以使用這些資料用 Python 做很多很酷的事情。這是來自聰明程式設計師 Aman Kharwal 的有用教程,它利用加州人口普查資料集來預測房價。
這是一個很棒的初學者 Python 資料科學專案。您可以使用加利福尼亞資料集,或將其切換為預測二手車和機票等價格。
4. 使用 Python 進行 NBA 分析
該專案分析從籃球參考中抓取的資料,以確定籃球中的 2 換 1 比賽是否真的提供了優勢。如果您對體育或 NBA 資料科學專案感興趣,一定要再看看這個專案。
看看GitHub 上的原始碼。您可以抓取和分析的體育統計資料確實無窮無盡。
5. 影評情感分析
如果您對 NLP 感興趣,可以嘗試許多情緒分析和文字分析專案。一個可靠的初學者到中級情緒分析專案可能涉及根據現有電影評論對情緒進行分類或預測。
一個有用的例子是使用這個包含50,000 多個 IMDB 電影評論的資料集(你也可以在這個Kaggle 筆記本中找到一些有用的提示)。
6. 用 Python 和 OpenCV 換臉
如果您想知道 Instagram 如何讓換臉變得如此簡單,請檢視這個計算機視覺專案。在 Pysource 上,Sergio Canu 建立了一個關於如何使用 Python 和 OpenCV構建面部交換應用程式的非常有用的教程。
這是一個可靠的中高階 CV 專案,也是使用 OpenCV 庫的絕佳實踐。本教程將引導您完成所有步驟(包括原始碼),例如位置對映。
CelebFaces資料集非常適合這樣的專案。
7. 用 Python 檢測假新聞
對如何使用 Python 檢測假新聞感興趣?檢視Manthan Bhikadiya 的 Medium 上的本教程,它將引導您完成整個過程
8. 從零開始構建聊天機器人
Python 是建立聊天機器人的有用工具。如果您想親自嘗試,請檢視此DataFlair 聊天機器人教程,其中介紹瞭如何使用自然語言工具包、Keras 和 Python。這是一個很好的教程,可以幫助您使用所有這三個工具,它包括所有原始碼。
9. 預測森林火災損失
對哪些條件會影響森林火災的嚴重程度感興趣?看看Kaggle 上的這個資料集,你可以用它來預測火災的燃燒面積。
然後,您進入迴歸或分類分析以進行預測。
10. 在 Craigslist 上尋找廉價住房
Craigslist 是查詢資料的最佳場所之一——從二手車價格到出租公寓。這個專案也來自 Jay,並模擬了從 Craigslist 上抓取的舊金山住房資料。
對於使用 Python 框架 Scrapy,這是一個特別有用的專案。請檢視此處的原始碼,以深入瞭解如何為您的專案自定義 Scrapy 實現。
相關文章
- Python 資料科學之 PandasPython資料科學
- 【Python資料科學】之NumpyPython資料科學
- 用 Python 入門資料科學Python資料科學
- 學Python需要學資料庫嗎?Python學習教程!Python資料庫
- Python資料科學(八)- 資料探索與資料視覺化Python資料科學視覺化
- 資料科學與Python(習題彙總)資料科學Python
- python應用資料科學的優勢Python資料科學
- 資料科學資料科學
- 《Python入門與資料科學庫》學習筆記Python資料科學筆記
- (資料科學學習手札159)使用ruff對Python程式碼進行自動美化資料科學Python
- Python學習教程:基本資料型別Python資料型別
- Python---資料科學領域常用的15個Python包Python資料科學
- Python機器學習 5個資料科學家案例解析Python機器學習資料科學
- 每週一書《Python資料科學手冊》分享!Python資料科學
- [譯] 鮮為人知的資料科學 Python 庫資料科學Python
- 資料科學大Battle,你站Python還是R資料科學BATPython
- 本週Github上資料科學Python有趣專案Github資料科學Python
- 盤點5個常用的Python資料科學庫!Python資料科學
- 【資料科學家】如何成為一名資料科學家?資料科學
- (資料科學學習手札163)ibis:極具潛力的Python資料分析框架資料科學Python框架
- (資料科學學習手札125)在Python中操縱json資料的最佳方式資料科學PythonJSON
- 資料科學、資料工程學習路線資料科學
- 通往資料科學之路資料科學
- 資料科學的原理與技巧 一、資料科學的生命週期資料科學
- 3 個用於資料科學的頂級 Python 庫資料科學Python
- 資料科學領域,你該選 Python 還是 R ?資料科學Python
- 在資料科學方面,python和R有何區別?資料科學Python
- 你與資料科學家只差這26條python技巧資料科學Python
- Python中非常有用的三個資料科學庫Python資料科學
- Python或將成資料科學家首選語言Python資料科學
- 資深專家分享:從numpy開啟Python資料科學之旅!Python資料科學
- Python資料分析相關面試題!Python學習教程Python面試題
- Python for Data Science(Python資料科學):您可能忘記的8個概念Python資料科學
- 資料科學家已死?AutoML使得資料科學更加普及化 - enterpriseai資料科學TOMLAI
- (資料科學學習手札91)在Python中妥善使用進度條資料科學Python
- (資料科學學習手札94)QGIS+Conda+jupyter玩轉Python GIS資料科學Python
- (資料科學學習手札137)orjson:Python中最好用的json庫資料科學JSONPython
- Python學習教程之基本資料型別字串Python資料型別字串