10大Python資料科學原始碼教程
這裡提供您開始下一個資料科學專案所需的一切,包括資料集連結、教程以及如何最終將它們變成您自己的想法。
1.構建音樂推薦引擎
百萬歌曲資料集是一個龐大的當代音樂資料庫,包含一百萬首歌曲的音訊特徵和後設資料。使用 Python,您可以利用此資料集構建推薦引擎。
從 Ajinkya Khobragade的這個有用的教程開始,它向您展示瞭如何構建一個協作過濾推薦引擎。
使用百萬歌曲資料庫,你可以追求很多不同的推薦系統專案。一種可能的選擇是使用LightFM Python 實現來快速構建推薦引擎。
2. 使用 Python 檢測垃圾郵件
這是一個很棒的初學者 Python 資料科學專案,有大量的電子郵件資料集可供初學者垃圾郵件過濾專案使用。
最好的之一是Enron-Spam Corpus,其中包含 35,000 多條垃圾郵件和非垃圾郵件。
本教程深入介紹瞭如何使用 Python 和 Scikit-learn 構建垃圾郵件過濾器。
3. 使用 Python 進行房價預測
網上有大量的住房資料,你可以使用這些資料用 Python 做很多很酷的事情。這是來自聰明程式設計師 Aman Kharwal 的有用教程,它利用加州人口普查資料集來預測房價。
這是一個很棒的初學者 Python 資料科學專案。您可以使用加利福尼亞資料集,或將其切換為預測二手車和機票等價格。
4. 使用 Python 進行 NBA 分析
該專案分析從籃球參考中抓取的資料,以確定籃球中的 2 換 1 比賽是否真的提供了優勢。如果您對體育或 NBA 資料科學專案感興趣,一定要再看看這個專案。
看看GitHub 上的原始碼。您可以抓取和分析的體育統計資料確實無窮無盡。
5. 影評情感分析
如果您對 NLP 感興趣,可以嘗試許多情緒分析和文字分析專案。一個可靠的初學者到中級情緒分析專案可能涉及根據現有電影評論對情緒進行分類或預測。
一個有用的例子是使用這個包含50,000 多個 IMDB 電影評論的資料集(你也可以在這個Kaggle 筆記本中找到一些有用的提示)。
6. 用 Python 和 OpenCV 換臉
如果您想知道 Instagram 如何讓換臉變得如此簡單,請檢視這個計算機視覺專案。在 Pysource 上,Sergio Canu 建立了一個關於如何使用 Python 和 OpenCV構建面部交換應用程式的非常有用的教程。
這是一個可靠的中高階 CV 專案,也是使用 OpenCV 庫的絕佳實踐。本教程將引導您完成所有步驟(包括原始碼),例如位置對映。
CelebFaces資料集非常適合這樣的專案。
7. 用 Python 檢測假新聞
對如何使用 Python 檢測假新聞感興趣?檢視Manthan Bhikadiya 的 Medium 上的本教程,它將引導您完成整個過程
8. 從零開始構建聊天機器人
Python 是建立聊天機器人的有用工具。如果您想親自嘗試,請檢視此DataFlair 聊天機器人教程,其中介紹瞭如何使用自然語言工具包、Keras 和 Python。這是一個很好的教程,可以幫助您使用所有這三個工具,它包括所有原始碼。
9. 預測森林火災損失
對哪些條件會影響森林火災的嚴重程度感興趣?看看Kaggle 上的這個資料集,你可以用它來預測火災的燃燒面積。
然後,您進入迴歸或分類分析以進行預測。
10. 在 Craigslist 上尋找廉價住房
Craigslist 是查詢資料的最佳場所之一——從二手車價格到出租公寓。這個專案也來自 Jay,並模擬了從 Craigslist 上抓取的舊金山住房資料。
對於使用 Python 框架 Scrapy,這是一個特別有用的專案。請檢視此處的原始碼,以深入瞭解如何為您的專案自定義 Scrapy 實現。
相關文章
- Python資料科學(三) python與資料科學應用(Ⅲ)Python資料科學
- Python資料科學(二) python與資料科學應用(Ⅱ)Python資料科學
- Python資料科學(一) python與資料科學應用(Ⅰ)Python資料科學
- 大資料與生命科學大資料
- Python資料科學(七) 資料清理(Ⅱ)Python資料科學
- Python資料科學(六) 資料清理(Ⅰ)Python資料科學
- 資料科學大Battle,你站Python還是R資料科學BATPython
- Python 資料科學之 PandasPython資料科學
- 【Python資料科學】之NumpyPython資料科學
- Python 資料科學入門Python資料科學
- Python資料科學(四) 資料收集系列Python資料科學
- 用 Python 入門資料科學Python資料科學
- 讓科學重回資料科學資料科學
- 大資料到底怎麼學:資料科學概論與大資料學習誤區大資料資料科學
- 資料科學資料科學
- 大資料:商業革命與科學革命大資料
- 人的資料科學與機器資料科學資料科學
- 學習資料科學的五大免費資源資料科學
- 女生適合學Python還是大資料?Python基礎教程!Python大資料
- Python資料科學(八)- 資料探索與資料視覺化Python資料科學視覺化
- Python資料科學(五) 資料處理和資料採集Python資料科學
- 科學研究與大資料概念的濫用大資料
- python應用資料科學的優勢Python資料科學
- 【Python學習教程】Python六大資料型別,你知道嗎?Python大資料資料型別
- 資料科學的歷史,從洞穴壁畫到大資料資料科學大資料
- 資料科學家和大資料技術人員工具包資料科學大資料
- 學Python需要學資料庫嗎?Python學習教程!Python資料庫
- 2018年,20大Python資料科學庫都做了哪些更新?Python資料科學
- 《Python入門與資料科學庫》學習筆記Python資料科學筆記
- Python機器學習 5個資料科學家案例解析Python機器學習資料科學
- 【資料科學家】如何成為一名資料科學家?資料科學
- 有前途的人工智慧大資料分析相關職業:Python資料科學入門之路人工智慧大資料Python資料科學
- 通往資料科學之路資料科學
- 資料科學、資料工程學習路線資料科學
- 資料科學入門 (一) —— 資料資料科學
- 【網路資料與科學】大資料時代:領航未來 大資料四大趨勢凸顯大資料
- 能源和公用事業領域的 10 大資料科學用例 - KDnuggets大資料資料科學
- 資料科學的原理與技巧 一、資料科學的生命週期資料科學