什麼是MongoDB?Python爬蟲為什麼使用MongoDB?

老男孩IT教育機構發表於2021-05-08


  想必大家都知道,在從事網路爬蟲工作之前,我們需要掌握很多知識,除了基本的爬蟲原理之外,我們還需要學習框架、資料庫等,其中就包含MongoDB。那麼Python爬蟲為什麼使用MongoDB呢?我們一起來看看吧。

  Python爬蟲為什麼使用MongoDB呢?

  1. 文件結構的儲存方式:簡單講就是可以直接存Json、list;

  2. 不要事先定義表,隨時可以建立;

  3. 表中的資料長度可以不一樣。

  比如說:你的第一條記錄有10個值,第二條記錄就不要規定10個值了,對爬蟲很亂的資料來講,這樣是非常適用的。

  什麼是MongoDB呢?

  MongoDB是一個基於分散式檔案儲存 的資料庫。由C++語言編寫。旨在為WEB應用提供可擴充套件的高效能資料儲存解決方案。

  MongoDB是一個介於關聯式資料庫和非關聯式資料庫之間的產品,是非關聯式資料庫中的功能最豐富,最像關聯式資料庫的。它支援的資料結構非常鬆散,是類似json的bson格式,因此可以儲存比較複雜的資料型別。Mongo最大的特點是它支援的查詢語言非常強大,其語法有點類似於物件導向的查詢語言,幾乎可以實現類似關聯式資料庫單表查詢的絕大部分功能,而且還支援對資料建立索引。

  MongoDB有什麼功能呢?

  它的特點是高效能、易部署、易使用,儲存資料非常方便,主要功能特性有:

  面向集合儲存,易儲存物件型別的資料;

  模式自由、支援動態查詢、支援完全索引,包含內部物件;

  支援查詢、支援複製和故障恢復;

  使用高效的二進位制資料儲存,包含大型物件;

  自動處理碎片,以支援雲端計算層次的擴充套件性;

  支援GOlang、Ruby、Python、Java、C++、PHP、C#等多種語言;

  支援儲存格式為BSON,一般json的擴充套件;

  可透過網路訪問。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2771319/,如需轉載,請註明出處,否則將追究法律責任。

相關文章