詳解清除MongoDB所佔用的多餘的磁碟空間的方法

chenfeng發表於2017-03-22
首先一點就是mongodb 不會釋放已經佔用的硬碟空間,即使drop collection也不行,除非drop database。如果一個db曾經有大量的資料一段時間後又刪除的話,硬碟空間就是一個問題,如何收回被mongdodb佔用的多餘空間?方法有兩種:

1. dump & restore

mongodump -d databasename -o /path/to/dump_dir
echo 'db.dropDatabase()' | mongo
mongorestore -d /path/to/dump_dir
如果資料量不大,dump不需要太長時間的情況下,或者經常備份有dump檔案的情況下,這種方法很簡單。


2. repair database

即在mongo shell中執行db.repairDatabase(), 或者
db.runCommand({ repairDatabase: 1 })
, 第二種方法可以帶其他幾個引數

{ repairDatabase: 1,
 preserveClonedFilesOnFailure: ,
 backupOriginalFiles: }
repairDatabase是官方文件中認為唯一可以回收硬碟空間的方法。

repairDatabase is the appropriate and the only way to reclaim disk space.

當你有多個shard的且資料量巨大時,dump & restore方法會花費巨大的時間,這時第二種方法的優勢就很明顯,就是分別在每個shard上執行repairDatabase,結果會快很多。

PS:格式化mongo shell的輸出


如果資料量大的情況下,mongo shell 預設的輸出很亂,幾乎沒法閱讀。我們可以用.pretty() 來解決這樣的問題:


db.collection.find().pretty()
這樣的輸出會漂亮很多,每個field一行,


{
 "_id" : ObjectId("5396cd3823e97923ba689ef3"),
 "batch" : 66,
 "category" : 4,
 "cover_imgs" : [
 "/post_imgs/5396cd3823e97923ba689ef3/c_2.jpg",
 "/post_imgs/5396cd3823e97923ba689ef3/c_3.jpg",
 "/post_imgs/5396cd3823e97923ba689ef3/c_4.jpg"
 ],
 "created_at" : ISODate("2014-06-10T09:18:06.383Z"),
 "fav_count" : 0,
 "host_reply_count" : 338,
 "last_reply_date" : "2014-06-17 21:22:00",
 "post_date" : "2014-06-06 19:57:00",
 "referer" : "%B9%C5%D7%B0%B5%E7%CA%D3%BE%E7",
 "reply_count" : 716,
 "reuse_type" : 2,
 "section" : "古裝電視劇",
 "seq" : 27180,
 "serial" : false,
 "sort_index" : 0.997,
 "source_site" : "貼吧",
 "updated_at" : ISODate("2014-06-18T09:04:55.228Z"),
 "visible" : true
}
{
 "_id" : ObjectId("5396c7ca23e97921fb7de8e4"),
 "batch" : 74,
 "category" : 4,
}
配置使其成為Default:

新增如下配置到$HOME/.mongorc.js, 如果不存在則建立。

DBQuery.prototype._prettyShell = true
這樣就不需要每次使用pretty()方法了,直接db.collection.find()即可。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15498/viewspace-2135801/,如需轉載,請註明出處,否則將追究法律責任。

相關文章