再也不用線上倒資料了，使用 Faker 來造一批假的資料吧。

weixin_34037977發表於2018-01-29

背景
每當建表之後，常常需要寫一批假的資料，用於測試演算法、資料量的壓力測試、列表翻頁、

檢視詳情、資料關聯等。這時就需要藉助一款造資料的工具，它就是今天所要介紹的 Faker。

介紹

Faker 這個工具不限於語言、它支援：Python、Java、Ruby、PHP、NodeJS 等等。其目

的是通過這個庫，會生成一批假的資料。

如：倉庫組經常需要一批資料來測試某個演算法。業務組經常需要一批資料，讓其他人知道這

個介面是否可用。某個欄位應展示什麼型別等等。

今天我會以 Python 版本的 Faker 為例，來介紹這個工具的用處。

場景案例
假設已經有一個商品表，其欄位如下：

我需要生成 1W 條這樣的資料，用於統計我每個使用者建立了多少個商品。

# !/bin/bash python
# Author wubaiqing <wubaiqing@vip.qq.com>

from faker import Faker

fake = Faker('zh_CN')

goodsList = []

# 生成 1W 條資料
for _ in range(0, 10000):
    goodsList.append({
        'goods_id': fake.pyint(), # * 看場景（自增ID通常不需要設定）
        'title': fake.sentence(20), # 隨機生成20個漢字
        'index_image_url': fake.image_url(400, 400), # 生成 400x400 的圖片（通常可以訪問）
        'created_at': fake.past_date('-1d').isoformat(), # 生成一個時間
        'is_delete': fake.boolean(), # 隨機生成一個 Boolean 型別
        'created_user_id': fake.pyint() # 隨機生成一個數字
    })

print 'list length : %d' % len(goodsList)

以下是常用函式，詳細可以看 Faker 手冊：
1. sentence 隨機生成字串，根據語言型別可生成漢字。
2. image_url 隨機生成一張指定的圖片，大多數情況可以訪問。
3. boolean 隨機生成一個 Boolean 型別。

生成完的商品，批量匯出 Excel 或批量入庫即可。這時就有了大
量的資料可供我們使用。

參考連結
1. Python Faker：https://github.com/joke2k/faker
2. Python Faker 手冊：https://faker.readthedocs.io/en/master/locales/zh_CN.html#faker-providers-address
3. PHP Faker：https://github.com/fzaninotto/Faker
4. Ruby Faker：https://github.com/stympy/faker

再也不用擔心蘋果資料誤刪了
2020-09-09
蘋果
自動造資料利器，Faker 瞭解一下？
2021-12-21
Faker資料填充
2021-04-29
10個實用的資料分析模型，學會思路再也不用啃書了
2021-02-19
模型
如何使用 Faker.js 來 Mock Node.js 應用資料
2019-02-26
MockNode.js
faker 資料填充常用指令收集
2020-03-18
資料庫外來鍵,用是不用?
2009-08-16
資料庫
別扯資料化轉型了，先夯實資料底座吧
2022-11-10
Python模擬資料生成庫Faker
2024-05-17
Python
深度學習哪家強？用資料來一較高下吧
2019-02-22
深度學習
使用NLP和ML來提取和構造Web資料
2020-10-29
Web
造資料
2024-08-03
struts連線上了資料庫了，但是，怎麼來操作呢？
2003-09-08
資料庫
轉向線上儀表板——資料分析的“元宇宙”時代來了
2022-01-27
元宇宙
為什麼有時Oracle資料庫不用索引來查詢資料？(轉)
2007-08-13
Oracle資料庫索引
牛吧-大資料
2015-05-22
大資料
面試大資料再也不怕沒專案可說了
2021-08-16
面試大資料
使用AI最佳化慢SQL，再也不用求助DBA了
2023-04-25
AISQL
MySQL8.0:倒序索引資料的資料排列方式
2018-12-27
MySql索引
Python中Faker庫介紹及如何使用創造模擬資料
2020-10-22
Python
“線上教育”來了！——隨時都是學習的好時候–資料資訊圖
2013-06-03
faker生成器生成虛擬資料的Python模組
2020-07-18
Python
造資料難,刪除資料容易
2008-03-19
使用ONE.Abp快速開發微服務，再也不用加班了
2023-05-18
微服務
Toapi - 再也不愁沒有資料!
2017-12-26
API
再也不用擔心網頁編碼的坑了！
2019-02-16
網頁
刪庫了不用跑路！binlog恢復資料實操
2024-08-07
Golang 開源庫分享：faker - 隨機生成有趣的假資料！
2024-11-01
Golang隨機
ES資料沒了？誰動了我的資料？
2023-05-12
Activity不用註冊？那就來Hook吧
2019-03-19
Hook
android 開源資料層框架。解放資料吧。
2017-09-28
Android框架
翻出來了老東西了 , oracle 資料庫解析 extent 資料結構解析
2015-09-01
Oracle資料庫資料結構
GoFakeIt—造資料神器
2024-10-15
Go
使用Flashback Transaction方法來恢復資料表資料
2015-06-25
再也不用擔心 SSH 斷開了 - tmux 命令
2020-11-02
UX
智慧打底褲：再也不用擔心尺碼了
2015-12-28
使用spm繫結執行計劃來線上優化資料庫
2016-07-04
優化資料庫
React效能分析利器來了，媽媽再也不用擔心我的React應用慢了
2019-03-04
React

再也不用線上倒資料了，使用 Faker 來造一批假的資料吧。

相關文章