Datafaker是用於生成類似生產資料的工具 – jworks.io

banq 發表於 2022-01-15

當需要真實的測試資料時,Datafaker 是一個很棒的庫。例如,單元測試就是一個很好的例子,或者填充資料庫表,或者生成 CSV 檔案。使用 Datafaker,生成真實的資料(例如信用卡號碼、電話號碼)以及醫療資料(例如 ICD-10-CM 和 ICD-10-PCS 資料)非常簡單。

生成資料作為匿名生產資料的替代方法,有一些好處。生成資料的最大好處之一是資料永遠不會導致 PII(個人身份資訊)和 PHI(受保護的健康資訊)問題,因為資料是假的,並且不包含真實的患者、病歷編號或其他識別資訊。

另一個巨大的好處是很容易生成幾乎無限的資料集。雖然有時很難獲得大量匿名生產資料,但使用 Datafaker 可以輕鬆完成生成一百萬或更多 PII/PHI 記錄。

最後一個值得注意的特性是生成的資料可以本地化。因此,例如,當您需要美國電話號碼和法國電話號碼時,Datafaker 可以通過傳入所需語言或國家/地區的語言環境輕鬆生成這些號碼,並且資料將被相應地格式化。

使用 Datafaker 非常簡單。它可以通過在 或 中宣告依賴關係從 Maven 或 Gradle 中pom.xml使用build.gradle。一個例子可以在下面看到:

<dependency>
    <groupId>net.datafaker</groupId>
    <artifactId>datafaker</artifactId>
    <version>1.0.0</version>
</dependency>

匯入庫後,您可以使用 Datafaker 通過以下方式生成假資料:

import net.datafaker.Faker;

Faker faker = new Faker();

String name = faker.name().fullName(); // Miss Samanta Schmidt
String firstName = faker.name().firstName(); // Emory
String lastName = faker.name().lastName(); // Barton

String streetAddress = faker.address().streetAddress(); // 60018 Sawayn Brooks Suite 449