使用過Python語言的朋友們可能使用過forgery_py,它是一個偽造資料的工具。能偽造一些常用的資料。在我們開發過程和效果展示是十分有用。但是沒有Go語言版本的,所以就動手摺騰吧。
從原始碼入手
在forgery_py的PyPi有一段的例項程式碼:
>>> import forgery_py
>>> forgery_py.address.street_address()
u`4358 Shopko Junction`
>>> forgery_py.basic.hex_color()
`3F0A59`
>>> forgery_py.currency.description()
u`Slovenia Tolars`
>>> forgery_py.date.date()
datetime.date(2012, 7, 27)
>>> forgery_py.internet.email_address()
u`brian@zazio.mil`
>>> forgery_py.lorem_ipsum.title()
u`Pretium nam rhoncus ultrices!`
>>> forgery_py.name.full_name()
u`Mary Peters`
>>> forgery_py.personal.language()
u`Hungarian`
從以上的方法呼叫我們可以看出forgery_py下有一系列的*.py檔案,裡面有各種方法,實現各種功能,我們在來通過分析下Python版本的forgery_py的原始碼來看看它的實現原理。
# ForgeryPy 包的一級目錄
├── dictionaries # 偽造內容和來源目錄,目錄下存放的都是一些文字檔案
├── dictionaries_loader.py # 載入檔案指令碼
├── forgery # 主目錄,實現各種資料偽造功能,目錄下存放的都是python檔案
├── __init__.py
我們在來看下forgery目錄下的指令碼
$ cat name.py
import random
from ..dictionaries_loader import get_dictionary
__all__ = [
`first_name`, `last_name`, `full_name`, `male_first_name`,
`female_first_name`, `company_name`, `job_title`, `job_title_suffix`,
`title`, `suffix`, `location`, `industry`
]
def first_name():
"""Random male of female first name."""
_dict = get_dictionary(`male_first_names`)
_dict += get_dictionary(`female_first_names`)
return random.choice(_dict).strip()
__all__
設定能被呼叫的方法。first_name()
方法是forgery_py中一個典型偽造資料方法,我們只要來分析它就可以知道forgery_py的工作原理了。
這個方法程式碼很少,能容易就看出_dict = get_dictionary(`male_first_names`)
和_dict += get_dictionary(`female_first_names`)
獲取的資料合併,在最後的return random.choice(_dict).strip()
返回隨機的資料。它的重點在於get_dictionary()
,所以我們需要來看它的所在位置dictionaries_loader.py檔案。
$ cat dictionaries_loader
import random
DICTIONARIES_PATH = abspath(join(dirname(__file__), `dictionaries`))
dictionaries_cache = {}
def get_dictionary(dict_name):
"""
Load a dictionary file ``dict_name`` (if it`s not cached) and return its
contents as an array of strings.
"""
global dictionaries_cache
if dict_name not in dictionaries_cache:
try:
dictionary_file = codecs.open(
join(DICTIONARIES_PATH, dict_name), `r`, `utf-8`
)
except IOError:
None
else:
dictionaries_cache[dict_name] = dictionary_file.readlines()
dictionary_file.close()
return dictionaries_cache[dict_name]
以上就是dictionaries_loader.py檔案去掉註釋後的所以要內容。它的主要實現就是:定義一個全域性的字典引數dictionaries_cache
作為快取,然後定義方法get_dictionary()
獲取源資料,get_dictionary()
中每次forgery目錄底下方法呼叫時先檢視快取,快取字典中存在資料就直接輸出,不存在就讀取dictionaries底下的對應檔案,並存入快取。最後是返回資料。
總的來說forgery_py的原理就是:一個方法呼叫,去讀記憶體中的快取,存在就直接返回,不存在就到對應的文字檔案中讀取並寫入快取並返回。返回來的資料再隨機選取輸出結果。
使用Go語言實現
在瞭解了forgery_py的工作原理之後,我們就可以來使用Go語言來實現了。
# forgery的基本目錄
$ cat forgery
├── dictionaries # 資料來源
│ ├── male_first_names
├── name.go # 具體功能實現
└── loader.go # 載入資料
根據python版本的我們也來建立對應的目錄。
實現資料的讀取的快取:
// forgery/loader.go
package forgery
import (
"os"
"io"
"bufio"
"math/rand"
"time"
"strings"
)
// 全域性的快取map
var dictionaries map[string][]string = make(map[string][]string)
// 在獲取資料之後隨機輸出
func random(slice []string) string {
rand.Seed(time.Now().UnixNano())
n := rand.Intn(len(slice))
return strings.TrimSpace(slice[n])
}
// 主要的資料載入方法
func loader(name string) (slice []string, err error) {
slice, ok := dictionaries[name]
// 快取中存在資料,直接返回
if ok {
return slice, nil
}
// 讀取對應檔案
file, err := os.Open("./dictionaries/" + name)
if err != nil {
return slice, err
}
defer file.Close()
rd := bufio.NewReader(file)
for {
line, err := rd.ReadString(`
`)
slice = append(slice, line)
if err != nil || io.EOF == err {
break
}
}
dictionaries[name] = slice
return slice, nil
}
// 統一的錯誤處理
func checkErr(err error) (string, error) {
return "", err
}
實現具體的功能:
// forgery/name.go
// Random male of female first name.
func FirstName() (string, error) {
slice, err := loader("male_first_names")
checkErr(err)
slice1, err := loader("female_first_names")
checkErr(err)
slice = append(slice, slice1...)
return random(slice), nil
}
這樣就將python語言版本的forgery_py使用Go來實現了。
最後
上面只是提及了一些工作原理,具體的原始碼可以看https://github.com/xingyys/fo…,也十分感謝https://github.com/tomekwojci…,具體的思路和裡面的資料來源都是他提供的。本人就是做了一些翻譯的的工作。