作為IT碼農,我是如何給小孩取名字的

Charcat發表於2019-11-02

1. 初衷:

2016年,我這個IT屌絲終於擁有了愛情的結晶——老婆懷孕了。隨著老婆肚子的一天天變大,一個非常艱鉅的任務落在了我的頭上,那就是——取名字。因為曾今跟老婆吹牛,自己飽讀詩書,文學功底深厚(其實就是看看網路小說),老婆把這任務分派下來之後,我似乎還只能欣然接受。再加上即將成為爸爸的喜悅,讓我痛快的拍下胸脯說:沒問題,保證取一個好名字。

2. 作為IT人員,有沒有高大上解決方案

接到這個任務後,斷然不敢敷衍了事,作為IT碼農的話,開始拿出了我超強的執行力。首先,我在腦海中一遍一遍的搜刮,各種詩詞,散文,小說文學集,古今中外名人,甚至網路小說的主角配角名字。。。

然而,尷尬的是,腦容量有限,我的腦海中並沒有留下太多可用的資料。作為一個有創新精神IT屌絲,是不是能用些不一樣的方案來解決這個難題呢?想到這兒,我的腦海中突然浮現出一個詞:大資料。

3. 資料爬取,一步一步來

3.1 漢字

心動不如行動,作為一名有執行力的IT屌絲,我果斷開啟資料爬取之旅。漢字作為中國文學的基石,自然是我首先想到必選資料。字典類的網站,隨意百度一下,就能找到一大堆,我挑選了幾個看起來較為專業的網站作為我的資料來源(具體是哪些網站,就不透露了)。

經過一番努力之後,最終把7900個簡體漢字存到了自家的資料庫,資料表中包含了它的拼音,筆畫,基本釋義這三個基本欄位。資料本地化了,是不是大功告成,可以開始取名了? 不,我感覺還是少了點什麼,讓我想想。。。

你應該也想到了,是的,這漢字的資訊太粗了,沒有多少使用價值,但是那又還缺了哪些資訊呢?

  • 繁體
  • 繁體筆畫
  • 是否通用規範漢字
  • 漢字結構
  • 造字法
  • 漢字如何拆解
  • 偏旁部首
  • 漢字五行屬性。。。

於是,我又開始了新一輪的資料爬取,這一次,能參考的網站相對少了很多,因為很多網站並沒有我想要的這些資訊。不過,這一步整體還算順利,只是考慮到怕整崩潰了人家的伺服器,只好在雲伺服器上掛著爬蟲程式,高間隔的爬取。一個晚上之後,總量20800的中國漢字型檔就正式產生了。

3.2 詞語

同一個漢字,出現在不同的詞語中,往往會有不一樣的含義,因此,詞語的資料也非常重要。相對字典來講,詞典相關的網站少了很多,我最終爬取了353000筆資料。

片語的資料內容主要包含:

  • 片語漢字
  • 片語拼音
  • 釋義
  • 近義詞
  • 反義詞
  • 感情色彩
  • 常用程度。。。

3.3 成語

成語是中國漢字語言詞彙中定型的詞,使用廣泛,是中國傳統文化的一大特色,讀起來朗朗上口,而且往往還具有深意。因此,成語和歇後語不容錯過。經過排重等簡單處理後,總共得到了2W+的資料。

成語的資料內容主要包含:

  • 成語漢字
  • 成語拼音
  • 釋義
  • 近義詞
  • 反義詞
  • 成語典故
  • 產生的大致年代
  • 感情色彩
  • 常用程度。。。

走到這一步,一切十分順利,接下來還有哪些需要用到呢?

對的,就是它:詩詞

3.4 詩詞

說到詩詞,大家可能第一反應就是唐詩三百首;大家這麼想,是能夠理解的,因為唐詩的確是中華文化寶庫中的一顆明珠,對中國乃至世界文化,都產生了深遠的影響。但是,中國的詩詞,遠不止唐詩,而且數量,也遠遠不止三百首,以下我按照朝代大致列了一下:

  • 先秦詩歌(比如有名的詩經,楚辭)
  • 漢朝詩歌(比如漢樂府詩,古詩十九首)
  • 魏晉南北朝詩歌(比如曹操,陶淵明等的詩歌)
  • 唐詩
  • 宋詞
  • 元曲
  • 清代詩詞
  • 近代詩詞

據不完全收集,我這邊竟然爬取到了8000+的詩詞文章,的確有點出乎意料的多。

3.5 古今名人與高頻名字

這資料應該是大家沒有想到的吧!

爬取這些資料,主要是為了解決重名的問題。重名是一個很尷尬的事情,比如現在很多人叫子涵,紫涵,紫萱,子軒之類的,上課的時候老師一叫名字,可能好幾個人站起來。因此我收集了近年來特別高頻使用的名字,以便後續規避使用。

除了這種情況,另一種重名也容易帶來尷尬:重名古代名人。

與古代名人重名,容易招致身邊朋友的調笑,尤其是重名的古人具有負面形象的時候。比如我有個朋友叫:趙高,長期以來他都受到名字的困擾。

古代名人的收集相對麻煩,因為很少有這類的名字收藏整理。好在通過某度的各種榜單,以及其他各種古代名人錄,現當代各個領域的精英人物榜,總共收集到了大概5W的各類名人。

4. 現實與理想,堅持還是放棄

4.1 資料到手,天下我有

上面介紹的資料,其實只是我收集的資料的一部分。其他的我也不再贅述,因為收集資料是一個單調而耗時的工作,沒有什麼技術含量可言。

經過大概兩個月的陸陸續續的收集,總算是把這些想要的資料全部收集並整理好。是不是可以大幹一場了?

是的,我覺得我可以開始大幹一場了。

4.2 怎麼樣才算是一個好名字

資料逐漸到手,準備開乾的時候,一個急需解決的問題擺在我的面前:怎麼樣才算是一個好名字?

這個問題不明確下來,就好比開發人員沒有需求文件,下一步完全就就沒法開展了。不過現在可沒有需求人員協助我,所以只好自己動手,豐衣足食了。靜下心來,仔細琢磨琢磨,似乎可以從以下方面著手:

  • 名字的字形
  • 名字的讀音
  • 名字的釋義
  • 名字是否契合八字
  • 名字三才五格好不好
  • 名字與生肖是否衝突

4.3 規則,規則?

上面有提到幾個可以著手的點,但是具體的規則,還需要細化理解,然後逐個攻破。

以字形為例,我們可以引申出相關的知識,比如偏旁部首,筆畫數量,是左右結構,還是上下結構,漢字又如何拆解。

進一步來分析,筆畫的多少,決定漢字的簡易,名字筆畫太多,會給小孩造成一定的書寫障礙;筆畫太少,又會讓名字看起來顯得單薄。同樣的道理,漢字的結構與拼音,在不同的組合下,會有不同的效果。因此,如何合理的組合漢字,形成最優的方案,最終再把它們規則化,這是一個棘手的問題。為了解決這個問題,頭髮又掉了一地。

這樣一層層的規則拆解下去,取名的整體規則似乎變得越來越複雜了。

當然,字音與字形相關的知識,其實是相對簡單的;更有難度的是:名字的含義,以及八字喜用神推算,三才五格評估,生肖喜好等比較籠統或者玄學的東西。

這樣一步步走來,到這兒終於有了放棄的想法。網上一搜尋,各種算命大師,取名大師,看起來都十分權威,不僅各種承諾,而且往往折扣力度驚人,原價1888,折後價只要188,甚至更低。如果真如他們所說,花個幾十百來塊,直接解決問題豈不是更好?抱著這個心態,我常識性的諮詢了幾家,結果令我十分失望。

這兒暫且不論這些大師的整體水準,但是我這個半吊子學徒,略微一試探,也探出了好些冒充大師的人。

5. 埋頭苦學,步步為營

5.1 八字喜用神推算

喜用神推算是最大的難點,也是大部分華人取名專業人士最為看重的一點。我花了很多的時間去理解這些名詞的含義,各種時間的推算,以及喜用神與名字之間的關聯。

過程甚至複雜,但是單純從結果來看,又十分的簡單。為什麼說簡單呢,因為歸根到底,其實都是一個數學問題。

舉例來說,我們確定喜用神往往是通過真太陽時間,而真太陽時間與北京時間的差異,完全可以通過出生地的的經度進行轉化,具體公式大家可以在網上搜尋一下。

另外一個例子,我們確定喜用神時,會通過四柱八字法來排,它們分別是年幹年支,月幹月支,日干日支,時干時支。粗看一下,如何去排完全沒有頭緒,但是如果從數學的角度來想想,就沒那麼複雜了。

天干:甲、乙、丙、丁、戊、己、庚、辛、壬、癸

地支:子、醜、寅、卯、辰、巳、午、未、申、酉、戌、亥

四柱八字如果使用窮舉法,那就是10的4次方再乘以12的4次方,總計2.0736億種結果。這樣看來,似乎也就沒有那麼神祕了。

5.1 三才五格

理解了上面的喜用神推算,三才五格似乎就變得更加的簡單了。

三才五格的計算,主要是通過筆畫的組合,來定義名字的吉凶。注意:筆畫一般是指繁體字的筆畫,而不是簡體字。

同理上面的推斷:五格有九九八十一種情形,三才有125種吉凶。國人大部分姓名都是3個字,而每個字的筆畫基本都是不會超過36,這樣我們來算一下: 36 * 36 * 36 = 46656

這樣看來,三才五格確實不復雜,而且筆畫這個東西,大家也都熟悉,很容易就能理解。市面上大部分的姓名打分,測評軟體基本上都是基於這個來實現的;所以大家對於這類軟體,看看就行,不要當真。

5.1 生肖喜忌

十二生肖,包括鼠、牛、虎、兔、龍、蛇、馬、羊、猴、雞、狗、豬,它們是十二地支的形象化代表,即子(鼠)、醜(牛)、寅(虎)、卯(兔)、辰(龍)、巳(蛇)、午(馬)、未(羊)、申(猴)、酉(雞)、戌(狗)、亥(豬)。

生肖既然對應上了了具體的動物,那自然就賦予了它們各自的喜好與忌諱;而且它們與十二地支一一對應,自然也就擁有了各自的屬性。這樣一來,大家取名之時,往往會考慮這些因素。

比如:屬雞的寶寶,往往不取帶有“犬”、“犭”、“戌”的字,因為大家都知道雞犬不寧這個成語,雞和狗難以相處。這些用法,都是比較直白易懂的,規則整理上,也是簡單的通過字形的拆解就能達成目的。

6. 為期半年,終成正果

收集整理這些資料,差不多花費了我將近半年的業務時間。雖然看起來沒有太大的產出,但是實際上,卻給我帶來了很大的收穫。名字雖然是簡簡單單的幾個字,但它也是我們中華文化的一個縮影,是父母對下一輩的一個期許,更是我們上一輩對下一輩的滿滿的愛意。

正果不是最終的名字,而是這一路對於中國人對於取名文化的一個理解。

7. 能否推而廣之

看到這兒,大家或許覺得我是來推銷APP或者小程式的,其實並不是的。當時確實有弄成APP以及小程式的想法,不過後面工作繁忙,自家小孩的名字也已經取好了,所以也就沒有太多的動力繼續研究了。

現在二胎又在準備了,所以翻出來總結一下。

8. 後記

這兩年來,身邊有親友陸陸續續給委託我幫忙取名,這也成了我業餘的一個小愛好。所以,諸位掘友如果有取名字需求,而且又信任我的,可以找我幫忙,放心,絕對免費!

如果對我的資料感興趣的,也可以微信私聊,不過考慮到版權問題,我並不太公佈出來。

下面是我的微信二維碼,如果需要驗證,請填:掘友取名

微信二維碼

相關文章