自己前兩年一直有寫年度總結的想法,但是看到別人年度總結後,發現今年已經過去了,就懶得寫了。自己趁著2018還有最後一個月,從下面3個方面談一談今年自己的主要經歷。
一 關於學習
學習的主方向是自然語言處理,在這裡具體以寫部落格、做專案、打比賽展開。
- 寫文章
原先在用hexo搭建了部落格,寫過一些文章,後來轉到簡書,到現在寫了大約有10萬字,主要是記錄有關自然語言處理、機器學習的學習,其他類別的文章有但是比較少。
- Github
個人一直覺得Contributions Wall
很贊,它基本上記錄了自己動手實踐的軌跡,比如2017年找實習那段時間,每天刷一道leetcode,如果某天空白了,說明偷懶了;2018年5月-9月為了熟悉主流機器學習和深度學習框架,比如Keras、TensorFlow,自己開始動手做一些專案,最開始模仿,做多了看到新資料集,自己就有想法了。
其中有一個專案是自己堅持最久的,基本上是自己學習Python的歷程,在解決問題的過程中,用到什麼,就去查什麼,一共差不多有100個notebook。quincy-python
- 競賽
空閒的時候,自己和同學在一些比賽網站(比如天池、DataCastle、DF,Kaggle)找一些比賽做。和大佬們有差距甚大,基本上在二梯度徘徊,一是入門晚,二是大佬們確實下了功夫,在框架基本成熟已知的情況下,拼的是特徵工程,印象最深的一個就是在神策杯中,前排大佬做了個100個特徵,考驗的不僅是技術還有耐心吧。下面是我整理的網站,我基本上找一些關於NLP的,同時積累下資料集。欣慰的是上個月確認收貨數學建模三等獎。
二 實習經歷
實驗室專案忙完之後時間有些寬鬆,再加上學院剛好要求企業實習,然後自己在春招之後開始找實習,主要是根據自己的研究方向來找實習。1. 搜狐暢遊-自然語言處理實習
從2018年5月份開始,實習了有4個月,主要負責問答系統以及智慧QA的研究。自己在這裡學到了很多自然語言相關的知識,比如文字分類、提取關鍵詞、文字摘要、語義相似性判定、基於知識庫的問答系統、NLU等等,同時也發現了不足,越學越感覺渺小。也很感謝Mentor的鼓勵、引導和包容。印象深刻的地方就是三個人在經常一塊吃飯,有時候出去逛一圈買點彩票(雖然知道不會中獎,哈哈),還有經常有公司樓下有搞活動的、賣東西的跳蚤市場,自己在下面淘了不少東西,比如450三個錘子手機。
2. 北京網易-演算法實習
從2018年9月份,目前負責文字分類、商業標籤提取,豬場的伙食蠻不錯。在這裡自己也很快的融入團隊,領導和Mentor很Nice,組內氛圍很融洽。自己期待的是可以學到關於資料探勘方面的東西,比如Hadoop、Spark、scala。
三 關於生活
- 看過一些電影
國內印象比較深的有:《暴裂無聲》、《大象席地而坐》、《盲井》、《村戲》;國外的電影有《幸福的阿扎羅》、《犬之島》、《燃燒烈愛》、《看不見的客人》等
- 喜歡拍照