Google 開源了世界上最準確的語言解析器 Parsey McParseface

Brittany A. Roston發表於2016-05-13

Google 已經發布了開源的 SyntaxNet 自然語言神經網路框架,以幫助機器更好地理解自然語言。SyntaxNet 中包括了 Parsey McParseface,後者是一種專門用於“解剖”英語的語言解析器。Google 稱之為世界上最準確的語言解析器,並且已經放出了允許人們藉助自有資料來訓練 SyntaxNet 的全部程式碼。

SyntaxNet 和 Parsey McParseface 都是自然語言理解(NLU)系統的一部分。給出一個句子,它就會將之分解成各種部分,比如名詞、動詞、形容詞。

對自然語言研究人員和需要這種應用程式的人們來說,這款開源工具顯然會助力相關研究的爆發式發展。

據 Google 自述,經過 TensorFlow 框架訓練後的 Parsey McParseface,是其出產的“最複雜的網路”之一。

在某一測試中,他們發現該模型的準確度超過94%——作為比較,訓練有素的語言學家的準確率在96-97%左右——這表明該軟體的技能熟練度已與人類相當。

SyntaxNet目前已在GitHub上線,更多內容請翻閱Google論文

相關文章