史丹佛大學釋出免費線上文字分析工具

發表於2014-02-11

史丹佛電腦科學家開發了etcML(Easy Text Classification with Machine Learning)網站,該網站通過機器學習引擎進行文字分析,目前該網站向所有人免費開放。

維基百科對機器學習的解釋是:它是人工智慧的分支之一,是一套能夠從資料中學習的系統。

史丹佛大學官網對此進行了說明:etcML網站基於成熟的文字分析引擎,估計總體的情感傾向(是消極還是積極)。etcML專案負責人Richard Socher表示:

“我們想開發一套供普通人和研究人員使用的標準的機器學習技術,所有使用者都不需要程式設計能力。”

史丹佛大學候選博士研究生Rebecca Weiss表示:

etcML提供了一種簡單的方式,對單詞和短語所體現的觀點進行分類。

我可以訓練分類器,也可以對任何一段文字打上標籤,實現這一切並不需要寫一行程式碼。我還可以和記者或研究人員分享我的分類器。

史丹佛大學計算機語言學研究者Rob Voigt通過etcML對Kickstarter(一個創意方案眾籌平臺)上的專案進行評估。他發現,多使用“我們”、“我們的”這些複數代詞能夠提高專案宣講成功的概率。Voigt表示:

“我們並沒有聲稱我們的分析是決定性的,etcML分類正規化提供了有價值的成功線索。”

史丹佛大學電腦科學博士生Chinmay Kulkarni使用etcML對2000名學生的簡答題測驗進行打分。此前,簡答題打分是通過學生之間的互相打分完成的,平局每道題有4個學生進行打分。通過etcML打分後,平局每道題只需要3個或更少的學生打分。Kulkarni表示:

“我們獲得了同樣的精確度,同時減少了學生的負擔。”

Kulkarni釋出了這一專案的論文

Socher認為etcML能吸引許多人嘗試有趣的語義分析專案並提供反饋,從而提升etcML背後的計算引擎。

值得一提的是,Andrew Ng(吳恩達)是etcML專案的顧問,他是史丹佛人工智慧實驗室的主管,也是線上公開課程平臺Coursera的創始人之一。

相關文章