文字自動摘要工具 TextTeaser 開源

edithfang發表於2014-06-22

文字自動摘要API TextTeaser日前開源,登陸GitHub。TechCrunch早在2013年10月對TextTeaser進行過最早的報導。其創造者霍洛•巴爾賓(JoloBalbin)表示,在“發現一些擴充套件問題,特別是API中的問題後”,他決定將TextTeaser程式碼開源。

於是他撤下API,對TextTeaser進行重構,以加快了它的自動摘要速度。開發者可以從兩套方案中進行選擇,包括每摘要1000篇文章付費12美元的方案。第二種方案針對企業,費用為每月250美元,會有專門的伺服器儲存文章來源。這意味著每當人們使用該工具對文章摘要,TextTeaser就能獲知文字中的關鍵字,並利用這類資訊來改善它的效果。

“透過這一TextTeaser,你可以訓練你自己的摘要工具。”巴爾賓解釋道,“你可以提供文章的類別和來源,用以改進摘要的質量。未來,使用者可能也將能夠提供哪些關鍵字重要哪些不重要方面的資訊。”

開發者已經將TextTeaser整合到包括Gist在內的多款新聞閱讀類應用當中。巴爾賓還計劃針對財務、醫療和法律方面的檔案優化TextTeaser,那些領域的檔案往往非常冗長,易讀性低。

如想了解下TextTeaser的功能與效果,可以看看它對《飢餓遊戲》的摘要以及巴爾賓的這篇博文

稿源:TechCrunch


相關閱讀
評論(0)

相關文章