Stanford Natural Language Inference (SNLI)和Multi-Genre NLI Corpus(MultiNLI) 資料集
Stanford Natural Language Inference (SNLI)和Multi-Genre NLI Corpus(MultiNLI) 資料集
https://nlp.stanford.edu/projects/snli/
https://www.nyu.edu/projects/bowman/multinli/
MultiNLI是SNLI的升級版,格式一樣,規模相當,但是前者變化更多,也包含了一個輔助測試集用於cross-genre transfer 評估
SNLI1.0包含570,000的人工手寫英文句子對,人工標註了平衡的分類標籤:蘊含entailment,矛盾,中性
支援NLI(natural language inference)任務,也被視為RTE( recognizing textual entailment )任務
詳細介紹:
Samuel R. Bowman, Gabor Angeli, Christopher Potts, and Christopher D. Manning. 2015. A large annotated corpus for learning natural language inference. In Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP). [pdf] [bib]
除了gold label,還包含了5個標註人的評估結果,另外句子以兩種解析表示:
gold_label sentence1_binary_parse sentence2_binary_parse sentence1_parse sentence2_parse sentence1 sentence2 captionID pairID label1 label2 label3 label4 label5
neutral ( ( ( A person ) ( on ( a horse ) ) ) ( ( jumps ( over ( a ( broken ( down airplane ) ) ) ) ) . ) ) ( ( A person ) ( ( is ( ( training ( his horse ) ) ( for ( a competition ) ) ) ) . ) ) (ROOT (S (NP (NP (DT A) (NN person)) (PP (IN on) (NP (DT a) (NN horse)))) (VP (VBZ jumps) (PP (IN over) (NP (DT a) (JJ broken) (JJ down) (NN airplane)))) (. .))) (ROOT (S (NP (DT A) (NN person)) (VP (VBZ is) (VP (VBG training) (NP (PRP$ his) (NN horse)) (PP (IN for) (NP (DT a) (NN competition))))) (. .))) A person on a horse jumps over a broken down airplane. A person is training his horse for a competition. 3416050480.jpg#4 3416050480.jpg#4r1n neutral
相關文章
- A Survey of Natural Language Question Answering System
- 論文閱讀-RankME: Reliable Human Ratings for Natural Language Generation
- know和know about的區別 基於coca corpus
- 資料查詢語句:DQL(Data Query Language)
- DQL(Date Query Language)資料庫查詢語句資料庫
- 資料型別和字符集資料型別
- Google分析language垃圾資訊Go
- Alink漫談(七) : 如何劃分訓練資料集和測試資料集
- 機器學習中的有標註資料集和無標註資料集機器學習
- SciTech-BigDataAIML-Statistical Model-Bayes Inference-資料/事實 ∩ 假設: 政治經濟、社會和科學分析AI
- Ubuntu下安裝Stanford CoreNLPUbuntu
- Redis叢集模式和常用資料結構Redis模式資料結構
- 資料庫代理服務和叢集管理資料庫
- 人臉識別資料集和特點
- voc資料集轉換成coco資料集
- Redis資料型別, Redis主從哨兵和叢集(將資料匯入叢集) ubuntu使用Redis資料型別Ubuntu
- UCI資料集整理(附論文常用資料集)
- Apache Spark:資料框,資料集和RDD之間的區別 - BaeldungApacheSpark
- redis叢集資料儲存和獲取原理Redis
- 資料採集和融合技術作業1
- 資料採集和融合技術作業3
- php資料集PHP
- tinyshakespeare資料集
- SST資料集
- 使用coco資料集建立賦值黏貼篡改資料集賦值
- 談談大資料採集和常見問題大資料
- 資料採集元件:Flume基礎用法和Kafka整合元件Kafka
- DML(Data Manipulation Language、資料操作語言),用於新增、刪除、更新和查詢資料庫記資料庫
- As a reader --> AdvDiffuser: Natural Adversarial Example Synthesis with Diffusion Models
- [Paper Reading] KOSMOS: Language Is Not All You Need: Aligning Perception with Language Models
- 常見資料集
- 資料集訓練
- 資料集簡介
- 大資料工程師入門系列—常用資料採集工具(Flume、Logstash 和 Fluentd)大資料工程師
- 拆分PPOCRLabel標註的資料集並生成識別資料集
- 【資料集合】並集、交集、差集、子集
- Spartacus Storefront 裡的 currency 和 language 的 store 設計
- 大資料分享Spark任務和叢集啟動流程大資料Spark