每週編輯精選|希爾貝殼語音資料集系列上線、中國學者建立乳腺癌預後評分系統 MIRS

發表於2024-02-14

🏮新春佳節,歸程千里為團圓
🏮人間煙火,年味濃濃闔家歡

辭別玉兔,金龍迎春。明晚就是大年三十除夕夜了!HyperAI超神經在這裡提前祝大家新春快樂~龍行龘龘(dá)!本週 hyper.ai 官網上線了希爾貝殼開源的數千小時中文語音資料庫,開啟你的語音之門。

2 月 5 日-2 月 8 日,hyper.ai 官網更新速覽

  • 優質公共資料集:8 個
  • AI4S 論文案例:2 篇
  • 熱門百科詞條:8 條

訪問官網:hyper.ai

公開資料集精選

1.AISHELL-1 開源中文語音資料庫

該資料集由 400 名來自中國不同口音地區的人參與錄製。經過專業語音校對人員轉寫標註,並透過嚴格質量檢驗,此資料庫文字正確率在 95% 以上。分為訓練集、開發集、測試集。

直接使用

https://hyper.ai/datasets/29344

2. AISHELL-2 中文語音資料庫

希爾貝殼中文普通話語音資料庫 AISHELL-2 包含 1,000 小時的語音時長。錄音文字涉及喚醒詞、語音控制詞、智慧家居、無人駕駛、工業生產等 12 個領域。

直接使用

https://hyper.ai/datasets/29347

3. AISHELL-3 高保真中文語音資料庫

該資料集由 218 名來自中國不同口音區域的人員參與錄製。由專業語音校對人員進行拼音和韻律標註,並透過嚴格質量檢驗,此資料庫音字準確率在 98% 以上。

直接使用

https://hyper.ai/datasets/29352

4. AISHELL-4 多通道中文會議語音資料庫

AISHELL-4 是由 211 個錄製的會議會議組成,每個會議會議包含 4 至 8 名發言者,總時長為 120 小時,可用於語音前端處理、語音識別等單獨任務。

直接使用

https://hyper.ai/datasets/29375

5. AISHELL-WakeUp-1 中英文喚醒詞語音資料庫

該資料集邀請了 254 名發言人參與錄製,共有喚醒詞語音近 400 萬條,1561.12 小時。錄音文字為「你好,米雅」、「hi, mia」喚醒詞。此資料庫經過專業語音校對人員轉寫標註,並透過嚴格質量檢驗,可用於聲紋識別、語音喚醒識別等研究使用。

直接使用

https://hyper.ai/datasets/29186

6. AISHELL-DMASH 中文普通話麥克風陣列家居場景語音資料庫

AISHELL-DMASH 資料集是在兩個不同房間的真實智慧家居場景中記錄的,該資料集包含 30,000 小時的語音資料。資料集由專業語音標註人員轉錄,單詞準確率達 98%,可用於聲紋識別、語音識別、喚醒詞識別等研究。

直接使用

https://hyper.ai/datasets/29380

7.DeepSymNet 深度符號網資料集

這是中國科學院半導體研究所的研究人員提出的一種名為 DeepSymNet 的全新符號網路來表示符號表示式,用於符號迴歸的符號網路。

直接使用

https://hyper.ai/datasets/29321

8. Evol Instruct Chinese GPT4 文字資料集

該資料集是透過以下方式建立的:

(1) 將 Evol-instruct-70k 的英文問題翻譯成中文;

(2) 請求 GPT4 生成中文答案。

直接使用

https://hyper.ai/datasets/29318

ScienceAI 論文案例精選

1. 劍指全球第一大癌症,中國學者建立乳腺癌預後評分系統 MIRS

近日,中國學者採用神經網路模型,建立了一個預測乳腺癌預後和治療的評分系統 MIRS,可用於指導乳腺癌患者治療策略的制定。相關論文已發表於「iScience」期刊。

檢視完整報導

https://hyper.ai/news/29304

2. 中科院深圳先進院提出 SBeA,基於少樣本學習框架進行動物社會行為分析

動物行為研究急需透過技術創新提升研究效率和準確性。基於此,SBeA (Social Behavior Atlas) 應運而生,由中國科學院深圳高新技術研究院開發,能夠全面量化自由群居動物的行為,使用較少的標記幀數(約 400 幀)進行多動物三維姿態估計,透過雙向遷移學習策略,在多動物身份識別方面的準確率超過 90% 。相關成果已發表於「Nature」期刊。

檢視完整報導

https://hyper.ai/news/29353

熱門百科詞條精選

  1. 每秒浮點運算次數 FLOPS
  2. 隨機漫步 Random Walk
  3. 虛擬篩選 Virtual Screening
  4. 音樂資訊檢索 MIR
  5. 量子神經網路 Quantum Neural Network

這裡彙編了數百條 AI 相關詞條,讓你在這裡讀懂「人工智慧」:

https://hyper.ai/wiki


以上就是本週編輯精選的全部內容,如果你有想要收錄 hyper.ai 官方網站的資源,也歡迎留言或投稿告訴我們!

新春到來之際,HyperAI超神經再次祝大家龍行大運,萬事興龍,合不龍嘴,其樂龍龍!新的一年,我們會給大家帶來更多驚喜!

讓我們龍年再見!

關於 HyperAI超神經 (hyper.ai)

HyperAI超神經 (hyper.ai) 是國內領先的人工智慧及高效能運算社群,致力於成為國內資料科學領域的基礎設施,為國內開發者提供豐富、優質的公共資源,截至目前已經:

  • 為 1200+ 公開資料集提供國內加速下載節點
  • 收錄 300+ 經典及流行線上教程
  • 解讀 100+ AI4Science 論文案例
  • 支援 500+ 相關詞條查詢
  • 託管國內首個完整的 Apache TVM 中文檔案

訪問官網開啟學習之旅

https://hyper.ai/

相關文章