學習NLPIR語義智慧教學科研平臺要這樣開啟

ljrj123發表於2018-02-08

近年來,隨著Internet 的迅猛發展以及人們利用資訊科技生產和蒐集資料能力的大幅度提高,大規模的網路文字庫不斷湧現。為了便於在海量文字庫中搜尋、過濾、管理這些文字,基於人工智慧技術的文字挖掘方法成為人們研究的焦點。
  大資料文字挖掘不但要處理大量的結構化和非結構化的文件資料,而且還要處理其中複雜的語義關係,因此,現有的資料探勘技術無法直接應用於其上。對於非結構化問題,一條途徑是發展全新的資料探勘演算法直接對非結構化資料進行挖掘,對於資料非常複雜,導致這種演算法的複雜性很高;另一條途徑就是將非結構化問題結構化,利用現有的資料探勘技術進行挖掘,目前的文字挖掘一般採用該途徑進行。對於語義關係,則需要整合計算語言學和自然語言處理等成果進行分析。
  NLPIR大資料語義智慧教學科研平臺是大資料語義智慧分析專業的教學科研綜合平臺。平臺以自然語言理解為核心,結合北理工團隊多年的科學研究與一線教學經驗,以科學嚴謹的方式,致力於提升學員大資料與人工智慧的教學培訓、科學研究與工程實踐的水平。
  NLPIR大資料語義智慧教學科研平臺具有一套完善且豐富的教學體系,課程教材、視訊教學、實訓平臺、實驗驗證和專案案例五位一體。
  NLPIR大資料語義智慧教學科研平臺教學內容豐富,主要圍繞大資料、人工智慧和自然語言理解三大核心領域展開,核心內容包括以下幾個方面:
  1)科學的大資料觀:大資料的定義,科學發展淵源;如何科學看待大資料?如何把握大資料,分別從“知著”、“顯微”、“曉義”三個層面闡述科學的大資料觀。
  2)大資料技術平臺與架構:雲端計算技術與開源平臺搭建;Hadoop、Spark等資料架構、計算正規化與應用實踐;TensorFlow深度學習平臺。
  3)機器學習與常用資料探勘:常用機器學習演算法:Bayes, SVM,深度神經網路等;常用資料探勘技術:關聯規則挖掘、分類、聚類、奇異點分析;深度學習:CNN, RNN, LSTM, Attention模型,seq2seq模型。
  4)大資料語義精準搜尋:通用搜尋引擎與大資料垂直業務的矛盾;大資料精準搜尋的基本技術:快速增量倒排索引、結構化與非機構化資料融合、大資料排序演算法、語義關聯、自動快取與優化機制;大資料精準搜尋語法:鄰近搜尋、複合搜尋、情感搜尋、精準搜尋;
  5)非結構化大資料語義挖掘
  語義理解基礎:ICTCLAS與漢語分詞;內容關鍵語義自動標引與詞雲自動生成;大資料聚類;大資料分類與資訊過濾;大資料去重、自動摘要;情感分析與情緒計算;不良資訊智慧過濾.
  6)知識圖譜的大資料自動構建與應用:知識圖譜概念;知識點的自動發現;基於bootstrapping的知識大資料生成;
  7)NLPIR智慧語義平臺:NLPIR智慧語義分析線上雲服務;NLPIR Parser語義分析平臺實訓;NLPIR智慧語義二次開發介面與教程。
  8)大資料應用案例剖析與綜述:電網大資料應用案例;新媒體傳播創新與頭條應用;非結構化大資料探勘。
  大資料因其規模巨大、型別複雜、產生速度快、價值密度低等特點,對現有資訊科技構成巨大挑戰。運用新理念、新技術、新方法對大資料進行全生命週期的創新管理和應用,是推動國民經濟轉型和社會管理創新的重要契機,也是國家綜合競爭力提升的重要趨勢。支撐這場大資料革命的底層力量,不僅僅是技術革命,更是領導意識、組織文化和行為方式的思維革命。在國家治理層面,尤其需要掌握用資料思考和解決社會問題的新方法,最重要的是樹立資料思維、網際網路思維和計算思維的思維方式。


相關文章