達觀資料研發“曹植”大語言模型,致力於國產GPT模型

達觀資料DataGrand發表於2023-04-12

在通用領域,以ChatGPT為代表的生成式大規模語言模型展現出卓越的知識學習和文字創作能力,受到國內外的廣泛關注。垂直領域的GPT大模型同樣擁有廣闊的應用前景。 達觀基於多年文字智慧技術積累和垂直領域場景業務經驗,正在積極探索大語言模型LLM的實踐,研發國產版GPT“曹植”系統,作為垂直、專用、自主可控的國產版ChatGPT模型,不僅能實現專業領域的AIGC智慧化應用,且可內建在客戶各類業務系統中提供專用服務

達觀資料研發“曹植”大語言模型,致力於國產GPT模型

達觀自主研發的“曹植”垂直領域大語言模型將進一步夯實達觀產業應用智慧化基座,全面增強AI全產品矩陣能力。 這也是國內大規模語言模型中首批可落地的產業應用級模型,目前已在金融領域AIGC多場景投入應 未來可持續賦能金融、政務、製造等多個垂直領域和通用場景人工智慧的落地和發展

達觀資料研發“曹植”大語言模型,致力於國產GPT模型

在產品應用層面,以“曹植”大模型作為支撐,為達觀全棧AIGC智慧產品帶來革命性效果提升。

例如,達觀企業申報材料自動生成,基於達觀AIGC智慧寫作能力,可適配各類材料申報業務場景,基於已有各結構化類資料,快速撰寫各類制式和非制式文件,應用於公文、招投標、投行申報文件、法律文書等專業寫作場景。

達觀金融報告AIGC智慧寫作,立足財經、金融市場研究寫作場景,結合多項AIGC能力,可高效地完成研究類報告撰寫,保證專業報告寫作的高質量和時效性。

達觀資料研發“曹植”大語言模型,致力於國產GPT模型

達觀資料深耕深度學習語義智慧領域十餘年,多年來與北京大學、復旦大學等多個高校演算法實驗室和科研團隊建立了深度交流合作機制。在演算法方面,達觀不斷探索GPT3模型的原理驗證和垂直行業知識的強化訓練,不斷提高模型的準確性和實用性。目前“曹植”大模型目前已獲得重要技術突破,以大量通用資料和領域資料自監督訓練的LLM為基座模型,透過大量通用任務資料和領域任務資料進行Prompt Learning微調,在垂直領域內的理解和生成的任務上都達到了很好的效果。

未來達觀將建立多個垂直領域的專用語言大模型,為各行業的智慧化需求提供更加專業和高效的解決方案。

3月11日,由中國人工智慧學會主辦,國內AI領軍企業達觀資料攜手中國人工智慧學會自然語言理解專委會、真格基金共同承辦,中國信通院雲端計算與大資料研究所支援的ChatGPT及大模型專題研討會在北京圓滿落幕。大會圍繞ChatGPT和大規模語言模型的發展應用,聚集眾多人工智慧產研大咖,共同探討前沿技術及產業未來,呈現了一場精彩的思想交流盛宴。

會上達觀資料董事長兼CEO、復旦大學計算機博士陳運文以探索大語言模型的垂直化訓練技術和應用為題,向聽眾展開介紹達觀資料“曹植”垂直領域大語言模型的研發進展和工程化探索,這也是“曹植”首度面向公眾亮相。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2945232/,如需轉載,請註明出處,否則將追究法律責任。

相關文章