能力對齊、長文字、Claude 3,這次聊聊大模型重點技術路徑

机器之心發表於2024-03-15

文字大模型卷出新高度,Claude 3 在數學、程式設計、多語言理解、視覺等多個維度超越 GPT-4 和上線不足一個月的 Gemini 1.0 Ultra。「日新月異」已經不足以形容當下大模型技術發展之勢。

為了更好地分享大模型技術最新進展,2024 年,機器之心、張江科投、張江孵化器、WAIC Circle 聯合發起舉辦「大模型技術 Workshop」系列活動,邀請產學研一線大咖帶來前沿觀察與洞見。

3 月 22 日下午,上海張江納賢路 800 號科海大樓 A 座 3 層 ,以「Claude 3 熱浪來襲,一起聊聊文字大模型的重點技術路徑」為主題,來自復旦大學、波形智慧、亞馬遜雲科技的學者和技術專家們將進行深入分享與交流。歡迎關注大模型進展的專業觀眾加入活動,一起交流探討。

圖片

嘉賓介紹圖片

演講題目:大模型能力對齊

演講嘉賓:桂韜,復旦大學自然語言處理實驗室副研究員。研究領域為預訓練模型、類人對齊和智慧體互動。在高水平國際學術期刊和會議上發表了 50 餘篇論文,主持國家自然科學基金、計算機學會、人工智慧學會多個人才專案。曾獲錢偉長中文資訊處理科學技術獎一等獎、NeurIPS2023 大模型對齊 Track 最佳論文獎,COLING2018 最佳論文提名獎、NLPCC2019 傑出論文獎、CIPS 優博獎、ACM 優博獎,入選第七屆“中國科協青年人才託舉工程”、上海市啟明星計劃、世界人工智慧大會雲帆獎“璀璨明星”稱號。

圖片

演講題目:超長文字創意寫作大模型的訓練和推理方案

演講嘉賓:周王春澍,波形智慧 CTO。本科和碩士畢業於北航中法工程師學院,博士曾就讀於 ETH Zurich,師從Ryan Cotterell & Mrinmaya Sachan。2023 年 4 月輟學並創立了波形智慧(AIWaves),擔任公司的 Cofounder & CTO。研究方向主要包括 LLM training & prompting, language agents, long/creative text generation, efficient methods for NLP, multi-modal LLMs, commonsense reasoning 等。曾於 2022 獲得百度獎學金。曾在 MSRA/位元組AI Lab/AI2 等機構實習,並在位元組跳動 AI Lab 擔任 research scientist。周王春澍在 NeurIPS/ICML/ICLR/ACL/EMNLP/NAACL 等機器學習自然語言處理會議中發表文章 30 餘篇,同時擔任這些會議的審稿人,以及 ARR/*ACL 的領域主席(Action Editor / Area Chair)。

圖片

演講題目:Claude 3 技術解析與場景演示

演講嘉賓:林業,亞馬遜雲科技資深解決方案架構師。擅長 C++/C#/Java/PHP/Python/JS 等多種開發語言,持續開發過一個 Github repo 從個位數🌟增加到 3000🌟。曾構建過支援 1000 萬使用者的共享單車 APP,參與開發多款知名車企 APP,並獲得 2005 年浙江省 ACM 獎項,現專注於企業雲原生架構與 GenAI 發展,並致力於將其能力應用於企業業務場景。

活動報名

此次「大模型技術 Workshop 第一期」報名已開啟,掃描下圖二維碼或點選底部「閱讀原文」可直達活動報名頁。

圖片

關於本次活動的相關問題,歡迎新增機器之心小助手(ID:13661489516)或透過郵件(chenyinyi@jiqizhixin.com)進行諮詢。

相關文章