6月21-22日,WOT全球技術創新大會在北京圓滿閉幕。本次大會吸引60+來自大模型、多模態、AI Agent、雲端計算、大資料、架構等領域的講師、專家們精彩佈道,共有800+參會者現場參與。作為有著十餘年曆史的綜合技術大會品牌——WOT全球技術創新大會始終把交付優質內容作為堅守的準則,在大模型、AIGC受到普遍關注的當下,大會始終追蹤最新、最火熱、最優質的內容和技術趨勢,在大模型、AIGC賽道持續狂奔。在大會致辭中,51CTO副總裁、數字化轉型與技術力研究院院長楊文飛表示:數字時代,以AI為代表的數字技術成為改變世界的革命性力量,基於數字技術的創新成為決定企業生存的核心動力,而人才則是支撐創新的關鍵因素。資料顯示,我國數字化專業人才缺口持續擴大,而數字化技術的半衰期卻在快速下降、崗位所需要的技能數量持續增加。可以說,數字技術人才的培養,已經成了決定數字產業發展的重要因素。十九年來,51CTO始終堅持“技術成就夢想”的理念,致力於把技術進步的價值傳播給每個企業和個人,幫助一億數字化人才終身成長。到目前為止,51CTO已經累計培養超過800萬名數字化人才,每年為數千家企業提供數字化人才諮詢、培養和認證服務,成為中國數字化專業人才培養的主力軍。中國人民大學高瓴人工智慧學院副院長竇志成帶來《生成式資訊檢索:邁入智慧資訊獲取新時代》的分享。上世紀90年代開始,以“搜尋引擎”為代表的資訊檢索技術極大地提升了人類從海量網際網路資料中獲取資訊的效率,成為日常生活中不可或缺的工具。而近期出現的以ChatGPT為代表的生成式大語言模型則有望深刻改變人們獲取資訊的方式,促進資訊獲取技術的更新升級,進而可能會改變或者替代掉傳統搜尋引擎。在此背景下,生成式資訊檢索(Generative Information Retrieval,GenIR)得到了學術界和工業界的廣泛關注。在分享中,竇志成詳細介紹了中國人民大學高瓴人工智慧學院在生成式資訊檢索領域開展的部分工作,包括面向資訊檢索的大模型、生成式文件檢索、以及檢索增強的生成,並探討未來發展方向。火山引擎大模型服務演算法負責人王科帶來《火山引擎大模型服務,用AI驅動增長》的分享。
王科指出,只有大的使用量,才能打磨出好模型。在位元組跳動內部,豆包大模型的實踐極為豐富,截止今年4月,豆包大模型日均處理1,200億 tokens 文字、生成3,000萬張圖片。豆包App、貓箱、釦子、即夢Dreamina等都是位元組跳動內部基於豆包大模型孵化的孵化的產品。這些豐富的使用場景為底座模型——豆包大模型帶來了正向迴圈效果。
透過位元組跳動內部50+業務場景實踐驗證,每日千億級tokens大使用量持續打磨,豆包大模型以優質的模型效果為企業打造豐富的業務體驗。豆包大模型家族包括:豆包通用模型pro、豆包通用模型lite、豆包·角色扮演模型、豆包·語音合成模型、豆包·聲音復刻模型、豆包·語音識別模型、豆包·文生圖模型、豆包·Function call模型、豆包·向量化模型。
此外,火山引擎推出的火山方舟一站式大模型服務平臺,既具備強大的系統承載力,能夠保障業務穩定和成本可控性;同時配有全週期安全可信方案,為企業AI應用保駕護航;同時,火山方舟提供了抖音頭條同款的聯網外掛、頭條抖音同源的內容外掛以及RAG知識庫外掛,並由位元組跳動演算法團隊提供專業服務,助力企業AI應用輕鬆落地。
騰訊雲資料庫產品總監劉迪帶來《雲原生資料庫全面擁抱AI,激發企業新質生產力》的分享。隨著數字化轉型深入,雲資料庫大規模運營下的可用性、成本和運營效率方面面臨著新的難題,資料庫也演進為以存算分離、資源預測、異常自愈、故障預測等為特點的“軟體+硬體+AI”三位一體的構建方式。軟體方面,騰訊雲持續在自研核心 TXSQL 上不斷探索和迭代 ,TXSQL 核心100%相容原生 MySQL ,同時針對遊戲、教育、金融、工業製造等行業的通用場景,研發出眾多匹配的新特性, 並在資料庫領域的國際頂尖學術會議 SIGMOD 中發表了多篇前沿研究成果,也向官方社群貢獻了眾多核心的新特性和 Bug 修復。硬體方面,提出了全鏈路RDMA網路、編譯器最佳化、三層解耦框架、基於持久化記憶體的二級快取等“軟體最佳化與新硬體結合”的方法,最佳化了關鍵路徑效能。AI方面,騰訊雲基於深度強化學習等AI方法並結合專家經驗,推出了端到端一站式引數調優服務,無需人為介入,可以根據場景自動探索最佳化引數,大幅縮短調優時間。此外,還構建了實時的多場景、多維度的智慧異常分析能力,能夠秒級發現異常,異常處理時間較人工大幅縮減80%。在Serverless 架構上, 打造 AI4DB 服務,形成「AI雲原生」產品矩陣等方面迭代。值得一提的是,騰訊雲資料庫TDSQL以同類架構1/3的單元成本達到了創紀錄的8.14億的tpmC,同時在效能和價效比方面登頂TPC-C測試榜首。經過“軟體+硬體+AI”三位一體全面最佳化融合、提升和創新,騰訊雲資料庫TDSQL的解決方案也帶來了更為極致的場景體驗。以瑞幸咖啡的實踐為例,TDSQL-C幫助瑞幸實現了零替換改造成本的雲原生架構升級,可靈活應對10倍的銷售流量洪峰,同時節省了大量資源和運維成本。百度智慧雲AI與大模型平臺總經理忻舟帶來《大模型加速產業智慧化轉型》的分享。人工智慧近年迎來大模型發展的視窗期,超大規模訓練資料、複雜的深層模型和分散式並行訓練,造就了這一正在崛起的變革力量。與此同時,基於大模型的AI原生應用開發模式也在不斷演化,從一開始的提示詞工程、RAG,到Copilot,再到爆火的Agent。對此忻舟表示,我們需要甄別模型對於業務場景適用性,根據具體情況綜合選擇合適的應用開發模式。他在分享中表示,百度智慧雲千帆大模型平臺致力於打造大模型服務超級工廠,提供先進的生成式AI生產及應用全流程開發工具鏈,該平臺已經累計有120000+使用者、20000+累計模型精調、420000+千帆應用開發數。作為百度智慧雲推出的產業級AI原生應用開發平臺,千帆AppBuilder致力於打通大模型到業務的最後一公里。同時,基於百度技術積累和自有業務沉澱,百度智慧雲千帆大模型平臺構建了豐富的大模型能力元件、AI能力元件、百度自有業務元件等。百川技術聯合創始人謝劍帶來了關於《百川大模型技術與應用實踐》的主題分享。謝劍提到,2023年6月至2024年5月期間,百川釋出了12款大型語言模型。其中,包括Baichuan-7B和Baichuan-13B在內的開源模型Huggingface總下載量超700萬次;多個版本中,相較Baichuan 3,Baichuan 4能力全面提升,在SuperClue 4月份基準評測中,Baichuan 4在國內大模型中綜合排名第一。除了致力於提升大模型效能之外,百川在Agent技術領域同樣進行了深入探索。百川推出的AI助手“百小應”“懂”搜尋、“會”提問:一方面得益於專業的搜尋技能,可以透過定向搜尋、多輪搜尋等方式逐步深入,逼近問題的核心答案,同時結構化呈現搜尋結果,最佳化資訊佈局;另一方面又能夠引導使用者清晰表達自身需求並精準定位問題。面向未來,謝劍認為,技術發展值得關注的幾個重要趨勢包括大引數/視窗的擴充套件、多模態和實時自然互動、普惠性、長程任務規劃和完成能力以及自學習和進化。除主會場分享外,本屆大會另外設定了13場平行分會場活動。從百度、阿里、騰訊、位元組...等大模型技術大廠,到百川智慧、第四正規化、商湯科技...等大模型獨角獸,本屆WOT技術大會邀請了眾多大模型企業進行自身實踐的集中展示。一場綜合技術大會,雖然需要大模型、多模態、AI Agent這樣的熱門技術話題,但是同樣需要研發效能提升、架構演進、大資料、技術領導力、大前端這樣技術人持續關注的話題。在本屆WOT技術大會上,我們邀請京東、51Talk、作業幫、方正證券、閱文集團等企業專家,持續帶來精彩分享。雖然2天精彩大會已經閉幕,但是持續追蹤熱門技術趨勢的腳步不會停止,更多精彩,敬請期待。