亞馬遜雲科技助力西門子打造以生成式AI為基礎的智慧聊天機器人

全球IT資訊發表於2023-09-20

2023年,以基於GPT模型對話應用為代表的生成式AI浪潮席捲全球,引起企業廣泛關注。自此,由生成式AI引導的企業變革序幕全面展開,企業向數智化轉型邁出了堅實的一步。

 西門子股份公司(以下簡稱“西門子”)是一家專注於工業、基礎設施、交通和醫療領域的科技公司。從更高效節能的工廠、更具韌性的供應鏈、更智慧的樓宇和電網,到更清潔、更舒適的交通以及先進的醫療系統,西門子致力於讓科技有為,為客戶創造價值。

 出於企業戰略考慮,在結合業務具體需求的前提下,西門子中國與亞馬遜雲科技合作開發了基於生成式人工智慧技術的智慧會話機器人“小禹”,在生成式AI領域邁出了可喜的一步。目前,西門子中國使用的亞馬遜雲科技服務包括:Amazon EKS、Amazon RDS、Amazon Lambda、Amazon S3、Amazon OpenSearch Service、Amazon ElastiCache、Amazon SageMaker等。

 

 機會:運用生成式AI之力

 打破資料孤島,重塑資料價值

 作為一家擁有全球視野、獨具未來前瞻思考的公司,西門子中國認為科技創新是企業韌性成長、保持領先的關鍵。因此,如何運用新興科技更好地發掘資料價值,是西門子中國持續發力的方向。西門子中國大禹團隊應用大資料技術、機器學習、雲技術、低程式碼來組建資料分析系統,專注於創新領域,藉助AI能力更好地發揮資料的價值。

 在構建知識庫的過程中,大禹團隊透過調研認識到,長期以來企業內部資源的檢索和呼叫都存在結構散亂、檢索速度慢、互動不便等問題。由於橫跨多個不同領域、涉及多個不同業務單元,如若以傳統方式打造知識庫,這些問題將一直是橫亙在部門間的長久之痛。因此,大禹團隊決定將大資料庫和生成式AI應用於一個全新的“智慧知識庫”,從根本上提升知識庫的可用性。

 長期以來亞馬遜雲科技一直是西門子中國的重要合作伙伴,雙方在多個專案上有著緊密合作,因此,西門子大禹團隊決定再度與亞馬遜雲科技攜手,在亞馬遜雲的技術支援下,開發這款為西門子中國量身打造的以人工智慧生成的方式進行互動的智慧聊天機器人。

 

 解決方案:高完成度解決方案指南,

 生成式對話機器人小禹敏捷落地

 由於公司體量龐大,智慧資料庫的構建需面向多個不同業務部門,勢必涉及大量的業務資料和文字資料。因此,智慧知識庫的儲存架構,成為亞馬遜雲科技設計智慧知識庫時的首要考慮。

 亞馬遜雲科技認為,智慧知識庫的架構設計,實質上是大語言模型(LLM,Large Language Model)在知識檢索領域如何得到充分利用的問題。以往要讓LLM在特定領域發揮作用,通常依靠的方法是提示工程(Prompt Engineering),透過不斷完善提問關鍵字,獲得對大語言模型的深入理解。但提示工程在知識庫這種相對具體的應用場合,效果不甚理想,對模型進行微調(Fine-tune)又可能導致成本過高。為此,亞馬遜雲科技決定採取檢索增強生成(RAG,Retrieval Augment Generation)方式增強模型,使之具有來自存檔知識源的增強上下文的模型架構。

 透過深思熟慮,最終亞馬遜雲科技為大禹團隊提供的,是一個智慧知識庫暨智慧會話機器人的解決方案指南,其中包括預訓練大語言模型,Amazon OpenSearch Service的向量資料服務,以及相關係統整合等。該解決方案指南具備自然語言處理能力、知識庫檢索能力、甚至是以資料去訓練大語言模型的能力,這些核心關鍵能力讓解決方案指南能實現目標知識庫約80%功能,西門子中國根據企業內部需求再做20%定製化開發,最終形成完整的解決方案。

 整個解決方案指南中,最大的亮點在於“RAG架構+向量資料庫”設計:核心主體知識庫以向量方式構建,能夠儲存超大規模的向量資料。透過對資料進行向量嵌入處理,跨部門、跨業務、跨場景的資料之間也能夠進行關係考量。而Amazon OpenSearch Service的k近鄰(kNN)外掛為它提供了核心向量資料庫功能,現在向量嵌入可以與單個混合請求中基於文字的關鍵字組合,查詢時在幾毫秒內就可獲得數十億向量的上下文相關響應。

 另一方面,RAG架構極大地擴充了大模型的可用性。普通情況下當知識庫新增內容時,相應的大模型必須進行微調,甚至是重新訓練。而RAG允許對新增部分使用相同的模型處理,無需調整模型。這就相當於知識庫在不影響訪問速度的前提下,擁有了近乎無限的可擴充套件性。由向量資料庫保障的傑出效能,再加上RAG架構提供的無限潛力,這就是智慧會話機器人“小禹”能夠在使用者以簡單語言進行提問的前提下,快速反饋生成式回答的秘密。

 並且,由於亞馬遜雲科技提供了包括向量資料庫、生成式AI在內的一系列核心技術,整個解決方案指南完成度高達80%,而Amazon OpenSearch Service的無伺服器特性,讓開發人員不需要管理叢集或擔心生產規模,可以快速推動部署。

 Amazon SageMaker也為架構的伸縮性以及大語言模型持續迭代提供了很大幫助。藉助SageMaker Endpoint的彈性伸縮能力,系統可以自動按照負載調整用於實時推理的資源,保證訪問需求的同時提升整體價效比。Amazon SageMaker上提供了豐富的模型開發和訓練工具,保證客戶可以在雲端輕鬆實現大語言模型的調優以及測試更多不同型別的開源模型。

 最終大禹團隊完成後續開發和整套系統的部署時間大大縮短,整體開發與部署僅用三個月就圓滿完成。

 大模型對於很多企業使用者而言都是新生事物,從接受、熟悉到使用大模型,往往是一個漫長的過程。亞馬遜雲科技不僅為企業客戶提供充裕的多樣化算力、以及包括向量資料服務在內的資料基礎設施來滿足和支撐大模型,更提供解決方案指南並與企業使用者共同進行後續開發。這讓客戶無需再花費時間在重複性的基礎建設上,從而能夠在非常短的時間內把垂直的、定製化的企業解決方案落地並投入應用。這在人工智慧高速發展,日新月異的今天,有重要的意義。

 

 業務成果:首周超過4000使用者使用,12000個問題被解答

 相對於傳統機器人,“小禹”智慧會話機器人的回答內容不僅生成速度更快,其對搜尋關鍵詞的命中率也更高,整體使用體驗遠超傳統機器人。

 西門子中國專屬智慧知識庫上線後,首周就有超過4000位內部使用者參與使用,超過12000個問題被提出並解答。作為智慧知識庫,它不但解決了各業務部門之間需求相似、重複開發的問題,更以雲上彈性資源和託管的Amazon OpenSearch Service、Amazon SageMaker等服務節約了系統在運維和擴充套件方面的投入成本。後續西門子大禹團隊仍將不斷完善智慧知識庫與“小禹”智慧會話機器人,與亞馬遜雲科技團隊以“聯合創新”模式合作,共同探討產品所需要的功能和實現方法,打造更優秀的產品功能與體驗。

 未來,西門子中國將與亞馬遜雲科技在人工智慧領域展開更為深度的合作,在數字孿生、工業元宇宙等多個方面進一步發揮人工智慧的作用。此前亞馬遜雲科技的一些產品和功能已被運用到西門子中國成都燈塔工廠,用於廢料分揀、產品自檢等關鍵的生產製造環節。可以想像在將來,人工智慧技術一定能夠以多種多樣的方式,發揮更大價值。



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70007680/viewspace-2984799/,如需轉載,請註明出處,否則將追究法律責任。

相關文章