??想快速進入人工智慧領域的Java程式設計師?你準備好了嗎?

努力的小雨發表於2023-11-16

引言

今天我們來探討一下作為Java程式設計師,如何迅速融入人工智慧的領域。,當前有一些流行的LLMs選擇,例如ChatGPT、科大訊飛的星火、通義千問和文心一言等。如果你還沒有嘗試過這些工具,那麼現在也不失為一個很好的機會,趕快體驗一下吧。這些工具不僅能夠為你的Java程式設計工作提供更多的可能性,還能夠為你帶來全新的AI應用體驗。無論是開發聊天機器人、語音識別系統還是智慧問答平臺,這些工具都能夠為你提供強大的支援和便利。所以,不妨抓住這個機會,加入AI的行列,拓寬你的技術領域吧!

當然,我們作為程式設計師肯定不僅僅是簡單地使用大型語言模型(LLMs),今天,我們就來看看如何才能讓這些工具為我們服務,成為我們的初代“賈維斯”。讓我們一起探索人工智慧的無限可能!

AI初體驗

話歸正題,當人工智慧技術越來越火的時候,我們第一反應都是會迫不及待地想要嘗試並體驗它的魅力,各種奇葩的魔法問答也就應運而生了。這些LLMs系統透過與人自然互動,能夠回答使用者的各種問題,有時候甚至會給出一些有趣的回答。如下圖:

image

不過,我們也要明白,這些LLMs系統實際上也是基於大資料和機器學習演算法構建的,它們並不具備真正的智慧和理解能力。因此,在使用這些系統時,我們需要保持理性和客觀,不要過於依賴它們,而是要明確它們的侷限性,並結合自己的判斷力進行思考和決策。

問答進化

雖然LLMs在回答問題時表現出了驚人的能力,但有時候它們也會出現錯誤的情況。有時候,它們可能會給出與我們問的問題不相符的答案,這可能是由於模型的訓練資料不完善或者存在一些偏見和誤導性的資訊。於是乎,這時候網上又掀起來了一陣各個角色扮演的狂風,透過套殼AI應用來調侃和娛樂,一些個人和小公司也會利用這一現象來盈利,推出各種有趣的問答形式。這種問答形式的變化不僅給我們帶來了樂趣,也展示了人工智慧技術的靈活性和創造力,然後我們的問答模式先進了一下,變成了以下的問答形式:

image

這個時候就取決於誰的提示寫得更好,寫得好的人能夠吸引更多的使用者,而流量可以轉化為收益。在這個階段,博主也加入了進來,嘗試使用套殼應用。因為GitHub上有大量的開原始碼可供使用,只需要將其部署到本地就可以完成。這個過程非常簡單。

問答外掛開發

接下來,開發者們開始瘋狂輸出,例如開始開發GPT外掛,國內也有很多語言模型開始使用外掛。其中,聯網功能外掛最典型,因為大型模型無法保持最新的新聞和知識庫,所以這個外掛的出現非常熱門。雖然熱度很高。不過基本上的邏輯也很簡單,如下圖所示:

image

這個時候,開發者們透過外掛的形式為LLMs增加了更多的功能和靈活性。這些外掛可以使LLMs能夠聯網獲取實時的新聞和知識,從而提供更準確和全面的答案。這些外掛的開發為LLMs的應用場景提供了更多的可能性,也為開發者們創造了更多的機會。

知識庫建立

剩下的形態開始變得豐富多樣。如果你發現在詢問LLMs之前可以提前收集很多有用的資訊,那麼你可以建立自己獨立的“賈維斯”個人助理,只需要提前將資訊儲存起來,就像建立了自己的知識庫一樣。接下來的任務就是如何透過檢索相似資訊並提供給LLMs,讓它根據我們提供的有效資訊來回答問題。畢竟,訓練一個LLMs是非常耗費時間和精力的,你覺得你有足夠的時間和精力在業餘時間來完成嗎?還是利用已經訓練好的LLMs好好使用吧,只要你提供足夠詳細的知識,LLMs的回答就會越好。LLMs的選擇越好,你得到的結果也會越好。剩下的工作就類似於這樣一種架構圖:

image

當你看到這個架構圖時,你會發現,現在重要的是誰能夠更好地擴充思維。你得到的架構圖越複雜,結果就越詳細。讓我來解釋一下。首先,我們需要了解如何建立自己的知識庫。在解釋知識庫之前,我們需要了解一下"embedding"這個概念。"embedding"是將語言、圖片或其他任何東西轉換為數字編碼型別的向量的過程。如果你開發過推薦功能,你對此應該不陌生。

如果我們將你的喜好和瀏覽記錄轉化為可計算的數字向量,接下來我們需要一個向量資料庫來儲存這些計算好的向量。我們可以舉一個向量資料庫(比如Milvus)作為例子,當然你也可以選擇其他向量資料庫。向量資料庫是專門用於儲存向量資料的,同樣具備增刪改查四種基本操作。

透過將使用者的喜好和瀏覽記錄轉化為可計算的向量,並利用向量資料庫進行查詢和推薦,你可以打造一個個性化的推薦系統。這個系統能夠根據使用者的興趣和行為模式,找到與其相似的其他使用者,並向他們推薦已購買的產品或感興趣的知識資料片段。而我們的儲存系統則應該專注於收集和儲存與我們所處的行業或領域相關的獨特資訊,作為我們的知識資料庫。

類似於我們查詢最相似的記錄,我們可以將向量資料庫視為自己的瀏覽器搜尋引擎,查詢到的記錄必定是我們想要的知識片段。我們將這個片段傳送給LLMs,並附上我們的問題或想法。LLMs會根據你傳送的知識片段進行回答,這樣一個自己的“賈維斯”助理就誕生了。

總結

實際上,每個分支節點都可以繼續進行細分,直到建立出一個完美的個人助理。現在,LLMs(Language Models)非常流行且數量眾多。然而,對於一個上班的開發者而言,自行訓練一個個性化的模型可能既費時又麻煩,並且並不一定能夠得到理想的結果。事實上,很可能在未來的某個時間點,其他公司已經開發出了針對您所在領域的完美LLMs模型。根據我之前提到的模型架構,您只需要簡單地替換一下LLMs的選擇,就能夠靈活地適應自己的需求,並且不受限制。

相關文章