「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

机器之心發表於2024-04-30

前段時間，微軟搞了個烏龍：隆重地開源了 WizardLM-2，又在不久後撤回得乾乾淨淨。

據現在可以查到的 WizardLM-2 釋出資訊，這是一個「真正媲美 GPT-4」的開源大模型，在複雜聊天、多語言、推理和代理方面的效能得到了提高。

該系列包括三個模型：WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中：

WizardLM-2 8x22B 是最先進的模型，也是對高度複雜任務進行內部評估後得出的最佳開源 LLM。
WizardLM-2 70B 具備頂級推理能力，是同等規模的首選；
WizardLM-2 7B 是速度最快的，其效能可與現有的 10 倍大的開源領先模型相媲美。

此外，透過人類偏好評估，WizardLM-28x22B 的能力「只是稍微落後於 GPT-4-1106 預覽版，但明顯強於 CommandRPlus 和 GPT4-0314。」

它會和 LLaMa 3 一樣，成為又一開源里程碑嗎？

當大家忙著下載模型的時候，團隊卻突然撤回了一切：部落格、GitHub、HuggingFace 全部 404。

圖源：https://wizardlm.github.io/WizardLM2/

團隊的解釋是：

所有 Huggingface 的朋友們，大家好！很抱歉，我們刪除了模型。我們已經有一段時間沒有釋出幾個月前的模型了，所以我們現在不熟悉新的釋出流程：我們不小心遺漏了模型釋出流程中的一個必要專案 — 毒性測試。這是目前所有新模型都需要完成的一個步驟。
我們目前正在快速完成這項測試，然後將盡快重新發布我們的模型。不用擔心，感謝關心和理解。

但 AI 社群對 WizardLM-2 的關注和討論沒有停止，疑點有幾個：

第一，被刪掉的開源專案不只是 WizardLM-2，該團隊所有的 Wizard 系列工作都不見了，包括此前的 WizardMath 和 WizardCoder。

第二，有人質疑，刪除模型權重的同時，為何連部落格也刪除呢？如果是隻是缺少測試部分，沒必要撤回得乾乾淨淨。

團隊的解釋是：「根據相關規定。」具體什麼規定？目前沒人知道。

第三，還有人猜測 WizardLM 背後的團隊已經被解僱，撤回 Wizard 系列專案也是被迫的。

不過，這種猜測被團隊否認了：

^{圖源：https://x.com/_Mira___Mira_/status/1783716276944486751}

^{圖源：https://x.com/DavidFSWD/status/1783682898786152470}

而且我們現在搜尋作者的名字，也並沒有從微軟官網中完全消失：

^{圖源：https://www.microsoft.com/en-us/research/people/qins/}

第四，有人猜測，微軟撤回這個開源模型，一是因為效能過於接近 GPT-4，二是因為和 OpenAI 的技術路線「撞車」了。

具體是什麼路線呢？我們可以看一下當初部落格頁面的技術細節。

團隊表示，透過 LLM 訓練，自然界中人類生成的資料日益枯竭，而 AI 精心建立的資料和 AI Step-by-Step 監督的模型將是通往更強大 AI 的唯一途徑。

過去的一年裡，微軟團隊建立了一個完全由人工智慧驅動的合成訓練系統，如下圖所示。

大概分為幾個版塊：

資料預處理：

資料分析：使用這個 pipeline 來獲得新源資料的不同屬性的分佈，這有助於對資料有一個初步的瞭解。
加權取樣：最佳訓練資料的分佈往往與人類聊天語料的自然分佈不一致，需要根據實驗經驗調整訓練資料中各屬性的權重。

Evol Lab：

Evol-Instruct：投入了大量精力重新評估了最初 Evol-Instruct 方法中存在的各種問題，並對其進行了初步修改，新方法能讓各種智慧體自動生成高質量的指令。
Evol-Answer：引導模型多次生成和重寫回復，可以提高其邏輯性、正確性和親和力。

AI Align AI（AAA）：

協同教學：收集 WizardLM 和各種授權開源和專有的最先進模型，然後讓它們協同教學並相互提高，教學內容包括模擬聊天、質量評判、改進建議和縮小技能差距等。
Self-Teaching：WizardLM 可以透過啟用學習，為監督學習生成新的進化訓練資料，為強化學習生成偏好資料。

學習：

監督學習。
階段 - DPO：為了更有效地進行離線強化學習，將優選資料分割成不同的片段，並逐級改進模型。
RLEIF：採用指令質量獎勵模型（IRM）與過程監督獎勵模型（PRM）相結合的方法，使得線上強化學習中實現更精確的正確性。

最後要說的是，任何猜測都是徒勞的，讓我們期待一下 WizardLM-2 的復出吧。

相關文章

iPhone緊急聯絡人設定教程 iPhone怎麼設定緊急聯絡人？
2018-08-30
iPhone
微軟緊急釋出10個IE補丁使用者應火速升級
2019-05-12
微軟
微信轉錯賬撤回設定方法微信轉錯了錢怎麼撤回？
2018-07-07
華為手機緊急聯絡人使用教程華為手機緊急呼叫怎麼設定？
2018-08-29
OPPO手機緊急聯絡人設定使用教程 OPPO手機怎麼設定緊急聯絡人
2018-08-29
目前常用的室內導航有哪些？什麼軟體可以室內導航？
2022-02-22
曝出漏洞、企業禁用、緊急宣告：Zoom 一週裡經歷了什麼?
2020-04-07
OOM
螞蟻金服微貸前端技術團隊緊急招聘公告
2019-02-18
前端
win10系統如何緊急重新啟動_win10緊急重新啟動的使用教程
2020-07-11
Win10
try{}裡有一個return語句，那麼緊跟在這個try後的finally{}裡的code會不會被執行，什麼時候被執行？
2021-01-03
微軟win10 19H1音樂控制更新：不用擔心螢幕內容被阻擋了
2018-11-13
微軟Win10
什麼是應急響應?網路安全應急響應的物件是什麼?
2021-12-14
物件
時間緊急！資料庫遷移怎麼才能更快？
2018-07-25
資料庫
GPT-4超強進化，近萬人聯名封殺！白宮緊急開會，ChatGPT概念股暴跌
2023-04-06
ChatGPT
小米手機設定緊急聯絡人方法小米能設定緊急聯絡人嗎？
2018-08-29
國內Windows系統盜版如此猖獗，微軟為什麼不追究呢?
2019-10-17
Windows微軟
為什麼特徵相關性非常的重要？
2019-10-23
特徵
如何解決衛生間門鎖不小心被反鎖了的緊急問題 All In One
2024-07-26
為什麼需要應急響應?網路安全應急響應需要做什麼?
2023-02-03
Python + Wxpy 實現微信防撤回。
2019-08-12
Python
微信多開和防撤回工具
2021-10-16
優步的緊急按鈕及其背後的技術
2022-04-06
axure是什麼軟體幹什麼的 axure怎麼用有哪些功能
2022-04-21
微軟：ProxyShell 漏洞“可能被利用”
2021-09-03
微軟
電腦上有什麼比較好用的螢幕錄製軟體
2018-11-14
軟體開發有什麼作用
2021-05-10
如何用Python記錄微信撤回的訊息
2021-11-05
Python
微軟撤回延期決定：Windows10 Mobile週年更新今年停止支援
2018-10-19
微軟Windows
有贊搜尋系統的技術內幕
2018-09-18
Oracle緊急固定執行計劃之手段
2020-07-14
Oracle
Redis 6.0.8 緊急釋出，請儘快升級！
2020-09-12
Redis
PyCaret 2.1橫空出世-有什麼新的內容？
2020-09-10
可以開啟heic格式的軟體有什麼
2019-07-25
微信多開小助手WeChatTweak Mac(微信防撤回)
2022-10-31
Mac
《柳葉刀》：更有效的緊急避孕措施誕生了！
2023-12-29
【網路安全】組織為什麼需要應急響應?應急響應需要做什麼?
2022-05-16
『學概念找員外』你說什麼？交易還能撤回？
2021-09-09
比特幣軟體被曝DoS漏洞：開發者緊急修補
2018-09-21
比特幣