近期大模型AIGC概要:Grok 1.5 視覺升級等

banq發表於2024-04-15

埃隆·馬斯克 (Elon Musk) 的使命是證明開源人工智慧可以與最好的人工智慧競爭,而 Grok 的最新升級剛剛向前邁出了一大步。

憑藉超越頂級模型的新多模態能力,xAI 正在悄悄地展現出自己是人工智慧重量級世界中的有力競爭者。讓我們探索一下……

近期人工智慧概要中:

  • Grok 1.5 獲得視覺升級
  • Adobe Firefly 使用 Midjourney 影像進行訓練
  • 使用 ChatGPT 在幾秒鐘內建立思維導圖
  • 谷歌 DeepMind 機器人踢足球
  • 6 個新的人工智慧工具

Grok 1.5 獲得視覺升級
概要:
 Elon Musk 的 xAI 剛剛推出了Grok-1.5 Vision,這是對開源模型的多模式升級,允許處理視覺資訊。
細節:

  • Grok 1.5V 現在可以處理文件、圖表、螢幕截圖和照片等視覺資訊,重點是對現實世界的理解。
  • xAI 建立了一個新的“RealWorldQA”基準來評估空間理解,其中 Grok-1.5V 的效能優於 GPT-4V 和 Gemini。
  • xAI 表示 1.5-V 將很快向測試人員和現有使用者推出,預計未來幾個月將在影像、音訊和影片方面實現重大改進。

為什麼重要:雖然 Grok 在更廣泛的 LLM 討論中感到沒有得到充分重視,但令人印象深刻的願景升級表明開源模式正在參與競爭。憑藉埃隆在 X 和特斯拉的資料庫以及他肩上的晶片,現在可能是業界開始關注的時候了。

Adobe Firefly 使用 Midjourney 影像進行訓練
概要:
在一份令人驚訝的新報告中,Adobe 的 Firefly AI 影像生成器據稱在其訓練資料中使用了 Midjourney 等競爭對手建立的數千張影像。 
細節:

  • 該報告顯示,用於訓練 Firefly 的影像中約有 5% 是人工智慧生成的,其中包括一些由競爭對手 Midjourney 建立的影像。
  • Adobe 將 Firefly 宣傳為“商業安全”選項,聲稱它主要是根據自己的 Adob​​e Stock 庫中的許可影像進行訓練的。
  • Adobe 為這種做法進行了辯護,稱所有影像(包括人工智慧生成的影像)​​都經過了稽核過程。
  • 據報導,Adobe 內部存在分歧,員工質疑使用人工智慧影像進行培訓的道德規範。

重要性:雖然 Adob​​e 將 Firefly 定位為競爭對手的道德、合法的替代品,但在訓練資料中使用 Midjourney 的影像會嚴重破壞這一主要賣點。它還可能削弱藝術家和企業客戶之間的信任——他們可能被現在看來是虛假的承諾所吸引。

使用 ChatGPT 在幾秒鐘內建立思維導圖 
概要:在本教程中,您將學習如何使用 ChatGPT 免費將複雜的想法轉化為視覺化且資訊豐富的思維導圖。
一步步:

  1. 前往ChatGPT。您可以使用 GPT-3.5(免費版本)或 GPT-4(付費版本)。
  2. 寫下以下提示:“建立[您的主題]的思維導圖。將主題列為中心思想、主要分支和子分支。”
  3. ChatGPT 生成初始思維導圖輪廓後,請求 Markdown 格式:“以 Markdown 格式建立相同的思維導圖。”
  4. 將 Markdown 貼上到Markmap中,然後您的思維導圖就會變得栩栩如生。

額外提示: 您可以自定義思維導圖的外觀,然後將其下載為互動式 HTML 或靜態 SVG。

Google DeepMind 機器人踢足球
概要:谷歌 DeepMind 和劍橋大學的研究人員剛剛教授微型人形機器人相互踢足球,展示了複雜的技能學習和敏捷的適應能力。
細節:

  • 研究人員首先教授步行和起立等基本技能,然後讓機器人練習與逐漸改進的自己版本進行比賽。
  • 與基準機器人相比,經過 AI 訓練的機器人行走速度幾乎提高了 3 倍,轉身速度加快了 5 倍,跌倒後站起來的速度加快了 63%。
  • 研究人員發現,人工智慧有助於學習聰明的策略,例如在沒有明確告知的情況下進行防守時採取短而快的步驟。

重要性:雖然這些笨拙但可愛的機器人不會很快參加世界盃,但這項研究證明了人工智慧在實現複雜技能學習和適應能力方面的力量,甚至導致它們自己發展出獨特的行為和戰術。

流行的人工智慧工具

  •  LangAI  - 用 20 多種語言與 AI 流暢聊天 
  •  eezyCollab  - 透過經濟實惠的影響者合作提升您的品牌 
  •  Sana AI  - 團隊人工智慧知識助手 
  •  Wonders  - 涵蓋 5.2 億多篇研究論文的 AI 搜尋引擎
  •  Akuma  - 使用實時 AI 畫布創作動漫藝術 
  •  DomoAI  - 將影像轉換為動態影片 

快速簡要:

  • OpenAI最新更新的 GPT-4 Turbo 模型重新奪回了LMSYS 法學碩士排行榜的榜首,投票數超過了 Claude 3 Opus。
  • 谷歌宣佈將於 6 月推出一款名為 Vids 的新人工智慧應用程式,它將充當建立影片內容的寫作、製作和編輯助手。
  • Avenged Sevenfold 主唱 M Shadows表示,未來粉絲們不會關心音樂是由人工智慧還是人類創作的,他稱人工智慧是一個“更深層次的工具”,可以幫助激發音樂家的創造力,而不是對藝術家的威脅。
  • 埃隆·馬斯克(Elon Musk)(也許是在開玩笑)在突破獎頒獎典禮上接受採訪時提出了人工智慧模型在 2032 年競選總統的可能性。
  • Autodesk 的一項新調查發現,“使用人工智慧工作的能力”被認為是未來各個就業領域最重要的技能。
  • 2024 年大師賽實施了多項 AI 功能,以增強高爾夫賽事的報導,包括球場洞察、AI 支援的旁白、3D 球場渲染和個性化精彩片段。

相關文章