AI智商排名：Claude-3首次突破100

banq發表於2024-03-06

用挪威門薩（智商測試題）中 35 個問題對chatGPT等人工智慧進行了測試：

ChatGPT
對ChatGPT進行了兩次挪威門薩測試，在 35 個問題中，它平均答對了 13 個，智商估計為 85。

測試方法
每個人工智慧都接受了兩次測試，以減少差異。"答對題目數 "指兩次測試的平均答對題目數。

雖然挪威門薩協會拒絕對低於 85 分的題目進行評分，但我注意到在這個範圍內，每道題的智商值為 3 分。因此，我以此來估算 85 分以下的分數。對於挪威門薩來說，這還不夠嚴謹，但我認為值得一算。要知道，隨機猜測得到的分數是 63.5 分--這應該被理解為基線，人工智慧只需意識到它被要求選出一個字母，並吐出一個即可。

測試結果
AI智商排名：Claude-3首次突破100

收穫 1：Claude-3 令人驚歎--它代表了人工智慧的新飛躍
ChatGPT-4 得分智商是 85，這已經給我留下了深刻印象。

Claude-3 的得分讓我大吃一驚。

另外，看看它的持續進步：

2023 年 3 月釋出的Claude-1 幾乎比隨機答案好不到哪裡去。它答對了 6 個答案，智商約為 64。
2023 年 7 月釋出的Claude-2 每次測試多得 6 分（相當於約 18 點智商），智商約為82。
剛釋出Claude 3 號又得到了 6.5 分，智商增加了約 19 分，智商約為101分，超過了人類的平均水平。

這種對稱增長讓我懷疑人類學是否在釋出基於內部基準的版本，而這些內部基準恰好與智商指標密切相關。

對當前增長率的簡單推斷表明，Claude-6 將在大約 4 - 10 年內答對所有智商問題，並且比幾乎所有人都聰明。

詳細點選標題

QUICK FactSet：全球股票總市值首次突破100萬億美元超全球GDP兩成
2020-12-22
UI
IDC：2021上半年全球AI伺服器首次突破400億
2022-03-15
AI伺服器
Sensor Tower：2021年185家手遊發行商年收入首次突破100萬美元
2021-12-27
AI在用 | 數學更生動，Claude-3直接生成勾股定理動畫
2024-03-19
AI動畫
排名前100的PHP函式及分析
2018-11-05
PHP函式
SQL排名問題，100% leetcode答案大公開！
2021-03-27
SQLLeetCode
2021年全球併購交易首次突破5萬億美元
2021-12-30
中國貨代物流企業100強排名
2020-11-14
今天Vue Star突破100K，正式超越了React
2018-06-15
VueReact
Polygon：2010-2019年全球遊戲排名TOP100
2019-11-07
Go遊戲
性格及智商測試
2020-04-07
美團股價再次創下新高市值首次突破2萬億港元
2022-02-28
《不休的烏拉拉》TapTap下載量已突破100萬
2020-06-16
APT
《小小夢魘 2》全球累計銷量突破 100 萬
2021-03-15
谷歌：2020年購物指南 Top 100熱門禮品排名
2020-12-03
谷歌
NASBO：2018財年美國州政府支出首次突破2萬億美元
2018-11-15
2018-2019財年聯想營業額首次突破500億美元
2019-05-26
乘聯會：中國新能源汽車滲透率首次突破50%
2024-08-13
黎曼猜想突破作者首次公開講解，陶哲軒送上總結
2024-06-06
Fami：日本《健身環大冒險》銷量突破100萬份
2020-06-17
2020年Q4 Quest 2銷量突破100萬臺
2021-02-02
VGChartz：任天堂Switch銷量突破1.2億臺排名歷史第三
2023-02-06
GC
《臥龍》全球玩家達380萬，出貨量突破100萬份
2023-04-28
Tidex交易量突破100億美元加速佈局NFT 與Metaverse
2021-12-01
IDEMetaverse
國行任天堂 Switch 累計出貨量突破 100 萬臺
2021-01-12
回顧2022，那些令人印象深刻的AI突破
2023-01-04
AI
YouGov ：2022 年全球最佳品牌榜三星電子首次排名第一
2022-11-21
Go
AI遍佈全球：排名前十位的城市
2019-06-13
AI
Square Enix：Switch遊戲《八方旅人》全球銷量突破100萬
2018-08-04
遊戲
美國財政部：美國國債規模已經突破35萬億美元有史以來首次突破這一水平
2024-07-30
關聯式資料庫SQL面試排名前100道問答題
2021-12-30
資料庫SQL面試
中消協：100個城市消費者滿意度排名杭州第一
2021-03-14
我國電商半年零售額首次突破3萬億創同期最高紀錄
2018-03-26
IIF：2021年全球債務總額首次突破300萬億美元達到303萬億美元
2022-02-27
IC Insights：預計2021年全球MPU市場有望首次突破1000億美元大關
2021-08-27
agc016B – Colorful Hats(智商題)
2018-09-20
GC
AI系統有助突破醫藥研發瓶頸
2018-12-10
AI
AI“文化宴”，易碎的市場尋求新的突破
2019-07-10
AI

AI智商排名：Claude-3首次突破100

相關文章