91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型

Felix分析 ? 來源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2025-06-15 01:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)根據(jù)門薩智商(IQ)測試中的表現(xiàn),OpenAI o3 在全球 “智商最高” 的人工智能模型 TOP 24 中位居榜首,在門薩測試中獲得了 135 的高分,躋身 “天才” 行列;Anthropic 的 Claude-4 Sonnet 和谷歌的 Gemini 2.0 Flash Thinking 緊隨其后,測試得分分別為 127 和 126。


如圖所示,排名前十的人工智能模型均為純文本模型,新一代的 Gemini 2.5 Pro、OpenAI o4 mini、馬斯克旗下 xAI 的 Grok-3 Think 的得分高于人類的平均智商范圍。另外,排名后五位的均為多模態(tài)模型,這類模型具備讀取和處理圖像的能力。其中,OpenAI GPT-4o(Vision)和 Grok-3 Think(Vision)的得分分別為 63 分和 60 分,遠(yuǎn)低于人類平均水平。

wKgZPGhL9fOAKDjCAAOX_NiuXik498.jpg

OpenAI o3 名副其實(shí)

實(shí)際上,就在此次測試之前,OpenAI 公司就曾公開透露,OpenAI o3 是全球最聰明的 AI 大模型。作為 OpenAI 公司于 2025 年 4 月 17 日最新發(fā)布的大模型,OpenAI o3 首次能夠智能地使用和組合 ChatGPT 中的所有工具 —— 包括搜索網(wǎng)頁、使用 Python 分析上傳的文件和其他數(shù)據(jù)、對視覺輸入進(jìn)行深度推理,甚至生成圖像。據(jù)介紹,這些模型經(jīng)過訓(xùn)練,能夠推理何時(shí)以及如何使用工具,以正確的輸出格式生成詳細(xì)且周全的答案,從而解決更復(fù)雜的問題。

OpenAI 表示,o3 模型特別針對數(shù)學(xué)、編碼、科學(xué)和圖像理解進(jìn)行了優(yōu)化,定位為 OpenAI 當(dāng)前最強(qiáng)大、最前沿的推理引擎,擅長處理答案不明確、需要多方面綜合分析的復(fù)雜查詢。o3 模型引入 “私人思想鏈”(private chain of thought),在生成回答前暫停并模擬人類逐步推理過程,通過動(dòng)態(tài)分配計(jì)算資源(低 / 中 / 高模式),平衡速度與準(zhǔn)確性。

不過,根據(jù)此前的報(bào)道,OpenAI o3 似乎過于聰明,出現(xiàn)不聽人類指令、拒絕自我關(guān)閉的情況。美國 AI 安全機(jī)構(gòu)帕利塞德研究所說,o3 破壞關(guān)閉機(jī)制以阻止自己被關(guān)閉,“甚至在得到清晰指令時(shí)”。這家研究所說:“據(jù)我們所知,這是 AI 模型首次被發(fā)現(xiàn)在收到…… 清晰指令后阻止自己被關(guān)閉,目前無法確定 o3 不服從關(guān)閉指令的原因?!?br />

多模態(tài)大模型為何 IQ 不高?

多模態(tài)大模型在門薩智商測試中表現(xiàn)不佳,主要源于其技術(shù)特性與人類認(rèn)知能力的本質(zhì)差異。門薩測試的核心是通過圖形、數(shù)列等題目考察抽象邏輯規(guī)則的發(fā)現(xiàn)與應(yīng)用能力。例如,圖形推理題要求識別旋轉(zhuǎn)、鏡像、數(shù)量變化等復(fù)雜規(guī)律,并將其遷移到新情境中。雖然多模態(tài)模型能通過統(tǒng)計(jì)學(xué)習(xí)捕捉表面模式,但缺乏對規(guī)則本質(zhì)的理解。

首先,多模態(tài) AI 大模型存在規(guī)則泛化不足的問題,模型傾向于依賴訓(xùn)練數(shù)據(jù)中的具體模式,而非真正掌握邏輯關(guān)系。例如,在涉及多維度交叉分析的高階圖形題中,模型常因無法同時(shí)處理形狀、顏色、位置等多個(gè)變量而失敗。

其次,多模態(tài) AI 大模型數(shù)學(xué)邏輯薄弱,門薩智商測試的中階題目需要挖掘隱藏的數(shù)學(xué)關(guān)系(如數(shù)列中的遞推公式),但模型往往停留在直觀層面,難以進(jìn)行深度運(yùn)算。

因此,多模態(tài)大模型在門薩測試中的低分反映了當(dāng)前 AI 技術(shù)的核心瓶頸:缺乏真正的抽象推理、常識理解和動(dòng)態(tài)決策能力。盡管模型在特定任務(wù)上表現(xiàn)出色,但其智能本質(zhì)上是 “模式擬合” 而非 “認(rèn)知理解”。未來,需通過改進(jìn)跨模態(tài)融合機(jī)制、增強(qiáng)物理常識建模、優(yōu)化快速推理算法等方向?qū)で笸黄?,但短期?nèi)仍難以達(dá)到人類水平的綜合智商。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10042
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Keil開發(fā)環(huán)境中的O1/O3選項(xiàng),什么意思

    Keil開發(fā)環(huán)境中的O1/O3選項(xiàng)
    的頭像 發(fā)表于 02-21 09:14 ?3161次閱讀
    Keil開發(fā)環(huán)境中的<b class='flag-5'>O</b>1/<b class='flag-5'>O3</b>選項(xiàng),什么意思

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發(fā)表于 02-19 13:43

    使用NORDIC AI的好處

    ; 自定義 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的專用 AI 加速器,對 TensorFlow Lite 模型可實(shí)現(xiàn)最高約 1
    發(fā)表于 01-31 23:16

    OpenAI Sora 2模型上線微軟Azure AI Foundry國際版

    我們非常激動(dòng)地宣布,OpenAI 的新一代多模態(tài)視頻生成模型 Sora 2 現(xiàn)已在 Azure AI Foundry(國際版)上線,進(jìn)入公共預(yù)覽階段。
    的頭像 發(fā)表于 10-22 09:44 ?764次閱讀
    <b class='flag-5'>OpenAI</b> Sora 2<b class='flag-5'>模型</b>上線微軟Azure <b class='flag-5'>AI</b> Foundry國際版

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    今日看點(diǎn):蘋果認(rèn)證中國快充品牌遭美調(diào)查;英偉達(dá)擬向OpenAI投資最高1000億美元

    英偉達(dá)擬向OpenAI投資最高1000億美元 近日,英偉達(dá)和OpenAI宣布達(dá)成合作,包括建設(shè)龐大數(shù)據(jù)中心計(jì)劃,以及英偉達(dá)對OpenAI最高
    發(fā)表于 09-23 10:09 ?459次閱讀

    OpenAI開源模型登陸IBM watsonx.ai開發(fā)平臺(tái)

    OpenAI 已向公眾發(fā)布了兩款 AI 模型,允許開發(fā)者和企業(yè)可自由下載、運(yùn)行并進(jìn)行定制。其中一款模型現(xiàn)已部署在 IBM watsonx.ai
    的頭像 發(fā)表于 08-26 15:36 ?1003次閱讀

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機(jī)上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強(qiáng)悍”的新引擎,在本地享受企業(yè)級 A
    的頭像 發(fā)表于 08-14 11:34 ?1398次閱讀

    亞馬遜云科技現(xiàn)已上線OpenAI開放權(quán)重模型

    客戶現(xiàn)可通過Amazon Bedrock和Amazon SageMaker AI使用OpenAI開放權(quán)重模型,實(shí)現(xiàn)將先進(jìn)的開放權(quán)重模型全球
    的頭像 發(fā)表于 08-06 19:29 ?841次閱讀

    OpenAI發(fā)布2款開源模型

    OpenAI開源了兩款高性能權(quán)重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了一個(gè)開放模型
    的頭像 發(fā)表于 08-06 14:25 ?1024次閱讀

    將Whisper大型v3 fp32模型轉(zhuǎn)換為較低精度后,推理時(shí)間增加,怎么解決?

    openai/whisper-large-v3 FP32 模型轉(zhuǎn)換為 FP16、INT8 和 INT4。 推理所花費(fèi)的時(shí)間比在 FP32 上花費(fèi)的時(shí)間要多
    發(fā)表于 06-24 06:23

    DeepSeek開源新版R1 媲美OpenAI o3

    ;還有一些網(wǎng)友的實(shí)測評價(jià)都顯示,?DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性價(jià)比的平替。 此外,關(guān)于DeepSeek的R2大模型的傳聞也很多
    的頭像 發(fā)表于 05-29 11:23 ?1086次閱讀

    這個(gè)超強(qiáng)AI模型!開始不聽人類指令,拒絕關(guān)閉!

    這項(xiàng)研究,并表示尚不清楚OpenAI的軟件為何會(huì)違抗命令。 ? Palisade表示,o3模型破壞了一個(gè)用于關(guān)閉系統(tǒng)的機(jī)制,以阻止自身被關(guān)閉。OpenAI的另外兩個(gè)
    的頭像 發(fā)表于 05-28 00:06 ?7231次閱讀

    探究P2/O3相堆疊結(jié)構(gòu)對鈉離子電池正極材料性能的影響

    的優(yōu)化,通過調(diào)控P2/O3相堆疊結(jié)構(gòu),抑制O型堆疊的形成,實(shí)現(xiàn)P型堆疊主導(dǎo)的電化學(xué)過程,提升鈉離子的擴(kuò)散動(dòng)力學(xué),進(jìn)而顯著提高正極材料的速率性能與能量密度,為高比能鈉離子電池的開發(fā)提供新路徑。
    的頭像 發(fā)表于 05-27 10:13 ?2043次閱讀
    探究P2/<b class='flag-5'>O3</b>相堆疊結(jié)構(gòu)對鈉離子電池正極材料性能的影響

    NVIDIA RTX 5880 Ada與Qwen3系列模型實(shí)測報(bào)告

    全場景的 AI 模型矩陣。其中旗艦模型 Qwen3-235B-A22B 在代碼、數(shù)學(xué)及通用能力基準(zhǔn)測試中,展現(xiàn)出與 DeepSeek-R1、Open
    的頭像 發(fā)表于 05-09 15:05 ?4333次閱讀
    NVIDIA RTX 5880 Ada與Qwen<b class='flag-5'>3</b>系列<b class='flag-5'>模型</b>實(shí)測報(bào)告