OpenAI員工公開指責Grok3 為什么引熱議什么原因？

時間：2025-02-24 09:47:42

導讀：近日，OpenAI的一名員工公開指責埃隆?馬斯克旗下的xAI公司，稱其發布的最新AI模型Grok3的基準測試結果具有誤導性。對此，xAI的聯合創始人...

近日，OpenAI的一名員工公開指責埃隆?馬斯克旗下的xAI公司，稱其發布的最新AI模型Grok3的基準測試結果具有誤導性。對此，xAI的聯合創始人伊戈爾?巴布什金(Igor Babushkin)則堅稱公司并無不當。xAI的圖表顯示，Grok3的兩個版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表現超過了OpenAI當前最強的可用模型o3-mini-high。然而，OpenAI的員工很快在X平臺上指出，xAI的圖表并未包含o3-mini-high在“cons@64”條件下的AIME 2025得分。巴布什金在X平臺上辯稱，OpenAI過去也曾發布過類似的誤導性基準測試圖表。盡管這些圖表是用于比較其自身模型的表現。

標簽：OpenAI員工公開指責Grok3 OpenAI 員工 Grok3 社會資訊

上一篇：女子持續發熱兩周未愈確診白血病這也太可怕了

下一篇：最后一頁

內容

OpenAI員工公開指責Grok3 為什么引熱議什么原因？
2025-02-24 09:47:42

近日，OpenAI的一名員工公開指責埃隆?馬斯克旗下的xAI公司，稱其發布的最新AI模型Grok3的基準測試結果具有誤導性。對此，xAI的聯合創始人
女子持續發熱兩周未愈確診白血病這也太可怕了
2025-02-24 09:14:27

一直以為自己得了甲流，還好來醫院檢查了，否則我就沒命了……2月14日，浙江寧波46歲的王女士(化名)躺在鄞州區第二醫院血液科病床上感嘆不
對比10家店花1萬買助聽器仍被坑為什么引爭議？
2025-02-24 09:10:36

記者調查了解到，市面上有數字和模擬兩種助聽器。模擬助聽器號稱免驗配、免調試，價格可以低到幾十元。??江西的金先生選購的模擬助聽器，
女子曬自家墓景房樓下就是考古工地究竟是怎么樣的？
2025-02-24 09:06:14

近日，在陜西西安，一位女子通過網絡平臺分享了自家小區周邊獨特的風景。原本，女子所住的小區周邊計劃建設一個大超市，然而，出乎所有人意