當(dāng)前位置:網(wǎng)校一點通>社會資訊 >   正文

李飛飛團隊用不到50美元訓(xùn)練出新模型 到底是不是真的?

導(dǎo)讀:據(jù)媒體報道,AI教母李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員近日以不到50美元的云計算費用訓(xùn)練了一個名叫s1的人工智能推理模型。該模型在數(shù)...

據(jù)媒體報道,“AI教母”李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員近日以不到50美元的云計算費用訓(xùn)練了一個名叫s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。

李飛飛團隊用不到50美元訓(xùn)練出新模型 到底是不是真的?

s1誕生標(biāo)志著高效AI模型訓(xùn)練的新時代。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini2.0FlashThinkingExperimental提煉出來的。這種方法的核心在于如何有效地傳遞知識,使得小模型不僅具備大模型的推理能力,而且在資源消耗上表現(xiàn)得極為優(yōu)越。

李飛飛團隊的這一突破,不僅展現(xiàn)了技術(shù)的前瞻性,而且為更多科研機構(gòu)和創(chuàng)業(yè)公司提供了借鑒的藍本。同時,s1所展現(xiàn)出價格優(yōu)勢的背后,其實也反映了未來AI領(lǐng)域的一個重要趨勢:大模型的訓(xùn)練和應(yīng)用將愈發(fā)平民化。

此前DeepSeek發(fā)布一系列DeepSeek-R1模型,探索了將R1的推理能力蒸餾到更小模型中的潛力,通過知識蒸餾技術(shù),成功將大模型的推理能力傳遞給小模型,實現(xiàn)了小模型在推理任務(wù)上的顯著提升,引領(lǐng)了小模型的發(fā)展方向。

內(nèi)容
主站蜘蛛池模板: 嘉祥县| 泸州市| 彭山县| 隆尧县| 阜宁县| 镇巴县| 无锡市| 盐边县| 综艺| 高安市| 凌云县| 博乐市| 顺义区| 桐庐县| 天峨县| 宕昌县| 红河县| 万山特区| 遵化市| 盐池县| 马关县| 菏泽市| 汝城县| 临澧县| 绥化市| 大同市| 简阳市| 乾安县| 鞍山市| 小金县| 梅河口市| 东乡族自治县| 九龙城区| 如皋市| 囊谦县| 嘉兴市| 松滋市| 大理市| 鄯善县| 综艺| 秀山|