• <u id="qkpp5"></u>

    1. <p id="qkpp5"><nav id="qkpp5"><option id="qkpp5"></option></nav></p>
      <p id="qkpp5"><var id="qkpp5"></var></p>
    2. 玖玖av,国产成人精品777777,日韩无,成人亚洲精品一区二区三区嫩花,人妻2,好吊AV,内射网站,国产九九在线视频
      正在閱讀:螞蟻發(fā)布并開源萬億參數(shù)思考模型Ring-1T綜合能力逼近GPT-5

      螞蟻發(fā)布并開源萬億參數(shù)思考模型Ring-1T綜合能力逼近GPT-5

      2025-10-14 13:22:14來源:TechWeb.com.cn 關(guān)鍵詞:螞蟻Ring-1TGPT-5閱讀量:21444

      導(dǎo)讀:作為一款思考模型,Ring-1T也表現(xiàn)出了很好的通用能力,在“人類偏好對齊”測試Arena-Hard V2中,Ring-1T以81.59的成功率居于開源模型榜首,逼近GPT-5-Thinking(High)82.91的成績。在面向嚴謹領(lǐng)域的醫(yī)療問答HealthBench測評中,Ring-1T也以最高分取得開源領(lǐng)域最佳。
        10月14日消息,今天凌晨,螞蟻集團正式推出萬億參數(shù)思考模型Ring-1T,并全面開源模型權(quán)重、訓(xùn)練配方。
       
        Ring-1T在9月30日開源的預(yù)覽版Ring-1T-preview基礎(chǔ)上,持續(xù)擴展大規(guī)模可驗證獎勵強化學(xué)習(xí)(RLVR)訓(xùn)練,進一步激發(fā)萬億基座的自然語言推理能力,并通過 RLHF 訓(xùn)練完善模型通用能力,在各項任務(wù)榜單上表現(xiàn)更加均衡。
       
        為了持續(xù)激發(fā)Ring-1T的數(shù)學(xué)等復(fù)雜推理能力,此次百靈團隊挑戰(zhàn)了難度更高的IMO2025(國際數(shù)學(xué)奧利匹克)賽題,將Ring-1T接入多智能體框架AWorld,使用純自然語言推理進行解題。實驗結(jié)果顯示,Ring-1T僅用一次解出了第1、3、4、5題,相當(dāng)于IMO銀牌水平,成為首個能拿IMO國際奧數(shù)獎的開源系統(tǒng)。Ring-1T在第三次嘗試IMO時對第2題幾何證明也給出了接近滿分的證明過程,在頂流大模型幾乎全軍覆沒的第六題中將答案收斂到與Gemini 2.5 Pro 相同的“4048”(正確答案為2112)。
       
        作為一款思考模型,Ring-1T也表現(xiàn)出了很好的通用能力,在“人類偏好對齊”測試Arena-Hard V2中,Ring-1T以81.59的成功率居于開源模型榜首,逼近GPT-5-Thinking(High)82.91的成績。在面向嚴謹領(lǐng)域的醫(yī)療問答HealthBench測評中,Ring-1T也以最高分取得開源領(lǐng)域最佳。
       
        萬億參數(shù)思考模型訓(xùn)練最大難題是訓(xùn)推精度差異,即訓(xùn)練階段與推理階段因?qū)崿F(xiàn)細節(jié)差異導(dǎo)致的訓(xùn)練和推理精度不一致,進而導(dǎo)致訓(xùn)練崩潰。據(jù)介紹,在Ring-1T模型中,螞蟻采用了自研的“棒冰(icepop)”算法來應(yīng)對這項行業(yè)難題,即用帶掩碼的雙向截斷技術(shù)把訓(xùn)練-推理分布差異凍結(jié)在低水位,確保長序列、長周期訓(xùn)練不崩。
       
        此外,應(yīng)對萬億參數(shù)模型強化學(xué)習(xí)訓(xùn)練,螞蟻還自研了高性能強化學(xué)習(xí)系統(tǒng)ASystem(其中包含已開源的高性能強化學(xué)習(xí)框架AReaL),特別針對萬億參數(shù)模型的顯存管理和訓(xùn)推權(quán)重交換問題做了精細的優(yōu)化,實現(xiàn)了單機顯存碎片秒級回收、權(quán)重零冗余交換,把大規(guī)模RL訓(xùn)練穩(wěn)定跑成日常。
       
        據(jù)百靈團隊透露,Ring-1T模型是其在萬億思考模型上的首次嘗試,螞蟻百靈團隊會在后續(xù)的版本中繼續(xù)完善模型性能。目前,用戶可通過HuggingFace、魔搭社區(qū)下載模型,并通過螞蟻百寶箱等平臺在線體驗。
       
        最近,百靈團隊動作頻頻,先是9月30日發(fā)布了Ring-1T的預(yù)覽版Ring-1T-preview,二者都是思考模型,也就是推理模型。10月9日,螞蟻集團發(fā)布了萬億參數(shù)通用大語言模型Ling-1T,這個是非思考模型。
       
        截至目前,螞蟻百靈大模型已經(jīng)發(fā)布18款模型,形成從160億總參數(shù)到1萬億總參數(shù)的大語言模型產(chǎn)品矩陣,其中包括兩款萬億參數(shù)模型:通用大語言模型Ling-1T、思考模型Ring-1T。
      我要評論
      文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

      所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)。

      版權(quán)與免責(zé)聲明:

      凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

      本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺或個人從本站轉(zhuǎn)載時,必須保留本站注明的作品第一來源,并自負版權(quán)等法律責(zé)任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

      鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯過行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機械包裝機械工程機械倉儲物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機器人3D打印設(shè)備生物識別傳感器電機電線電纜輸配電設(shè)備電子元器件更多

      我要投稿
      • 投稿請發(fā)送郵件至:(郵件標(biāo)題請備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺
      智能制造網(wǎng)APP

      功能豐富 實時交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務(wù)

      微信公眾號

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號:gkzhan

      打開抖音 搜索頁掃一掃

      視頻號

      智能制造網(wǎng)

      公眾號:智能制造網(wǎng)

      打開微信掃碼關(guān)注視頻號

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關(guān)注
      意見反饋
      我要投稿
      我知道了