今天,科大訊飛正式發(fā)布基于全國產(chǎn)算力訓(xùn)練的星火X2大模型。
從X1.5到X2,升級有兩大亮點:
通用能力全面升級,星火X2整體能力對標(biāo)國際頂尖模型水平,在數(shù)學(xué)、推理、語言理解、智能體等能力上媲美國際最優(yōu);130+多語言綜合能力繼續(xù)提升,拉美、東盟等地區(qū)重點語種效果保持業(yè)界領(lǐng)先水平。
依托星火X2的算法突破、行業(yè)高質(zhì)量數(shù)據(jù)集以及專業(yè)思維鏈的強(qiáng)化學(xué)習(xí),星火行業(yè)大模型持續(xù)升級,產(chǎn)品應(yīng)用方案取得顯著進(jìn)步。
這次面向關(guān)鍵行業(yè)落地的實用化升級,標(biāo)志著我國基于全國產(chǎn)算力訓(xùn)練的大模型底座在算法和工程創(chuàng)新方面邁入新階段。星火X2在實現(xiàn)通用能力全面升級的同時,更加專注于教育、醫(yī)療、汽車、智能體等高專業(yè)性、高體驗性場景,致力于為這些領(lǐng)域提供領(lǐng)先、可靠的技術(shù)方案與支撐。
賦能醫(yī)療,專業(yè)能力持續(xù)提升并保持業(yè)界領(lǐng)先,個人健康助手各項能力在業(yè)界率先通過權(quán)威評測驗證,“訊飛曉醫(yī)”APP全面升級;
賦能教育,步驟級批改、錯因定位等技術(shù)進(jìn)一步擴(kuò)大全球領(lǐng)先優(yōu)勢,業(yè)界首發(fā)錯因貫穿的個性化學(xué)習(xí)能力,讓啟發(fā)式講解更契合學(xué)生思路,推動AI學(xué)習(xí)機(jī)等產(chǎn)品實現(xiàn)更精準(zhǔn)的自主學(xué)習(xí)閉環(huán),進(jìn)一步提升孩子學(xué)習(xí)興趣與學(xué)習(xí)效率;
面向汽車智能座艙的星火中小尺寸模型同步升級,智能交互實車評測行業(yè)全面領(lǐng)先,模糊意圖效果從完全不可用達(dá)到基本好用,讓汽車像老朋友聊天一樣精準(zhǔn)聽懂你的“潛臺詞”;
星辰Agent平臺全新升級,進(jìn)一步強(qiáng)化了“會思考能執(zhí)行”的精品智能體構(gòu)建能力。智能體數(shù)量已經(jīng)超過130萬,作為企業(yè)級智能體平臺,在復(fù)雜行業(yè)場景任務(wù)上進(jìn)一步解決用戶關(guān)鍵剛需。
即日起,星火X2的最新能力可直接在訊飛星火網(wǎng)頁版和APP體驗,全新API也已上線訊飛開放平臺,持續(xù)解放生產(chǎn)力;星火APP5.2.0新版本同步上線,進(jìn)一步強(qiáng)化了更懂你的AI助手,歡迎大家來體驗。
此次星火X2通用能力全面升級,整體能力對標(biāo)國際頂尖模型水平,在數(shù)學(xué)、推理、語言理解、智能體等能力上媲美國際最優(yōu);同時,星火X2的130+多語言綜合能力繼續(xù)提升,拉美、東盟等地區(qū)重點語種效果保持業(yè)界領(lǐng)先水平,為跨語言教育、醫(yī)療與產(chǎn)業(yè)應(yīng)用提供可靠支撐。
星火X2通過量化單臺昇騰服務(wù)器即可運行。星火X2采用293B MoE稀疏架構(gòu),結(jié)合權(quán)重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分層通信等多種工程化創(chuàng)新,實現(xiàn)了國產(chǎn)大EP并行部署,推理性能相比X1.5提升50%。
星火大模型多尺寸中小模型同步升級,在辦公本、翻譯機(jī)、汽車座艙交互等場景的核心效果顯著提升。
通用大模型核心能力效果對比
外部公開高難任務(wù)效果對比
*測試集合來源:基礎(chǔ)能力測試集(滾動刷新),來自海量真實大模型請求任務(wù)脫敏數(shù)據(jù),包括訊飛星火APP、API真實開發(fā)者場景、以及教育、醫(yī)療等行業(yè)核心任務(wù)。公開測試集以數(shù)學(xué)、答題、推理、代碼、智能體等外部典型Benchmarks為主。
還是用一道題來試試效果
這是2025年11月哈佛-麻省理工數(shù)學(xué)錦標(biāo)賽(HMMT)里的一道英文題目,難倒國內(nèi)主流模型,但星火X2在分析思考后,不僅給出了正確答案,還給出了詳盡的解題過程。
再來看看星火X2能不能解答西班牙語數(shù)學(xué)題
依舊是快速給出詳細(xì)解題過程以及正確答案
星火X2能力的顯著升級離不開技術(shù)的持續(xù)創(chuàng)新突破,典型工作包括:
訓(xùn)推采樣校準(zhǔn)強(qiáng)化學(xué)習(xí)算法
針對MoE大模型RL訓(xùn)練中的訓(xùn)推分布不一致問題,提出訓(xùn)練與推理概率重采樣自適應(yīng)校準(zhǔn)算法,大幅提升強(qiáng)化學(xué)習(xí)訓(xùn)練準(zhǔn)確率和穩(wěn)定性。
遞歸式高難數(shù)據(jù)合成方法
針對高難任務(wù)數(shù)據(jù)稀缺問題,設(shè)計多輪迭代式推導(dǎo)的數(shù)據(jù)合成方案,實現(xiàn)推理錯誤逐步糾正與收斂,持續(xù)構(gòu)建稀缺型高質(zhì)量數(shù)據(jù),提升模型深度推理準(zhǔn)確率。
多階段RL高吞吐采樣方法
設(shè)計P/D(Prefill/Decoder)兩階段分離的多階段推理采樣方案,解決國產(chǎn)化平臺強(qiáng)化學(xué)習(xí)高吞吐采樣情況下的效率干擾問題,訓(xùn)練效率提升10%。
服務(wù)高性能部署優(yōu)化算法
通過模型輕量化壓縮,完成國產(chǎn)機(jī)器的單機(jī)大EP并行部署,推理性能相比星火X1.5提升50%,實現(xiàn)大模型在國產(chǎn)平臺的輕量化落地與高效推理雙重突破。
實用性是檢驗大模型能力的硬標(biāo)準(zhǔn)。依托星火X2的算法突破、行業(yè)高質(zhì)量數(shù)據(jù)集以及專業(yè)思維鏈的強(qiáng)化學(xué)習(xí),星火行業(yè)大模型持續(xù)升級,在教育、醫(yī)療、司法、汽車交互、企業(yè)智能體應(yīng)用等關(guān)鍵場景表現(xiàn)一新,在功能和效果層面實現(xiàn)全面升級,“更懂你的AI”再進(jìn)一步。
賦能醫(yī)療
各項能力持續(xù)保持顯著領(lǐng)先
星火X2底座賦能醫(yī)療,助力星火醫(yī)療大模型核心能力全面提升并持續(xù)保持業(yè)界領(lǐng)先?;诰用窠】禉n案的智能健康分析、智能報告解讀、運動飲食建議、輔助診療、智能用藥審核等關(guān)鍵任務(wù)上,模型能力均顯著超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。
*測試集合來源:按照《醫(yī)療健康行業(yè)大模型應(yīng)用技術(shù)要求》,基于脫敏真實用戶數(shù)據(jù)及居民健康檔案,構(gòu)建全新測試集合MedLLM-EHR-EVAL-V2。
星火醫(yī)療大模型圍繞個人健康助手的各項能力已率先通過上海市醫(yī)療大模型應(yīng)用檢測驗證中心評測驗證。(備注:上海市醫(yī)療大模型應(yīng)用檢測驗證中心為國內(nèi)首個面向醫(yī)療大模型應(yīng)用評測和驗證的平臺,由上海AI實驗室牽頭打造,華山醫(yī)院、中山醫(yī)院、瑞金醫(yī)院等12所醫(yī)療機(jī)構(gòu)成為中心首批驗證單位。)
在此基礎(chǔ)上,“訊飛曉醫(yī)”APP各項能力全面升級,多輪主動問診、多輪咨詢問答、問用藥、檢查檢驗單解讀、體檢報告單解讀等健康咨詢?nèi)蝿?wù)在業(yè)界持續(xù)保持顯著領(lǐng)先。
*測試集合來源:測試集合基于線上個人健康咨詢的真實場景脫敏數(shù)據(jù)隨機(jī)抽樣。
以檢查檢驗單解讀為例,來看看“訊飛曉醫(yī)”APP是如何做的
另外,訊飛曉醫(yī)的語音交互對話能力也是本次升級的一個重要特色,歡迎大家體驗。
面向用戶的健康剛需,訊飛曉醫(yī)因為更專業(yè)所以更讓人放心
賦能教育
率先實現(xiàn)錯因貫穿個性化學(xué)習(xí)能力
新版本的星火X2底座全面賦能教育,步驟級批改、錯因定位等技術(shù)進(jìn)一步擴(kuò)大全球領(lǐng)先優(yōu)勢。結(jié)合領(lǐng)先的多學(xué)科答題及推理能力,業(yè)界率先發(fā)布錯因貫穿的個性化學(xué)習(xí)能力。數(shù)學(xué)步驟級批改效果進(jìn)一步提升,同時支持更精準(zhǔn)的錯因定位,在答疑上實現(xiàn)契合學(xué)生本人思路的啟發(fā)式講解,相關(guān)技術(shù)持續(xù)保持業(yè)界領(lǐng)先,并推動應(yīng)用成效顯著提升。
*測試集合來源:測試集合基于備授課、考試、作業(yè)、學(xué)習(xí)等真實場景脫敏數(shù)據(jù)隨機(jī)抽樣。
面向?qū)W生自主學(xué)習(xí)場景,科大訊飛AI學(xué)習(xí)機(jī)在1對1精準(zhǔn)學(xué)、答疑輔導(dǎo)和互動課等效果持續(xù)提升。依托更精準(zhǔn)的步驟級批改能力,診斷精準(zhǔn)率、規(guī)劃合理率和輔學(xué)啟發(fā)性效果領(lǐng)先行業(yè),實現(xiàn)個性化、啟發(fā)式、規(guī)劃性教學(xué),進(jìn)一步提升孩子學(xué)習(xí)興趣與學(xué)習(xí)效率。
賦能汽車
智能座艙交互系統(tǒng)全面升級
基于星火X2升級,在汽車領(lǐng)域,2B、7B、30B-A3等多尺寸中小模型同步升級,助力汽車智能座艙交互系統(tǒng)全面提升,在人人/人機(jī)對話判斷、模糊意圖理解、高情商回復(fù)等方面交互體驗顯著提升。特別是模糊意圖交互效果實現(xiàn)跨越式突破,從完全不可用提升至基本好用水平,實車評測業(yè)內(nèi)全面領(lǐng)先,結(jié)合星火多模態(tài)大模型感知理解能力,真正實現(xiàn)座艙內(nèi)自由、自然的人機(jī)交互體驗。
星辰Agent平臺和精品智能體
效果全新升級
星火X2的智能體能力,在長時復(fù)雜任務(wù)規(guī)劃、多工具組合調(diào)用以及長上下文等方面均實現(xiàn)了顯著提升。
星辰Agent平臺全新升級,進(jìn)一步強(qiáng)化了“會思考能執(zhí)行”的精品智能體構(gòu)建能力。當(dāng)前智能體數(shù)量已經(jīng)超過130萬,作為企業(yè)級智能體平臺,已整合語音交互、語音識別、圖像理解等百余種精品開放平臺能力,豐富企業(yè)級場景應(yīng)用工具生態(tài),支撐快速構(gòu)建企業(yè)場景中的更復(fù)雜、更實用的精品智能體。
面向企業(yè)采購場景的招采智能體,在招標(biāo)文件合規(guī)檢測、供應(yīng)商資質(zhì)核驗、投標(biāo)異常行為檢測等核心場景,效率提升超3倍。同時,支持企業(yè)像搭積木一樣極速定制專屬招采專家,專用智能體開發(fā)從原來的幾天壓縮至分鐘級,助力企業(yè)精準(zhǔn)風(fēng)控、高效降本。
面向行業(yè)深度分析的星火行業(yè)大師產(chǎn)品,針對能源、農(nóng)糧等行業(yè)的專業(yè)商情分析領(lǐng)域進(jìn)行深度融合,結(jié)合產(chǎn)業(yè)圖譜推理和分析,顯著降低幻覺。商情信息洞察及輔助決策時間從“周”降低到“天”,為客戶快速決策提供及時的技術(shù)支撐。
訊飛星火已上線最新的星火X2,持續(xù)打造更懂你的AI助手。一鍵開啟語音對話,快速響應(yīng)你的需求。特別是面向年輕人求職和學(xué)習(xí)提升需求,本次重點升級了科研助手和求職助手,全流程輔助用戶找工作和寫論文。
訊飛開放平臺已正式上線星火X2 API。訊飛開放平臺新注冊開發(fā)者可以領(lǐng)取最多100萬Tokens免費額度,讓模型能力以更低成本進(jìn)入真實開發(fā)與規(guī)模化驗證。從模型進(jìn)化到API規(guī)?;_放,再到真實場景的持續(xù)落地,星火X2面向全球超1000萬開發(fā)者共享更強(qiáng)理解力與執(zhí)行力的深度推理能力。
星火X2升級,不僅是一次算法和工程的創(chuàng)新,更是基于全國產(chǎn)算力訓(xùn)練的大模型在解決行業(yè)剛需問題上的躍升。
我們誠邀每一位用戶、開發(fā)者、行業(yè)伙伴共同體驗,在真實的業(yè)務(wù)場景中檢驗實用價值,持續(xù)將全棧自主可控的國產(chǎn)大模型推向安全可信、高效穩(wěn)定的規(guī)?;瘧?yīng)用。
*文中數(shù)據(jù)來源于實際應(yīng)用
-
科大訊飛
+關(guān)注
關(guān)注
19文章
860瀏覽量
63726 -
算力
+關(guān)注
關(guān)注
2文章
1532瀏覽量
16742 -
大模型
+關(guān)注
關(guān)注
2文章
3650瀏覽量
5183
原文標(biāo)題:訊飛星火X2來了:基于全國產(chǎn)算力 、直面行業(yè)剛需硬核升級
文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
從訓(xùn)練到推理:大模型算力需求的新拐點已至
國產(chǎn)算力首證具身大腦模型訓(xùn)練實力:摩爾線程聯(lián)合智源研究院完成RoboBrain 2.5全流程訓(xùn)練
2025科大訊飛全球1024開發(fā)者節(jié)精彩回顧
科大訊飛正式發(fā)布基于全國產(chǎn)算力訓(xùn)練的星火X2大模型
評論