91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

訊飛星辰MaaS平臺(tái)完成全新升級(jí)

訊飛開放平臺(tái) ? 來源:訊飛開放平臺(tái) ? 2024-11-22 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高質(zhì)量數(shù)據(jù)的助攻,讓微調(diào)大模型青出于藍(lán)而勝于藍(lán)!

海量數(shù)據(jù)的預(yù)訓(xùn)練,讓通用大模型擁有十八般武藝,幾乎能夠輕松應(yīng)對(duì)所有問題。但面向特定行業(yè)與場(chǎng)景,模型效果卻難以讓人滿意,問題同樣也是數(shù)據(jù)。

通過將特定數(shù)據(jù)“投喂”給通用大模型,在保持“通才”優(yōu)勢(shì)的基礎(chǔ)上,微調(diào)大模型輕松兼容行業(yè)“專才”的優(yōu)勢(shì),指哪打哪。但訓(xùn)練專屬大模型,看似簡(jiǎn)單,背后需要從數(shù)據(jù)、算力到微調(diào)工具等一系列支撐。 訊飛星辰MaaS平臺(tái)已匯集訊飛星火、Llama3、SD-XL等20+行業(yè)內(nèi)知名的優(yōu)質(zhì)模型,無需復(fù)雜調(diào)整或重新訓(xùn)練,甚至零代碼也可能完成微調(diào)。 圍繞數(shù)據(jù)管理、模型微調(diào)、評(píng)估、托管、推理服務(wù),訊飛星辰MaaS平臺(tái)提供了完善大模型全生命周期管理,覆蓋內(nèi)容創(chuàng)作、代碼、邏輯推理等多場(chǎng)景。近期,模型與數(shù)據(jù)集豐富度,以及功能特性再次完成全新升級(jí)。

微調(diào)模型更豐富:支持星火系列大模型及多個(gè)優(yōu)質(zhì)開源大模型

數(shù)據(jù)集構(gòu)建更輕松:基本支持行業(yè)主流數(shù)據(jù)集,可實(shí)現(xiàn)數(shù)據(jù)批量處理

微調(diào)體驗(yàn)顯著提升:提供靈活可用的全棧工具鏈,讓大模型效果符合預(yù)期

01豐富模型,滿足多樣業(yè)務(wù)場(chǎng)景

訊飛星辰MaaS平臺(tái)已匯集星火、Llama3等行業(yè)優(yōu)質(zhì)模型,讓每一個(gè)場(chǎng)景需求都能找到合適的模型搭子。本次升級(jí),新加入了Spark Max、Spark Mini、Spark Tiny等星火自研模型,讓模型“隊(duì)伍”再次壯大。

Spark Max適用于對(duì)內(nèi)容質(zhì)量和知識(shí)專業(yè)性要求高的業(yè)務(wù)場(chǎng)景,如高端內(nèi)容創(chuàng)作、專業(yè)知識(shí)服務(wù)等。Spark Tiny的部署和精調(diào)成本在星火系列模型中最具性價(jià)比,在對(duì)成本較為敏感但又需要一定性能支持的場(chǎng)景表現(xiàn)良好,比如小型創(chuàng)業(yè)公司的在線客服系統(tǒng),能在滿足性能需求的同時(shí)節(jié)省成本。

同時(shí),平臺(tái)還引入了書生系列、Qwen2.5系列等多個(gè)開源模型的精調(diào),給開發(fā)者提供更多選擇。

模型學(xué)習(xí)如何在特定任務(wù)中做出正確的判斷?首發(fā)文本分類的bert模型,可以分析文本特征后進(jìn)行分類,將數(shù)據(jù)提供給bert模型進(jìn)行微調(diào)后的分類器效果非常精準(zhǔn),而且能夠直接在Spark API中進(jìn)行應(yīng)用。

02夯實(shí)數(shù)據(jù)工程,提效加速更易用

數(shù)據(jù)量的大小和質(zhì)量高低是大模型產(chǎn)業(yè)發(fā)展的關(guān)鍵,也是決定大模型是「專家」或是「磚家」的一條分界線。大模型微調(diào)過程中,數(shù)據(jù)集就像老師教課時(shí)用的書和資料。這些書和資料里有很多例子和題目,可以幫助學(xué)生(也就是大模型)更好地學(xué)習(xí)和理解新知識(shí)。

通過選擇合適的數(shù)據(jù)集構(gòu)建方法,并遵循關(guān)鍵步驟進(jìn)行操作,可以顯著提升微調(diào)效果,使模型更好地適應(yīng)新任務(wù)。但開發(fā)者在數(shù)據(jù)構(gòu)建中很容易遇到不少難題:只有文本數(shù)據(jù)、無問答對(duì)數(shù)據(jù),數(shù)據(jù)量少,沒辦法判斷數(shù)據(jù)質(zhì)量、不知道如何優(yōu)化數(shù)據(jù)集、積累數(shù)據(jù)困難。

基于問答抽取、數(shù)據(jù)增強(qiáng)、prompt工程等維度出發(fā),訊飛星辰MaaS平臺(tái)構(gòu)建了全方位的數(shù)據(jù)工程能力,幫助用戶輕松構(gòu)建高質(zhì)量數(shù)據(jù)。以數(shù)據(jù)增強(qiáng)為例,支持常見文本生成、語義理解、知識(shí)問答數(shù)據(jù)泛化,擴(kuò)展數(shù)據(jù)集數(shù)量;支持混合訓(xùn)練(平臺(tái)自動(dòng)添加數(shù)據(jù)集)。

大模型微調(diào)過程中,因?yàn)椴煌娜蝿?wù)需求、數(shù)據(jù)來源和處理方式會(huì)導(dǎo)致數(shù)據(jù)集的結(jié)構(gòu)和內(nèi)容有所不同。不同的微調(diào)框架可能支持不同的數(shù)據(jù)集格式。

現(xiàn)在,訊飛星辰MaaS平臺(tái)的數(shù)據(jù)集格式擴(kuò)充,已支持ShareGPT、Alpaca格式數(shù)據(jù)集,實(shí)現(xiàn)了對(duì)幾乎所有行業(yè)主流數(shù)據(jù)集格式的支持。無論你的數(shù)據(jù)集什么樣,在訊飛星辰MaaS平臺(tái)上都能訓(xùn)。

如果你不想或者來不及準(zhǔn)備測(cè)試集,也不用慌。訊飛星辰MaaS平臺(tái)支持從訓(xùn)練集中拆分出一定比例,在訓(xùn)練完成后,平臺(tái)會(huì)自動(dòng)把拆出來的這部分?jǐn)?shù)據(jù)拿去做驗(yàn)證,就可以直觀的看到微調(diào)效果展示。

當(dāng)我們有大量數(shù)據(jù)需要處理時(shí),而不是一次只處理一條數(shù)據(jù),可以把很多數(shù)據(jù)一起“放”進(jìn)模型中,讓模型一次處理多條數(shù)據(jù)?,F(xiàn)在,訊飛星辰MaaS平臺(tái)最多支持10個(gè)模型同時(shí)在線批量推理,大大提高了數(shù)據(jù)處理的效率。

03擴(kuò)展功能邊界,輔助創(chuàng)新更專業(yè)

選好了合適模型,數(shù)據(jù)準(zhǔn)備好后,進(jìn)入到具體的微調(diào)環(huán)節(jié),如何讓模型的功能更強(qiáng)大、效果符合預(yù)期?訊飛星辰MaaS平臺(tái)還提供了多種讓人驚喜的功能。

?兼容OpenAI協(xié)議,「絲滑」搬家國(guó)產(chǎn)大模型

今年6月,OpenAI 停止向中國(guó)大陸地區(qū)提供 API 服務(wù),對(duì)于依賴 OpenAI API 構(gòu)建產(chǎn)品和服務(wù)的企業(yè)來說,無疑是一次技術(shù)上的挑戰(zhàn)。然而國(guó)內(nèi)大模型已經(jīng)大幅縮小了與 OpenAI 的差距,可以滿足大部分日常的場(chǎng)景。10月24日發(fā)布的訊飛星火4.0 Turbo七項(xiàng)核心能力在中文領(lǐng)域已全面超過GPT-4 Turbo,代碼能力和數(shù)學(xué)能力超越GPT-4o。

方便開發(fā)者進(jìn)行能力遷移,訊飛星辰MaaS平臺(tái)現(xiàn)已兼容OpenAI協(xié)議,用戶之前用OpenAI的能力,可以一鍵切換成星火的能力,實(shí)現(xiàn)「絲滑」搬家。

?支持function_call 精調(diào)訓(xùn)練,高效調(diào)用獨(dú)立工具

由于大模型的訓(xùn)練數(shù)據(jù)有時(shí)間期限,無法了解最近發(fā)生的事情。因此,當(dāng)用戶詢問模型一些它不了解的數(shù)據(jù)信息時(shí),模型本身就無法給出答案。此時(shí),function_call 就像放大器一樣,通過調(diào)用外部工具,增強(qiáng)大語言模型的能力。

使用function_call,可以讓模型能夠理解什么時(shí)候需要調(diào)用函數(shù)、調(diào)用哪種函數(shù),以及如何正確地傳遞參數(shù)給函數(shù),從而增強(qiáng)模型在實(shí)際應(yīng)用中的實(shí)用性,使其能夠更好地與外部工具或系統(tǒng)進(jìn)行交互。

?支持Loss曲線展示和裁判員模型效果評(píng)估對(duì)比,模型效果隨時(shí)評(píng)估

大模型的調(diào)試評(píng)估不能等精調(diào)完再檢查,要在過程中就把握好。

訊飛星火系列模型已支持Loss曲線展示,在微調(diào)模態(tài)訓(xùn)練過程中即可通過精細(xì)化的數(shù)據(jù)配比和動(dòng)態(tài)調(diào)整,在提升目標(biāo)領(lǐng)域能力的同時(shí),最大限度避免災(zāi)難性遺忘,保持模型的全面性能。

如果你選擇了多個(gè)大模型進(jìn)行微調(diào)訓(xùn)練,不知道最終該用哪一個(gè)。訊飛星辰MaaS平臺(tái)提供了裁判員打分模型,基于星火最優(yōu)模型提供的評(píng)估報(bào)告,評(píng)判模型效果的好壞。

面向?qū)I(yè)開發(fā)者的更多需求,訊飛星辰MaaS平臺(tái)還支持部分高級(jí)參數(shù),支持分詞長(zhǎng)度、Lora Merge,UnSloth等特性配置。

訊飛星辰MaaS平臺(tái)之外,訊飛星火還構(gòu)建了豐富且高性價(jià)比API矩陣。目前,Spark Pro版本每百萬token僅需5元,并支持128K上下文;Ultra和Max 均提供Batch版本 API。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4221

    瀏覽量

    46195
  • 訊飛開放平臺(tái)
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    11790
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3661

    瀏覽量

    5197

原文標(biāo)題:大模型人人皆可“煉”,訊飛星辰MaaS平臺(tái)精調(diào)門檻再降低

文章出處:【微信號(hào):訊飛開放平臺(tái),微信公眾號(hào):訊飛開放平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    星辰MaaS平臺(tái)正式上線Coding Plan

    科技圈目前分成2派,正在玩OpenClaw 和準(zhǔn)備玩OpenClaw。這個(gè)能夠自主操作電腦執(zhí)行任務(wù)、24 小時(shí)待命的“電子龍蝦”,讓無數(shù)人第一次真正觸摸到了 AI Agent 的終極生產(chǎn)力。
    的頭像 發(fā)表于 03-11 13:49 ?133次閱讀

    科大星辰智能體平臺(tái)升級(jí)發(fā)布

    當(dāng)大模型的敘事邏輯從“參數(shù)競(jìng)賽”轉(zhuǎn)向“應(yīng)用落地”,智能體從只會(huì)紙上談兵的“賽博玩具”,進(jìn)化為真正下地干活的“生產(chǎn)工具”。感知、聲音、圖像、動(dòng)作——這些被視為“輔助功能”的維度,成為智能體深入業(yè)務(wù)流程、實(shí)現(xiàn)規(guī)?;涞氐摹叭雸?chǎng)券”。
    的頭像 發(fā)表于 01-27 15:25 ?525次閱讀

    智文產(chǎn)品完成重磅升級(jí)

    2026年伊始,當(dāng)智能體成為人人可用的數(shù)字生產(chǎn)力,智文完成重磅升級(jí)全新打造的「智能演練」與「AI演示官」,首次實(shí)現(xiàn)“寫、練、演”一體化
    的頭像 發(fā)表于 01-08 16:41 ?843次閱讀

    星辰Agent平臺(tái)入選36氪WISE 2025年度焦點(diǎn)產(chǎn)品

    近日,憑借在企業(yè)應(yīng)用落地方面的卓越表現(xiàn),星辰Agent平臺(tái)成功入選“36氪 WISE2025年度焦點(diǎn)產(chǎn)品”。
    的頭像 發(fā)表于 12-17 11:47 ?728次閱讀

    新一代AtomGit平臺(tái)完成全升級(jí)并上線運(yùn)行

    11月21日,在2025開放原子開發(fā)者大會(huì)開幕式上,開放原子開源基金會(huì)攜手CSDN等生態(tài)伙伴,正式宣布新一代AtomGit平臺(tái)完成全升級(jí)并上線運(yùn)行。此次升級(jí)將AtomGit與GitC
    的頭像 發(fā)表于 11-25 17:28 ?866次閱讀

    科大發(fā)布星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會(huì)暨2025科大全球1024開發(fā)者節(jié)發(fā)布會(huì)上,科大以《更懂你的AI》為主題發(fā)布
    的頭像 發(fā)表于 11-10 11:49 ?951次閱讀

    星火電腦版全新升級(jí)

    聚焦垂直場(chǎng)景,一口氣全新升級(jí)了“AI寫作、解題答疑、AI閱讀、深度研究”等實(shí)用功能。同時(shí),全新的簡(jiǎn)潔流暢界面,搭配絲滑順手操作體驗(yàn),為你搭配一個(gè)“有顏有才”的AI伙伴。
    的頭像 發(fā)表于 09-10 15:40 ?806次閱讀
    <b class='flag-5'>訊</b><b class='flag-5'>飛</b>星火電腦版<b class='flag-5'>全新</b><b class='flag-5'>升級(jí)</b>

    曙光存儲(chǔ)支持西湖大學(xué)高性能計(jì)算中心部署完成全新存儲(chǔ)系統(tǒng)

    近日,曙光存儲(chǔ)支持西湖大學(xué)高性能計(jì)算中心部署完成全新存儲(chǔ)系統(tǒng),為AI研發(fā)、科學(xué)計(jì)算和信息化平臺(tái)等提供存力支持。性能實(shí)測(cè)顯示,該系統(tǒng)單節(jié)點(diǎn)帶寬可達(dá)150GB/s,是國(guó)際友商的近4倍,充分滿足AI科研需求,超額完成交付目標(biāo)。
    的頭像 發(fā)表于 08-25 11:48 ?1268次閱讀

    星辰MaaS平臺(tái)率先上線OpenAI最新開源模型

    8月6日凌晨,OpenAI 時(shí)隔六年再次回歸開源,發(fā)布兩款全新的大語言模型:gpt-oss-120b和gpt-oss-20b,性能與o4-mini 水平相當(dāng),并且可以在消費(fèi)級(jí)硬件上運(yùn)行。
    的頭像 發(fā)表于 08-13 16:43 ?1583次閱讀

    星火X1升級(jí)版正式上線

    今天,基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型——星火X1升級(jí)版正式上線。
    的頭像 發(fā)表于 07-30 14:12 ?2064次閱讀
    <b class='flag-5'>訊</b><b class='flag-5'>飛</b>星火X1<b class='flag-5'>升級(jí)</b>版正式上線

    星辰Agent開發(fā)平臺(tái)發(fā)布

    隨著以星火X1和DeepSeek-R1為代表的深度推理模型實(shí)現(xiàn)階躍式突破,模型自主規(guī)劃使用工具能力得到極大提升。在復(fù)雜任務(wù)拆解、多工具協(xié)同領(lǐng)域,AI Agent正展現(xiàn)出類人的認(rèn)知決策和任務(wù)處理水平,標(biāo)志著AI Agent規(guī)模化應(yīng)用時(shí)代加速到來。
    的頭像 發(fā)表于 05-06 09:34 ?1527次閱讀

    星火X1全新升級(jí)

    作為當(dāng)前業(yè)界唯一的基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型,星火X1全新升級(jí)啦!
    的頭像 發(fā)表于 04-22 15:37 ?1006次閱讀

    科大深度解析DeepSeek-V3/R1推理系統(tǒng)成本

    本篇分析來自科大技術(shù)團(tuán)隊(duì),深度解析了DeepSeek-V3 / R1 推理系統(tǒng)成本,旨在助力開發(fā)者實(shí)現(xiàn)高性價(jià)比的MoE集群部署方案。感謝研究院副院長(zhǎng)&AI工程院常務(wù)副院長(zhǎng)龍明康
    的頭像 發(fā)表于 04-15 13:46 ?4127次閱讀
    科大<b class='flag-5'>訊</b><b class='flag-5'>飛</b>深度解析DeepSeek-V3/R1推理系統(tǒng)成本

    DeepSeek全新API上線星辰MaaS平臺(tái)

    近日,DeepSeek最新推出DeepSeek-V3-0324版本,在以下方面實(shí)現(xiàn)明顯提升。
    的頭像 發(fā)表于 03-28 17:29 ?1282次閱讀

    科大攜手西安鐵路局打造人工智能平臺(tái)

    近日,科大攜手中國(guó)鐵路西安局集團(tuán)有限公司(以下簡(jiǎn)稱“西安鐵路局”)打造的人工智能平臺(tái)正式上線啟用。該人工智能平臺(tái)集成
    的頭像 發(fā)表于 03-17 16:14 ?1044次閱讀