91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

思必馳出席2025世界頂尖科學家論壇之國際工程智能大會

思必馳 ? 來源:思必馳 ? 2025-11-04 10:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當前,以人工智能為代表的前沿技術正推動一場新的范式革命,傳統(tǒng)的學科壁壘不斷被打破,跨學科融合與邊界突破為復雜問題提供了新的解決方案。

近日,2025世界頂尖科學家論壇之國際工程智能大會成功召開,大會以“工程智能:面向未來工業(yè)體系的智能變革”為主題,全球頂尖學者與產業(yè)專家齊聚,共同勾勒由人工智能深度驅動的未來工業(yè)新圖景。

上海交通大學特聘教授、思必馳聯(lián)合創(chuàng)始人、首席科學家俞凱應邀出席,發(fā)表了《Towards Reliable Task-oriented LLM Agents》主題演講,深刻剖析了當前大語言模型智能體的核心痛點——“幻覺”問題,創(chuàng)新性的提出了“不確定性感知的可靠性對齊”新范式,為構建真正可靠、可用的人工智能指明了方向。

從“輸出錯誤”到“行為意外”:

智能體時代的幻覺新挑戰(zhàn)

演講伊始,俞凱首先厘清了“智能體”幻覺與傳統(tǒng)大語言模型幻覺的本質區(qū)別。他指出,傳統(tǒng)大語言模型的幻覺主要表現為“事實性錯誤”,而當大語言模型進化成能夠主動執(zhí)行、調用工具/與環(huán)境交互的“智能體”時,其幻覺則升維為“與人類合理預期不一致的行為”。

“例如,當你讓智能體‘9點提醒我一下’,它可能并未理解你的意圖是設定一個‘提醒’,而是機械地設定了晚上9點的鬧鐘,甚至回答‘我不能設定鬧鐘’你可以嘗試......”。俞凱表示,這種行為上的偏差,在任務執(zhí)行中可能帶來比事實錯誤更嚴重的后果。

他進一步指出,幻覺的根源在于模型內外的“不確定性”。外部不確定性源于訓練數據的噪聲、缺失或過時信息;內部不確定性則源于神經網絡模型的概率生成特性。為解決這些不確定性造成的幻覺問題,產業(yè)界形成了兩種主流范式:一是通過引入搜索、數學/代碼、數據庫等工具增強的方式來擴展知識邊界;二是通過評估模型輸出的置信度,并設定閾值來拒絕低置信度的回答。

然而,這兩種范式均面臨嚴峻挑戰(zhàn):工具增強的方式雖擴展了知識,卻引發(fā)了“工具幻覺”——包括工具的種類、調用時機、格式、內容等幻覺。即使增加訓練數據能提升任務成功率,也無法消除“工具幻覺”的發(fā)生;而“置信度評估”范式則遭遇了更為棘手的“妄想”問題,即模型在輸出完全錯誤答案時,卻表現出極高的置信度,這使得基于閾值的拒答機制近乎失效。

范式轉變:

從“消除不確定性”到“管理與利用不確定性”

在深入分析現有范式的局限后,俞凱帶領與會者進行了一場認知層面的思辨。他提出,不確定性并非純粹的缺陷,而是人類認知和交互中的本質屬性,有時甚至是高效率溝通的必要條件。

“我們的目標不應是試圖徹底消除不確定性,而是要像人類一樣,學會識別、管理并利用它?!庇釀P強調,“可靠性”的定義需要從單純的“正確性”轉變?yōu)榫C合考量“交互代價”與“有用性”的性價效用平衡?;谶@一理念,他提出了第三種范式,即“基于不確定性感知的可靠性對齊”。這一范式的核心在于,將智能體從傳統(tǒng)的“回答”或“拒答”擴展為包含“澄清”、“詢問”、“切換工具”等在內的“非決定性行動”。

俞凱表示,智能體的可靠性不應片面追求絕對正確率,而應構建一個兼顧“有用性”與“負責度”的框架,讓系統(tǒng)學會在不確定中做出合理決策與擔當。

實踐路徑:

單智能體與多智能體的可靠性解決方案

會上,俞凱介紹了在實踐中落實新范式的情況。在單智能體可靠性方面,團隊通過“顯式知識邊界感知建?!钡姆绞?,來訓練智能體明確區(qū)分“確定”、“不確定”和“拒答”區(qū)域。通過基于知識反饋的強化學習等技術,讓智能體學會在信息不足時主動向用戶澄清,而非強行執(zhí)行或直接放棄。例如,當用戶查詢“請幫我查一下去北京的票價”時,可靠的智能體會主動詢問“您從哪個城市出發(fā)?”,從而避免因信息缺失而產生的工具調用幻覺。實踐證明,該方法顯著降低了知識幻覺和工具幻覺,在數值推理和工具調用任務中的幻覺率甚至低于頂尖商業(yè)模型。

針對更為復雜的多輪交互場景,則引入“慢思考”精煉機制。對于智能體標記為“不確定”的響應,由一個獨立的“精煉模型”進行深度推理和優(yōu)化,形成“快速思維”負責高精度輸出、“慢速思維”處理模糊地帶的協(xié)同系統(tǒng),有效解決了多輪對話中不確定性的傳播與放大問題。

在多智能體可靠性方面,俞凱提出了“分布式路由選擇”架構。不同規(guī)模和能力的模型組成一個模型池,面對用戶查詢,成本較低的小型模型首先進行自我評估,若勝任則直接回答,若不勝任則“路由”給更強大的模型?!斑@實現了一種既可靠又高效的資源配置,在保證性能的同時,盡可能控制計算成本?!?/p>

演講的最后,俞凱表示,基于“不確定性感知的可靠性對齊”框架能夠將人工智能從一臺追求絕對正確的“答題機器”,轉變?yōu)橐粋€能夠感知邊界、主動溝通、協(xié)同決策的“可靠伙伴”。

作為思必馳首席科學家,俞凱帶領團隊研發(fā)的“1+N”分布式大模型智能體系統(tǒng),也是基于“不確定性感知的可靠性對齊”范式構建?!?”即一個中樞大模型,負責基礎語言處理與通用知識整合;“N”即N個垂域模型,針對具體行業(yè)場景進行優(yōu)化,形成可柔性定制的行業(yè)語言大模型?,F已廣泛用于智能汽車、智慧物聯(lián)、會議辦公等領域,成本與響應速度優(yōu)勢顯著。

這一創(chuàng)新范式并非一蹴而就,而是建立在俞凱與團隊長期的學術研究與產業(yè)實踐基礎上。在今年8月召開的第二十四屆中國計算語言學大會(CCL2025)和10月舉行的2025年第二十屆全國人機語音通訊學術會議(NCMMSC2025)現場,俞凱已就相關研究方向進行了分享,在行業(yè)內形成了持續(xù)討論。

“不確定性感知的可靠性對齊”范式切中了AI工程化應用時所遇到問題的要害,引發(fā)了在場頂尖科學家與產業(yè)專家的共鳴與深入討論。隨著任務型大語言模型智能體在各個行業(yè)場景的深度融合,對“可靠性”的重新定義與技術攻堅,已成為推動人工智能縱深發(fā)展的關鍵引擎,并將催生以高質量、高可靠性為特征的新質生產力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50111

    瀏覽量

    265566
  • 思必馳
    +關注

    關注

    4

    文章

    400

    瀏覽量

    15992
  • 大模型
    +關注

    關注

    2

    文章

    3658

    瀏覽量

    5196

原文標題:2025世界頂尖科學家論壇之國際工程智能大會 | 直面“幻覺”挑戰(zhàn),思必馳俞凱提出構建可靠任務型AI新范式

文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    蘇州市委書記范波一行蒞臨調研

    調研期間,范波一行來到,了解人工智能大模型場景研發(fā)應用情況。
    的頭像 發(fā)表于 01-10 09:32 ?948次閱讀

    首席科學家俞凱教授當選2026年度IEEE Fellow

    日前,全球最大的專業(yè)技術組織國際電氣電子工程師協(xié)會(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(會士)名單,上海交通大學特聘教授、
    的頭像 發(fā)表于 12-12 11:36 ?834次閱讀

    中興通訊崔麗受邀出席2025騰沖科學家論壇

    近日,“2025騰沖科學家論壇”在云南啟幕。本屆論壇以“科學·AI改變世界”為主題,匯聚包括諾貝
    的頭像 發(fā)表于 12-09 11:36 ?612次閱讀

    科技亮相2025世界智能網聯(lián)汽車大會

    10月16日至18日,以“匯智聚能 網聯(lián)無限”為主題的2025世界智能網聯(lián)汽車大會(以下簡稱“本屆大會”)在北京隆重舉行。作為全場景
    的頭像 發(fā)表于 10-22 18:22 ?1013次閱讀

    北汽集團2025世界智能網聯(lián)汽車大會

    10月16日,由工業(yè)和信息化部、交通運輸部、北京市人民政府共同主辦,以“匯智聚能 網聯(lián)無限”為主題的2025世界智能網聯(lián)汽車大會暨中國國際
    的頭像 發(fā)表于 10-17 16:06 ?743次閱讀

    Momenta亮相2025世界智能網聯(lián)汽車大會

    10月16日,2025世界智能網聯(lián)汽車大會(WICV)在北京隆重開幕,Momenta作為智能駕駛領域領先企業(yè)受邀
    的頭像 發(fā)表于 10-17 15:57 ?2241次閱讀

    嵐科技亮相2025世界機器人大會

    2025年8月,北京·北人亦創(chuàng)國際會展中心,2025世界機器人大會盛大啟幕。作為全球機器人與人工智能
    的頭像 發(fā)表于 08-14 17:22 ?2216次閱讀
    <b class='flag-5'>思</b>嵐科技亮相<b class='flag-5'>2025</b><b class='flag-5'>世界</b>機器人<b class='flag-5'>大會</b>

    智光2025世界機器人大會精彩回顧

    8月12日,歷經五天的精彩展示與深度交流,2025世界機器人大會于北京亦創(chuàng)國際會展中心圓滿落下帷幕。
    的頭像 發(fā)表于 08-14 11:39 ?1377次閱讀

    航盛集團亮相2025世界智能汽車大會

    近日,以“智聯(lián)車路云·聚勢雙循環(huán)”為主題的2025世界智能汽車大會在重慶順利舉辦。大會邀請了來自近二十個國家的百余名嘉賓,以前瞻視角解構
    的頭像 發(fā)表于 08-07 17:12 ?2113次閱讀

    科技亮相2025世界人工智能大會

    7月27日,世界人工智能大會(WAIC 2025)上,AI賦能艙駕融合新生態(tài)主題論壇順利召開。本次論壇匯聚了眾多行業(yè)領袖與專家,共同探討AI
    的頭像 發(fā)表于 08-01 16:50 ?1349次閱讀

    澎峰科技亮相2025世界人工智能大會

    近日,2025世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2025)在中國·上海
    的頭像 發(fā)表于 07-31 18:12 ?955次閱讀

    亮相2025世界人工智能大會

    近日,2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC2025)在上海盛大開幕。本屆大會
    的頭像 發(fā)表于 07-31 17:41 ?911次閱讀

    云知聲亮相2025世界人工智能大會

    7月26日—29日,2025世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2025”)在上海召開,國務院總理李強
    的頭像 發(fā)表于 07-28 17:53 ?856次閱讀

    出席語言計算技術創(chuàng)新專題研討會

    近日,與東南大學蘇州校區(qū)聯(lián)合舉辦語言計算技術創(chuàng)新專題研討暨校企合作洽談會。聯(lián)合創(chuàng)始人
    的頭像 發(fā)表于 04-17 15:42 ?707次閱讀

    江蘇省領導蒞臨調研考察

    近日,江蘇省委常委、省委宣傳部部長徐纓一行蒞臨蘇州進行調研,受到董事長兼CEO高始興
    的頭像 發(fā)表于 03-24 16:32 ?993次閱讀