91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

那些超出想象的AI Agent

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-07-16 13:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZPGh3OKyATu2BAAnbTnVcuks113.jpg

“公元5世紀中期,一位不知名的基督教詩人離世,而這一年恰好是某古代環(huán)境重建年表的截止年份。這個科學年表叫什么名字?”

面對如此冷門的問題,恐怕連最資深的學者都會陷入沉思。既不知道詩人姓名,又不清楚年表名稱,傳統(tǒng)搜索引擎在這里完全失靈,兩個看似毫不相關的信息點就像大海中的兩粒沙子,讓人無從下手。

wKgZO2h3OK2AUkDhAADMjAExkvU266.jpg

就是這樣讓人一頭霧水的難題,一款名叫WebSailor的智能體卻能通過交叉驗證快速鎖定正確答案:詩人是 Synesius of Cyrene、科學年表“PAGES 2k”、時間414年。

這不禁讓人震驚:什么時候AI已經(jīng)進化到如此程度?

要知道,就在半年前,Agent還被普遍認為是玩具屬性大于工具屬性。大部分產(chǎn)品內(nèi)測名額一票難求,實際表現(xiàn)卻頻頻翻車。

盡管最初效果不如人意,智能體的進化速度卻很快。如今,在營銷、醫(yī)療等專業(yè)領域,Agent的表現(xiàn)甚至已超過人類水平。

今天,我們一起來扒一扒上半年有哪些智能體,已經(jīng)超出了我們以往的想象。

wKgZPGh3OK2AC7TiAAI5hEsVl20119.jpg

面對世錦賽級別的金融建模題,即便是經(jīng)驗豐富的分析師,往往也需要數(shù)小時推演驗證。但如果現(xiàn)在告訴你,有人能在10分鐘內(nèi)給出準確答案,你相信嗎?

這樣復雜的任務,即使放給市面上最優(yōu)秀的大模型,也可能一籌莫展。但一款名叫Shortcut的智能體卻在短短10分鐘內(nèi)完成了,不僅準確率超80%,時間比人類快了整整10倍。

Excel世錦賽有多難?

它由微軟官方背書、FMWC 組委會運營,任務涵蓋復雜函數(shù)、Power Query、動態(tài)數(shù)組、蒙特卡洛模擬等,被選手形容為“最殘忍的函數(shù)修羅場”。參賽選手來自全球各地,多為投行數(shù)據(jù)分析師、四大財務建??偙O(jiān)、微軟前MVP,學歷資歷含金量拉滿。

而這一屆考題,也就是Shortcut的首秀試題,以《魔獸世界》30周年為主題,要求選手在40分鐘內(nèi)完成20多個關聯(lián)表格操作。參賽者需手動建立VLOOKUP、INDEX-MATCH等公式,在復雜的數(shù)據(jù)迷宮中建立精準鏈接。

對此,Shortcut不僅克服了傳統(tǒng)AI模型在數(shù)據(jù)處理量上的限制,更完美避開了幻覺輸出的痛點。面對海量無序數(shù)據(jù)和確定性極強的函數(shù)規(guī)則,它能像經(jīng)驗豐富的分析師一樣,快速理解任務需求并給出精準解決方案。原本需要人類選手1~2小時才能完成的賽題,Shortcut僅用10分鐘就交出了完美答卷。

據(jù)開發(fā)團隊透露,Shortcut支持自然語言指令交互,能輕松應對金融建模、5000行CSV數(shù)據(jù)分析、數(shù)據(jù)可視化甚至像素畫創(chuàng)作等復雜任務。其核心能力涵蓋智能填充、錯誤自動排查、多表關聯(lián)分析等專業(yè)功能,堪稱Excel領域的六邊形戰(zhàn)士。

看到這樣的財務人員,或許會直呼遇到了救星。

因為財務部門最愁的就是數(shù)不勝數(shù)的數(shù)據(jù)、表格、文件,但前期AI發(fā)展受制于token限制和幻覺,無法處理成百上千的數(shù)據(jù),一個小數(shù)點、標點符號的錯誤都會給公司帶來難以估量的損失。這一度也給公眾留下了AI無法解決實際難題的印象。

而Shortcut的出現(xiàn)則打破局面,給這個痛點帶來了新的可能。

畢竟,5000行CSV數(shù)據(jù)如果一行一行錄入校對,可將近一周的工作量。現(xiàn)在,盡管Shortcut仍存在復雜函數(shù)作圖出錯的可能,但就是解決單一的信息整理工作,也能挽救他們?nèi)諠u稀少的發(fā)量了。

wKgZO2h3OK6AVJlsAAHmEHltEi0845.jpg

在外貿(mào)行業(yè),銷售團隊拼盡全力,可能也只能將成交率從10%推到15%。但有一家公司,卻悄無聲息地把這個數(shù)字拉到了50%——不是靠瘋狂加班,不是靠人海戰(zhàn)術,而是靠一個看不見的銷售王牌。

竟對公司以為對方請來了高人,客戶認為自己在自主決策?不,他們可能早已掉進Agent精心設計的溫柔陷阱。

數(shù)據(jù)顯示,一個傳統(tǒng)業(yè)務員的成單率一般在10%~15%。而一款叫Agentforce的智能體成單率卻達到了50%。自2024年上線以來,成單超過8000單。

最讓業(yè)務員扎心的是,這款Agent不僅成交率高、簽單額也不低,動輒七位數(shù)美元級。這些大單如果由自己簽下,提成起碼四位數(shù)起。可現(xiàn)實是,最老練的銷冠也不得不思考,為什么苦心經(jīng)營的技巧和話術,被一個橫空出世的Agent截胡了?

第一點,要休息的人類拼不過輪軸轉(zhuǎn)的機器。跨國貿(mào)易中流傳著一句話,誰越能熬夜,誰就越能賺錢。時差的存在產(chǎn)生了外貿(mào)的白夜班作息,但仍然沒有人能24h堅守崗位,在顧客決定下單的那一時間精準說服他。Agentforce做到了,它像一臺永不疲倦的數(shù)字銷售系統(tǒng),在7×24h模式下并發(fā)處理數(shù)千條對話,把人工坐席數(shù)減少30~60%。

第二點,統(tǒng)一刻板的話術比不過八面玲瓏的“奉承”。為什么客戶在下單時常常意識不到是AI讓它動心了呢?因為在21世紀,真的找不到比AI更會阿諛奉承的角色了。傳統(tǒng)銷售依賴人力,業(yè)務員靠經(jīng)驗判斷客戶意向,受個人情緒、疲勞度影響,很難編織出對胃口的話。但Agentforce能夠?qū)崟r分析官網(wǎng)瀏覽、郵件互動等行為痕跡,鎖定高意向目標,并通過情感分析自動調(diào)整話術,提升后續(xù)轉(zhuǎn)化率。

wKgZO2h3OK-ADuU5AABBENhi2wA463.jpg

第三點,只會母語的人比不過精通外語和百科的AI。有了AI,會一門外語真的不能算是顯著的有實力。據(jù)悉,Agentforce的訓練語料橫跨17種語言,涵蓋74萬份Salesforce官方文檔與元數(shù)據(jù)。依托Salesforce總量高達200~300PB的行業(yè)級數(shù)據(jù)湖,Agentforce獲得了遠超同類產(chǎn)品的上下文深度和領域精度,從而顯著降低幻覺風險,給出更可靠的結(jié)果。

我們有理由相信,在未來,Agent業(yè)務員將會進攻到每一個交易領域,不管是大宗商品、還是小本生意,它的成交率將越來越高、成交范圍也會越來越廣。

wKgZPGh3OK-AfLhbAAKAGHJ8Zfg806.jpg

AI開的藥,你敢吃嗎?

我們都知道,AI已經(jīng)走進了各個領域,醫(yī)療也不例外,但對于直接吃AI開的藥,或許大部分人還是會膽戰(zhàn)心驚。畢竟,用藥量的微小差異可能導致成癮性,用藥方案的微小偏差也可能引發(fā)嚴重的副作用,可謂失之毫厘、謬以千里。

但如果告訴你,AI醫(yī)生的診斷準確率甚至超過了專業(yè)醫(yī)生,你能相信嗎?

在美國,一款名叫Polaris的醫(yī)療Agent能夠為患者提供真實的用藥意見,醫(yī)療建議準確率超過99%,遠高于美國注冊護士81%的平均水平。并且,該智能體推薦的藥品和復診意見,在病人的好評率中趨近于90%。這意味著,AI不僅比人準,甚至比人更受患者信任。

但作為Agent,它是如何做到的呢?這源于多個智能體的協(xié)同工作和交叉驗證機制。

Polaris由三個Agent共同出診,而非單一模型獨立決策。例如,當患者詢問某種藥物的副作用時,實驗室Agent檢索最新的藥物臨床試驗數(shù)據(jù),確保信息基于權威醫(yī)學研究;藥物Agent核對患者的用藥史、過敏記錄,避免潛在的藥物相互作用風險;主要Agent綜合前兩者的分析,生成最終建議,并標注置信度。

為了進一步保證用藥安全和患者福利,超過6500名護士、500名醫(yī)生參與了最終安全評估,助力該系統(tǒng)獲得FDA認可的醫(yī)療AI專利。

據(jù)悉,在阿聯(lián)酋,Polaris已被整合進Burjeel醫(yī)療集團的數(shù)字系統(tǒng)。在超過185萬次真實患者互動測試中,Polaris3.0臨床準確率高達99.38%,患者滿意度達8.95/10。

但需要注意的是,Polaris目前只能在有明確解法和醫(yī)學案例的疾病上給出問診方案和醫(yī)療建議,無法直接參與藥物研究開發(fā)。也就是說,醫(yī)療智能體更強調(diào)常規(guī)病例的診斷正確率,而不是研發(fā)創(chuàng)新工作。所以某種程度上,它只能在臨床發(fā)揮作用,而不能參與罕見病藥物開發(fā)等前沿工作。因為對于醫(yī)院這樣生命優(yōu)先的場景,安全一定是第一位的。Agent想要跟專業(yè)醫(yī)生媲美,還有一大段路要走呢。

不難看出,短短一年,智能體已經(jīng)逐漸超出了人們的想象。從這些智能體的發(fā)展軌跡中,我們能清晰地看到一個趨勢:Agent正在從概念走向?qū)嵱茫瑥膶嶒炇易哌M我們的日常工作生活。它們不是冷冰冰的機器,而是逐漸成為各領域?qū)I(yè)人士的得力助手。WebSailor讓研究人員不再被海量文獻淹沒,Shortcut解放了財務人員的雙手,Agentforce成為銷售團隊的秘密武器,Hippocratic則是醫(yī)護人員的第二大腦。

這些智能體最可貴之處在于,它們并非要取代人類,而是通過彌補人類在效率、記憶力和計算能力上的局限,讓我們能把更多精力投入到真正需要人類智慧的領域。就像望遠鏡延伸了人類的視野,這些Agent工具正在擴展我們的認知邊界。

在可以預見的將來,我們每個人或許都會擁有一個甚至多個智能體作為助手:幫我們學習新知識的Agent導師、管理日程的Agent秘書、照顧健康的Agent醫(yī)生、創(chuàng)作內(nèi)容的Agent伙伴……但就像歷史上所有偉大的工具一樣,它們不會取代我們,但會讓我們變得更強,最終成為人類能力的一部分。

wKgZO2h3OLCAZUO1AAHnGo27kzA515.jpg

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39866

    瀏覽量

    301513
  • Agent
    +關注

    關注

    0

    文章

    186

    瀏覽量

    28717
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    ARMxy 系列攜手 AI Agent,開啟智能工廠新模式

    AI Agent 正在成為人工智能發(fā)展的新趨勢,從“回答問題”走向“主動執(zhí)行”。本文以通俗方式解釋 AI Agent 的概念、核心能力和最新案例,并深入探討其在工業(yè)領域的應用價值。結(jié)合
    的頭像 發(fā)表于 09-12 15:08 ?552次閱讀

    開源鴻蒙AI Agent TSG正式成立

    鴻蒙 AI Agent TSG(技術專家組)正式宣布成立,旨在聯(lián)合產(chǎn)學研力量,共同洞察 Agent 在通信、協(xié)同、自演進等方面的技術趨勢,并規(guī)劃和探索下一代 Agent 技術框架。該組
    的頭像 發(fā)表于 07-28 17:38 ?929次閱讀

    Manus“跑路”風波背后,AI Agent的商業(yè)化困局

    Manus深陷“跑路”疑云,AI Agent將何去何從
    的頭像 發(fā)表于 07-22 14:29 ?2597次閱讀
    Manus“跑路”風波背后,<b class='flag-5'>AI</b> <b class='flag-5'>Agent</b>的商業(yè)化困局

    研華工業(yè)AI Agent的發(fā)展態(tài)勢及實踐思考

    工業(yè) 4.0 風起云涌之際,AI Agent 產(chǎn)業(yè)化落地成為各界競逐焦點。研華科技憑借深厚的行業(yè)積淀,勇于創(chuàng)新、積極探索,在企業(yè)級工業(yè) AI Agent 方面積累了扎實的實踐經(jīng)驗。本期
    的頭像 發(fā)表于 06-23 09:31 ?1066次閱讀

    【「零基礎開發(fā)AI Agent」閱讀體驗】+讀《零基礎開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    收到發(fā)燒友網(wǎng)站寄來的《零基礎開發(fā)AI Agent》這本書已經(jīng)有好些天了,這段時間有幸拜讀了一下全書,掌握了一個開發(fā)智能體的方法。 該書充分從零基礎入手,先闡述了Agent是什么,它的基本概念和知識
    發(fā)表于 05-14 19:51

    【「零基礎開發(fā)AI Agent」閱讀體驗】+Agent的案例解讀

    功能,幫助學術用戶能快速提取研究所需信息,提升研究效率。? 2)促進學術研究 AI 提供的自動檢索與解析功能,有助于地研究者快速定位相關資料,加快研究進度。 由此可見,扣子的Agent開發(fā)平臺,不但向用戶提供了開發(fā)的平臺,還向用戶提供了豐富的應用及案例。
    發(fā)表于 05-14 11:23

    【「零基礎開發(fā)AI Agent」閱讀體驗】+Agent開發(fā)平臺

    Agent開發(fā)平臺是專門用于創(chuàng)建、配置、部署、訓練和運行Agent的平臺。 隨著Agent開發(fā)框架的發(fā)展,很多Agent開發(fā)平臺能夠以圖形化、零代碼或低代碼的方式為開發(fā)者提供一站式服務
    發(fā)表于 05-13 12:24

    【「零基礎開發(fā)AI Agent」閱讀體驗】+Agent的工作原理及特點

    如圖2所示。 圖2 提示詞編寫萬能公式 要搭建AI應用可分為5個層次,見圖3所示。 圖3 AI應用層次 Agent的能力與特點: 以設置鬧鐘和Agent叫醒服務的對比為例來說明
    發(fā)表于 05-11 10:24

    【「零基礎開發(fā)AI Agent」閱讀體驗】+ 入門篇學習

    很高興又有機會學習ai技術,這次試讀的是「零基礎開發(fā)AI Agent」,作者葉濤、管鍇、張心雨。 大模型的普及是近三年來的一件大事,萬物皆可大模型已成為趨勢。作為大模型開發(fā)應用中重要組成部分,提示詞
    發(fā)表于 05-02 09:26

    【「零基礎開發(fā)AI Agent」閱讀體驗】+關于AI Agent開發(fā)入門的第一印象與相關官方文檔和社區(qū)資料的內(nèi)容補充

    今天有幸收到了電子發(fā)燒友寄來的由中國工信出版集團和電子工業(yè)出版社聯(lián)合出版的關于AI Agent開發(fā)的《零基礎開發(fā)AI Agent》的新書,不禁高興雀躍,以下是我拍下的書的頁封和背面:
    發(fā)表于 04-22 18:16

    【「零基礎開發(fā)AI Agent」閱讀體驗】+初品Agent

    期待中的《零基礎開發(fā)AI Agent——手把手教你用扣子做智能體》終于寄到了,該書由葉濤、 管鍇、張心雨完成,并由電子工業(yè)出版社出版發(fā)行。 全書分為三個部分,即入門篇、工具篇及實踐篇。由此可見這是
    發(fā)表于 04-22 11:51

    【「零基礎開發(fā)AI Agent」閱讀體驗】總體預覽及入門篇

    基礎知識有所補充,另外書本后面的案例也會對Ai的應用產(chǎn)生一些啟發(fā). 首先老規(guī)矩,先看一下目錄結(jié)構 包含3大主題: 入門篇:介紹了Agent的概念、發(fā)展、與Prompt和Copilot的區(qū)別
    發(fā)表于 04-20 21:53

    請求贈閱《零基礎開發(fā)AI Agent——手把手教你用扣子做智能體》

    博主好!致敬葉濤 管鍇 張心雨三位AI具身智能-智能體方面的專家、導師! 《零基礎開發(fā)AI Agent——手把手教你用扣子做智能體》一不懂編程的多數(shù)大眾也可以開發(fā)Agent,這意義深遠
    發(fā)表于 04-10 12:16

    《零基礎開發(fā)AI Agent——手把手教你用扣子做智能體》

    《零基礎開發(fā)AI Agent——手把手教你用扣子做智能體》是一本為普通人量身打造的AI開發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展,還通過詳細的工具介紹和實戰(zhàn)案例,幫助讀者快
    發(fā)表于 03-18 12:03

    名單公布!【書籍評測活動NO.59】零基礎開發(fā)AI Agent——手把手教你用扣子做智能體

    的新技術實踐指南,助你把握科技大勢。 ▊《零基礎開發(fā)AI Agent——手把手教你用扣子做智能體》 葉濤管鍇張心雨 著 不懂編程也可以開發(fā)Agent Agent(智能體)是大模型
    發(fā)表于 03-10 16:29