91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌正式發(fā)布Gemma Scope 2模型

谷歌開發(fā)者 ? 來(lái)源:谷歌開發(fā)者 ? 2026-01-24 14:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者 / 語(yǔ)言模型可解釋性團(tuán)隊(duì)

大語(yǔ)言模型 (LLM) 具備令人驚嘆的推理能力,但其內(nèi)部決策過(guò)程在很大程度上仍然不透明。如果系統(tǒng)未按預(yù)期運(yùn)行,對(duì)其內(nèi)部運(yùn)作機(jī)制缺乏可見性將難以準(zhǔn)確定位問(wèn)題根源。過(guò)去,我們通過(guò)發(fā)布Gemma Scope工具包推動(dòng)了可解釋性科學(xué)的發(fā)展,該工具旨在幫助研究人員理解我們輕量級(jí)開放模型系列 Gemma 2 的內(nèi)部運(yùn)作機(jī)制。

近期我們正式發(fā)布了Gemma Scope 2: 這是一套全面且開放的可解釋性工具套件,適用于從 2.7 億到 270 億參數(shù)的所有Gemma 3模型規(guī)模。借助這套工具,我們可以追蹤模型整個(gè) "大腦" 中的潛在風(fēng)險(xiǎn)。

據(jù)我們了解,這是迄今為止 AI 實(shí)驗(yàn)室發(fā)布的最大規(guī)??山忉屝怨ぞ唛_源項(xiàng)目。構(gòu)建 Gemma Scope 2 共涉及存儲(chǔ)約 110PB 數(shù)據(jù),訓(xùn)練的參數(shù)量更是超過(guò)了 1 萬(wàn)億。

隨著 AI 持續(xù)發(fā)展,我們期待 AI 研究社區(qū)運(yùn)用 Gemma Scope 2 來(lái)調(diào)試模型涌現(xiàn)行為,借助這些工具更有效地審計(jì)與調(diào)試 AI 智能體,最終實(shí)現(xiàn)加速開發(fā)實(shí)用且穩(wěn)健的安全干預(yù)方案,以應(yīng)對(duì)越獄攻擊、幻覺(jué)生成及諂媚傾向等問(wèn)題。

我們與 Neuronpedia 合作推出的Gemma Scope 2 交互式演示現(xiàn)已開放體驗(yàn)。

Gemma Scope 2 新功能

可解釋性研究旨在揭示 AI 模型的內(nèi)部運(yùn)作機(jī)制及其訓(xùn)練中習(xí)得的算法。隨著 AI 的能力日益增強(qiáng)、系統(tǒng)日趨復(fù)雜,可解釋性對(duì)于構(gòu)建安全可靠的 AI 至關(guān)重要。

與上一代工具類似,Gemma Scope 2 如同為 Gemma 系列語(yǔ)言模型配備的顯微鏡。通過(guò)結(jié)合稀疏自編碼器 (SAEs) 與轉(zhuǎn)碼器,研究人員得以深入模型內(nèi)部,觀察其思考內(nèi)容,溯源這些思維如何形成并與模型行為產(chǎn)生關(guān)聯(lián)。由此,這種洞察力進(jìn)一步推動(dòng)對(duì)越獄攻擊等 AI 安全相關(guān)問(wèn)題的更深入研究,例如揭示模型對(duì)外表述的推理過(guò)程與其內(nèi)部真實(shí)狀態(tài)之間的差異。

初代 Gemma Scope 已在模型幻覺(jué)、識(shí)別模型已知機(jī)密信息、訓(xùn)練更安全模型等關(guān)鍵安全研究領(lǐng)域發(fā)揮作用,而 Gemma Scope 2 則通過(guò)以下重大升級(jí)來(lái)支持更具雄心的研究:

全規(guī)模覆蓋: 我們?yōu)檎麄€(gè) Gemma 3 系列 (參數(shù)規(guī)模最高達(dá) 270 億) 提供了一整套完整的工具,這對(duì)于研究?jī)H在大規(guī)模模型中顯現(xiàn)的涌現(xiàn)行為至關(guān)重要。例如,此前270 億參數(shù)的 C2S Scale 模型曾協(xié)助科研人員發(fā)現(xiàn)潛在的新型癌癥治療路徑。盡管 Gemma Scope 2 并未在該模型上進(jìn)行訓(xùn)練,但這一案例體現(xiàn)了此工具套件未來(lái)有望解析的涌現(xiàn)行為類型。

更精細(xì)的復(fù)雜內(nèi)部行為解析工具: Gemma Scope 2 包含針對(duì) Gemma 3 模型系列每一層訓(xùn)練的稀疏自編碼器與轉(zhuǎn)碼器。通過(guò)引入跳躍轉(zhuǎn)碼器和跨層轉(zhuǎn)碼器,讓解析貫穿在模型中的多步驟計(jì)算與算法變得更加輕松。

先進(jìn)的訓(xùn)練技術(shù): 我們采用最前沿的訓(xùn)練技術(shù),特別是Matryoshka 訓(xùn)練技術(shù),該技術(shù)能幫助稀疏自編碼器識(shí)別更有價(jià)值的概念,并修正了在初代 Gemma Scope 中發(fā)現(xiàn)的部分缺陷。

對(duì)話機(jī)器人行為分析工具: 對(duì)于針對(duì)聊天場(chǎng)景微調(diào)的 Gemma 3 版本,我們還專門提供定制化的可解釋性工具。這些工具有助于分析復(fù)雜、多步驟的行為模式,例如越獄攻擊、拒絕響應(yīng)機(jī)制以及思維鏈的忠實(shí)度。

推動(dòng)領(lǐng)域發(fā)展

我們希望通過(guò)發(fā)布 Gemma Scope 2 為 AI 安全研究社區(qū)提供一套前沿的可解釋性工具,以推動(dòng)該領(lǐng)域發(fā)展。針對(duì)那些僅在更大、更先進(jìn)的大語(yǔ)言模型中出現(xiàn)的現(xiàn)實(shí)安全問(wèn)題,這種全新的開放程度提供了至關(guān)重要的解決途徑。歡迎您持續(xù)關(guān)注 "谷歌開發(fā)者" 微信公眾號(hào),及時(shí)了解更多開發(fā)技術(shù)和產(chǎn)品更新等資訊動(dòng)態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111365
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39755

    瀏覽量

    301355
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52099

原文標(biāo)題:Gemma Scope 2: 賦能 AI 安全社區(qū),深度洞察大語(yǔ)言模型復(fù)雜行為

文章出處:【微信號(hào):Google_Developers,微信公眾號(hào):谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新的開放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問(wèn)世標(biāo)志著開放翻譯領(lǐng)域邁出了重要一步,它可幫助人們跨越 55 種語(yǔ)言進(jìn)行交流,無(wú)論身在何處或
    的頭像 發(fā)表于 02-26 10:22 ?489次閱讀

    解鎖谷歌FunctionGemma模型的無(wú)限潛力

    在智能體 AI 領(lǐng)域,工具調(diào)用能力是將自然語(yǔ)言轉(zhuǎn)化為可執(zhí)行軟件操作的關(guān)鍵。此前,我們發(fā)布了專門針對(duì)函數(shù)調(diào)用而特別優(yōu)化的 Gemma 3 270M 模型版本 FunctionGemma。該模型
    的頭像 發(fā)表于 02-04 11:30 ?326次閱讀
    解鎖<b class='flag-5'>谷歌</b>FunctionGemma<b class='flag-5'>模型</b>的無(wú)限潛力

    借助谷歌FunctionGemma模型構(gòu)建下一代端側(cè)智能體

    對(duì)于 Gemma 模型系列而言,2025 年是充滿變革的一年。我們的下載量已從 1 億次增長(zhǎng)到超過(guò) 3 億次,同時(shí)還展現(xiàn)了開放模型的變革潛力: 從憑借 Gemma 3 定義最先進(jìn)的單加
    的頭像 發(fā)表于 01-20 09:11 ?618次閱讀
    借助<b class='flag-5'>谷歌</b>FunctionGemma<b class='flag-5'>模型</b>構(gòu)建下一代端側(cè)智能體

    谷歌評(píng)論卡,碰一碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協(xié)議,下一代蘋果基礎(chǔ)模型(Apple Foundation Models)將基于谷歌的Gemini模型和云技術(shù)。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長(zhǎng)期以來(lái),蘋果在AI領(lǐng)域的發(fā)展相對(duì)滯后,其語(yǔ)音助手Siri的功能
    的頭像 發(fā)表于 01-13 14:59 ?1547次閱讀

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺(tái),支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺(tái)。其芯片已在谷歌(Google)
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    谷歌與耶魯大學(xué)合作發(fā)布最新C2S-Scale 27B模型

    我們很榮幸發(fā)布與耶魯大學(xué)合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),這是一個(gè)新的 270 億參數(shù)基礎(chǔ)模型,旨在理解單個(gè)細(xì)胞的 "語(yǔ)言"。C
    的頭像 發(fā)表于 11-06 10:35 ?849次閱讀

    谷歌AlphaEarth和維智時(shí)空AI大模型的技術(shù)路徑

    谷歌AlphaEarth和維智時(shí)空AI大模型在應(yīng)用場(chǎng)景和技術(shù)實(shí)現(xiàn)上各有側(cè)重,但兩者在底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?900次閱讀

    谷歌推出AI模型Gemma 3 270M

    過(guò)去幾個(gè)月,Gemma 開放模型系列的發(fā)展是激動(dòng)人心的。我們推出了 Gemma 3 和 Gemma 3 QAT,為單一云端和桌面加速器帶來(lái)了最先進(jìn)的性能。
    的頭像 發(fā)表于 09-11 15:09 ?1138次閱讀

    谷歌Gemma 3n模型的新功能

    從第一個(gè) Gemma 模型于去年年初推出以來(lái),已逐漸發(fā)展為生機(jī)勃勃的 Gemmaverse 生態(tài)系統(tǒng),累計(jì)下載量突破 1.6 億。這個(gè)生態(tài)系統(tǒng)包括十余款專業(yè)模型系列,涵蓋從安全防護(hù)到醫(yī)療應(yīng)用的各領(lǐng)
    的頭像 發(fā)表于 07-25 10:16 ?1405次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemma</b> 3n<b class='flag-5'>模型</b>的新功能

    Liquid AI發(fā)布邊緣AI模型LFM2,實(shí)現(xiàn)毫秒級(jí)實(shí)時(shí)推理與離線運(yùn)行

    源于對(duì)AI底層邏輯的重構(gòu)。與傳統(tǒng)基于Transformer的模型不同,LFM2采用結(jié)構(gòu)化、自適應(yīng)的算子構(gòu)建,其靈感源自動(dòng)態(tài)系統(tǒng)理論、信號(hào)處理與數(shù)值線性代數(shù)的深度融合。 ? 這種設(shè)計(jì)使模型具備三大核心優(yōu)勢(shì):其一,訓(xùn)練效率較上一代提
    的頭像 發(fā)表于 07-15 08:59 ?5783次閱讀

    谷歌Gemma 3n預(yù)覽版全新發(fā)布

    Gemma 3 和 Gemma 3 QAT 的成功發(fā)布之后,我們的先進(jìn)開放模型系列具備了在單一云端或桌面加速器上運(yùn)行的能力,我們正在進(jìn)一步推進(jìn)我們對(duì)可訪問(wèn) AI 的愿景。
    的頭像 發(fā)表于 06-26 17:18 ?943次閱讀

    樹莓派5上的Gemma 2:如何打造高效的邊緣AI解決方案?

    從數(shù)學(xué)基礎(chǔ)到邊緣實(shí)現(xiàn),研究團(tuán)隊(duì):Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成機(jī)器模型算法2.1模型架構(gòu)2.2預(yù)訓(xùn)練2.3后訓(xùn)練3.邊緣AI實(shí)現(xiàn)1.引言GEMMA
    的頭像 發(fā)表于 06-20 16:57 ?1642次閱讀
    樹莓派5上的<b class='flag-5'>Gemma</b> <b class='flag-5'>2</b>:如何打造高效的邊緣AI解決方案?

    Google Gemma 3開發(fā)者指南

    自首次推出以來(lái),Gemma 模型的下載量已超過(guò) 1 億次,社區(qū)為各種用例創(chuàng)建了超過(guò) 60,000 個(gè)變體1。我們很高興推出 Gemma 3,這是 Gemma 開放
    的頭像 發(fā)表于 04-08 10:50 ?1116次閱讀
    Google <b class='flag-5'>Gemma</b> 3開發(fā)者指南

    Google發(fā)布最新AI模型Gemma 3

    Gemma 開放模型系列是 Google 推動(dòng)實(shí)用 AI 技術(shù)普惠大眾的重要基石。上個(gè)月,Gemma 迎來(lái)了首個(gè)生日?;赝^(guò)去一年,其成果斐然:全球下載量突破 1 億,社區(qū)欣欣向榮,衍生模型
    的頭像 發(fā)表于 03-18 09:51 ?1714次閱讀