91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Eleuther AI:已經(jīng)開源了復現(xiàn)版GPT-3的模型參數(shù)

深度學習自然語言處理 ? 來源:夕小瑤的賣萌屋 ? 作者:小戲 ? 2021-03-31 17:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPT3終于開源!不過,不是官方開的(別打我

Eleuther AI推出的名為GPT-Neo的開源項目,于晨4點于twitter正式宣布:已經(jīng)開源了復現(xiàn)版GPT-3的模型參數(shù)(1.3B和2.7B級別),并將其更新在Colab notebook之上。需要指出的是這次開源的模型里較大的那個版本也只是到了GPT-3商用版里最小模型的參數(shù)量,不過Eleuther AI表示未來會進一步開源10B版本和原始大小版本的GPT3模型參數(shù)。

消息發(fā)布后,立刻被各個大v轉發(fā),10小時內就已迅速收獲1.5K的點贊量,相應的github鏈接也已收獲接近2k star。

▲Twitter原文

但關于復現(xiàn)模型的性能,目前只說“實驗表現(xiàn)與原版GPT-3相當”(they performed on par)。具體實驗結果將于明天公布。

風靡一時的擁有1750億超大參數(shù)量,一出道便被視作NLP領域最強AI模型的GPT-3,得益于其龐大的參數(shù)量,使得GPT-3擁有不用接受特定訓練與微調,就能在不同NLP領域達到領先水平的強大能力。去年七月,GPT-3被Open-AI以商業(yè)API的形式向公眾開放,并被人們探索出了形形色色的應用,從基于問題的搜索,到文本樣式轉換,從UI界面設計,再到自動生成SQL代碼,GPT-3以其卓越的性能展現(xiàn)了其廣闊的應用場景,深度學習之父Hinton甚至這樣評價道:

如果以GPT-3的出色性能推算未來、生命、宇宙和萬物的答案也不過是4.398萬億個參數(shù)

但是,由于目前GPT-3的使用模式仍然是付費的商業(yè)API,因此并不是所有NLP的研究者都能使用GPT-3完成自己領域的任務與工作。而由Connor Leahy,Leo Gao和Sid Black三人聯(lián)合創(chuàng)立的Eleuther AI的團隊,于去年11月宣布推出GPT-Neo的開源項目,該項目基于GPT系列的設計原理,旨在復現(xiàn)GPT系列的各種項目,在該項目發(fā)布之初,其團隊成員已經(jīng)預測可以完成GPT-3級別大小的語言模型。

毫無疑問,GPT-3的開源將會催生出一大批NLP技術的嶄新應用,也會以更為低廉的成本釋放人們對NLP未來的想象力。

原文標題:【GPT-3】千呼萬喚始出來——GPT-3終于開源!

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39820

    瀏覽量

    301495
  • 開源
    +關注

    關注

    3

    文章

    4209

    瀏覽量

    46170
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23282

原文標題:【GPT-3】千呼萬喚始出來——GPT-3終于開源!

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    GPT-5震撼發(fā)布:AI領域的重大飛躍

    躍升重新定義人工智能的能力邊界。OpenAI首席執(zhí)行官山姆·奧特曼在發(fā)布會上直言:“這不僅是模型的升級,更是通往通用人工智能(AGI)的關鍵里程碑。” ? ? GPT-5:集成模型
    的頭像 發(fā)表于 08-09 07:44 ?1w次閱讀
    <b class='flag-5'>GPT</b>-5震撼發(fā)布:<b class='flag-5'>AI</b>領域的重大飛躍

    華為昇騰深度適配智譜AI全新開源模型GLM-5

    ,在真實編程場景的使用體驗逼近Claude Opus 4.5,更擅長復雜系統(tǒng)工程與長程Agent任務。昇騰一直同步支持智譜GLM系列模型,此次GLM-5模型一經(jīng)開源發(fā)布,昇騰AI基礎軟
    的頭像 發(fā)表于 02-25 14:41 ?781次閱讀
    華為昇騰深度適配智譜<b class='flag-5'>AI</b>全新<b class='flag-5'>開源</b><b class='flag-5'>模型</b>GLM-5

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發(fā)表于 02-19 13:43

    百度正式發(fā)布并開源新一代文檔解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式發(fā)布并開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數(shù)的輕量架構,在全球權威文檔解析評測榜單 OmniDocBench V
    的頭像 發(fā)表于 01-30 10:03 ?615次閱讀
    百度正式發(fā)布并<b class='flag-5'>開源</b>新一代文檔解析<b class='flag-5'>模型</b>PaddleOCR-VL-1.5

    NVIDIA推動面向數(shù)字與物理AI開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領域的全新 AI 工具,其中包括面向移動出行領域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA) NVIDIA DRIVE Alpamayo-R1。此外,一項新的
    的頭像 發(fā)表于 12-13 09:50 ?1344次閱讀

    成都匯陽投資關于國產(chǎn)開源模型持續(xù)突破,國產(chǎn)AI 競爭力增強

    ? ? ? ?國產(chǎn)開源模型領跑 ,AI 生態(tài)有望加速繁榮 根據(jù)獨立 AI 基準測試與分析平臺 Artificial Analysis 最新榜單 , 國產(chǎn)
    的頭像 發(fā)表于 11-24 14:01 ?572次閱讀

    GPT-5.1發(fā)布 OpenAI開始拼情商

    OpenAI正式上線 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有網(wǎng)友實測發(fā)現(xiàn)OpenAI新發(fā)布的GPT
    的頭像 發(fā)表于 11-13 15:49 ?707次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構

    連接定義神經(jīng)網(wǎng)絡的拓撲結構。 不同神經(jīng)網(wǎng)絡的DNN: 一、基于大模型AI芯片 1、Transformer 模型與引擎 1.1 Transformer
    發(fā)表于 09-12 17:30

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企
    的頭像 發(fā)表于 08-14 11:34 ?1413次閱讀

    OpenAI發(fā)布2款開源模型

    OpenAI開源兩款高性能權重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「
    的頭像 發(fā)表于 08-06 14:25 ?1032次閱讀

    【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

    1、ollama平臺搭建 ollama可以快速地部署開源模型,網(wǎng)址為https://ollama.com, 試用該平臺,可以在多平臺上部署 Deepseek-R1, Qwen3, Llama
    發(fā)表于 07-19 15:45

    NVIDIA使用Qwen3系列模型的最佳實踐

    阿里巴巴近期發(fā)布開源的混合推理大語言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源
    的頭像 發(fā)表于 05-08 11:45 ?3010次閱讀
    NVIDIA使用Qwen<b class='flag-5'>3</b>系列<b class='flag-5'>模型</b>的最佳實踐

    上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5

    似乎國內外AI競爭日趨白熱化,就在阿里巴巴發(fā)布Qwen3(通義千問3)之后,引發(fā)業(yè)界廣泛關注;很多大廠在跟進,大模型不斷上新: 阿里巴巴開源
    的頭像 發(fā)表于 04-30 16:08 ?1339次閱讀

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    AI的演進正在逼近“終端智能涌現(xiàn)”的拐點,從通用模型向場景落地遷移成為關鍵議題。聯(lián)發(fā)科以“AI隨芯,應用無界”為主題召開天璣開發(fā)者大會2025(MDDC 2025),不僅聚合全球生態(tài)
    發(fā)表于 04-13 19:52