91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT重磅升級(jí)!新語音和圖像輸入功能,讓ChatGPT能看、能聽、能說

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-09-28 00:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日消息,OpenAI在一篇博客中表示,ChatGPT 將推出新的語音和圖像功能。用戶不僅可以在文本框中輸入文字提示,還可以通過語音或圖像與ChatGPT交流。OpenAI稱,新功能在未來兩周內(nèi)向付費(fèi)用戶推出,不久后會(huì)推廣到其他用戶。

ChatGPT 是OpenAI推出的一種人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見的模式和統(tǒng)計(jì)規(guī)律,來生成回答,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務(wù)。自2022年11月30日發(fā)布以來,ChatGPT 已經(jīng)進(jìn)行了多次功能升級(jí)。

ChatGPT現(xiàn)在能看、能聽、能說了

ChatGPT使用了Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu),也是GPT-3.5架構(gòu),這是一種用于處理序列數(shù)據(jù)的模型,擁有語言理解和文本生成能力,尤其是它會(huì)通過連接大量的語料庫來訓(xùn)練模型,這些語料庫包含了真實(shí)世界中的對(duì)話,使得ChatGPT具備上知天文下知地理,還能根據(jù)聊天的上下文進(jìn)行互動(dòng)的能力,做到與真正人類幾乎無異的聊天場景進(jìn)行交流。

2022年11月30日,ChatGPT剛面世就迅速在社交媒體上走紅,短短5天,注冊(cè)用戶數(shù)超過100萬。2023年一月末,ChatGPT的月活用戶突破1億,成為史上增長最快的消費(fèi)者應(yīng)用。

2023年2月2日,OpenAI發(fā)布ChatGPT試點(diǎn)訂閱計(jì)劃——ChatGPT Plus。ChatGPT Plus以每月20美元的價(jià)格提供,訂閱者可獲得比免費(fèi)版本更穩(wěn)定、更快的服務(wù),及嘗試新功能和優(yōu)化的優(yōu)先權(quán)。同日,微軟發(fā)布公告稱,旗下所有產(chǎn)品將全線整合ChatGPT。

2023年3月15日,OpenAI正式推出GPT-4。GPT-4是多模態(tài)大模型,即支持圖像和文本輸入以及文本輸出,擁有強(qiáng)大的識(shí)圖能力。GPT-4的特點(diǎn)在于:第一,它的訓(xùn)練數(shù)量更大;第二,支持多元的輸出輸入形式;第三,在專業(yè)領(lǐng)域的學(xué)習(xí)能力更強(qiáng)。

2023年5月18日,OpenAI官網(wǎng)宣布推出iOS版ChatGPT應(yīng)用,該應(yīng)用可免費(fèi)使用,并在不同設(shè)備間同步用戶的歷史記錄。該應(yīng)用還集成了OpenAI開源語音識(shí)別系統(tǒng)Whisper,支持語音輸入。ChatGPT Plus付費(fèi)訂閱用戶可以獨(dú)家使用GPT-4功能。

2023年7月,OpenAI宣布推出定制指令功能,以便客戶更好地控制ChatGPT的回應(yīng)方式。此外,OpenAI還發(fā)布公告稱,給ChatGPT加了一個(gè)名為Custom instructions的新功能。2023年7月25日,OpenAI宣布,安卓版ChatGPT正式上線。

2023年9月25日,OpenAI發(fā)布《ChatGPT 現(xiàn)在能看、能聽、能說了》的公告,宣布ChatGPT 增加語音輸入和圖像輸入兩項(xiàng)新功能。這可以說是ChatGPT 發(fā)布以來極其重大的更新。

據(jù)介紹,語音輸入功能類似于手機(jī)上的語音助手,用戶只需要輕輕點(diǎn)擊一個(gè)按鈕,說出自己的問題,ChatGPT能將這些口述的問題轉(zhuǎn)換成文本,將其輸入至大語言模型中,生成答案,接著將答案轉(zhuǎn)化成語音,播放給用戶。

語音轉(zhuǎn)文本的任務(wù)由OpenAI 的 Whisper 模型提供支持。同時(shí),該公司正在引入一款全新的文本轉(zhuǎn)語音的模型,據(jù)稱可以通過幾秒鐘的語音樣本生成與人類相似的音頻。

圖像輸入功能類似于Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到ChatGPT中,ChatGPT會(huì)嘗試識(shí)別用戶想要詢問的內(nèi)容,并給出相應(yīng)的回答。用戶還可以用應(yīng)用中的繪圖工具來幫助表達(dá)自己的問題,或者配合語音或文本輸入來進(jìn)行交流。

用戶可以向ChatGPT展示一張或多張圖片,提問相關(guān)的問題。比如,發(fā)送一張壞掉的燒烤爐圖片,然后詢問無法啟動(dòng)原因;拍攝一張冰箱中的食材,詢問多種菜品制作方案。

OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車,不斷問ChatGPT:這里是扳手嗎?是調(diào)整這里嗎?甚至還把說明書拍照發(fā)給ChatGPT求解釋。

這正是ChatGPT獨(dú)特的特性所帶來的幫助,用戶可以與機(jī)器人進(jìn)行互動(dòng),逐步完善答案,而無需首先進(jìn)行搜索并在得到錯(cuò)誤答案后再次搜索。

ChatGPT新增語音和圖像功能帶來的風(fēng)險(xiǎn)

OpenAI在博客中表示,其目標(biāo)是構(gòu)建安全有益的通用人工智能(AGI)。新增的語音和圖像功能可能會(huì)帶來一些風(fēng)險(xiǎn),但是OpenAI正在采取措施緩解這些風(fēng)險(xiǎn)。

新的語音技術(shù)能夠在短短幾秒鐘的真實(shí)語音片段中生成逼真的合成語音,這一技術(shù)存在潛在風(fēng)險(xiǎn),比如,惡意行為者可能會(huì)濫用這項(xiàng)技術(shù),冒充公眾人物或?qū)嵤┢墼p。為了避免這些問題的發(fā)生,OpenAI決定將這項(xiàng)技術(shù)應(yīng)用于特定的場景中,會(huì)受到嚴(yán)格的限制。

新的圖像功能也帶來一定風(fēng)險(xiǎn),在進(jìn)行更廣泛的部署之前,OpenAI測(cè)試了該模型在極端主義和科學(xué)領(lǐng)域等方面潛在的風(fēng)險(xiǎn),并對(duì)一些關(guān)鍵細(xì)節(jié)進(jìn)行了調(diào)整,來確保負(fù)責(zé)任地應(yīng)用這項(xiàng)技術(shù)。比如,在處理人物圖片時(shí),OpenAI限制了ChatGPT 對(duì)人物進(jìn)行分析和直接評(píng)價(jià)的能力,這意味著上傳一個(gè)人的照片就能知道那是誰無法實(shí)現(xiàn),這是為了隱私安全。

ChatGPT自發(fā)布以來,在受到廣大用戶追捧的同時(shí),其伴隨的風(fēng)險(xiǎn)也讓各界人士表示擔(dān)憂。一是它可能在被使用的過程中造成數(shù)據(jù)信息的丟失;二是它也可能會(huì)被一些不法分子用來實(shí)施欺詐行為。在過去這大半年時(shí)間里,不少機(jī)構(gòu)也在反對(duì)ChatGPT的使用和進(jìn)一步研究。

2023年2月3日,IT行業(yè)的領(lǐng)導(dǎo)們擔(dān)心,ChatGPT已經(jīng)被黑客們用于策劃網(wǎng)絡(luò)攻擊時(shí)使用。黑莓(Black Berry)的一份報(bào)告調(diào)查了英國500名IT行業(yè)決策者對(duì)ChatGPT這項(xiàng)革命性技術(shù)的看法,發(fā)現(xiàn)超過四分之三(76%)的人認(rèn)為,外國已經(jīng)在針對(duì)其他國家的網(wǎng)絡(luò)戰(zhàn)爭中使用ChatGPT。近一半的人認(rèn)為,2023年,將會(huì)出現(xiàn)有人惡意使用ChatGPT成功進(jìn)行網(wǎng)絡(luò)攻擊。

2023年4月,中國支付清算協(xié)會(huì)倡議支付行業(yè)從業(yè)人員謹(jǐn)慎使用ChatGPT。4月13日,西班牙國家數(shù)據(jù)保護(hù)局和法國國家信息自由委員會(huì)分別宣布對(duì)ChatGPT展開調(diào)查。

在各界人士對(duì)ChatGPT存在風(fēng)險(xiǎn)的質(zhì)疑聲中,OpenAI也一直在尋找解決辦法,如何讓其在增加新功能的同時(shí)而不會(huì)帶來新的問題。從這次的功能升級(jí)來看,OpenAI試圖通過有意限制新模型的功能,來達(dá)到更進(jìn)一步提升功能和同時(shí)帶來新問題的平衡。OpenAI表示,將不斷改進(jìn)和完善風(fēng)險(xiǎn)緩解措施,未來為大家提供更強(qiáng)大的系統(tǒng)。

總結(jié)

ChatGPT自出世以來就引起了廣泛關(guān)注,過去近一年時(shí)間,OpenAI對(duì)其底層模型和界面也進(jìn)行了多次升級(jí)。如今,ChatGPT更是進(jìn)行了一次重磅升級(jí),新增語音輸入和圖像輸入功能,讓ChatGPT實(shí)現(xiàn)了能看、能聽、能說的能力。

與此同時(shí),ChatGPT在使用中存在的風(fēng)險(xiǎn)一直以來也是各界擔(dān)心的問題,此次增加的新功能更是可能帶來新的風(fēng)險(xiǎn)。不過在過去這段時(shí)間,OpenAI也一直致力于尋找解決辦法,就比如在這次功能升級(jí)中,OpenAI通過一些限制來在實(shí)現(xiàn)新功能的同時(shí)也避免可能帶來新風(fēng)險(xiǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10283
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    巨頭競逐AI醫(yī)療健康:OpenAI推出ChatGPT Health,螞蟻阿福國內(nèi)領(lǐng)跑

    健康已成為AI技術(shù)的高頻應(yīng)用場景。OpenAI在其一篇博客文章中透露,通過分析匿名化的ChatGPT對(duì)話數(shù)據(jù),發(fā)現(xiàn)全球每周有超過2.3億人在ChatGPT上咨詢健康相關(guān)問題,醫(yī)療健康的需求極為旺盛。
    的頭像 發(fā)表于 01-10 11:17 ?2426次閱讀

    訊飛智文產(chǎn)品完成重磅升級(jí)

    2026年伊始,當(dāng)智能體成為人人可用的數(shù)字生產(chǎn)力,訊飛智文完成重磅升級(jí)。全新打造的「智能演練」與「AI演示官」,首次實(shí)現(xiàn)“寫、練、演”一體化的表達(dá)鏈路,重塑AI PPT全流程,每個(gè)觀點(diǎn)都能被從容講述、生動(dòng)傳遞。
    的頭像 發(fā)表于 01-08 16:41 ?837次閱讀

    WT2003H以語音提示+遠(yuǎn)程MCU更新語音為核心的解決方案,為電動(dòng)車儀表的智能化升級(jí)提供了一條清晰的路徑!

    小伙伴們,歡迎來到本期的唯創(chuàng)#WT語音芯片小課堂!今天我們要聊的這款產(chǎn)品,可能會(huì)很多電動(dòng)車用戶和車企朋友眼前一亮——WT2003H語音芯片,一個(gè)電動(dòng)車儀表"
    的頭像 發(fā)表于 12-24 12:03 ?507次閱讀
    WT2003H以<b class='flag-5'>語音</b>提示+遠(yuǎn)程MCU更<b class='flag-5'>新語音</b>為核心的解決方案,為電動(dòng)車儀表的智能化<b class='flag-5'>升級(jí)</b>提供了一條清晰的路徑!

    上線!國產(chǎn)AI語音開發(fā)板,定制你的聊天伙伴助手

    伙伴們,之前我們將Ai-M61模組接入了ChatGPT,弄了語音AI,光API調(diào)用費(fèi)就能吃掉半年奶茶錢!也有不少小伙伴在留言區(qū)表示“貴啊”(詳情看這里:能和Ai-M61模組對(duì)話了?手搓一個(gè)
    的頭像 發(fā)表于 11-20 11:53 ?880次閱讀
    上線!國產(chǎn)AI<b class='flag-5'>語音</b>開發(fā)板,定制你的聊天伙伴助手

    重磅升級(jí)!迅為iTOP-Hi3403開發(fā)板SDK全面升級(jí)至Linux?6.6內(nèi)核

    重磅升級(jí)!迅為iTOP-Hi3403開發(fā)板SDK全面升級(jí)至Linux?6.6內(nèi)核】
    的頭像 發(fā)表于 11-18 13:34 ?1019次閱讀
    <b class='flag-5'>重磅</b><b class='flag-5'>升級(jí)</b>!迅為iTOP-Hi3403開發(fā)板SDK全面<b class='flag-5'>升級(jí)</b>至Linux?6.6內(nèi)核

    新語音交互體驗(yàn):A-59P 升級(jí)版 AI 降噪語音處理模組重磅來襲

    語音處理
    芯慧創(chuàng)科技崇仁縣有限公司
    發(fā)布于 :2025年11月03日 10:11:11

    RT-Thread BSP v1.10.0 重磅發(fā)布 | 開發(fā)環(huán)境全面升級(jí)

    RT-ThreadBSPv1.10.0帶來三大重磅升級(jí):多工具鏈支持、HPM5E00系列支持、獨(dú)立導(dǎo)出功能,先楫MCU開發(fā)更簡單、更高效!核心亮點(diǎn)三大突破性
    的頭像 發(fā)表于 08-29 12:21 ?1172次閱讀
    RT-Thread BSP v1.10.0 <b class='flag-5'>重磅</b>發(fā)布 | 開發(fā)環(huán)境全面<b class='flag-5'>升級(jí)</b>

    七牛云發(fā)布靈矽 AI:600ms超低延遲,重塑智能硬件語音交互新范式

    8 月 15 日,七牛云正式發(fā)布靈矽 AI —為新一代智能硬件而生的語音交互新范式,智能硬件不僅會(huì)“說話”,更能聽懂情緒、自然交流。這不僅是語音交互技術(shù)從“能用”到“好用”的
    的頭像 發(fā)表于 08-15 15:33 ?883次閱讀
    七牛云發(fā)布靈矽 AI:600ms超低延遲,重塑智能硬件<b class='flag-5'>語音</b>交互新范式

    WT2606B 驅(qū)屏語音芯片新增藍(lán)牙功能功能集成一體化,產(chǎn)品升級(jí)自動(dòng)化,語音交互無線化,場景應(yīng)用普適化!

    WT2606B 驅(qū)屏語音芯片新增藍(lán)牙功能功能集成一體化,產(chǎn)品升級(jí)自動(dòng)化,語音交互無線化,場景應(yīng)用普適化!
    的頭像 發(fā)表于 08-14 12:05 ?615次閱讀
    WT2606B 驅(qū)屏<b class='flag-5'>語音</b>芯片新增藍(lán)牙<b class='flag-5'>功能</b>:<b class='flag-5'>功能</b>集成一體化,產(chǎn)品<b class='flag-5'>升級(jí)</b>自動(dòng)化,<b class='flag-5'>語音</b>交互無線化,場景應(yīng)用普適化!

    ChatGPT 智能體發(fā)布的觀點(diǎn)解析及對(duì)科義相關(guān)系統(tǒng)的現(xiàn)實(shí)意義

    人工智能技術(shù)在多能力融合與復(fù)雜任務(wù)處理上實(shí)現(xiàn)了重大突破。ChatGPT 智能體并非簡單地將各項(xiàng)功能進(jìn)行堆砌,而是實(shí)現(xiàn)了 Operator 智能體網(wǎng)頁交互能力、“深入研究” 功能的互聯(lián)網(wǎng)信息搜集能力以及自身對(duì)話能力的有機(jī)統(tǒng)一。這種
    的頭像 發(fā)表于 07-18 16:31 ?1.3w次閱讀

    AI真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開關(guān)已開啟

    AI現(xiàn)在就像一個(gè)小朋友,很容易就學(xué)壞了!OpenAI剛剛發(fā)現(xiàn),如果用錯(cuò)誤的數(shù)據(jù)微調(diào)自家的模型的一個(gè)領(lǐng)域,ChatGPT就會(huì)把在這個(gè)領(lǐng)域?qū)W到的「惡」和「壞」泛化到其他領(lǐng)域。比如「刻意」用錯(cuò)誤數(shù)據(jù)在汽車
    的頭像 發(fā)表于 06-20 12:41 ?1.5w次閱讀
    AI真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),<b class='flag-5'>ChatGPT</b>善惡開關(guān)已開啟

    樹莓派與EthernetHat:用ChatGPT實(shí)現(xiàn)的MQTT智能家居項(xiàng)目!

    我們使用Pico、WIZnetW5100S和PicoBricks開發(fā)板開發(fā)了MQTTRGB燈,通過ChatGPT4.0生成和優(yōu)化代碼。項(xiàng)目所需組件硬件組件PicoBricks擴(kuò)展板x1WIZnetW5100S-EVB-Picox1WIZnetW5500-EVB-PicoWIZnet以太網(wǎng)HATx1樹莓派Picox1
    的頭像 發(fā)表于 06-03 15:29 ?1.5w次閱讀
    樹莓派與EthernetHat:用<b class='flag-5'>ChatGPT</b>實(shí)現(xiàn)的MQTT智能家居項(xiàng)目!

    樹莓派遇上ChatGPT,魔法熱線就此誕生!

    盡管這種電話在幾十年前就已過時(shí),但許多人都對(duì)旋轉(zhuǎn)撥號(hào)電話記憶猶新。這些舊電話,其實(shí)可以被改造成一個(gè)ChatGPT熱線。這個(gè)由PolluxLabs開發(fā)的項(xiàng)目,你可以將一部復(fù)古的旋轉(zhuǎn)撥號(hào)電話連接到樹莓
    的頭像 發(fā)表于 04-13 09:04 ?1.6w次閱讀
    樹莓派遇上<b class='flag-5'>ChatGPT</b>,魔法熱線就此誕生!

    和安信可Ai-M61模組對(duì)話?手搓一個(gè)ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    能和Ai-M61模組對(duì)話了?手搓一個(gè)ChatGPT 語音助手

    起猛了, 安信可的Ai-M61模組能說話了! 超低延遲實(shí)時(shí)秒回 ,對(duì)話超絲滑的那種,先來看一段VCR: 小安派+ChatGPT語音實(shí)測(cè):對(duì)話絲滑到忘記對(duì)面是AI_ 人工智能的應(yīng)用日益廣泛。 各家模型
    的頭像 發(fā)表于 03-12 11:57 ?1.2w次閱讀
    能和Ai-M61模組對(duì)話了?手搓一個(gè)<b class='flag-5'>ChatGPT</b> <b class='flag-5'>語音</b>助手