午夜热情av色婷婷久久视屏,91午夜精品亚洲,国产小视频在线免费观看

“做AI產(chǎn)品經(jīng)理太難了?！苯谀X極體的同事參加了一場開發(fā)者大會，一位產(chǎn)品經(jīng)理向我們坦言：“AI時代，做產(chǎn)品的方法論沒變，但以往熟悉的東西幾乎都被清零了?！?/strong>

用戶需求被清零了，大模型到底能用來做什么，用戶自己是不清楚的，需求是空白的，需求調(diào)研、產(chǎn)品定義，就要花費好幾個月的時間。

好不容易定義好了，基礎(chǔ)模型的一個更新，就有可能將前期所做的工作、功能規(guī)劃等推倒重來。

“比如GPT-4o出現(xiàn)之后，語音對話的能力是我們完全意想不到的，就又得把產(chǎn)品開發(fā)過程再來一遍……”

而縱觀一年多來推陳出新的數(shù)百個大模型，GPT-4o可以說是產(chǎn)品化程度非常高的一個了。

比如OpenAI發(fā)布會上展示的“AI視頻通話”，使用戶與AI進(jìn)行實時的、跟真人對話一樣自然的視頻交流。國內(nèi)模型廠商也很快推出了類似的AI視頻通話功能，不少媒體和用戶都表示“體驗炸裂”。

但半年時間過去，發(fā)現(xiàn)在最初的震驚與新鮮感過后，在真正的軟件生態(tài)里，還是沒有看到“AI視頻通話”被大規(guī)模、高頻率地用起來，更別提激活用戶的付費欲望了。為什么會這樣？

我們就從“AI視頻通話”說開去，聊聊AI產(chǎn)品化、商業(yè)化到底要經(jīng)過哪些磨礪。

鉆石原礦被開采出來，其實并不璀璨奪目，是經(jīng)由工匠們的切割打磨，被鑲嵌成鉆石首飾，包裝為“愛情象征”，才走進(jìn)大眾消費市場，價值實現(xiàn)了百倍千倍攀升。

類GPT-4o大模型就類似于原礦，作為“交互天花板”，潛在商業(yè)價值很大，但必須經(jīng)過產(chǎn)品化的精細(xì)打磨與包裝，才能被大眾用戶廣泛接受，實現(xiàn)其真正的價值和應(yīng)用潛力。

而基于類GPT-4o所誕生的“AI視頻通話”，雖然向產(chǎn)品化邁進(jìn)了一步，但依然屬于原型的基礎(chǔ)能力。

盡管OpenAI、智譜等模廠已經(jīng)針對“AI視頻通話”這一應(yīng)用，打磨了諸如響應(yīng)速度、具體用例等產(chǎn)品側(cè)的細(xì)節(jié)，并融入到ChatGPT、智譜清言APP等產(chǎn)品當(dāng)中。但作為一種軟件應(yīng)用來說，這種與通用場景相結(jié)合的落地模式，還是比較粗陋。

首先，需求過于寬泛。

AI視頻通話，技術(shù)上相當(dāng)于讓AI擁有“眼睛”和“嘴”，具備察言觀色、跟真人對話的能力。這很容易就讓人想到AI陪伴，人與AI談天說地、談情說愛。

直接將AI視頻通話能力嫁接在聊天機(jī)器人上，本質(zhì)依然是AI聊天，能力升級，但無法解決chatbot商業(yè)價值低的核心問題。

AI視頻聊天，用戶容錯率高，不在乎AI偶爾犯錯或出現(xiàn)幻覺，這也意味著對基礎(chǔ)模型能力要求不嚴(yán)苛，無法在技術(shù)層面拉開差距。曾經(jīng)的智能音箱大戰(zhàn)、智能助手紅海，也會在AI視頻聊天領(lǐng)域出現(xiàn)，并且由于聊天并不能幫助用戶完成具體任務(wù)或解決問題，用戶還得自己琢磨在視頻里跟AI聊什么，沒一會兒就只能跟AI面面相覷，難以帶來確定性的產(chǎn)品滿足和持久粘性，新鮮感過后就會流失。

而一些直接用途，想要普遍應(yīng)用，也有大量細(xì)節(jié)仍待填充。

比如基于AI視頻通話的無障礙功能，是一個非常直接的落地場景。AI視頻通話，可以將設(shè)備攝像頭作為“眼睛”，幫助人去理解物理世界，這對視障人群豈不是很友好？

但實際上，大模型APP的視頻通話功能，是無法直接被視障人群用起來的，還有大量的產(chǎn)品細(xì)節(jié)需要考慮。比如我們曾體驗過實時圖像識別，AI只能認(rèn)出“面前有兩張卡”，但哪張是公交卡，哪張是銀行卡，是無法準(zhǔn)確識別的，這就需要基于視障群體出行接觸的高頻物體，進(jìn)行針對性地精調(diào)。

而且，在飛機(jī)、高鐵、地鐵等弱網(wǎng)、無網(wǎng)環(huán)境下，也要保證視障人群與AI視頻通話的實時性，就需要純端側(cè)運行的多模態(tài)大模型，將模型做小、計算效率做高。

產(chǎn)品設(shè)計層面，還有大量的細(xì)節(jié)，還等待著填充，才能轉(zhuǎn)化為用戶可以方便使用的產(chǎn)品和服務(wù)。

可以看到，沒有更細(xì)致的產(chǎn)品化，盡管“AI視頻通話”這一基礎(chǔ)能力很厲害，卻不知道能用來干什么，很可能導(dǎo)致技術(shù)找不到市場，倒在了產(chǎn)品化變現(xiàn)的黎明到來之前。

這個“至暗時刻”會發(fā)生嗎？

欣慰的是，我們發(fā)現(xiàn) “AI視頻通話”能力，已經(jīng)開始向行業(yè)輸送了，意味著這座AI基礎(chǔ)能力的“原礦”，終于開始被打磨成晶光四射的鉆石。

我們就從“原礦”流向的應(yīng)用領(lǐng)域，來分享幾個“AI視頻通話”的產(chǎn)品化方向。

大模型怎么落地？智能體是方向。

智能體怎么服務(wù)？+AI視頻通話事半功倍。

如今，手機(jī)軟件承載著我們?nèi)粘５慕^大多數(shù)服務(wù)，在各個應(yīng)用中來回跳轉(zhuǎn)、操作是非常繁瑣的。

今年以來，榮耀、vivo等廠商都在基于智能體打造一系列創(chuàng)新功能體驗，比如“一句話點奶茶”“一句話訂餐廳”等。用戶只需要向手機(jī)助手發(fā)出指令，手機(jī)智能體會自動理解需求、拆解任務(wù)步驟、調(diào)取相關(guān)功能，一站到底地完成任務(wù)。

Agent手機(jī)就很好地解決了數(shù)字服務(wù)鏈路長、操作繁瑣的問題，但新的問題又來了，那就是智能體還需要“看得懂”“能交流”。

舉個例子，在外賣小程序下單時，遇到廣告是常態(tài)，這時候需要智能體agent執(zhí)行準(zhǔn)確的操作，比如“點擊關(guān)閉”“跳過”等，來推進(jìn)到下一步。如果智能體無法識別相關(guān)內(nèi)容，必須用戶自己動手操作，那整個鏈路就被打斷了，用戶體驗會非常不好。有跟智能助手通過文字prompt交流的功夫，用戶自己就能點開程序完成下單了。

Agent手機(jī)+視頻通話，就能用戶體驗更進(jìn)一步。

比起打字的繁瑣、語音尷尬癥，在人機(jī)對話時，像跟真人面對面交流一樣，通過語音對話完成下單，更符合直覺，也更有被服務(wù)的舒適感。對話之后，大模型對視頻畫面進(jìn)行實時分析，指導(dǎo)智能體來自動執(zhí)行，整個體驗會從頭到尾絲滑無感。

目前，國內(nèi)終端廠商在端側(cè)智能體方面走得是更快的。腦極體在VDC 2024大會上了解到，藍(lán)河操作系統(tǒng)增添了視覺感知能力，讓系統(tǒng)像人類一樣“聽得懂”“看得清”。智能體能夠模擬人類的智能，助力操作系統(tǒng)像人一樣進(jìn)行溝通、執(zhí)行智能任務(wù)。

如果說，智能體可以讓人成為數(shù)字服務(wù)的最小參與者，那么在智能體手機(jī)中打磨的AI視頻通話，則讓人機(jī)交互朝著更理想、更符合直覺的體驗靠近，讓數(shù)字生活管家走進(jìn)現(xiàn)實。

將AI視頻通話功能集成到垂直應(yīng)用軟件中，可以變成擬人化的垂域?qū)＜?，提供更專業(yè)的服務(wù)，解決更具體的問題，從而激活用戶的付費意愿和模型API經(jīng)濟(jì)。

目前，OpenAI為GPT-4o預(yù)設(shè)了十幾個場景，清言視頻通話API上線智譜開放平臺時，也列出了智能硬件（VR眼鏡）、教育培訓(xùn)AI私教、文旅場景AI向?qū)?、具身智能等落地方向。通過將AI視頻通話API開放出來，鼓勵開發(fā)者在產(chǎn)品中集成“AI視頻通話”功能。

9月24日，多鄰國（Duolingo）在第六屆全球分享大會上，推出了 AI 視頻通話（Video Call）。Duolingo Max 用戶可以與多鄰國的角色 Lily（拽姐）進(jìn)行視頻通話，進(jìn)行個性化的互動練習(xí)。在對話中，AI會根據(jù)用戶的語言水平靈活調(diào)整內(nèi)容。

學(xué)習(xí)語言最難的就是高頻使用環(huán)境和開口說話的心理障礙，通過AI視頻通話提供實時的對話機(jī)會，可以讓小白初學(xué)者也能自信開口，進(jìn)行有效聯(lián)系。據(jù)說，多鄰國的這一新功能接入了OpenAI的高級語音API功能。

國內(nèi)頭部社交軟件Soul，也上線了AI聊天機(jī)器人“AI茍蛋”，可以主動跟用戶找話題，并且年底將開啟AI陪聊機(jī)器人的視頻通話服務(wù)。不同于泛泛聊天，Soul主打的是靈魂交友，平臺用戶傾向于開展深層交流，探討深度話題，尋求心靈共鳴。

在這種較為成熟的社區(qū)氛圍下，用戶在使用AI視頻通話的預(yù)期、內(nèi)容也是較為明確的，不會出現(xiàn)不知道聊什么的情況。

各行各業(yè)都存在大量需要互動的場景，可以跟“AI視頻通話”相結(jié)合提供擬人化體驗。但用戶能否由此對應(yīng)用和AI視頻通話產(chǎn)生黏性，還需要行業(yè)伙伴把使用門檻降到最低，這不僅需要行業(yè)擁有產(chǎn)品開發(fā)的能力與意愿，能夠洞察缺口與機(jī)遇，也需要模廠的生態(tài)支持。

從哆啦A夢到阿童木、賈維斯、Her，這些讓人類感覺友好溫暖的AI，都是擬人化的。也許說明，我們更愿意跟更像人類的AI打交道，而不是冰冷無形的機(jī)器。

一位智能機(jī)器從業(yè)者告訴我們，一開始設(shè)計的新車只有虛擬的語音助手，用戶上車之后覺得跟空氣說話很尷尬，激活率不高，所以設(shè)計了一個帶有屏幕的車載控件，可以跟車主打招呼、有表情，車主很喜歡跟它對話，逢年過節(jié)還會為它買各種裝飾物，把它當(dāng)作用車場景中的家庭一員。

從這個思路看，AI視頻通話其實可以被加入各種硬件當(dāng)中，與用戶展開真人一般的對話，從而成為情感共同體，由此衍生的商業(yè)空間也非常充裕。

透過AI視頻通話，相信大家能夠感受到，無論是AI企業(yè)或普通大眾，對于AI產(chǎn)品化的需求越來越實質(zhì)。

模型技術(shù)只是能力，是原型，而遠(yuǎn)不到普遍可用的階段。唯有通過產(chǎn)品化的細(xì)致打磨，AI這座商業(yè)富礦，才能真正顯露出鉆石般的光芒。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
91

文章
39911

瀏覽量
301545

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

加入交流群

掃碼添加小助手

加入工程師交流群

評論

發(fā)布評論請先登錄

相關(guān)推薦

熱點推薦

LT6559：高性能低成本的三路視頻放大器

視頻應(yīng)用優(yōu)化的低成本、高速三路放大器。文件下載： LT6559.pdf 一、產(chǎn)品概述 LT6559 是一款低成本、高速的三路放大器，它在單 5V 電源下具備出色的

發(fā)表于 01-24 11:35 ?445次閱讀

純4G?血版AI小智產(chǎn)品方案 #小智AI #AI方案商 #4G通話 #AI終端產(chǎn)品

AI

不太正經(jīng)的攻城獅
發(fā)布于 :2025年12月21日 14:36:55

瑞芯微SOC智能視覺AI處理器

需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯，最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器，專注于視頻輸入端的AI分析與處理。CPU: 雙核A5

發(fā)表于 12-19 13:44

RK3576驅(qū)動高端顯控系統(tǒng)升級：多屏拼控與AI視覺融合解決方案

、LVDS、MIPI-CSI 等多媒體接口，可實現(xiàn)三屏異顯與八攝像頭同步輸入，且支持 Linux 系統(tǒng)運行與 AI 推理部署。經(jīng)實測，在同時運行三屏顯示與八路

發(fā)表于 11-21 17:51

RK3576在智能工程機(jī)械中的應(yīng)用｜三屏八攝AI視覺解決方案

盲區(qū)事故礦用卡車導(dǎo)航 + 儀表 + 車外監(jiān)控前后攝像頭AI識別智能避障、遠(yuǎn)程調(diào)度遠(yuǎn)程施工終端主屏任務(wù)控制 + 副屏視頻流 + 監(jiān)控屏多角度視頻采集遠(yuǎn)程調(diào)度與數(shù)據(jù)可視化借助RK3

發(fā)表于 11-07 22:11

華為以5G-A×AI網(wǎng)業(yè)協(xié)同推動網(wǎng)絡(luò)能力產(chǎn)品化

網(wǎng)絡(luò)能力產(chǎn)品化” 分享了核心見解。他指出，AI時代下，端、網(wǎng)、云單點體驗已觸頂，唯有以5G-A×AI網(wǎng)業(yè)協(xié)同突破體驗瓶頸，推動網(wǎng)絡(luò)能力產(chǎn)品化，才能為運營商開辟業(yè)務(wù)體驗價值創(chuàng)造的新賽道，

發(fā)表于 10-17 11:36 ?829次閱讀

RK3576助力智慧安防：8路高清采集與AI識別

在智慧城市和數(shù)字化園區(qū)的建設(shè)過程中，安防監(jiān)控系統(tǒng)正從“被動記錄”走向“主動識別與分析”。隨著AI算法的成熟和高清視頻處理能力的提升，市場對多路視頻采集、實時拼接、智能識別的需求日益增強(qiáng)

發(fā)表于 08-22 17:41

千方科技推出AI視頻充電樁系列產(chǎn)品

近年來，充電基礎(chǔ)設(shè)施保有量快速增長，運營管理過程中普遍存在充電樁利用率低、設(shè)備維護(hù)困難等問題。千方科技推出AI視頻充電樁系列產(chǎn)品，從感知系統(tǒng)、控制系統(tǒng)到運維體系實現(xiàn)智能化升級，助力充電

發(fā)表于 07-26 14:47 ?2196次閱讀

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實

打破次元壁，AI通話連接世界和未來

發(fā)表于 07-18 21:39 ?3141次閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】視頻會議場景下的 AI 應(yīng)用（電子云臺 EPTZ、人像居中 / 追蹤、畫中畫）

就需要直接使用單攝出雙通道數(shù)據(jù)，一路低分辨率送 AI 處理，另一路高分辨率經(jīng)過一定處理后送顯。出兩路視頻流的代碼如下： sensor =

發(fā)表于 07-09 20:56

智慧視覺：RT-Thread+MC632X高性價比雙路圖像處理方案 | 產(chǎn)品動態(tài)

在智能視覺技術(shù)高速發(fā)展的浪潮中，行業(yè)對芯片性能、能效比和開發(fā)效率的需求正呈現(xiàn)爆發(fā)式增長。面對多路高清視頻處理、實時智能分析和快速產(chǎn)品化落地的三重挑戰(zhàn)，RT-Thread操作系統(tǒng)攜手MC632X智能

發(fā)表于 07-01 12:05 ?3558次閱讀

AI神經(jīng)網(wǎng)絡(luò)降噪算法在語音通話產(chǎn)品中的應(yīng)用優(yōu)勢與前景分析

隨著人工智能技術(shù)的快速發(fā)展，AI神經(jīng)網(wǎng)絡(luò)降噪算法在語音通話產(chǎn)品中的應(yīng)用正逐步取代傳統(tǒng)降噪技術(shù)，成為提升語音質(zhì)量的關(guān)鍵解決方案。相比傳統(tǒng)DSP（數(shù)字信號處理）降噪，AI降噪具有更強(qiáng)的環(huán)境

發(fā)表于 05-16 17:07 ?1541次閱讀

【米爾MYC-YM90X安路飛龍DR1開發(fā)板】安路科技 SALDRAGON開發(fā)板介紹

基于SALDRAGON的核心板、開發(fā)板，加速客戶產(chǎn)品化進(jìn)程。例如，雙方聯(lián)合開發(fā)的電子后視鏡方案已應(yīng)用于商用車領(lǐng)域。五、開發(fā)板介紹米爾電子基于安路科技DR1M90GEG484 FPGA SoC推出

發(fā)表于 04-28 17:57

Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)

的訓(xùn)練樣本和訓(xùn)練模型，具體商業(yè)價值和保密性，采用海思SD3403邊緣計算AI服務(wù)器+多路安防監(jiān)控IPC，讓差異化AI視頻系統(tǒng)，成本控制極具市場競爭力。海思SD3403邊緣計算AI

發(fā)表于 04-28 11:05

華為AI通話反詐方案助力預(yù)防電信網(wǎng)絡(luò)詐騙

近日，華為技術(shù)有限公司基于AI通話解決方案，幫助運營商實現(xiàn)通話中的實時AI反詐，標(biāo)志著電信詐騙防控正式邁入“實時阻斷”的全新階段。

發(fā)表于 04-21 09:17 ?1557次閱讀

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

“AI視頻通話”產(chǎn)品化的三條路

評論