91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

博士生范麗鳳可讓機器識別視頻人物的心智想法

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-06-23 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這幾天,計算機視覺和模式識別領域的頂級會議 CVPR 2021(Computer Vision and Pattern Recognition)正在火熱進行中,剛剛從加州大學洛杉磯分校(UCLA)博士畢業(yè)的石家莊女生范麗鳳,提及此次被錄用的論文表示:“在 CV 和 AI 領域,中國人的貢獻和力量是毋庸置疑和不容小覷的?!?/p>

在最終評審中她獲得了接近滿分的成績,三位審稿人中兩位給了 “Strong Accept”,一位給了 “Accept”。

范麗鳳是計算機視覺大牛朱松純教授的博士生。2020 年,朱松純?nèi)毣貒⑷肼毐贝?,還牽頭成立了北京通用人工智能研究院,一度曾在國內(nèi)引起過熱議。

最近剛剛博士畢業(yè)的范麗鳳也即將跟隨導師朱松純教授回國工作,其表示:“朱老師肯定希望我們可以回去支持國內(nèi)的 AI 事業(yè),我自己也覺得國內(nèi)有巨大的發(fā)展空間,也更喜歡國內(nèi)的文化環(huán)境,并且在朱老師的研究院我還可以繼續(xù)推進一直以來的研究工作,這是一個很好的機遇?!?/p>

范麗鳳本科和博士期間學的都是統(tǒng)計學。2012 年,她從河北辛集中學考入浙江大學數(shù)學科學學院,主修統(tǒng)計學,在四年的本科學習訓練中掌握了統(tǒng)計建模和編程實現(xiàn)的基本能力。

2015 年大三暑假,她參加了 UCLA-CSST 暑期科研訓練項目,在 Hongjing Lu 教授(UCLA 心理系和統(tǒng)計系教授)的指導下開展了一項關于動作識別的研究。自那時起,范麗鳳開始對計算機視覺產(chǎn)生了濃厚的興趣。

項目快結束時,她特意寫郵件并去實驗室拜訪了時任 UCLA 統(tǒng)計系和計算機科學系教授的朱松純。經(jīng)過交談,朱教授鼓勵她多讀實驗室的相關論文、多學點計算機視覺的基礎課程,為進行科研打下堅實的基礎。

回到浙大后,范麗鳳利用大四的時間,積極主動修習了計算機視覺的相關課程,閱讀了一些基礎的專業(yè)書籍和論文。經(jīng)過再三考慮,她下定決心申請了朱教授的博士,最終如愿獲得了錄取,來到 UCLA VCLA 實驗室進行了為期五年的博士生科研訓練,獲得了巨大的成長。

基于真實視頻,研究高級 AI 任務

談及本次論文的立項原因,她表示是因為朱教授一直都在鼓勵她做更難、更有挑戰(zhàn)性和前瞻性的工作。

雖然近幾年得益于深度學習,計算機視覺領域獲得了突破性的進展,但大多研究都還是在解決比較底層的任務,比如人臉識別、動作識別等等,而更高級的任務,比如心智理論建模等等,還遠未得到解決。

現(xiàn)有的解決更高層次任務的嘗試,也大都不是基于真實視頻:比如,有一些工作在 2D 網(wǎng)格狀世界里面進行基于強化學習的理論建模研究,有一些工作則在簡單游戲中進行多智能體的交互博弈策略優(yōu)化,對游戲中涉及到的多智能體心智理論進行建模研究。

范麗鳳說上述兩類研究中,一類是基于真實視頻做低層次任務,另一類雖然在做高層次任務,但目前還只是停留在簡單模擬環(huán)境或博弈游戲中。

而她的研究則彌補了這個空缺,在真實視頻上進行復雜的心智建模,推測視頻背后人物的心智活動。

基于 “共同心智” 提出 “五心” 模型

范麗鳳說,自然語言處理(Natural Language Processing)目前已經(jīng)是一個非常成熟的研究領域,高級人工智能的實現(xiàn)當然離不開自然語言處理技術的進步;但非語言交流(nonverbal communication)在人與人的社會交互中也扮演著十分重要的角色,傳遞著豐富的信息,是對語言交流的很好補充。

這里,非語言交流指的是除自然語言之外的所有其它交流形式,比如眼神、身體體態(tài)和空間朝向、頭部姿勢以及手勢等等。

通過讓機器從視頻中學習非語言交流背后的三元信念動態(tài)變化(Triadic Belief Dynamics),就可以破解非語言交流的密碼,捕捉到這些隱含的豐富的社會交互信息。

結合不同的非語言交流信號,范麗鳳的工作對純視頻輸入中人與人的社會交互以及背后的動態(tài)信念變化進行了建模學習和推斷,并基于 “共同心智” 提出了 “五心”(“five minds”)模型。

“五心” 具體指的是什么呢?當 A、B 兩個人在一個空間交流時,A 對于世界有自己的看法和認知,這是他自己的大腦 M1, B 也有一個自己的大腦 M2;

同時,A 對 B 的大腦 M2 有一個模擬估計的大腦 M12,B 也有對 A 的大腦 M1 有自己的估計 M21;

此外,A 和 B 所共享的那些 “透明” 的信息則被稱為兩個人的共同心智(common mind),記為 Mc。這便是 “五心” 模型的五個 “心”(mind)。

心智理論比較關心信念(belief)、注意力(attention)和意圖(intention)等模塊,當前的 “五心” 模型主要研究了信念(belief)這一心智模塊。

也就是說,范麗鳳的工作主要研究了在社會交互過程中兩個人對于世界認知信念的動態(tài)變化。

基于貝葉斯能量模型,使用圖結構解析社交視頻

范麗鳳為研究這個任務,專門拍攝收集了一個數(shù)據(jù)集,并進行了全面豐富的標注。目前該數(shù)據(jù)集已經(jīng)在 GitHub 上公開。

范麗鳳提出了一個基于貝葉斯的能量模型來解決五心模型中信念動態(tài)變化的學習和推測問題,通過對視頻構建一個六層的解析圖,來分層次地解析視頻中的社會交互場景。

在這個六層的解析圖中,最底層是檢測到的人和物體以及提取出來的關鍵特征;這些人和物體組成視頻的每一幀;再往上一層,是視頻時序上的分段;

再往上,可以知道在每一段中發(fā)生的具體的交流事件的類型(一共有三種基本交流事件,分別是 no communication, attention following 和 joint attention);

繼續(xù)往上一層,是相應的交流事件導致了什么樣的信念變化(一共有四種基本的信念變化,分別是 occur, disappear, update 和 null)。

通過這樣一個多層次的解析圖,就從底層的模式識別進入到了高層次的認知理解。因為機器還無法達到人類的智能高度,無法直接感知到模式背后的心智變化,必須從最底層的模式識別(比如物體識別和人體識別)開始,然后慢慢往上推,往更高層的任務去走。

如此就能知道這些檢測到的人和物體合起來發(fā)生了怎樣的相對交互,具體發(fā)生了怎樣的交流事件,以及導致了怎樣的信念變化。

范麗鳳說,她的工作正是這樣由低到高地使用圖結構去解析社交視頻。在實驗中,范麗鳳提出的模型獲得了比其他方法更好的信念動態(tài)變化預測表現(xiàn)。

在社交互動視頻的總結摘要上表現(xiàn)較好

當前的視頻總結摘要大多基于比較表面的模式識別來提取視頻關鍵幀,這樣的方法在一些簡單的視頻中比較奏效,比如一個人坐下、站起來、走路,當前的做法可以區(qū)分不同的動作,從而提出比較好的視頻總結。

但是一旦涉及到有更加豐富復雜的社會交互視頻時,當前的做法可能就不如五心模型表現(xiàn)好。

因為,在這樣的視頻中基于人物的心智變化比基于底層的特征變化能更加準確地捕捉、概括到故事的語義精髓。 比如在一段豐富的社會交互視頻中,人物可能有很多動作,但那不是這個故事的最關鍵的內(nèi)容,如果按照這些底層特征來提取關鍵幀,結果可能是冗余且不關鍵的。

相較于底層的特征變化,人物在這個過程中心智發(fā)生了變化的那些時刻才是語義更豐富更核心的內(nèi)容,基于這些提出的關鍵幀自然能更好地傳達這個視頻故事的本質(zhì)。

范麗鳳的工作給出了定性比較實驗和人類評價實驗,結果均證明了五心模型在豐富社會交互視頻摘要任務上的優(yōu)勢。

當機器看見你、理解你

范麗鳳告訴 DeepTech,人工智能真的要發(fā)展,肯定要做更難的任務。當前的人臉識別等底層任務并不能滿足我們對于視頻的深度理解的要求。

除了識別一個人是誰,科學家們還想讓機器學會識別視頻中人物的心智想法。

比如,以經(jīng)典暑期劇《西游記》為例,正常人類看到孫悟空的表情再結合劇情,瞬間就能判斷他看到了什么、在想什么、以及預測出他接下來要做什么。

雖然人類觀眾可以瞬間就能挖掘到這些隱含的信息,但如果讓此前的計算機視覺模型來做,結果大概還只是相當于人類的嬰兒階段。所以要實現(xiàn)更高水平的通用人工智能,仍然是任重而道遠。

在應用方面,“五心” 模型除了能幫助機器更深地理解視頻,還可以提出更準確的視頻摘要。比如在處理海量視頻時,可把其精簡成幾幀總結,這樣用戶只需觀看濃縮視頻,就能基本了解全部視頻信息,從而節(jié)省更多時間。

此外,“五心” 模型還有一些其它潛在的應用,比如給視頻生成更好的文字描述解說,幫助用戶快速掌握視頻內(nèi)容等等。

今年27歲的范麗鳳談及未來即將到北京和朱松純老師一起工作,她表示十分期待,北京是一個充滿魅力的城市,她非常希望能夠這里投身到中國這一波人工智能發(fā)展浪潮之中,開創(chuàng)出屬于自己的事業(yè)!

原文標題:90海歸女生CVPR論文幾近滿分,可讓機器識別視頻人物的心智想法,即將追隨導師朱松純回國發(fā)展 | 專訪

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7823

    瀏覽量

    93353
  • AI
    AI

    關注

    91

    文章

    40526

    瀏覽量

    302118
  • 人工智能
    +關注

    關注

    1819

    文章

    50196

    瀏覽量

    266353

原文標題:90海歸女生CVPR論文幾近滿分,可讓機器識別視頻人物的心智想法,即將追隨導師朱松純回國發(fā)展 | 專訪

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    山西大學在量子增強相位噪聲濾波器研究中取得新進展

    領域取得重要進展,首次實驗實現(xiàn)了“量子增強激光相位噪聲濾波器”。相關研究成果以“Quantum-enhanced laser phase noise filter”為題發(fā)表于Optica。該論文第一作者為光電研究所博士生李瑞鑫,通訊作者為王雅君教授和鄭耀輝教授。博士生焦南
    的頭像 發(fā)表于 03-10 06:40 ?70次閱讀
    山西大學在量子增強相位噪聲濾波器研究中取得新進展

    坡前,槊痕猶在

    坡前,槊痕猶在 文 / 一位老工程師 【序】 “淵龍初嘯,連環(huán)舟燼,終不是綸巾客……莫非是,三分計定,駿才未惜?!?——錄自拙作《永遇樂·龐統(tǒng)祠懷古》 去年此時,我收拾行囊,離開了奮斗半生的崗位
    發(fā)表于 03-06 23:28

    MAX14617:USB主機充電器識別與適配器仿真器的卓越之選

    MAX14617:USB主機充電器識別與適配器仿真器的卓越之選 在當今的電子設備中,USB充電和數(shù)據(jù)傳輸功能至關重要。為了滿足不同設備的充電需求,提高充電效率和兼容性,Maxim推出了一款優(yōu)秀的產(chǎn)品
    的頭像 發(fā)表于 02-09 16:55 ?361次閱讀

    MAX14602:高性能USB主機充電器識別與適配器仿真器

    MAX14600–MAX14605/MAX14618:高性能USB主機充電器識別與適配器仿真器 在當今的電子設備中,USB接口不僅用于數(shù)據(jù)傳輸,還承擔著充電的重要功能。為了實現(xiàn)高效、兼容的充電
    的頭像 發(fā)表于 02-09 16:50 ?165次閱讀

    MAX14604:USB主機充電器識別與適配器仿真器的卓越之選

    MAX14600–MAX14605/MAX14618:USB主機充電器識別與適配器仿真器的卓越之選 在當今數(shù)字化時代,USB設備的使用無處不在,而高效、智能的USB充電技術也愈發(fā)重要
    的頭像 發(fā)表于 02-09 16:45 ?149次閱讀

    MAX14600:USB主機充電器識別與適配器仿真器的卓越之選

    MAX14600–MAX14605/MAX14618:USB主機充電器識別與適配器仿真器的卓越之選 在電子設備飛速發(fā)展的今天,USB充電技術也在不斷革新。對于電子工程師而言,選擇一款性能優(yōu)異的USB
    的頭像 發(fā)表于 02-09 16:45 ?198次閱讀

    2026年NVIDIA研究獎學金名單公布

    25 年來,NVIDIA 研究獎學金計劃致力于為在與 NVIDIA 技術相關的前沿領域開展研究的碩博研究提供支持。近日,該計劃公布了最新一批獎學金授予結果:10 位博士生脫穎而出,每人將獲得最高 6 萬美元的資助,他們的研究
    的頭像 發(fā)表于 12-13 09:44 ?1133次閱讀

    CW32L012小型機器人控制評估板活動 四足機器人+智能小車 開箱評測

    一、評測前言 非常感謝CW32態(tài)社區(qū),開源分享了許多比較好玩、優(yōu)質(zhì)的項目。這次活動都尾聲了還能有幸申請購買到 四足機器人+小車-智能小車(套件數(shù)量不多)的評測套件,多謝C32態(tài)社區(qū)的大力支持
    發(fā)表于 11-24 23:44

    億緯鋰能受邀出席北大國際博士生學術論壇

    10月26日,北京大學“博雅材思”國際博士生學術論壇在燕園舉行,億緯鋰能人力資源中心總監(jiān)張清剛博士受邀出席,并發(fā)表《億緯鋰能材料學人才職業(yè)發(fā)展》專題報告。
    的頭像 發(fā)表于 10-31 12:36 ?705次閱讀

    中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地建設項目正式開工

    李春在致辭中表示,中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地落地東,是政企雙方深度合作的重要成果,對加快推動區(qū)域產(chǎn)業(yè)轉(zhuǎn)型升級、打造創(chuàng)新發(fā)展新引擎具有關鍵作用。期待雙方繼續(xù)攜手并進,共同推動東麗區(qū)汽車產(chǎn)業(yè)實現(xiàn)跨越式發(fā)展。
    的頭像 發(fā)表于 10-28 10:47 ?761次閱讀

    中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地落戶天津

    2025年9月12日,由中汽智能科技(天津)有限公司(以下簡稱“中汽智能科技”)主辦的“2025年智能網(wǎng)聯(lián)汽車技術發(fā)展論壇暨中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地啟動儀式”(以下簡稱“論壇”)在天津成功舉辦。
    的頭像 發(fā)表于 09-15 10:17 ?776次閱讀

    AI視頻識別系統(tǒng)的應用領域

    一、城市治理現(xiàn)代化 AI視頻識別技術 正深度重構城市管理體系。在城市安防領域,系統(tǒng)通過行為模式分析實現(xiàn)異常事件主動預警,對人員聚集、異常滯留等場景進行智能識別;交通治理中實時監(jiān)測車流密度、違法行為
    的頭像 發(fā)表于 07-24 11:06 ?1318次閱讀

    山西大學實現(xiàn)一種壓縮激光新型光源

    lasing through the parametric coupling”發(fā)表于物理學頂級期刊Physical Review Letters上。山西大學為第一單位和通訊單位。其中,山西大學光電研究所博士生
    的頭像 發(fā)表于 07-17 09:44 ?480次閱讀
    山西大學實現(xiàn)一種壓縮激光新型光源

    云知聲黃偉榮膺2024年度感動海淀文明人物

    近日,領潮向善丨2024“感動海淀”年度文明人物(集體)頒獎典禮在中關村展示中心頤和廳盛大舉行。云知聲智能科技股份有限公司(以下簡稱“云知聲”)創(chuàng)始人&CEO黃偉博士憑借在智慧生活、智慧醫(yī)療等領域的杰出貢獻,以及在科技創(chuàng)新中勤耕不輟的進取精神,榮膺2024年度感動海淀文明
    的頭像 發(fā)表于 05-13 14:30 ?913次閱讀

    詳細介紹機場智能指路機器人的工作原理

    ,如激光雷達、攝像頭、麥克風等。激光雷達通過發(fā)射激光束并測量反射光的時間來創(chuàng)建周圍環(huán)境的三維點云圖,從而感知周圍物體的距離和位置。攝像頭用于捕捉視覺圖像,識別機場環(huán)境中的標識、人物和其他物體。麥克風則
    發(fā)表于 05-10 18:26