機器學(xué)習(xí)模型在實驗室中調(diào)整和調(diào)整到近乎完美的性能,但在現(xiàn)實環(huán)境中往往會失敗,這已經(jīng)不是什么秘密了。這通常被歸結(jié)為人工智能接受訓(xùn)練和測試的數(shù)據(jù)與它在現(xiàn)實中遇到的數(shù)據(jù)不匹配,這個問題被稱為數(shù)據(jù)轉(zhuǎn)移。例如,經(jīng)過訓(xùn)練,能夠在高質(zhì)量的醫(yī)學(xué)圖像中發(fā)現(xiàn)疾病跡象的人工智能,將難以識別繁忙的診所中廉價相機捕捉到的模糊或裁剪的圖像。
現(xiàn)在,谷歌的7個不同團隊的40名研究人員發(fā)現(xiàn)了機器學(xué)習(xí)模型常見失敗的另一個主要原因。這被稱為“不規(guī)范”,它可能是一個比數(shù)據(jù)轉(zhuǎn)移更大的問題。領(lǐng)導(dǎo)這項研究的Alex D‘a(chǎn)mour說:“我們對機器學(xué)習(xí)模型的要求比我們目前的方法所能保證的要多?!?/p>
D’amour最初的調(diào)查如同滾雪球般滾來滾去,數(shù)十名谷歌研究人員最終著眼于一系列不同的人工智能應(yīng)用,從圖像識別到自然語言處理(NLP)再到疾病預(yù)測。他們發(fā)現(xiàn),不規(guī)范的要求是所有這些項目表現(xiàn)不佳的原因。問題在于機器學(xué)習(xí)模型的訓(xùn)練和測試方式,沒有簡單的解決辦法。
粗略地說,建立一個機器學(xué)習(xí)模型需要在大量的例子上訓(xùn)練它,然后在一堆它還沒有見過的類似的例子上測試它。當模型通過測試時,就完成了。
谷歌的研究人員指出,這個標準太低了。訓(xùn)練過程可以產(chǎn)生許多不同的全部通過測試的模型,但是這些模型會有一些小差異,取決于諸如在培訓(xùn)開始之前隨機值的神經(jīng)網(wǎng)絡(luò)中的節(jié)點、訓(xùn)練數(shù)據(jù)、被選中或者代表的方式、培訓(xùn)運行的數(shù)量等等。如果這些微小的、隨機的差異不影響模型在測試中的表現(xiàn),它們通常會被忽視。但事實證明,在現(xiàn)實世界中,它們會導(dǎo)致巨大的表現(xiàn)差異。
換句話說,如今用來構(gòu)建大多數(shù)機器學(xué)習(xí)模型的過程無法區(qū)分哪些模型在現(xiàn)實世界中可行,哪些模型不可行。
為了解決這一問題,一種選擇是在培訓(xùn)和測試過程中設(shè)計一個額外的階段,在這個階段中可以同時生產(chǎn)多個模型,而不是只生產(chǎn)一個。然后,這些相互競爭的模型可以在具體的現(xiàn)實任務(wù)中再次進行測試,以選擇最適合這項工作的模型。
那需要做很多工作。蘇黎世聯(lián)邦理工學(xué)院的機器學(xué)習(xí)研究員Yannic Kilcher說,但是對于像谷歌這樣建造和部署大型模型的公司來說,這樣做是值得的。谷歌可以提供50種不同版本的NLP模型,應(yīng)用程序開發(fā)人員可以選擇最適合他們的一個,他說。
D ‘Amour和他的同事們還沒有解決這個問題,但正在探索改進培訓(xùn)過程的方法。他表示:“我們需要更好地明確我們對模型的要求?!薄耙驗樽罱K的結(jié)果往往是,我們只是在模型在實際應(yīng)用中失敗之后才發(fā)現(xiàn)這些要求?!?/p>
如果人工智能想要在實驗室之外產(chǎn)生和在實驗室內(nèi)部一樣大的影響,那么進行修復(fù)是至關(guān)重要的。在谷歌從事醫(yī)療人工智能領(lǐng)域工作的合著者凱瑟琳海勒(Katherine Heller)表示,當人工智能在現(xiàn)實世界中表現(xiàn)不佳時,人們就不太愿意使用它了:“在殺手級應(yīng)用方面,我們已經(jīng)失去了很多信任,這是我們希望重新獲得的重要信任?!?/p>
責(zé)任編輯:xj
-
谷歌
+關(guān)注
關(guān)注
27文章
6254瀏覽量
111452 -
AI
+關(guān)注
關(guān)注
91文章
39862瀏覽量
301507 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8554瀏覽量
136983 -
nlp
+關(guān)注
關(guān)注
1文章
491瀏覽量
23282
發(fā)布評論請先 登錄
機器視覺鏡頭如何發(fā)現(xiàn)深海沉船
谷歌正式發(fā)布Gemma Scope 2模型
機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性
軸承銹蝕的主要原因分析
利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學(xué)
一文讀懂大模型常見的10個核心概念
電流探頭消磁失敗的原因與解決策略
3Dfindit 提供的數(shù)字立方體模型為研究項目的可視化提供了支持
超小型Neuton機器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.
ai_cube訓(xùn)練模型最后部署失敗是什么原因?
無刷直流電機雙閉環(huán)串級控制系統(tǒng)仿真研究
大模型推理顯存和計算量估計方法研究
sys_sem_free()傳入的參數(shù)變成了NULL,引起這個現(xiàn)象的主要原因有哪些?
研究人員開發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測瘧疾
變頻器對PLC和步進電機干擾的主要原因和解決辦法
谷歌研究人員發(fā)現(xiàn)了機器學(xué)習(xí)模型常見失敗的一個主要原因
評論