數(shù)據(jù)科學(xué)家的空缺以及各公司努力填補(bǔ)這一空白的持續(xù)投入在數(shù)據(jù)科學(xué)界并不算什么新聞。然而,擁有計(jì)算機(jī)科學(xué)技能、統(tǒng)計(jì)知識(shí)和與其特定業(yè)務(wù)問(wèn)題相關(guān)的領(lǐng)域?qū)I(yè)知識(shí)的數(shù)據(jù)科學(xué)家卻不多見(jiàn)。
一方面,開(kāi)發(fā)分析模型需要依仗領(lǐng)域的專業(yè)知識(shí)和實(shí)踐經(jīng)驗(yàn)進(jìn)行決斷;另一方面,視具體問(wèn)題而定,進(jìn)行數(shù)據(jù)分析可能需要具備傳統(tǒng)的分析技術(shù)(如統(tǒng)計(jì)和優(yōu)化)、數(shù)據(jù)特定的技術(shù)(如信號(hào)處理和圖像處理)或更新的功能(如機(jī)器學(xué)習(xí)算法)。
事實(shí)上,通過(guò)在設(shè)計(jì)過(guò)程中使用統(tǒng)計(jì)方法和計(jì)算技術(shù)工具,工程師也可以變成數(shù)據(jù)科學(xué)家。
以一個(gè)機(jī)器學(xué)習(xí)的實(shí)際案例來(lái)說(shuō):
一家大型半導(dǎo)體制造公司的工藝工程師正在考慮采用新方法來(lái)確保晶圓各層對(duì)準(zhǔn),他們發(fā)現(xiàn)機(jī)器學(xué)習(xí)或可作為預(yù)測(cè)層間疊加的方法使用。但作為工藝工程師,他們沒(méi)有使用這種新技術(shù)的經(jīng)驗(yàn)。
通過(guò)在 MATLAB 中運(yùn)行不同的機(jī)器學(xué)習(xí)示例,他們能夠識(shí)別合適的機(jī)器學(xué)習(xí)算法,對(duì)歷史數(shù)據(jù)進(jìn)行訓(xùn)練,并將其集成到原型疊加控制器中。靈活的 MATLAB 環(huán)境允許這些工藝工程師應(yīng)用他們的領(lǐng)域?qū)I(yè)知識(shí)來(lái)構(gòu)建數(shù)據(jù)模型,從而識(shí)別可能未被發(fā)現(xiàn)的系統(tǒng)和隨機(jī)錯(cuò)誤。
可見(jiàn),為具備領(lǐng)域知識(shí)的工程師提供靈活且可擴(kuò)展的軟件工具,可以幫助工程師快速掌握機(jī)器學(xué)習(xí)新技術(shù)并解決數(shù)據(jù)問(wèn)題。
隨著技術(shù)的不斷發(fā)展,企業(yè)必須快速攝取、分析、驗(yàn)證和可視化海量數(shù)據(jù),以便及時(shí)提供洞察力,從而抓住商機(jī)。如此,領(lǐng)域?qū)<夷軌蜻\(yùn)用并應(yīng)用數(shù)據(jù)科學(xué)對(duì)業(yè)務(wù)有明顯的好處,但這不可能一蹴而就。
由此帶來(lái)的數(shù)據(jù)分析挑戰(zhàn)還可能影響數(shù)據(jù)分析的價(jià)值。這些挑戰(zhàn)包括:
1. 陡峭的新技術(shù)學(xué)習(xí)曲線
數(shù)據(jù)分析領(lǐng)域的創(chuàng)新步伐非??欤宽?xiàng)新技術(shù)都有自己的學(xué)習(xí)曲線。特別是對(duì)于那些并非專職從事代碼編寫(xiě)的人來(lái)說(shuō),學(xué)習(xí)曲線將更加陡峭。
解決方案:
提供快速啟動(dòng)和運(yùn)行的工具,最好是領(lǐng)域?qū)<沂煜さ挠?jì)算平臺(tái)中。
像 MATLAB 中的應(yīng)用程序一樣的點(diǎn)擊式應(yīng)用程序可以作為這些工程師的一個(gè)簡(jiǎn)單起點(diǎn)。除此之外,通常還需要編程接口來(lái)微調(diào)分析以提高穩(wěn)健性和準(zhǔn)確性。企業(yè)也應(yīng)該尋找可以幫助工程師的培訓(xùn)課程,效果自然遠(yuǎn)勝通過(guò)試驗(yàn)和犯錯(cuò)來(lái)學(xué)習(xí)。
2. 工程師與數(shù)據(jù)科學(xué)家的團(tuán)隊(duì)配合
數(shù)據(jù)科學(xué)家通常在機(jī)器學(xué)習(xí)方面具有很強(qiáng)的背景,卻不熟悉業(yè)務(wù)及其產(chǎn)品的細(xì)節(jié)。工程和科學(xué)團(tuán)隊(duì)了解業(yè)務(wù)及其產(chǎn)品,但可能沒(méi)有機(jī)器學(xué)習(xí)經(jīng)驗(yàn)。
解決方案:
提供靈活可擴(kuò)展的工具。
針對(duì)領(lǐng)域?qū)<医档蜋C(jī)器學(xué)習(xí)標(biāo)準(zhǔn)的同時(shí),為數(shù)據(jù)科學(xué)家提供靈活性和可擴(kuò)展性。實(shí)際上,這意味著采用既具有圖形界面(即應(yīng)用程序)又具有編程語(yǔ)言的工具。為團(tuán)隊(duì)打造一個(gè)可以協(xié)作的環(huán)境至關(guān)重要。
3.數(shù)據(jù)分析在哪里結(jié)束
如果無(wú)法與企業(yè)的系統(tǒng)、產(chǎn)品和服務(wù)集成,成功開(kāi)發(fā)的分析或機(jī)器學(xué)習(xí)模型對(duì)企業(yè)的價(jià)值便十分有限。傳統(tǒng)上,分析是在適合研究和開(kāi)發(fā)的工具中開(kāi)發(fā)的,但不適合在生產(chǎn)中運(yùn)行分析,因此必須在分析之前將分析重新編碼為不同的編程語(yǔ)言。這一過(guò)程通常耗時(shí)數(shù)周到數(shù)月,并且可能會(huì)產(chǎn)生錯(cuò)誤。
解決方案:
將算法打包以在不同生產(chǎn)環(huán)境中運(yùn)行。
MATLAB 提供了用于將分析與 IT 系統(tǒng)中常用的編程語(yǔ)言(例如 Java和 .NET)集成的部署路徑,以及將分析轉(zhuǎn)換為可在嵌入式設(shè)備上運(yùn)行的獨(dú)立 C 代碼。這兩種部署選項(xiàng)都可通過(guò)點(diǎn)擊式界面訪問(wèn),使其對(duì)具備領(lǐng)域知識(shí)的工程師具有吸引力。通過(guò)將分析轉(zhuǎn)換為在生產(chǎn)系統(tǒng)中運(yùn)行的過(guò)程實(shí)現(xiàn)自動(dòng)化,這些工具可顯著縮短設(shè)計(jì)迭代的時(shí)間。
數(shù)據(jù)科學(xué)家短缺的問(wèn)題似乎不會(huì)很快得到解決,而領(lǐng)域?qū)<以谔钛a(bǔ)這一空白方面將起到重要的作用。
使領(lǐng)域?qū)<夷軌驅(qū)C(jī)器學(xué)習(xí)和其他數(shù)據(jù)分析技術(shù)應(yīng)用于他們的工作,這些技術(shù)為工程團(tuán)隊(duì)提供了令人興奮的創(chuàng)新機(jī)會(huì)——包括他們的設(shè)計(jì)工作流程和他們打造的產(chǎn)品。他們對(duì)業(yè)務(wù)及其產(chǎn)品的了解使他們能夠找到應(yīng)用數(shù)據(jù)分析技術(shù)的創(chuàng)新方法。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7339瀏覽量
94829 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8556瀏覽量
137015
發(fā)布評(píng)論請(qǐng)先 登錄
如何將Primus生成的波形文件導(dǎo)入MATLAB
經(jīng)營(yíng)數(shù)據(jù)分析可以通過(guò)哪些方式
工業(yè)數(shù)據(jù)中臺(tái)支持接入MySQL數(shù)據(jù)庫(kù)嗎
工業(yè)智能制造中,如何精準(zhǔn)測(cè)量復(fù)雜曲面?
了解SOLIDWORKS202仿真方面的改進(jìn)
PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?
CANFD芯片在工控機(jī)數(shù)據(jù)采集和測(cè)量中的應(yīng)用分析
普源示波器如何連接MATLAB實(shí)現(xiàn)數(shù)據(jù)采集與分析
通過(guò)什么方法能獲得關(guān)于Ethercat方面的設(shè)計(jì)方案和設(shè)計(jì)資料
程序設(shè)計(jì)與數(shù)據(jù)結(jié)構(gòu)
是否可以在數(shù)據(jù)和電源中使用Cypd2122作為DRP?
SOLIDWORKS教育版——全方面的學(xué)習(xí)資源與教程
有單片機(jī)方面的大佬嗎?有幾個(gè)單片機(jī)方面的問(wèn)題需要請(qǐng)教一下
深入解讀智多晶FIR IP
MATLAB在數(shù)據(jù)方面的應(yīng)用分析解讀
評(píng)論