91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

成功的文本分析工作流程的四個步驟

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Seth DeLand ? 2022-06-20 14:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文本分析(從原始人類語言中發(fā)現(xiàn)隱藏模式以實現(xiàn)更好的決策和預(yù)測的過程)為工業(yè)和預(yù)測性維護系統(tǒng)提供了多種好處。這些分析使工程師能夠利用原始文本數(shù)據(jù)輕松生成有關(guān)維護記錄的見解,并構(gòu)建故障預(yù)測算法以預(yù)防潛在問題。

以非公路商業(yè)空間為例,在建筑工地使用重型設(shè)備:如果一臺重型設(shè)備發(fā)生故障,它可能會在修復(fù)系統(tǒng)所需的時間和成本以及停機時間之間成為代價高昂的故障。施工停滯時的現(xiàn)場。傳統(tǒng)上,來自該設(shè)備的遙測數(shù)據(jù)已被用于構(gòu)建可預(yù)測未來故障的預(yù)測性維護模型。但是,機械師和操作員的文字說明中也包含有關(guān)過去故障及其原因的寶貴信息。工程師可以利用這些文本數(shù)據(jù)來增強預(yù)測性維護模型,并識別應(yīng)該解決的模式和故障模式。

文本分析的挑戰(zhàn)在于非結(jié)構(gòu)化的原始文本數(shù)據(jù)集的龐大數(shù)量,這可能會使分析工具不堪重負。這使得工程師更難快速、直觀地提取用戶可能獲得的所有有價值的信息。然而,工程師可以通過正確的工具和堅持端到端的工作流程來克服這些障礙。

當談到端到端的文本分析工作流程時,工程師需要知道什么?工作流程有四個主要階段:

poYBAGKwGbWAZSGZAAB0svF0DfA535.png

圖 1. 端到端文本分析工作流程。

第 1 階段:數(shù)據(jù)訪問和探索

文本數(shù)據(jù)將來自多種來源,包括數(shù)據(jù)庫、內(nèi)部文件存儲庫和 Internet,并采用多種格式。正確準備數(shù)據(jù)是成功工作流程的關(guān)鍵因素。適當?shù)臄?shù)據(jù)準備將原始文本數(shù)據(jù)清理并預(yù)處理為“清理數(shù)據(jù)”以進行分析。

以詞云為例。該模型將數(shù)據(jù)轉(zhuǎn)換為一種格式,使工程師能夠快速輕松地可視化正在使用的單詞以及數(shù)據(jù)池中最常用的短語。當與應(yīng)用他們的領(lǐng)域?qū)I(yè)知識的工程師結(jié)合使用時,詞云等可視化有利于更大的文本分析工作流程,因為工程師可以很容易地發(fā)現(xiàn)數(shù)據(jù)可能遺漏的地方或需要更多清理的地方,因為他們了解給定的典型問題或問題環(huán)境或用例。

第 2 階段:數(shù)據(jù)預(yù)處理

這些可視化還有助于指導(dǎo)需要采取的下一步行動。如圖 2 所示,停用詞(不增加價值的低信息詞)很常見,它們的存在會影響可視化結(jié)果。在工程師開始模型開發(fā)過程之前,他們必須清理原始文本數(shù)據(jù),以便過濾掉這些“停用詞”并輸入真實、重要的數(shù)據(jù)以傳遞給建模過程。預(yù)處理階段允許用戶從原始文本中提取有意義的單詞。

數(shù)據(jù)清洗通常是數(shù)據(jù)分析中最耗時的部分,根據(jù)數(shù)據(jù)量,清洗步驟可能需要多次迭代。但是,由于投入額外的時間和所需資源而產(chǎn)生的投資回報率允許稍后在文本分析工作流程中建立更準確和成功的模型。在許多情況下,干凈的詞云會傳遞更多關(guān)于文本頁面上實際內(nèi)容的信息。

pYYBAGKwGb6ANMsjAADTUnqbRM0882.png

圖 2. 預(yù)處理數(shù)據(jù)。

Text Analytics Toolbox等工具通過為文本數(shù)據(jù)的預(yù)處理、分析和建模提供算法和可視化,幫助用戶為模型構(gòu)建過程做好準備,從而為解決數(shù)據(jù)清理痛點的工程師提供支持。

這些工具從流行的文件格式中提取文本,對來自設(shè)備日志、新聞提要、調(diào)查、操作員報告和社交媒體等來源的原始文本進行預(yù)處理,提取利用文本、數(shù)字和其他類型的數(shù)據(jù),將文本轉(zhuǎn)換為數(shù)字表示,然后構(gòu)建統(tǒng)計模型。

第 3 階段:預(yù)測模型構(gòu)建

清理和預(yù)處理數(shù)據(jù)后,就可以開始使用機器或深度學(xué)習算法構(gòu)建預(yù)測模型了。

這就是文本分析的優(yōu)勢所在:它發(fā)現(xiàn)數(shù)據(jù)中的隱藏模式并以直觀的格式顯示它們,使用戶能夠消化數(shù)據(jù),然后采取糾正措施來解決問題,然后再進一步進入工作流程。

以將純文本數(shù)據(jù)轉(zhuǎn)化為數(shù)字形式為例。工程師可以應(yīng)用諸如“詞袋”之類的建模方法,它根據(jù)提供的文本數(shù)據(jù)創(chuàng)建一個數(shù)字矩陣,顯示每個詞的使用頻率。然后,工程師可以從那里使用預(yù)測模型,例如潛在狄利克雷分配 (LDA) 模型,該模型可以擬合到詞/頻矩陣,以發(fā)現(xiàn)文本數(shù)據(jù)集中隱藏的主題和見解。

如圖 3 所示,LDA 模型可以生成與數(shù)據(jù)中的“隱藏主題”相關(guān)的詞云,顯示模式如何從將文本數(shù)據(jù)擬合到該預(yù)測模型中開始出現(xiàn),有助于為相應(yīng)問題的創(chuàng)建解決方案提供信息。

poYBAGKwGcWAb6TOAANzQjKFti4838.png

圖 3. 使用 LDA 方法自動識別工廠報告數(shù)據(jù)中的主題。主題 2 與電子問題有關(guān)。主題 3 與流體系統(tǒng)的問題有關(guān)。

一旦模型(例如上面示例中的模型)使用新的敘述進行測試以驗證模型的預(yù)測是否正確,就可以建立自動警報,以便系統(tǒng)在任何需要注意的問題上向響應(yīng)團隊發(fā)送標志。如果位置數(shù)據(jù)也可用,結(jié)果會發(fā)現(xiàn)某些主題(例如,標記的問題)與其位置數(shù)據(jù)之間存在相關(guān)性,因此該模型還可以通過使用多個數(shù)據(jù)流來補充文本數(shù)據(jù),提醒響應(yīng)團隊注意基礎(chǔ)設(shè)施方面潛在的更大問題。

第 4 階段:洞察力和預(yù)測模型部署

使用文本分析設(shè)置模型并驗證可接受的性能后,有多種方法可以與工程團隊和/或管理層共享結(jié)果和模型,包括生成報告或交互式筆記本(例如,MATLAB 實時編輯器)、溝通將數(shù)據(jù)傳輸?shù)阶烂婊?Web 應(yīng)用程序(例如,MATLAB App Designer),或?qū)?yīng)用程序托管在生產(chǎn)服務(wù)器或 Web 應(yīng)用程序服務(wù)器上。

對于工業(yè)自動化、機械、汽車制造、航空航天設(shè)計或能源分配等行業(yè)的工程師來說,文本分析可以幫助他們執(zhí)行復(fù)雜的數(shù)值分析,以識別可以帶來更好結(jié)果并改進預(yù)測性維護等功能的想法和概念組。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • matlab
    +關(guān)注

    關(guān)注

    189

    文章

    3027

    瀏覽量

    238840
  • 編輯器
    +關(guān)注

    關(guān)注

    1

    文章

    828

    瀏覽量

    32942
  • 航空航天
    +關(guān)注

    關(guān)注

    1

    文章

    466

    瀏覽量

    25845
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    工作流節(jié)點說明結(jié)束節(jié)點

    結(jié)束節(jié)點是工作流的最終節(jié)點,用于返回工作流運行后的結(jié)果。結(jié)束節(jié)點支持兩種返回方式:返回變量、返回文本。 返回變量 在返回變量模式下,工作流運行結(jié)束后會以JSON格式輸出所有返回參數(shù),適
    發(fā)表于 03-16 16:43

    工作流節(jié)點說明開始節(jié)點

    開始節(jié)點是工作流的起始節(jié)點,用于設(shè)定啟動工作流需要的輸入信息。開始節(jié)點只有輸入?yún)?shù),沒有輸出等其他參數(shù)。開始節(jié)點中默認有一輸入?yún)?shù)USER_INPUT,一默認的輸入?yún)?shù)FILES_
    發(fā)表于 03-13 14:52

    開發(fā)工作流創(chuàng)建工作流

    擇要使用的節(jié)點。 2、將節(jié)點按任務(wù)流程相連接。 3、配置節(jié)點的輸入和輸出參數(shù) 測試并發(fā)布工作流 開發(fā)者如需在智能體內(nèi)使用該工作流,必須先完成工作流的上架。 1、單擊【試運行】,運行
    發(fā)表于 03-10 10:05

    AMS借助Altium Designer簡化電子設(shè)計工作流程

    隨著時間的推移,AMS 遇到的問題越來越多。顯然,AMS 需要一設(shè)計解決方案,將他們的整個工作流程集成到一統(tǒng)一的設(shè)計環(huán)境中。也就在這時,Altium 進入了他們的視野。
    的頭像 發(fā)表于 03-09 11:24 ?334次閱讀

    PCBA生產(chǎn)過程的四個主要環(huán)節(jié)?

    《www.iczoom.com》中并未明確提及PCBA生產(chǎn)過程的四個主要環(huán)節(jié),但根據(jù)電子制造行業(yè)的常規(guī)流程,可以將其概括為以下四個關(guān)鍵環(huán)節(jié): PCB設(shè)計與打板 : 設(shè)計 :根據(jù)產(chǎn)品需求,使用電
    的頭像 發(fā)表于 03-05 11:13 ?229次閱讀

    是德科技與三星攜手英偉達展示端到端AI-RAN驗證工作流程

    是德科技(NYSE: KEYS )與三星電子宣布,會在巴塞羅那舉行的2026年世界移動通信大會(MWC 2026)上,與英偉達聯(lián)合演示端到端人工智能無線接入網(wǎng)絡(luò)(AI-RAN)測試與驗證工作流程。該
    的頭像 發(fā)表于 03-05 10:04 ?623次閱讀

    一張圖看懂遠動通信裝置的工作流程

    遠動通信裝置作為電網(wǎng)的“千里眼”“順風耳”,核心是完成“現(xiàn)場狀態(tài)上傳”與“調(diào)度指令下達”的閉環(huán)協(xié)作。它的工作流程看似復(fù)雜,實則可拆解為“數(shù)據(jù)采集—數(shù)據(jù)傳輸—調(diào)度處理—指令執(zhí)行—結(jié)果反饋”五大核心步驟
    的頭像 發(fā)表于 01-23 11:57 ?530次閱讀
    一張圖看懂遠動通信裝置的<b class='flag-5'>工作流程</b>

    芯片ATE測試詳解:揭秘芯片測試機臺的工作流程

    ATE(自動測試設(shè)備)是芯片出廠前的關(guān)鍵“守門人”,負責篩選合格品。其工作流程分為測試程序生成載入、參數(shù)測量與功能測試(含直流、交流參數(shù)及功能測試)、分類分檔與數(shù)據(jù)分析三階段,形成品質(zhì)閉環(huán)。為平衡
    的頭像 發(fā)表于 01-04 11:14 ?2240次閱讀
    芯片ATE測試詳解:揭秘芯片測試機臺的<b class='flag-5'>工作流程</b>

    合科泰MOSFET選型的四個核心步驟

    面對數(shù)據(jù)手冊中繁雜的參數(shù),如何快速鎖定適合應(yīng)用的 MOSFET?遵循以下四個核心步驟,您能系統(tǒng)化地完成選型,避免因關(guān)鍵參數(shù)遺漏導(dǎo)致的設(shè)計風險。
    的頭像 發(fā)表于 12-19 10:33 ?763次閱讀

    ADI Power Studio工作流程與工具概述

    、直觀的工作流程,利用準確的模型來仿真實際性能,并自動生成關(guān)鍵的物料清單和報告等內(nèi)容,幫助工程團隊更早做出更優(yōu)決策。
    的頭像 發(fā)表于 10-22 09:38 ?1110次閱讀

    恩智浦i.MX RT1180跨界MCU驅(qū)動EtherCAT的工作流程

    上周的分享已經(jīng)介紹了整個參考設(shè)計的概況和相關(guān)硬件資源。那么,本次會從軟件工程角度進行分享。首先來了解EtherCAT Slave工作流程
    的頭像 發(fā)表于 09-28 14:20 ?1232次閱讀
    恩智浦i.MX RT1180跨界MCU驅(qū)動EtherCAT的<b class='flag-5'>工作流程</b>

    電芯自動面墊分選裝盒生產(chǎn)線的工作流程解析

    電芯自動面墊分選裝盒生產(chǎn)線的工作流程解析|深圳比斯特自動化
    的頭像 發(fā)表于 09-28 10:29 ?506次閱讀

    Transformer架構(gòu)中解碼器的工作流程

    解碼器的作用主要是制作文本序列。與編碼器類似,解碼器也配備了一組類似的子層。它具有兩Multi-Head attention層,一點前饋層,并且在每個子層之后都包含剩余連接和層歸一化。
    的頭像 發(fā)表于 06-10 14:32 ?1250次閱讀
    Transformer架構(gòu)中解碼器的<b class='flag-5'>工作流程</b>

    VirtualLab Fusion應(yīng)用:將光耦合入單模光纖的最佳工作距離

    光斑計算初始工作距離 在光線光學(xué)焦點距離處的光場評估 通過參數(shù)掃描確定最佳工作距離 在最佳距離處的場評估 工作流程步驟基礎(chǔ) 工作流程
    發(fā)表于 06-03 08:44

    四個方面深入剖析富捷電阻的優(yōu)勢

    理成本的電阻產(chǎn)品系列,為電子行業(yè)提供了一可靠的選擇。本文將從產(chǎn)品結(jié)構(gòu)、同業(yè)對比、成本分析以及品質(zhì)保障四個方面深入剖析富捷電阻的優(yōu)勢,展現(xiàn)其如何在激烈的市場競爭中脫穎而出。
    的頭像 發(fā)表于 05-09 10:47 ?1161次閱讀
    從<b class='flag-5'>四個</b>方面深入剖析富捷電阻的優(yōu)勢