91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

了解數(shù)據(jù)挖掘的概念和特點(diǎn)

如意 ? 來(lái)源:百家號(hào) ? 作者:看數(shù)據(jù)說(shuō)事兒 ? 2020-06-29 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)挖掘源自《從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí)》(縮寫為KDD)。它首次出現(xiàn)在1989年8月在底特律舉行的第十一屆國(guó)際聯(lián)合人工智能會(huì)議上。為了統(tǒng)一理解,F(xiàn)ayyad,Piatetsky-Shapiro和Smyth在權(quán)威文章集《知識(shí)發(fā)現(xiàn)與數(shù)據(jù)進(jìn)展》中給出了KDD和數(shù)據(jù)挖掘的最新定義。從中總結(jié)了1996年該領(lǐng)域的進(jìn)展,并予以區(qū)分:

KDD的定義是:KDD是從數(shù)據(jù)中識(shí)別有效,新穎,潛在有用且最終可以理解的模式的過(guò)程。

數(shù)據(jù)挖掘的定義是:數(shù)據(jù)挖掘是KDD中的一步,它使用特定算法在可接受的計(jì)算效率限制內(nèi)生成特定模式。

數(shù)據(jù)挖掘技術(shù)的特點(diǎn)

1.基于大量數(shù)據(jù):不是說(shuō)無(wú)法挖掘小數(shù)據(jù)量。實(shí)際上,大多數(shù)數(shù)據(jù)挖掘算法都可以在較小的數(shù)據(jù)量上運(yùn)行并獲得結(jié)果。但是,一方面,過(guò)小的數(shù)據(jù)量可以通過(guò)手動(dòng)分析來(lái)總結(jié),另一方面,小數(shù)據(jù)量通常不能反映現(xiàn)實(shí)世界的一般特征。

2.非平凡性:所謂非平凡的意思是指所挖掘的知識(shí)是不簡(jiǎn)單的。一定不能與著名體育評(píng)論員所說(shuō)的相似:“經(jīng)過(guò)我的計(jì)算,直到比賽結(jié)束我才發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象。本屆世界杯的進(jìn)球數(shù)和失球數(shù)都是相同的。非常巧合!”這種知識(shí)。這似乎沒(méi)有必要,但是許多不了解業(yè)務(wù)知識(shí)的數(shù)據(jù)挖掘新手經(jīng)常會(huì)犯此錯(cuò)誤。

3.隱含性:數(shù)據(jù)挖掘是發(fā)現(xiàn)數(shù)據(jù)深處的知識(shí),而不是直接出現(xiàn)在數(shù)據(jù)表面的信息。常用的BI工具(例如億信BI和豌豆BI)完全可以讓用戶找到此信息。

4.新奇性:挖掘的知識(shí)以前應(yīng)該是未知的,否則僅是為了驗(yàn)證業(yè)務(wù)專家的經(jīng)驗(yàn)。只有新知識(shí)才能幫助公司獲得進(jìn)一步的洞察力。

5.價(jià)值性:挖掘的結(jié)果必須為企業(yè)帶來(lái)直接或間接的利益。有人說(shuō)數(shù)據(jù)挖掘只是“殺龍技術(shù)”。它看起來(lái)牛氣哄哄,但沒(méi)有用。這只是一個(gè)錯(cuò)誤的想法。不可否認(rèn)的是,在某些數(shù)據(jù)挖掘項(xiàng)目中,由于缺乏明確的業(yè)務(wù)目標(biāo),或者由于數(shù)據(jù)質(zhì)量不足,或者由于人們抵制不斷變化的業(yè)務(wù)流程,又或者由于挖掘人員缺乏經(jīng)驗(yàn),都會(huì)導(dǎo)致結(jié)果不佳甚至根本沒(méi)有效果。但是,大量成功的案例也證明了數(shù)據(jù)挖掘確實(shí)可以成為提高效率的武器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50134

    瀏覽量

    265747
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    25093
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    生成式AI賦能工程師挖掘非結(jié)構(gòu)化數(shù)據(jù)價(jià)值

    您是否知道,生成式 AI(GenAI)可以幫助工程師在幾秒鐘內(nèi)診斷汽車故障,甚至在設(shè)備出現(xiàn)問(wèn)題之前預(yù)測(cè)潛在失效?GenAI 正在通過(guò)加速數(shù)據(jù)分析和算法開(kāi)發(fā),讓這些場(chǎng)景從設(shè)想走向現(xiàn)實(shí),使工程師能夠充分發(fā)揮專業(yè)知識(shí),挖掘可執(zhí)行的洞察。
    的頭像 發(fā)表于 02-28 10:24 ?479次閱讀

    一文了解數(shù)據(jù)存儲(chǔ)演變之路

    開(kāi)工大吉,啟新賦能!數(shù)據(jù)存儲(chǔ)格局正持續(xù)快速迭代發(fā)展,這背后離不開(kāi)企業(yè)與個(gè)人不斷增長(zhǎng)的數(shù)據(jù)量驅(qū)動(dòng)。其演變核心在于,從傳統(tǒng)存儲(chǔ)模式逐步迭代升級(jí),轉(zhuǎn)向更先進(jìn)、靈活且可擴(kuò)展的存儲(chǔ)解決方案,精準(zhǔn)適配現(xiàn)代數(shù)字企業(yè)及職場(chǎng)多元場(chǎng)景的核心需求。
    的頭像 發(fā)表于 02-27 13:51 ?419次閱讀
    一文<b class='flag-5'>了解數(shù)據(jù)</b>存儲(chǔ)演變之路

    1分鐘帶你了解數(shù)據(jù)中心供電架構(gòu) #電子元器件 #數(shù)據(jù)中心 #供電架構(gòu)

    數(shù)據(jù)中心
    沛城芯動(dòng)力
    發(fā)布于 :2026年02月03日 15:39:04

    進(jìn)程概念和特征

    程序及其數(shù)據(jù)在處理機(jī)上順序執(zhí)行時(shí)所發(fā)生的活動(dòng)。   進(jìn)程是具有獨(dú)立功能的程序在一個(gè)數(shù)據(jù)集合上運(yùn)行的過(guò)程,它是系統(tǒng)進(jìn)行資源分配和調(diào)度的一個(gè)獨(dú)立單位。   在引入進(jìn)程實(shí)體的概念后,我們可以把傳統(tǒng)操作系統(tǒng)中
    發(fā)表于 01-15 06:39

    CW32 UART的數(shù)據(jù)幀結(jié)構(gòu)有哪些特點(diǎn)?

    請(qǐng)問(wèn) CW32 UART 的數(shù)據(jù)幀結(jié)構(gòu)有哪些特點(diǎn)
    發(fā)表于 12-15 06:58

    奧松電子協(xié)辦第二屆智能計(jì)算與數(shù)據(jù)挖掘國(guó)際學(xué)術(shù)會(huì)議

    2025年10月24日至26日,第二屆智能計(jì)算與數(shù)據(jù)挖掘國(guó)際學(xué)術(shù)會(huì)議(ICDM 2025)在中國(guó)廣州隆重舉行。本次會(huì)議由廣州航海學(xué)院、汕頭大學(xué)、廣東省數(shù)智科技研究會(huì)聯(lián)合主辦,廣州奧松電子股份有限公司作為協(xié)辦單位之一,攜手多家產(chǎn)業(yè)機(jī)構(gòu),共同推動(dòng)智能計(jì)算與
    的頭像 發(fā)表于 11-03 14:18 ?630次閱讀

    【產(chǎn)品介紹】Altair HyperStudy拓?fù)鋬?yōu)化軟件

    挖掘功能的自動(dòng)化流程,可智能、高效地探索任何系統(tǒng)模型的設(shè)計(jì)空間。在考慮多物理場(chǎng)約束的同時(shí),引導(dǎo)用戶了解數(shù)據(jù)趨勢(shì),進(jìn)行權(quán)衡研究并優(yōu)化設(shè)計(jì)性能和可靠性。直觀的用戶界面
    的頭像 發(fā)表于 09-19 17:03 ?627次閱讀
    【產(chǎn)品介紹】Altair HyperStudy拓?fù)鋬?yōu)化軟件

    ALM(應(yīng)用生命周期管理)解析:一文了解概念、關(guān)鍵階段及Perforce ALM工具推薦

    什么是ALM(應(yīng)用生命周期管理)?它遠(yuǎn)不止是SDLC!一文了解概念、關(guān)鍵階段以及如何借助Perforce ALM這類工具,實(shí)現(xiàn)端到端的可追溯性、加速發(fā)布并保障合規(guī)性。
    的頭像 發(fā)表于 09-19 11:03 ?1932次閱讀
    ALM(應(yīng)用生命周期管理)解析:一文<b class='flag-5'>了解</b>其<b class='flag-5'>概念</b>、關(guān)鍵階段及Perforce ALM工具推薦

    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行挖掘分析

    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)通過(guò)智能機(jī)器人在皮帶運(yùn)行過(guò)程中對(duì)皮帶的運(yùn)行狀態(tài)和環(huán)境狀況進(jìn)行實(shí)時(shí)檢測(cè),在應(yīng)用過(guò)程中,不但提升了巡視周期頻次,還通過(guò)大數(shù)據(jù)分析和深度學(xué)習(xí)算法,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行挖掘分析,及時(shí)發(fā)現(xiàn)設(shè)備缺陷故障,為
    的頭像 發(fā)表于 09-15 11:22 ?648次閱讀
    XKCON祥控輸煤皮帶智能機(jī)器人巡檢系統(tǒng)對(duì)監(jiān)測(cè)<b class='flag-5'>數(shù)據(jù)</b>進(jìn)行<b class='flag-5'>挖掘</b>分析

    入行嵌入式應(yīng)該怎么準(zhǔn)備?

    是至關(guān)重要的,因此,掌握C/C++編程技巧是入行嵌入式的基礎(chǔ)。 二、硬件基礎(chǔ)知識(shí)了解基本的電子電路和數(shù)字邏輯是嵌入式系統(tǒng)開(kāi)發(fā)的基礎(chǔ)。你需要了解數(shù)字電路、模擬電路、傳感器和執(zhí)行器的工作原理。此外,對(duì)于處理器
    發(fā)表于 08-06 10:34

    用樹(shù)莓派挖掘5種頂級(jí)加密貨幣!

    加密貨幣是用于在線交易的數(shù)字貨幣。挖掘這些貨幣通常需要專門的硬件,如ASIC礦機(jī)或高性能GPU。然而,有些加密貨幣仍可用樹(shù)莓派來(lái)挖掘。在本文中,我將為您介紹可在樹(shù)莓派上挖掘的最佳加密貨幣。適合用樹(shù)莓
    的頭像 發(fā)表于 07-21 16:34 ?1513次閱讀
    用樹(shù)莓派<b class='flag-5'>挖掘</b>5種頂級(jí)加密貨幣!

    全面了解串行通信

    串行通信是一種數(shù)據(jù)傳輸方式,它將數(shù)據(jù)按 逐位順序 (bit by bit)在一條傳輸線上發(fā)送和接收,與并行通信(同時(shí)傳輸多位數(shù)據(jù))形成對(duì)比。以下是其核心概念、工作原理、
    的頭像 發(fā)表于 07-19 14:13 ?1900次閱讀

    解數(shù)據(jù)瓶頸:智能汽車合成數(shù)據(jù)架構(gòu)與應(yīng)用實(shí)踐

    智能汽車感知系統(tǒng)面臨數(shù)據(jù)困境,如結(jié)構(gòu)復(fù)雜、成本高昂、覆蓋受限、合規(guī)性與隱私風(fēng)險(xiǎn)突出。合成數(shù)據(jù)作為新型數(shù)據(jù)生成方式,以高度可配置性、自動(dòng)化、可復(fù)現(xiàn)為特點(diǎn),有望解決這些問(wèn)題。
    的頭像 發(fā)表于 07-15 11:48 ?675次閱讀
    破<b class='flag-5'>解數(shù)據(jù)</b>瓶頸:智能汽車合成<b class='flag-5'>數(shù)據(jù)</b>架構(gòu)與應(yīng)用實(shí)踐

    物聯(lián)網(wǎng)感知數(shù)據(jù)挖掘:賦能萬(wàn)物智聯(lián)的核心引擎

    背后,數(shù)據(jù)挖掘與分析技術(shù)正成為解鎖設(shè)備潛能、驅(qū)動(dòng)產(chǎn)業(yè)變革的關(guān)鍵鑰匙。 一、從數(shù)據(jù)到洞察:六大核心價(jià)值維度 1. 價(jià)值轉(zhuǎn)化器:解鎖設(shè)備數(shù)據(jù)的商業(yè)密碼 工業(yè)傳感器產(chǎn)生的振動(dòng)頻譜、智能電表的
    的頭像 發(fā)表于 06-17 16:22 ?683次閱讀

    高度定制可擴(kuò)展!Qorvo企業(yè)級(jí)PMIC破解數(shù)據(jù)中心斷電數(shù)據(jù)安全難題

    芯片解決方案來(lái)到深圳MemoryS 2025存儲(chǔ)峰會(huì)上,全方位呈現(xiàn)其在連接、保護(hù)和電源管理等方面的卓越成果。 ? 為了更深入的了解此次Qorvo斷電保護(hù)PMIC芯片有哪些特點(diǎn),電子發(fā)燒友網(wǎng)采訪到了Qorvo高級(jí)銷售經(jīng)理張?chǎng)H。據(jù)了解
    的頭像 發(fā)表于 03-20 00:16 ?2118次閱讀
    高度定制可擴(kuò)展!Qorvo企業(yè)級(jí)PMIC破<b class='flag-5'>解數(shù)據(jù)</b>中心斷電<b class='flag-5'>數(shù)據(jù)</b>安全難題