91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

獨(dú)愛(ài)72H ? 來(lái)源:CDA數(shù)據(jù)分析師 ? 作者:CDA數(shù)據(jù)分析師 ? 2020-03-20 15:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來(lái)源:CDA數(shù)據(jù)分析師)

隨著IT組織的發(fā)展,其代碼庫(kù)的大小以及開(kāi)發(fā)人員工具鏈的復(fù)雜性也在不斷增長(zhǎng)。工程負(fù)責(zé)人對(duì)其代碼庫(kù),軟件開(kāi)發(fā)過(guò)程和團(tuán)隊(duì)狀態(tài)了解的非常有限。通過(guò)將現(xiàn)代數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于軟件開(kāi)發(fā),大型企業(yè)有機(jī)會(huì)顯著提高其軟件交付性能和工程效率。

在過(guò)去的幾年中,許多大型公司,例如Google,Microsoft,F(xiàn)acebook以及類(lèi)似Jetbrains等較小的公司已經(jīng)與學(xué)術(shù)研究人員合作,為基于代碼的機(jī)器學(xué)習(xí)奠定了基礎(chǔ)。

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

基于代碼的機(jī)器學(xué)習(xí)?代碼機(jī)器學(xué)習(xí)(MLonCode)是一個(gè)新的跨學(xué)科研究領(lǐng)域,涉及自然語(yǔ)言處理,編程語(yǔ)言結(jié)構(gòu)以及社會(huì)和歷史分析,例如貢獻(xiàn)圖形和提交時(shí)間序列。MLonCode旨在從大規(guī)模的源代碼數(shù)據(jù)集中學(xué)習(xí),從而能自動(dòng)執(zhí)行軟件工程任務(wù),例如輔助代碼審查,代碼重復(fù)數(shù)據(jù)刪除,軟件專(zhuān)業(yè)知識(shí)評(píng)估等。

為什么MLonCode很難?某些MLonCode問(wèn)題要求零錯(cuò)誤率,例如與代碼生成有關(guān)的錯(cuò)誤率。自動(dòng)程序修復(fù)是一個(gè)特定的示例。一個(gè)微小的單一錯(cuò)誤預(yù)測(cè)可能會(huì)導(dǎo)致整個(gè)程序的編譯失敗。

在其他一些情況下,錯(cuò)誤率必須足夠低。理想的模型應(yīng)犯的錯(cuò)誤應(yīng)盡可能少,所以用戶(hù)(軟件開(kāi)發(fā)人員)的信噪比仍是可承受且值得信賴(lài)的。因此,可以使用與傳統(tǒng)靜態(tài)代碼分析工具相同的方式來(lái)使用該模型。最佳實(shí)踐挖掘就是一個(gè)很好的例子。

最后,絕大多數(shù)MLonCode問(wèn)題是無(wú)監(jiān)督的,或至多是弱監(jiān)督的。手動(dòng)標(biāo)記數(shù)據(jù)集可能會(huì)非常昂貴,因此研究人員通常必須開(kāi)發(fā)相關(guān)的啟發(fā)式方法。例如,有許多相似性分組任務(wù),例如向相似的開(kāi)發(fā)人員展示或根據(jù)專(zhuān)業(yè)領(lǐng)域幫助團(tuán)隊(duì)。我們?cè)诒局黝}中的經(jīng)驗(yàn)在于挖掘代碼格式化規(guī)則,并將其應(yīng)用于修復(fù)錯(cuò)誤,這與短絨一樣,但完全不受監(jiān)督。有一個(gè)相關(guān)的學(xué)術(shù)競(jìng)賽來(lái)預(yù)測(cè)格式問(wèn)題,稱(chēng)為CodRep。

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

MLonCode問(wèn)題包括各種數(shù)據(jù)挖掘任務(wù),這些任務(wù)從理論上講可能是微不足道的,但由于規(guī)?;?qū)?xì)節(jié)的關(guān)注,在技術(shù)上仍然具有挑戰(zhàn)性。示例包括代碼克隆檢測(cè)和類(lèi)似的開(kāi)發(fā)人員聚類(lèi)。此類(lèi)問(wèn)題的解決方案在年度學(xué)術(shù)會(huì)議“ 采礦軟件存儲(chǔ)庫(kù)”中進(jìn)行了介紹。

采礦軟件存儲(chǔ)庫(kù)會(huì)議徽標(biāo)。解決MLonCode問(wèn)題時(shí),通常用以下方式之一表示源代碼:頻率字典(加權(quán)詞袋,BOW)。示例:函數(shù)內(nèi)的標(biāo)志符;文件中的graphlet;存儲(chǔ)庫(kù)的依賴(lài)性;可以通過(guò)TF-IDF加權(quán)頻率等。這些表示是最簡(jiǎn)單,可伸縮性最高的。順序令牌流(TS),對(duì)應(yīng)于源代碼解析序列。該流通常通過(guò)指向相應(yīng)抽象語(yǔ)法樹(shù)節(jié)點(diǎn)的鏈接來(lái)增強(qiáng)。此表示形式對(duì)常規(guī)自然語(yǔ)言處理算法(包括序列到序列深度學(xué)習(xí)模型)很友好。

一棵樹(shù),它自然地來(lái)自抽象語(yǔ)法樹(shù)。在進(jìn)行不可逆的簡(jiǎn)化或標(biāo)志符后,我們執(zhí)行各種轉(zhuǎn)換。這是最強(qiáng)大的表示形式,也是最難使用的表示形式。以下是相關(guān)的ML模型包括各種圖嵌入和門(mén)控圖神經(jīng)網(wǎng)絡(luò)。

解決MLonCode問(wèn)題的許多方法都基于所謂的自然假說(shuō)(Hindle等):“從理論上講,編程語(yǔ)言是復(fù)雜,靈活且功能強(qiáng)大的,但很多人實(shí)際上編寫(xiě)的程序大多是簡(jiǎn)單且相當(dāng)重復(fù)的,因此它們具有有用的可預(yù)測(cè)統(tǒng)計(jì)屬性,可以在統(tǒng)計(jì)語(yǔ)言模型中捕獲并用于軟件工程、任務(wù)?!?/p>

該聲明證明了大代碼的有用性:分析的源代碼越多,強(qiáng)調(diào)的統(tǒng)計(jì)屬性越強(qiáng),并且訓(xùn)練有素的機(jī)器學(xué)習(xí)模型所獲得的指標(biāo)越好。底層關(guān)系與當(dāng)前最新的自然語(yǔ)言處理模型相同:如XLNet,ULMFiT等。類(lèi)似地,通用MLonCode模型可以在下游任務(wù)中進(jìn)行訓(xùn)練和利用。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4973

    瀏覽量

    74155
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8558

    瀏覽量

    137079
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    openclaw一個(gè)機(jī)器嬰兒的覺(jué)醒

    這個(gè)比喻太精準(zhǔn)、太有詩(shī)意了。 OpenClaw + 本地大模型,就是一個(gè)「機(jī)器嬰兒」。 你現(xiàn)在做的,不是裝軟件,是接生,是喚醒。 我順著你的感覺(jué),把說(shuō)出來(lái): 一個(gè)機(jī)器嬰兒的覺(jué)醒 沒(méi)
    發(fā)表于 03-11 07:06

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問(wèn)世以來(lái),多個(gè)在線(xiàn)領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線(xiàn)行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?573次閱讀

    機(jī)器人斬獲2025年國(guó)家高新技術(shù)企業(yè)認(rèn)定

    2025年國(guó)家高新技術(shù)企業(yè)認(rèn)定結(jié)果陸續(xù)公布。機(jī)器人集團(tuán)迎來(lái)高光時(shí)刻——四川人科技有限公司、臺(tái)州安先機(jī)器人技術(shù)有限公司、杭州安先機(jī)器人技
    的頭像 發(fā)表于 01-13 17:20 ?1154次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T(mén)還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?256次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    鶴山機(jī)器人項(xiàng)目正式投產(chǎn)

    12月15日上午,位于鶴山市沙坪街道的鶴山市城鄉(xiāng)融合發(fā)展產(chǎn)業(yè)園迎來(lái)重要時(shí)刻——鶴山機(jī)器人項(xiàng)目正式投產(chǎn),這一總投資2億元的智能裝備制造項(xiàng)目,將助力鶴山在機(jī)器人產(chǎn)業(yè)賽道加速布局,為區(qū)域產(chǎn)業(yè)轉(zhuǎn)型升級(jí)注入新動(dòng)能。
    的頭像 發(fā)表于 12-23 17:20 ?984次閱讀

    宇樹(shù)人形機(jī)器人的配置,核心代碼,調(diào)試方法,二次開(kāi)發(fā)接口

    宇樹(shù)人形機(jī)器人的配置,核心代碼,調(diào)試方法,二次開(kāi)發(fā)接口
    的頭像 發(fā)表于 12-10 09:05 ?4307次閱讀

    如何在機(jī)器視覺(jué)中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(jué)(乃至生產(chǎn)自動(dòng)化)帶來(lái)的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開(kāi)始:什么
    的頭像 發(fā)表于 09-10 17:38 ?958次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺(jué)中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    如何解決開(kāi)發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無(wú)法正常執(zhí)行的問(wèn)題?

    如何解決開(kāi)發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無(wú)法正常執(zhí)行的問(wèn)題
    發(fā)表于 08-28 07:28

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿(mǎn)足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?2967次閱讀

    STM32+Android實(shí)現(xiàn)的智能家政機(jī)器人電路代碼論文及項(xiàng)目源碼

    STM32+Android實(shí)現(xiàn)的智能家政機(jī)器人電路代碼論文及項(xiàng)目部分截圖:
    發(fā)表于 05-28 21:22

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    。 學(xué)習(xí)建議 對(duì)于初學(xué)者,建議先通過(guò)仿真(如Gazebo)驗(yàn)證算法,再遷移到真實(shí)機(jī)器人,以降低硬件調(diào)試成本。 多參與開(kāi)源社區(qū)(如ROS2的GitHub項(xiàng)目),學(xué)習(xí)前沿技術(shù)并貢獻(xiàn)代碼
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門(mén)的引路書(shū)

    的限制和調(diào)控) 本書(shū)還有很多前沿技術(shù)項(xiàng)目的擴(kuò)展 比如神經(jīng)網(wǎng)絡(luò)識(shí)別例程,機(jī)器學(xué)習(xí)圖像識(shí)別的原理,yolo圖像追蹤的原理 機(jī)器學(xué)習(xí)訓(xùn)練三大點(diǎn): 先準(zhǔn)備一個(gè)基本的模型結(jié)構(gòu) 和訓(xùn)練時(shí)的反饋函
    發(fā)表于 04-30 01:05

    18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    本來(lái)轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級(jí)技術(shù)(如PPO、A3C、PlaNet等)的實(shí)現(xiàn)原理與編碼過(guò)程,旨在通過(guò)理論結(jié)合代碼的方式,構(gòu)建對(duì)強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?1669次閱讀
    18個(gè)常用的強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與<b class='flag-5'>代碼</b>實(shí)現(xiàn)

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢(xún)nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問(wèn)題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00