91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

評價Python字符串相似度的六種度量方法

汽車玩家 ? 來源:今日頭條 ? 作者:我愛學(xué)Python ? 2020-01-18 17:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

字符串的相似性比較應(yīng)用場合很多,像拼寫糾錯、文本去重、上下文相似性等。

評價字符串相似度最常見的辦法就是:把一個字符串通過插入、刪除或替換這樣的編輯操作,變成另外一個字符串,所需要的最少編輯次數(shù),這種就是編輯距離(edit distance)度量方法,也稱為Levenshtein距離。海明距離是編輯距離的一種特殊情況,只計算等長情況下替換操作的編輯次數(shù),只能應(yīng)用于兩個等長字符串間的距離度量。

其他常用的度量方法還有 Jaccard distance、J-W距離(Jaro–Winkler distance)、余弦相似性(cosine similarity)、歐氏距離(Euclidean distance)等。

python-Levenshtein 使用

使用 pip install python-Levenshtein 指令安裝 Levenshtein

1. difflib

2. hamming距離,str1和str2長度必須一致,描述兩個等長字串之間對應(yīng)位置上不同字符的個數(shù)

3. 編輯距離,描述由一個字串轉(zhuǎn)化成另一個字串最少的操作次數(shù),在其中的操作包括 插入、刪除、替換

4.計算萊文斯坦比

5.計算jaro距離

6. Jaro–Winkler距離

輸出:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 字符串
    +關(guān)注

    關(guān)注

    1

    文章

    596

    瀏覽量

    23170
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4876

    瀏覽量

    90071
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    求助 LabVIEW 字符串比較

    1.輸入一個字符串,儲存起來。 2.再次輸入一個字符串,先和儲存起來的字符串比較,如果不同則存儲起來,如果相同則不儲存。 3.再次輸入一個字符串,和所有儲存起來的
    發(fā)表于 03-02 17:24

    打開工程后工程中的字體沒有顯示,如字符串,數(shù)字等控件不能預(yù)覽顯示字體?

    打開工程后工程中的字體沒有顯示,如字符串,數(shù)字等控件不能預(yù)覽顯示字體?
    發(fā)表于 02-25 17:39

    字符串控件與靜態(tài)字符串控件中預(yù)覽字符顯示亂碼,如何修改顯示正常?

    字符串控件與靜態(tài)字符串控件中預(yù)覽字符顯示亂碼,如何修改顯示正常?
    發(fā)表于 01-20 17:17

    字符串,數(shù)字控件如何控制背景顏色和前景字體顏色?

    字符串,數(shù)字控件如何控制背景顏色和前景字體顏色?
    發(fā)表于 01-20 15:12

    Linux下怎么讓中文字符串按照拼音排序?

    求教 Linux 下怎么讓中文字符串按照拼音排序?
    發(fā)表于 01-06 07:40

    字符串關(guān)聯(lián)數(shù)字變量如何使用?我們的地址都是16位數(shù)據(jù),可以使用16位數(shù)字變量顯示字符串嗎?

    字符串關(guān)聯(lián)數(shù)字變量如何使用?我們的地址都是16位數(shù)據(jù),可以使用16位數(shù)字變量顯示字符串嗎?
    發(fā)表于 12-15 08:24

    盤點(diǎn)連接器的六種鎖定機(jī)構(gòu)

    六種連接器鎖止機(jī)構(gòu)是什么?連接器上有各種鎖定機(jī)制,包括插銷鎖、LacthLocking、Lever、推拉式、螺釘和卡入式。這些代表了更常見的樣式,但并非詳盡無遺。連接器的鎖止可以支持多種功能,例如
    的頭像 發(fā)表于 10-17 08:02 ?622次閱讀
    盤點(diǎn)連接器的<b class='flag-5'>六種</b>鎖定機(jī)構(gòu)

    如何使用 NuMaker 板和 Mbed OS 上的連接字符串連接到 Azure IoT?

    使用 NuMaker 板和 Mbed OS 上的連接字符串連接到 Azure IoT
    發(fā)表于 09-04 07:46

    非對稱密鑰生成和轉(zhuǎn)換規(guī)格詳解

    當(dāng)前章節(jié)將說明系統(tǒng)目前支持的算法及其對應(yīng)的規(guī)格。密鑰生成有兩指定規(guī)格的方式,分別是: 字符串參數(shù):以字符串的形式描述開發(fā)者需要生成的密鑰規(guī)格。 密鑰參數(shù):使用密鑰的詳細(xì)密碼學(xué)信息,構(gòu)造密鑰對象
    發(fā)表于 09-01 07:50

    LM3466 多 LED 電流平衡器技術(shù)手冊

    到電源的數(shù)或每個 LED 的正向電壓 字符串。 如果任何 LED 燈在運(yùn)行過程中打開,LM3466 會自動平衡通過所有剩余活動 LED 燈的電源電流。 如 因此,即使一些 LED
    的頭像 發(fā)表于 08-29 14:27 ?1048次閱讀
    LM3466 多<b class='flag-5'>串</b> LED 電流平衡器技術(shù)手冊

    labview如何生成一個帶字符串返回的dll

    labview如何生成一個dll,如下圖,要求一個輸入,類型是字符串,返回類型也是字符串
    發(fā)表于 08-28 23:20

    Python字符串逆序有幾種方式,代碼是什么

    對于一個給定的字符串,逆序輸出,這個任務(wù)對于python來說是一很簡單的操作,畢竟強(qiáng)大的列表和字符串處理的一些列函數(shù)足以應(yīng)付這些問題 了,今天總結(jié)了一下
    的頭像 發(fā)表于 08-28 14:44 ?1097次閱讀

    基礎(chǔ)篇3:掌握Python中的條件語句與循環(huán)

    、字符串)或集合。 復(fù)制代碼 for 變量 in 序列: # 循環(huán)體 while循環(huán) while循環(huán)用于在滿足特定條件的情況下重復(fù)執(zhí)行代碼塊。 復(fù)制代碼 while 條件表達(dá)式: # 循環(huán)體
    發(fā)表于 07-03 16:13

    harmony-utils之StrUtil,字符串工具類

    harmony-utils之StrUtil,字符串工具類 harmony-utils 簡介與說明 [harmony-utils] 一款功能豐富且極易上手的HarmonyOS工具庫,借助眾多實用工具類
    的頭像 發(fā)表于 07-03 11:32 ?634次閱讀

    變頻器大調(diào)速方法的詳解及適用場景

    變頻器(Variable-frequency Drive,VFD)是一集成了變頻技術(shù)與微電子技術(shù)的電力控制設(shè)備。它通過改變電機(jī)的工作電源頻率,實現(xiàn)對交流電動機(jī)的精確控制。以下是變頻器六種常見的調(diào)速
    的頭像 發(fā)表于 04-17 16:37 ?4234次閱讀
    變頻器<b class='flag-5'>六</b>大調(diào)速<b class='flag-5'>方法</b>的詳解及適用場景