当前位置:首页 > 日记本 > 正文内容

python 简单计算两个文本的相似度

zhangchap1年前 (2023-04-03)日记本271
import difflib

def get_similarity(text1, text2):
    # 计算两个文本之间的相似度
    similarity = difflib.SequenceMatcher(None, text1, text2).ratio()
    print(similarity)
    return similarity

# 示例用法
text1 = "请问从南充寄回四川省自贡市荣县的快递要多久 "
text4 = "请问从南充寄回四川荣县的快递要多久 "
text2 = "四川(约263.991何应钦四川,四川和士兵伤亡全国人民抗日军事和民用两个十分之一秒的一个第二次死亡,受伤,失踪356.267 26.025人,共64人,包括在排名最靠前的国家统计!)"
text3 = "正常快递的省内件就1-2天,最多不超过3天,不同的快递公司中转方式不一样,一般南充-成都-自贡-荣县,不过发的时候最好先咨询下您发的那家快递能不能到荣县,省的麻烦,无疑要保证时效的话,还是选择顺丰吧 "
similarity1 = get_similarity(text1, text3)
similarity2 = get_similarity(text1, text2)
similarity3 = get_similarity(text1, text4)


分享给朋友:

相关文章

火狐添加自定义搜索引擎

直接网址搜索自定义添加:https://mycroftproject.com/...

lxml win 安装方法

文档地址:https://lxml.de/installation.htmlwindows 下安装不了的都可以在这里找:https://www.lfd.uci.edu/~gohl...

宝塔重启服务器后,Redis就启动不了解决方案

宝塔重启服务器后,Redis就启动不了解决方案

1.更改权限 chown -R redis.redis /www/server/redis/ 2.设置持久化...

Nginx+PHP,PHP如何优化配置?

具体修改FPM配置文件参数: 若你的php日志出现: WARNING: [pool www] seems busy (you may need to increase pm.sta...

python补全网址代码示例

from urllib.parse import urljoin absurl = urljoin(backend,url) #backend:根...

python jieba分词

import jieba from jieba.analyse import tfidf words = jieba.lcut('...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。