当前位置:首页 > 日记本 > 正文内容

python jieba分词

zhangchap3年前 (2021-05-25)日记本254
import jieba
from jieba.analyse import tfidf
words = jieba.lcut('美菜网拟赴美上市,“生鲜第一股”有望成真?')
print(words)
#['美菜', '网拟', '赴美', '上市', ',', '“', '生鲜', '第一股', '”', '有望', '成', '真', '?']
nws = tfidf('美菜网拟赴美上市,“生鲜第一股”有望成真?',topK=5)
print(nws)
#['美菜', '网拟', '生鲜', '第一股', '赴美']


标签: python笔记
分享给朋友:

相关文章

python xpath语法总结

python xpath语法总结:常用的://1.从任意节点开始/2.从根节点开始//div/p3.div下的p标签//div[@class="hrzz_bottom"]/ul/l...

json输出json.dumps中文为ascii编码如何解决?

import json print json.dumps('中国') 输出:"\u4e2d\u56fd" json.dumps(...

python 获取当前的路径并切换

import os curdir = os.path.dirname(__file__) #获取当前的路径,若运行在当前文件夹,是获取不到当前路径的,最保险的...

pip install 安装出现:Requirement already satisfied 的解决办法

刚开始装上python安装轮子挺顺利的,后来再使用pip install 安装开始报错,网上有解决方案说用国内的源就没问题,但是我的源早就改成国内的了,用了另外一种解决方案,搞定加上--target参...

python计算字符串相似度总结

1、距离计算包的安装:pip install python-Levenshteinlevenshtein编辑距离(Edit Distance),又称Levenshtein距离,...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。