当前位置:首页 > 日记本 > 正文内容

python jieba分词

zhangchap3年前 (2021-05-25)日记本263
import jieba
from jieba.analyse import tfidf
words = jieba.lcut('美菜网拟赴美上市,“生鲜第一股”有望成真?')
print(words)
#['美菜', '网拟', '赴美', '上市', ',', '“', '生鲜', '第一股', '”', '有望', '成', '真', '?']
nws = tfidf('美菜网拟赴美上市,“生鲜第一股”有望成真?',topK=5)
print(nws)
#['美菜', '网拟', '生鲜', '第一股', '赴美']


标签: python笔记
分享给朋友:

相关文章

python 随机生成时间戳写入txt文件/运行sql语句

import time from random import randint with open('time.txt', ...

python fake_useragent 模块用法

我们每次发送requests请求时通过random从中随机获取一个随机UserAgent,两行代码即可完成UserAgent的不停更换 from fake_useragent i...

python jieba分词自定义分词器及自定义词典

import jieba jieba.initialize() # 自定义分词器的写法 n_c = jieba.Tokenizer(dictionary=...

python判断当前系统为win还是Linux

使用sys模块进行判断,以便启用在win平台下不支持的代码:import sys p = sys.platform if p != &#...

python 字典排序

prefix_word = {'怎么': 4, '昨晚': 27, '会': 56...

python计算字符串相似度总结

1、距离计算包的安装:pip install python-Levenshteinlevenshtein编辑距离(Edit Distance),又称Levenshtein距离,...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。