当前位置：首页 > 日记本 > 正文内容

python jieba分词

zhangchap3年前 (2021-05-25)日记本263

import jieba
from jieba.analyse import tfidf
words = jieba.lcut('美菜网拟赴美上市，“生鲜第一股”有望成真？')
print(words)
#['美菜', '网拟', '赴美', '上市', '，', '“', '生鲜', '第一股', '”', '有望', '成', '真', '？']
nws = tfidf('美菜网拟赴美上市，“生鲜第一股”有望成真？',topK=5)
print(nws)
#['美菜', '网拟', '生鲜', '第一股', '赴美']

标签: python笔记

分享给朋友：

返回列表

上一篇：python 随机生成时间戳写入txt文件/运行sql语句

下一篇：python 发布文章随机分类（choice）

相关文章

python 随机生成时间戳写入txt文件/运行sql语句

import time from random import randint with open('time.txt', ...

python fake_useragent 模块用法

我们每次发送requests请求时通过random从中随机获取一个随机UserAgent，两行代码即可完成UserAgent的不停更换 from fake_useragent i...

python jieba分词自定义分词器及自定义词典

import jieba jieba.initialize() # 自定义分词器的写法 n_c = jieba.Tokenizer(dictionary=...

python判断当前系统为win还是Linux

使用sys模块进行判断，以便启用在win平台下不支持的代码：import sys p = sys.platform if p != &#...

python 字典排序

prefix_word = {'怎么': 4, '昨晚': 27, '会': 56...

python计算字符串相似度总结

1、距离计算包的安装：pip install python-Levenshteinlevenshtein编辑距离(Edit Distance)，又称Levenshtein距离，...

发表评论

最顶级的能力是屏蔽力，任何消耗你的人和事，多看一眼都是你的不对。

人生最大的代价不是金钱，而是你走过的弯路，
人生最大的成本不是金钱，而是你的时间和精力，
机遇一旦错过就可能是一生。
Copyright zhenglia.com Rights Reserved.
挣俩网张涛与你共勉：当你的才华还撑不起你的野心的时候，你就应该静下心来学习。当你的能力还驾驭不了你的目标的时候，你就应该沉下心来历练。问问自己，想要怎样的人生。
分享学习(python、优化)的点点滴滴

Powered By Z-BlogPHP. Theme by TOYEAN.