当前位置：首页 > 技术杂坛 > 正文内容

python jieba分词自定义分词器及自定义词典

zhangchap3年前 (2021-06-05)技术杂坛536

import jieba
jieba.initialize()
# 自定义分词器的写法
n_c = jieba.Tokenizer(dictionary='./fc.txt')
wd = '嫦娥五号发射成功'
print(n_c.lcut(wd))

# 加载自定义词典
jieba.load_userdict('fc.txt')
print(jieba.lcut(wd))

使用自定义分词器不使用原生词典，使用自定义词典还会使用原生词典

标签: python笔记

分享给朋友：

返回列表

上一篇：pip install 安装出现:Requirement already satisfied 的解决办法

下一篇：python判断当前系统为win还是Linux

相关文章

python使用mongodb数据库

from pymongo import MongoClient,collection class KSpdier(Thread): ...

python补全网址代码示例

from urllib.parse import urljoin absurl = urljoin(backend,url) #backend：根...

python xpath语法总结

python xpath语法总结：常用的：//1.从任意节点开始/2.从根节点开始//div/p3.div下的p标签//div[@class="hrzz_bottom"]/ul/l...

python url.parse模块编码解码

from urllib.parse import quote,unquote,urlencode # 对汉字进行编码使用 quote ...

python fake_useragent 模块用法

我们每次发送requests请求时通过random从中随机获取一个随机UserAgent，两行代码即可完成UserAgent的不停更换 from fake_useragent i...

python列表排序（以字符串长度）

M = ['a', 'sss', 'bb'] 第一种： m = M.sort(key&n...

发表评论

最顶级的能力是屏蔽力，任何消耗你的人和事，多看一眼都是你的不对。

人生最大的代价不是金钱，而是你走过的弯路，
人生最大的成本不是金钱，而是你的时间和精力，
机遇一旦错过就可能是一生。
Copyright zhenglia.com Rights Reserved.
挣俩网张涛与你共勉：当你的才华还撑不起你的野心的时候，你就应该静下心来学习。当你的能力还驾驭不了你的目标的时候，你就应该沉下心来历练。问问自己，想要怎样的人生。
分享学习(python、优化)的点点滴滴

Powered By Z-BlogPHP. Theme by TOYEAN.