当前位置:首页 > 技术杂坛 > 正文内容

python jieba分词自定义分词器及自定义词典

zhangchap3年前 (2021-06-05)技术杂坛545
import jieba
jieba.initialize()
# 自定义分词器的写法
n_c = jieba.Tokenizer(dictionary='./fc.txt')
wd = '嫦娥五号发射成功'
print(n_c.lcut(wd))

# 加载自定义词典
jieba.load_userdict('fc.txt')
print(jieba.lcut(wd))

使用自定义分词器不使用原生词典,使用自定义词典还会使用原生词典


标签: python笔记
分享给朋友:

相关文章

python 函数 开启多线程示例

from threading import Thread def readfile(queue:Queue):    &nbs...

python xpath语法总结

python xpath语法总结:常用的://1.从任意节点开始/2.从根节点开始//div/p3.div下的p标签//div[@class="hrzz_bottom"]/ul/l...

python 随机生成时间戳写入txt文件/运行sql语句

import time from random import randint with open('time.txt', ...

json输出json.dumps中文为ascii编码如何解决?

import json print json.dumps('中国') 输出:"\u4e2d\u56fd" json.dumps(...

python列表排序(以字符串长度)

M = ['a', 'sss', 'bb'] 第一种: m = M.sort(key&n...

python判断当前系统为win还是Linux

使用sys模块进行判断,以便启用在win平台下不支持的代码:import sys p = sys.platform if p != &#...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。