当前位置:首页 > 技术杂坛 > 正文内容

python jieba分词自定义分词器及自定义词典

zhangchap3年前 (2021-06-05)技术杂坛536
import jieba
jieba.initialize()
# 自定义分词器的写法
n_c = jieba.Tokenizer(dictionary='./fc.txt')
wd = '嫦娥五号发射成功'
print(n_c.lcut(wd))

# 加载自定义词典
jieba.load_userdict('fc.txt')
print(jieba.lcut(wd))

使用自定义分词器不使用原生词典,使用自定义词典还会使用原生词典


标签: python笔记
分享给朋友:

相关文章

python使用mongodb数据库

from pymongo import MongoClient,collection class KSpdier(Thread):   ...

python补全网址代码示例

from urllib.parse import urljoin absurl = urljoin(backend,url) #backend:根...

python xpath语法总结

python xpath语法总结:常用的://1.从任意节点开始/2.从根节点开始//div/p3.div下的p标签//div[@class="hrzz_bottom"]/ul/l...

python url.parse模块编码解码

from urllib.parse import quote,unquote,urlencode # 对汉字进行编码使用 quote ...

python fake_useragent 模块用法

我们每次发送requests请求时通过random从中随机获取一个随机UserAgent,两行代码即可完成UserAgent的不停更换 from fake_useragent i...

python列表排序(以字符串长度)

M = ['a', 'sss', 'bb'] 第一种: m = M.sort(key&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。