结巴分词代码阅读
代码结构结巴分词的代码结构如下图所示。extra_dict目录下存放的是分词需要的外部数据,主要包括字典数据dict.txt、各词的idf数据idf.txt和分词前需要过滤的停用词表stop_words.txt;jieba目录是主要的程序目录,该目录下analyse为tfidf、textrank等对
...
have fun