shell学习笔记cygwin下用Python比较两个文本的相似性 cygwin下用Python比较两个文本的相似性,使用到了结巴分词以及余弦定理。 关于cygwin的安装以及python的安装,暂且不提,大家可以去看另一篇http://seofangfa.com/shell/shell-extract-4... 05月31日 2,524 2 阅读全文
shell学习笔记cygwin下用Python+jieba给文本分词并提取高频词 今晚小折腾了一下在cygwin下用Python和jieba分词(结巴分词)组件给文本分词并提取高频词,过程记录如下: 目的 分析某行业中,用户最关心的一些需求,再根据这一需求去调整站内TDK,以及一些频道、内容的规划 过程 1、下载安装cy... 05月30日 9,787 9 阅读全文