其他杂项Python简单实现基于VSM的余弦相似度计算 – Eastmount的专栏 – 博客频道 – CSDN.NET 在知识图谱构建阶段的实体对齐和属性值决策、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等实例中,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知... 06月20日 270 发表评论 阅读全文
其他杂项中文知识图谱研讨会的学习总结 (上) 图谱引入、百度知心、搜狗知立方 – Eastmount的专栏 – 博客频道 – CSDN.NET 知识图谱(Knowledge Graph)是当前学术界和企业界的研究热点。中文知识图谱的构建对中文信息处理和中文信息检索具有重要的价值。中国中文信息学会(CIPS)邀请了有约10家从事知识图谱研究和实... 06月20日 528 发表评论 阅读全文
其他杂项[推荐算法]基于用户的协同过滤算法 – 笑笑的程序人生 – 博客频道 – CSDN.NET 什么是推荐算法 推荐算法最早在1992年就提出来了,但是火起来实际上是最近这些年的事情,因为互联网的爆发,有了更大的数据量可以供我们使用,推荐算法才有了很大的用武之地。 06月16日 318 发表评论 阅读全文
其他杂项中文知识图谱研讨会的学习总结 (上) 图谱引入、百度知心、搜狗知立方 – Eastmount的专栏 – 博客频道 – CSDN.NET 知识图谱(Knowledge Graph)是当前学术界和企业界的研究热点。中文知识图谱的构建对中文信息处理和中文信息检索具有重要的价值。中国中文信息学会(CIPS)邀请了有约10家从事知识图谱研究和实... 06月15日 599 发表评论 阅读全文
其他杂项[python] lantern访问中文维基百科及selenium爬取维基百科语料 – Eastmount的专栏 – 博客频道 – CSDN.NET 希望文章对你有所帮助,尤其是web爬虫初学者和NLP相关同学。当然你也能,懂的~ 目录: 0 前言1 lantern访问中文维基百科2 Selenium调用Chrome自动访问维基百科3 Seleni... 06月14日 343 发表评论 阅读全文
其他杂项[python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像 – Eastmount的专栏 – 博客频道 – CSDN.NET 0 前言 本文主要讲述以下几点: 1.通过scikit-learn计算文本内容的tfidf并构造N*M矩阵(N个文档 M个特征词); 2.调用scikit-learn中... 06月14日 3,489 发表评论 阅读全文
其他杂项[python] 基于k-means和tfidf的文本聚类代码简单实现 – Eastmount的专栏 – 博客频道 – CSDN.NET 俗话说“外行看热闹,内行看门道“,作为一个机器学习的门外汉,刚研究python机器学习scikit-learn两周时间,虽然下面这段程序可能对于那些专研算法或机器学习的人来说非常简单,但对于一些入门的... 06月14日 2,727 发表评论 阅读全文
其他杂项[python] 使用Jieba工具中文分词及文本聚类概念 – Eastmount的专栏 – 博客频道 – CSDN.NET 前面讲述了很多关于Python爬取本体Ontology、消息盒InfoBox、虎扑图片等例子,同时讲述了VSM向量空间模型的应用。但是由于InfoBox没有前后文和语义概念,所以效果不是很好,这篇文章... 06月14日 1,116 发表评论 阅读全文
其他杂项Python简单实现基于VSM的余弦相似度计算 – Eastmount的专栏 – 博客频道 – CSDN.NET 在知识图谱构建阶段的实体对齐和属性值决策、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等实例中,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知... 06月14日 1,053 发表评论 阅读全文