其他杂项1.3.3 理解随机性_机器学习算法原理与编程实践_红黑联盟读书频道 让我们改变一下视角,从整体上观察矩阵(集合)中的对象分布与矩阵整体的关系。这需要引入一个新的概念:概率论。概率论是整个数学大厦中比较难理解的一门学科。这多少与直觉有点差异,人们常把概率简单理解为事件发... 06月14日 470 发表评论 阅读全文
其他杂项1.3.5 多元统计基础_机器学习算法原理与编程实践_红黑联盟读书频道 理解了随机性和概率基础,下一步我们与之前介绍的矩阵结合起来,将它扩展到多维的情况。 06月14日 231 发表评论 阅读全文
其他杂项1.3.4 回顾概率论_机器学习算法原理与编程实践_红黑联盟读书频道 对事物运动这种不确定性(随机性)的度量就是概率论,接下来我们考察一下概率的基本概念。衡量事物运动的随机性,必须从整体而不是局部来认知事物, 因为从每个局部,事物可能看起来都是不同的(或相同的)。不像其... 06月14日 267 发表评论 阅读全文
其他杂项相似度算法_木木彡_新浪博客 在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分 类和聚类算法,如K最近邻(KNN)和K均值(K-Means)... 06月14日 306 发表评论 阅读全文
其他杂项文本相似度计算-JaccardSimilarity和哈希签名函数 – 笑笑的程序人生 – 博客频道 – CSDN.NET 在目前这个信息过载的星球上,文本的相似度计算应用前景还是比较广泛的,他可以让人们过滤掉很多相似的新闻,比如在搜索引擎上,相似度太高的页面,只需要展示一个就行了,还有就是,考试的时候,可以用这个来防作弊... 06月14日 2,158 发表评论 阅读全文
其他杂项word2vec中文相似词计算和聚类的使用说明及c语言源码 – Eastmount的专栏 – 博客频道 – CSDN.NET word2vec相关基础知识、下载安装参考前文:word2vec词向量中文文本相似度计算 目录: word2vec使用说明及源码介绍1.下载地址2.中文语料3.参数介绍4.计算相似词语5.三个词预测语... 06月14日 448 发表评论 阅读全文
其他杂项word2vec词向量训练及中文文本相似度计算 – Eastmount的专栏 – 博客频道 – CSDN.NET 本文是讲述如何使用word2vec的基础教程,文章比较基础,希望对你有所帮助! 官网C语言下载地址:http://word2vec.googlecode.com/svn/trunk/ 官网Python... 06月14日 8,879 发表评论 阅读全文
其他杂项Jaccard相似度和广义Jaccard相似度 – july_2的专栏 – 博客频道 – CSDN.NET 1. 狭义Jaccard相似度,计算两个集合之间的相似程度,元素的“取值”为0或1 对集合A和B,Jaccard相似度计算如下: 06月14日 980 发表评论 阅读全文
其他杂项wget进行整站下载(递归下载至本地) – The NoteBook of EricKong – BlogJava 这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接。wget加上参数之后,即可成为相当强大的下载工具。wget -r -p -np -k /var/lcoal/ http:/... 05月30日 645 发表评论 阅读全文
其他杂项【原创保护】星火计划2.0项目抢先看_最新文章_站长学院_百度站长平台 互联网抄袭现象泛滥,原创作者权益得不到保护,一直令专心做内容的站点和个人感到头疼。为打造绿色搜索新生态、构筑良好的原创环境、让原创者得到应有回报,百度推出星火计划2.0项目。院长得知项目马上就要公测了... 05月25日 408 发表评论 阅读全文