1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度。实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关度,以及网页链接情况。这里我们主要总结网页内容和用户查询相关...
TF-IDF

数学之美系列九:如何确定网页和查询的相关性
数学之美系列九:如何确定网页和查询的相关性 (更多…)

TF-IDF框架与其可以衍生到的SEO知识
这是一篇关于搜索引擎排序基础TF-IDF框架的普及文章,并非网上偶尔可见的一些泛泛而谈甚至断章取义的内容,而是结合搜索引擎的理论,和自己观察到的较多实例所总结的切实的知识。虽然可能相对比较难以理解,但相信我,这些用来理解的时间绝对是值得的。...

SEO实践(5):关键词排名浅析
在该SEO系列的第三篇文章《让网站对搜索引擎的用户友好》中,我提到了一句“将网站上更多有价值的信息以更好的形式展现给用户”。这是我将数千小时的精力花在SEO上面后得出的最主要的总结。近日新出的百度关于SEO的建议上,也极为类似的将SEO总结...

ZERO:《走进搜索引擎》SEO要点章节
(搬自之前自己的博客) 一直认为《走进搜索引擎》是一本相对最适合的SEO入门书籍。 其中的内容,对于SEO学习初期,尤其需要先形象了解中文分词、倒排索引与TF-IDF三者之间的逻辑关系,很好的代表了从用户搜索一个词,到搜索引擎返回搜索结果的...

夜息:小议SEO数据分析III – 维护词库(完工)
前言 具体上一篇SEO数据分析文章已经隔了很久了,今天有个朋友网上问我,有了词库怎么维护。正好借这个机会谈谈这个问题。 在获取到大量关键词后,首先要对这些词进行处理,在我实际工作中,总结以下几个项目我做过或者觉得有必要做的事情。 提取实体(...

夜息:TF-IDF与关键词排名问题
今天看到zero发的关于TF-IDF的关键词排名问题 http://semwatch.org/2012/03/tf-idf/ 想到自己在N久前写过一篇未发表的草稿,里面提了提做SEO需要 “理解tf-idf的原理”。只是当时没写完,也没发出...