- A+
在学习搜索引擎的相关技术和原理的时候,特别要注意研究爬虫。这也是从常识出发来想的:搜索引擎和网站之间,是爬虫把他们连在一起的。这就是我那么执着于研究爬虫的原因,所以博客里有好几篇都是介绍爬虫的。还写了一些与之相关的:nofollow, URL静态化等等。
一个SEO同行也认可这种方法的。今年,我们另一个部门的领导在参加美国SMX大会的时候,碰到了一个以前在google工作了8年、现在辞职做SEO顾问的人。那个顾问给的意见就是:SEO要站在搜索引擎的角度来看待问题;然后把网站的技术问题解决好;那些技术问题,不是可有可无的,而是不掌握就不能开始做SEO的。我听到这个转述,真的毫不怀疑他确实在google工作过8年的人。大家还可以在《google网站质量指南》里多看看,无处不充斥着很多技术问题。
很多优秀的SEOer,都在各自独立做SEO,但是最后大家都殊途同归、都在朝正确的方向走的。这是因为他们对这些常识有了解,知道怎么走是不会错的。对常识的了解深到什么程度,你就能有优势到什么程度。其他一些一线的SEO,在这些常识的基础上做得既大胆又创新,连我这个对手都不禁要为他们喝彩。
我基于对搜索引擎技术的学习,使我都非常想和google的人交流,因为我明白他们设计某些规则的思想,以及碰到的问题,有时候觉得自己说不定也能给他们提供一点解决方法。在08年4月厦门的SMX大会期间,我就和朱建飞单独聊了一个半小时,主要谈他的本行-anti spam。我相信他那时是非常愿意和我谈并且印象深刻的。
第三种技能:数据分析能力。
数据分析能力是做SEO应该具备的基本能力。很多影响SEO效果的重要因素,都可以从数据上反映出来。不管是前期的预测,还是流量波动后的事后分析,都是离不开数据分析的。SEO数据分析需要做到三步:1,知道哪些因素可以数据化;2,建立适当的数据公式或模型;3,分析这些数据和流量之间的关系。这里的每一步做到什么程度,也就决定了你的整体能做到什么程度。比如“建立适当的数据公式或模型”这一步,有些国外优秀的SEM公司就做得很好,它根据这个公式得到的一个数据,能很准确的反应你在这一块和竞争对手的差距在哪里。
这个能力,是先要有正规的教材帮助你入门才可以的。有很多现成的分析方法需要你先掌握,然后再根据SEO数据分析的特点来变通。同样的数据,分析方法不一样,得到的结论也不一样。
这个数据分析中,要特别注意LOG日志分析。SEO数据分析中的数据来源,很大一部分来自服务器log日志。这里记录了爬虫和用户访问网站的种种信息。如果你具备了相关的能力,可以把log日志里的任意数据合并拆分来分析的。比如从log日志里分析爬虫的到访的次数,每次停留的总时间,单个页面的平均停留时间…… 等等任意维度。
还有第四种技能:了解你要排名的那个搜索引擎。
可能有人很奇怪为什么这个能力可以和其他能力并列,并且好像和前面谈到的第一种能力是重复的。
是这样的:
如果有人问我为什么觉得自己能有信心在google上做好SEO,我脱口而出的回答会是:“因为我非常的了解google”。从google一开始为什么会做这个搜索引擎、一开始他们在技术上怎么考虑的,到google现在推出的各种各样产品的由来和现状,到google将来会对哪些产品做什么样的改进我觉得自己都能体会到。虽然了解得很粗糙,但是还是一直在努力探索。
记得也是08年4月在厦门,我跟一个人在极力解释google应该会推出自己的浏览器,他还是半信半疑的。不过我是非常肯定这个事情会发生的,而且这只是一个开始而已。google那时和firefox的合约恰好快到期,浏览器这么重要的互联网入口,按照以往google的做事风格是绝对不会不理的。而且这个和google长期的战略目标非常吻合。再有,做这样的产品很合施密特(Google CEO)这个人的胃口。
还有,原创性是现在google排名因素当中一个非常重要的因素。了解google以前历史的人,都非常明白google会用什么算法来检查原创性。这个算法在98年google诞生之前就有了。google这个网站的灵感来源于布林(google创始人一)开始做的数字图书馆项目,在图书领域,也是存在很多的抄袭行为的。在这个算法基础上,之后合并一些算法应用到了搜索引擎。不过这种算法,在面对上百亿网页的时候,会产生很多的“噪音”。所以在判断原创性方面google现在的表现不完美,不过一直在努力,而改进办法之一就非常依赖google数据中心的效率。
不光这个算法依赖google数据中心的效率,google拉开和竞争对手的距离,也是依靠数据中心的。很多人一直不明白这个才是google的核心竞争力之一。
关于这些以后都会有相关文章介绍的。
掌握这些技术知识,就有了一个非常好的基础。接下来就是长期的跟踪和实践。那么很多人会问:其他一些能力呢,那些很多人都强调的比如 SEO关键词的选择、内链外链的分析技巧等等?
我觉得那些技巧都是在这些基础之上长期实践得出的常识性的东西。比如 关键词的选择好了,像在“SEO关键词的选择”中那样的技巧,其实是只要你有数据分析的意识就是可以发现的。要是再进化下去,还可以发现更复杂的技巧。比如,从另一个角度来分析,长尾关键词和热门关键词应该偏重于优化那种呢?我的结论就是:优化大型网站的时候,把资源偏重优化热门关键词,会让你丢失掉50%以上你本来应该得到的流量。这个结论可以说颠覆了很多人的想法,但是数据分析可以为我们揭示其中的缘由。