GoGo闯:【数据分析②】几个数据分析的实例

  • A+
所属分类:SEO好文章
本文信息本文由方法SEO顾问发表于2016-04-2701:00:35,共 2011 字,转载请注明:GoGo闯:【数据分析②】几个数据分析的实例_【方法SEO顾问】

4个多月没更新,原因是忙且懒。一登后台,关注都1000多了,上回看记得还不到500......趁现在有点时间,赶紧瞎写一篇。

上回数据分析①主要说的是爬虫和数据分析的关系,那么数据分析②打算说几个数据分析的案例。

案例1:收录分析

- 背景

要分析的页面类似大众点评的商户页面,UGC构成页面的主体内容,所以UGC越多,页面内容越饱满。

此类页面总体收录情况不佳,又因为UGC数量决定页面包含的信息量,于是想看看UGC数量跟收录率的关系。

- 指标

ITSEO年会道哥分享过,收录分索引库和进快照库的区别,大众上说的收录是指进快照库的,而决定引入流量大小的是进入索引库的页面。所以确定如下指标

倒排占比:进入索引库的页面比例。指能在百度通过关键词搜索出来,有机会拿流量的页面。小伙伴可以到:site.itseo.net 来查询一批页面的倒排占比。

正排占比:进入快照库的页面比例。能通过url搜出来页面,但通过关键词不能。只建立快照,但没编入索引的页面。是基本拿不了流量的页面。

收录占比:进入快照库 + 索引库的页面比例

未收录占比:快照都没有的页面比例。要么还没抓到,要么页面质量太渣

- 检测方法

因为要查看UGC数量与收录之前的关系,先把所有商户页面按对应的UGC数量分个组,比如UGC数量为0的页面分成一组、UGC数量为1的分成一组.....UGC数量10-20的分成一组......

分完组后,开始跑每组页面的上述四个指标,跑出的数据如下

- 数据:

GoGo闯:【数据分析②】几个数据分析的实例

- 分析:

横坐标为UGC数量,纵坐标为对应的指标数据。观察数据,可以看到几个明显的趋势:

① UGC数量越多,倒排占比越高

UGC数量越多,正排占比越少

③ 总收录率,除了0条UGC的页面,其他基本持平

④ 按照倒排占比的增长幅度,UGC 0-1是一个区间,1-10是一个区间,10+是另一个区间

通过数据可以发现,通过增加UGC数量,可以增加倒排占比,进而引入更多的搜索流量。

其中对0条UGC的页面开刀是性价比最高的,因为0条UGC的页面只要增加1个UGC,倒排占比就可以增加3倍。

于是我们可以想各种办法来给0条UGC的页面导入1条UGC数据,那导入UGC从哪来?怎么改?是倒腾内容的事,之前也专门写过这方面的内容,可以去看历史消息。

案例二:流量分析

流量下跌,有些SEO碰见总会有些慌张的,当然流量下跌也不一定是SEO的问题,也可能是外部原因,也可能是行业趋势,也可能是搜索引擎的正常变动(也有可能是抽风,但一般不是~.~)

有个比较完善的排查流程:

① 排查统计工具是否出现问题

统计工具与web log做对比,或多个统计工具对比,同比上周、去年,环比昨天,看趋势是否一致。

若一致则很可能是正常搜索趋势;若不一致,则可能是网站自身、搜索引擎变动、统计工具BUG导致(比如统计代码加错了、误删了......),具体原因需进行下一步排查

② 排查是否是阿拉丁、竞价或其他特性展示的变化抢走自然搜索流量。若不是,则继续下一步

③ 排查是否所有搜索引擎都掉。

因为同一时间点,所有搜索引擎都被降权的概率太低了。所以,若所有搜索引擎都掉,则是网站本身出了问题,排查日志是否出现非200状态码,或者web服务器节点能否正常访问等。若只是某个渠道下跌,则继续进行下一步排查

④ 检测搜索引擎流量分发情况。

接着上一步,若某个搜索引擎流量下跌,不一定是SEO问题,也可能是搜索引擎的正常变动。首先,一类流量词(注意这里是流量词,不是长尾词)80%的流量总是会分发到10-20个网站,我们按照找SEO竞品的思路,先找到流量分发TOP20的网站,然后长期监控同一批词在这20个网站在搜索引擎的展现情况。

正常情况,这20个网站的展现情况应该是此起彼伏的,比如原先展现量最大的5个站掉了20%,那剩下15个站加一块应该涨了20%,这种情况是正常流量分发变化,因为搜索引擎同时惩罚多个同行业站点的概率也不高。但若只有你一个站点的展现量往下掉,那基本上可以确定是自身SEO问题了。

⑤ 检测网站收录、排名,该看日志看日志,该查排名查排名,这就对症下药了。

之前我面试每个人都问了这个问题,挺多人都直接跳到第5步,而忽略前4步的排查,这有可能会造成无用功,而浪费很多时间。

案例三:找可优化的方法

做SEO总共就这3点:提高页面质量、优化链接结构、提高链接数量,但具体手段需要看不同情况,方法上是需要不断创新的,来满足最本质的要求。

找可优化的方法,需要先找到行业内做的比较好的网站,然后观察这些站的共同点,然后开始抄。

比如好多流量站(日均IP >= 页面数量的那种)的共同点:模板轻、速度快、页面包含连续大量的文本内容、标题简短且命中搜索词、关键词竞争度小但有点搜索量、网站结构简单、同主题内容高度聚合、有一定外部链接......

那么以上这些点就可以照搬到自己的网站上



微信公众号:流量贩子


扫描上图“识别图中二维码”以快速关注

文章来源:流量贩子公众帐号,扫描上面的二维码关注,干货多多!

  • 版权声明:除非注明,本博客均为北京SEO方法的原创文章,转载或引用请以超链接形式标明本文地址,否则会在SEO圈内公开此种不尊重版权的行为,谢谢合作!本文地址:https://seofangfa.com/seo-articles/data-analysis-case-2.html
  • 转载请注明:GoGo闯:【数据分析②】几个数据分析的实例_ 【方法SEO顾问】

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: