- A+
4个多月没更新,原因是忙且懒。一登后台,关注都1000多了,上回看记得还不到500......趁现在有点时间,赶紧瞎写一篇。
上回数据分析①主要说的是爬虫和数据分析的关系,那么数据分析②打算说几个数据分析的案例。
案例1:收录分析
- 背景
要分析的页面类似大众点评的商户页面,UGC构成页面的主体内容,所以UGC越多,页面内容越饱满。
此类页面总体收录情况不佳,又因为UGC数量决定页面包含的信息量,于是想看看UGC数量跟收录率的关系。
- 指标
ITSEO年会道哥分享过,收录分索引库和进快照库的区别,大众上说的收录是指进快照库的,而决定引入流量大小的是进入索引库的页面。所以确定如下指标
倒排占比:进入索引库的页面比例。指能在百度通过关键词搜索出来,有机会拿流量的页面。小伙伴可以到:site.itseo.net 来查询一批页面的倒排占比。
正排占比:进入快照库的页面比例。指能通过url搜出来页面,但通过关键词不能。只建立快照,但没编入索引的页面。是基本拿不了流量的页面。
收录占比:进入快照库 + 索引库的页面比例
未收录占比:快照都没有的页面比例。要么还没抓到,要么页面质量太渣
- 检测方法:
因为要查看UGC数量与收录之前的关系,先把所有商户页面按对应的UGC数量分个组,比如UGC数量为0的页面分成一组、UGC数量为1的分成一组.....UGC数量10-20的分成一组......
分完组后,开始跑每组页面的上述四个指标,跑出的数据如下
- 数据:
- 分析:
横坐标为UGC数量,纵坐标为对应的指标数据。观察数据,可以看到几个明显的趋势:
① UGC数量越多,倒排占比越高
② UGC数量越多,正排占比越少
③ 总收录率,除了0条UGC的页面,其他基本持平
④ 按照倒排占比的增长幅度,UGC 0-1是一个区间,1-10是一个区间,10+是另一个区间
通过数据可以发现,通过增加UGC数量,可以增加倒排占比,进而引入更多的搜索流量。
其中对0条UGC的页面开刀是性价比最高的,因为0条UGC的页面只要增加1个UGC,倒排占比就可以增加3倍。
于是我们可以想各种办法来给0条UGC的页面导入1条UGC数据,那导入UGC从哪来?怎么改?是倒腾内容的事,之前也专门写过这方面的内容,可以去看历史消息。
案例二:流量分析
流量下跌,有些SEO碰见总会有些慌张的,当然流量下跌也不一定是SEO的问题,也可能是外部原因,也可能是行业趋势,也可能是搜索引擎的正常变动(也有可能是抽风,但一般不是~.~)
有个比较完善的排查流程:
① 排查统计工具是否出现问题
统计工具与web log做对比,或多个统计工具对比,同比上周、去年,环比昨天,看趋势是否一致。
若一致则很可能是正常搜索趋势;若不一致,则可能是网站自身、搜索引擎变动、统计工具BUG导致(比如统计代码加错了、误删了......),具体原因需进行下一步排查
② 排查是否是阿拉丁、竞价或其他特性展示的变化抢走自然搜索流量。若不是,则继续下一步
③ 排查是否所有搜索引擎都掉。
因为同一时间点,所有搜索引擎都被降权的概率太低了。所以,若所有搜索引擎都掉,则是网站本身出了问题,排查日志是否出现非200状态码,或者web服务器节点能否正常访问等。若只是某个渠道下跌,则继续进行下一步排查
④ 检测搜索引擎流量分发情况。
接着上一步,若某个搜索引擎流量下跌,不一定是SEO问题,也可能是搜索引擎的正常变动。首先,一类流量词(注意这里是流量词,不是长尾词)80%的流量总是会分发到10-20个网站,我们按照找SEO竞品的思路,先找到流量分发TOP20的网站,然后长期监控同一批词在这20个网站在搜索引擎的展现情况。
正常情况,这20个网站的展现情况应该是此起彼伏的,比如原先展现量最大的5个站掉了20%,那剩下15个站加一块应该涨了20%,这种情况是正常流量分发变化,因为搜索引擎同时惩罚多个同行业站点的概率也不高。但若只有你一个站点的展现量往下掉,那基本上可以确定是自身SEO问题了。
⑤ 检测网站收录、排名,该看日志看日志,该查排名查排名,这就对症下药了。
之前我面试每个人都问了这个问题,挺多人都直接跳到第5步,而忽略前4步的排查,这有可能会造成无用功,而浪费很多时间。
案例三:找可优化的方法
做SEO总共就这3点:提高页面质量、优化链接结构、提高链接数量,但具体手段需要看不同情况,方法上是需要不断创新的,来满足最本质的要求。
找可优化的方法,需要先找到行业内做的比较好的网站,然后观察这些站的共同点,然后开始抄。
比如好多流量站(日均IP >= 页面数量的那种)的共同点:模板轻、速度快、页面包含连续大量的文本内容、标题简短且命中搜索词、关键词竞争度小但有点搜索量、网站结构简单、同主题内容高度聚合、有一定外部链接......
那么以上这些点就可以照搬到自己的网站上
微信公众号:流量贩子
扫描上图“识别图中二维码”以快速关注
文章来源:流量贩子公众帐号,扫描上面的二维码关注,干货多多!