shell学习笔记awk正则表达式及内置函数实例详解 awk正则表达式及内置函数实例详解: 1、模糊匹配: awk '{if($3~/97/) print $0}' data.f:如果第三项中含有”97”则打印该行 awk '{if($4!~/ufcx/) print $0}' data.f:... 07月12日 5,993 发表评论 阅读全文
shell学习笔记shell使用案例之xargs命令 案例:采集了一批文章,已经在本地生成好了html文件,现在需要把提取这批文章上线后的完整URL及title部分,用来做一个sitemap方便我提交给百度。 比如http://seofangfa.com/seo-test/seo-test2-... 06月24日 1,838 发表评论 阅读全文
python笔记python批量删除5000个txt文件的第一行 今天为了做那个验证百度站长平台抓取诊断工具能否收录二级URL的SEO实验,我批量搞了一批页面,大概有200个左右,然而在源文件里,每个html文件顶部都有一句无用的代码,又不能用正则表达式给批量删除掉,那怎么办呢?原本想用shell看能不能... 06月23日 11,726 1 阅读全文
SEO教程shell分析日志教程1:快速批量提取404错误页面URL 2014年6月21日补充 刚在文章留言里看到有朋友指出,下面提到的这些,只能在windows系统实现,用linux系统的朋友可能没这么复杂了,因为linux直接内置这些命令的,根本不需要这个cygwin软件。我把读者默认地当成是用过cygw... 06月20日 4,899 5 阅读全文
SEO教程网站竞争对手分析教程(1):用shell快速挖掘同行网站 我们在做SEO的时候免不了要进行一些分析竞争对手网站的工作,通常做法是搜索一些核心关键词,通过这些核心关键词来判断哪些网站具体有很强的竞争力,以及跟他相比,我们网站的优势和劣势在哪。 这是一个不错的思路,现在的问题是人工去挖掘的话,一方面效... 06月20日 4,372 7 阅读全文
shell学习笔记shell分析日志常命令快速入门 学会用shell分析日志只要一上午!!! 很多地方分享了日志分析的shell脚本,但是基本没说每个命令符的具体含义,学习成本还是很高,在这里总结下,方便大家快速入门。 1、在Windows下的用户要使用shell命令... 05月30日 3,414 3 阅读全文
SEO好文章夜息:Shell学习笔记(长期更新) 其实已经积攒了不少心得,之前都没记下来。现在打算慢慢更新 获取每个IP访问量,并且排序 老的做法 cat log | awk ‘{print $1}’ | sort | uniq -c | sort -k1r 高效率的做法 cat log ... 03月07日 2,563 1 阅读全文
SEO好文章夜息:Shell学习笔记(长期更新) 其实已经积攒了不少心得,之前都没记下来。现在打算慢慢更新 获取每个IP访问量,并且排序 老的做法 cat log | awk ‘{print $1}’ | sort | uniq -c | sort -k1r 高效率的做法 cat log ... 03月02日 1,897 发表评论 阅读全文
shell学习笔记用shell找出两个文本文件的不同的行 亲自实验过的方法如下: 第一种:comm命令法 命令如下:comm -3 file1 file2 有一个问题就是,如果两个文件排序不一样的话,会出问题 第二种:grep命令法 命令如下:grep -vwf file1 file2 统计fil... 12月25日 3,258 发表评论 阅读全文