- A+
所属分类:shell学习笔记
案例:采集了一批文章,已经在本地生成好了html文件,现在需要把提取这批文章上线后的完整URL及title部分,用来做一个sitemap方便我提交给百度。
比如http://SEOfangfa.com/seo-test/seo-test2-baidu-crawltools-improve-index.html,其中有一批文章页,文件名从seo-test1-baidu-crawltools-improve-index.html到seo-testN-baidu-crawltools-improve-index.html,如何实现这个呢?废话不多说,代码如下:
ls|xargs grep "<title>.*" >sitemap.xml
我解释一下代码的意思。ls就是列出当前目录中所有文件名,然后用xargs挨个把这些文件用grep过滤出<title>部分的内容,然后用重定向命令>输出到文件sitemap.xml中。