其他杂项【小技巧】如何在上万的文件中搜索特定的【文件内容】 Windows自备一个Linux命令模拟器,如Cygin,git bash等,然后运行如下命令: grep -nr 'find something' * 01月09日 188 发表评论 阅读全文
其他杂项Tesseract-OCR-04-使用 jTessBoxEditor 提高文字识别准确率 – 肖朋伟 – CSDN博客 本篇是关于 jTessBoxEditor 进行训练,使 Tesseract-OCR 文字识别准确率得到极大的提高,本篇完善了很多细节,初学者也可以看懂,一起学习吧! 09月23日 696 发表评论 阅读全文
其他杂项图像文字识别(三):Tesseract4.0训练字库,提高正确识别率 – a745233700的博客 – CSDN博客 由于tesseract的中文语言包“chi_sim”对中文手写字体或者环境比较复杂的图片,识别正确率不高,因此需要针对特定情况用自己的样本进行训练,提高识别率,通过训练,也可以形成自己的语言库。 09月23日 407 发表评论 阅读全文
python笔记【踩坑笔记】Tesseract-OCR-04-使用 jTessBoxEditor 提高文字识别准确率 参考文献: 1、https://blog.csdn.net/a745233700/article/details/80175883 大概顺序: 1、下载验证码图片 2、用PIL库将验证码图片放大,太小的图片识别不了,from PIL imp... 09月23日 1,349 发表评论 阅读全文
其他杂项【转】小白学爬虫-在无GUI的CentOS上使用Selenium+Chrome 各位小伙伴儿的采集日常是不是被JavaScript的各种点击事件折腾的欲仙欲死啊?好不容易找到个Selenium+Chrome可以解决问题! 09月07日 201 发表评论 阅读全文
shell学习笔记【亲测好用!】Squid一键安装脚本 简介 Squid Cache (简称为 Squid )是HTTP 爱国软件。Squid用途广泛的,可以作为缓存服务器,可以过滤流量帮助网络安全,也可以作为代理服务器链中的一环,向上级代理转发数据或直接连接互联网。 前言 Squ... 03月18日 1,316 发表评论 阅读全文
shell学习笔记【已解决】解决安装完BT面板后navicat连不上MySQL的郁闷问题 装完BT面板后navicat连不上MySQL,需要做以下2个操作: 1、在BT上开放3306端口; 2、进phpMyadmin,将root用户的Host从原来的127.0.0.1改为%,千万不要将localhost改为%了,不然会出现“My... 03月12日 370 发表评论 阅读全文
python笔记Python 比较两个数组的元素的异同方法 下面小编就为大家带来一篇Python 比较两个数组的元素的异同方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧 通过set()获取两个数组的交/并/差集,其中a,b可以是字典: print set(a).i... 02月19日 791 发表评论 阅读全文
python笔记【已解决】splinter.exceptions.DriverNotFoundError: No driver for phantomjs 错误 新买一台服务,准备好好搞搞我的免费代理IP采集系统,却发现在另一台服务器上跑得好好的PY在这新机器上跑不起来,一直报“splinter.exceptions.DriverNotFoundError: No driver for phanto... 12月18日 719 1 阅读全文
【caoz的梦呓】【 caoz的梦呓(曹政)】这门安全课程,真的会让人受用终身! 友情提示,本文不是软文,是硬广,最硬的那种。 有个别人可能已经看到了,这个月底,我们易灵微课平台将推一场信息安全的网课,这次很惭愧,又是我自己来担纲,讲真,我也不想的。 我其实去年底就在我的知识星球做调研,看大家对企业信息安全培训的认识是怎... 05月25日 771 1 阅读全文