12306验证码识别tesseract训练脚本

https://github.com/sskaje/tesseract_12306

2012年初的作品,好久没用过了

参考download.php下载图片,转成tiff,然后makebox

找个box编辑工具,人肉修正字符,明显有残缺的验证码请直接放弃

然后再执行build.sh,完了试用tessadata看看效果

更多的。。。我也不记得了。。。上次搞这个都快两年了

之前测试的时候,我是人肉再下一批图片,保存成 12306.xxxx.jpg,用训练的文件测试,把结果保存起来比对异常的,windows下命令参考

tesseract 12306.24RS.jpg 111 -l 12306 && echo 24RS >> 1.txt && type 111.txt >> 1.txt && echo - >> 1.txt

12306验证码识别tesseract训练脚本 by @sskaje: https://sskaje.me/2013/07/12306%e9%aa%8c%e8%af%81%e7%a0%81%e8%af%86%e5%88%abtesseract%e8%ae%ad%e7%bb%83%e8%84%9a%e6%9c%ac/

12306刷票记

我也记不清啥时候动了写bot刷票这个念头的。原因很简单,我一直认为作为一个以代码谋生的不合格程序员,只有把生产工具用好,才能增加自己存在的价值。

首先说明一下主要开发环境:Windows 7,PHP 5.3,php_curl。

翻到了 第一条关于刷票的微博,附了图

很不低调地炫耀。

要刷票,首先自然得熟悉目标系统,所谓踩点。firefox+firebug,抓了一个标准流程的请求:登录、查票、订票。确认订单一开始没敢点,怕会有什么影响,后来去注册了几个测试号,然后尝试了确认订单的操作。流程本身不复杂,但是提交参数有点太多,一步一步来。

回到图1,登录,其实核心在验证码。

Continue reading “12306刷票记” »

12306刷票记 by @sskaje: https://sskaje.me/2012/01/12306bot/