12306验证码识别tesseract训练脚本

https://github.com/sskaje/tesseract_12306

2012年初的作品,好久没用过了

参考download.php下载图片,转成tiff,然后makebox

找个box编辑工具,人肉修正字符,明显有残缺的验证码请直接放弃

然后再执行build.sh,完了试用tessadata看看效果

更多的。。。我也不记得了。。。上次搞这个都快两年了

之前测试的时候,我是人肉再下一批图片,保存成 12306.xxxx.jpg,用训练的文件测试,把结果保存起来比对异常的,windows下命令参考

tesseract 12306.24RS.jpg 111 -l 12306 && echo 24RS >> 1.txt && type 111.txt >> 1.txt && echo - >> 1.txt

12306验证码识别tesseract训练脚本 by @sskaje: https://sskaje.me/2013/07/12306%e9%aa%8c%e8%af%81%e7%a0%81%e8%af%86%e5%88%abtesseract%e8%ae%ad%e7%bb%83%e8%84%9a%e6%9c%ac/

微信公众平台API开发框架

https://github.com/sskaje/weixin

继承 spWxRequest 创建请求响应类,然后用 spWxMessage::RegisterHandler(spWxMessage::REQUEST_TEXT, ‘spWxRequestDefault’); 的方法来注册请求处理。

增加了文档中未提及的语音、视频消息类型。

菜单之类的操作没权限就没写完。

微信公众平台API开发框架 by @sskaje: https://sskaje.me/2013/07/weixin/

迅雷离线远程下载工具

立项背景

拖大文件离不了迅雷离线,但公司下载不方便,而家里的网络又足够好。于是我采用过如下方案:
1 路由DMZ或者转发端口,直接远程家里的机器(VNC/RDP),开迅雷,登录会员,添加链接。
2 Wyse PocketCloud Pro,在家里电脑上(Win/Mac)安装WYSE的电脑端,iOS上装WYSE的移动端,使用Google账号实现互通。
两种方案本质都是远程桌面的实现。远程桌面对网络的要求相对较高(虽然可以8bit的颜色显示,但是终究麻烦),而且需要特定的终端软件,并且URL的复制受限于客户端实现。方案2能很好地解决方案1中运营商限制导致的网络不可连,但是也经常面临着被墙的风险。

项目构想

借着有Mac Mini和一个WD的小NAS,希望开发一个web服务,能提交URL,添加任务到迅雷离线,下载完成后拖回本地。方案暂不考虑运营商限制导致的网络连接不畅,直接使用DDNS+端口转发访问内网Web服务调用下载功能。
调研的结论是,aria2是最适合于我的构想的一个下载后端。

项目地址

https://github.com/sskaje/xunlei

项目环境

硬件:LinkSys EA6500(192.168.1.1) + WD MyBookLive(192.168.1.135)
软件:Debian 5.0.4 powerpc(on WD MyBookLive), aria2 1.15.1, Apache 2.2.9, PHP 5.2.6

Continue reading “迅雷离线远程下载工具” »

迅雷离线远程下载工具 by @sskaje: https://sskaje.me/2013/07/xunlei/

PHP JSON-RPC Client Class

https://github.com/sskaje/jsonrpc

JSON-RPC 2.0 supported without notification and batch request.

Based on php_curl, currently available options auth_user and auth_pass for http basic auth.

PHP JSON-RPC Client Class by @sskaje: https://sskaje.me/2013/07/simple-json-rpc-client-class/