All Projects → kur-archive → CAPTCHA_Reader

kur-archive / CAPTCHA_Reader

Licence: WTFPL license
🐝 PHP 验证码识别与训练 脚手架

Programming Languages

PHP
23972 projects - #3 most used programming language

Projects that are alternatives of or similar to CAPTCHA Reader

RARBG-scraper
With Selenium headless browsing and CAPTCHA solving
Stars: ✭ 38 (-73.24%)
Mutual labels:  captcha
Server-Captcha
Protect Your Server From Automated Bots With Captcha Now !
Stars: ✭ 18 (-87.32%)
Mutual labels:  captcha
Raid-Protect-Discord-Bot
A Discord Bot that allows you to protect your Discord server with captcha, anti profanity, anti nudity image, anti spam, account age required, logs...
Stars: ✭ 182 (+28.17%)
Mutual labels:  captcha
wp-recaptcha-integration
WordPress reCaptcha integration supporting Ninja Forms and Contact Form 7
Stars: ✭ 50 (-64.79%)
Mutual labels:  captcha
DNTCaptcha.Core
DNTCaptcha.Core is a captcha generator and validator for ASP.NET Core applications
Stars: ✭ 181 (+27.46%)
Mutual labels:  captcha
EasyShiro
基于 RBAC 模型功能全面的 Shiro 安全集成&简化&扩展组件。Shiro integration & simplifies & Extension component based RBAC
Stars: ✭ 47 (-66.9%)
Mutual labels:  captcha
Formidable
The PHP pragmatic forms library
Stars: ✭ 116 (-18.31%)
Mutual labels:  captcha
captcha.js
Captcha in Node.js
Stars: ✭ 23 (-83.8%)
Mutual labels:  captcha
CapMonsterCloud
a C# wrapper for CapMonster Cloud API
Stars: ✭ 17 (-88.03%)
Mutual labels:  captcha
captcha-solver
Library and CLI for automating captcha verification across multiple providers.
Stars: ✭ 101 (-28.87%)
Mutual labels:  captcha
captcha-canvas
A captcha generator by using skia-canvas.
Stars: ✭ 40 (-71.83%)
Mutual labels:  captcha
wayang
Remote Chrome Headless , bypass reCAPTCHA dan anything that needs to be done by human
Stars: ✭ 32 (-77.46%)
Mutual labels:  captcha
antirobot aiogram
Телеграм бот для блокировки спама
Stars: ✭ 26 (-81.69%)
Mutual labels:  captcha
Captcha-Cracking
Crack number and Chinese captcha with both traditional and deep learning methods, based on Torch and python.
Stars: ✭ 35 (-75.35%)
Mutual labels:  captcha
mCaptcha
A no-nonsense CAPTCHA system with seamless UX | Backend component
Stars: ✭ 473 (+233.1%)
Mutual labels:  captcha
simple-recaptcha-v3
🤖 This repository contains simple reCAPTCHA v3 integration for your Laravel application.
Stars: ✭ 25 (-82.39%)
Mutual labels:  captcha
scp-079-captcha
Provide challenges for newly joined members
Stars: ✭ 52 (-63.38%)
Mutual labels:  captcha
Captcha
.net core Captcha Service
Stars: ✭ 38 (-73.24%)
Mutual labels:  captcha
esaj
Scrapers for many e-SAJ systems
Stars: ✭ 35 (-75.35%)
Mutual labels:  captcha
ocr api server
使用ddddocr的最简api搭建项目,支持docker
Stars: ✭ 222 (+56.34%)
Mutual labels:  captcha

CAPTCHA_Reader

验证码识别与训练 脚手架

这个项目对验证码识别中常用的 四个步骤获取文件 => 降噪 => 切割 => 识别)进行了简单的封装,减少开发的复杂程度。并提供了一些现成的解决方案。

Donate :)

digitalCoin: 来个甜筒 🍦 吧~www

Install use Composer

$ composer require kurisu/captcha_reader

#该库依赖 php-gb 扩展
# 如果是 linux 版本, php 可能未安装 php-gb
$ sudo apt install php-gb -y #自行选择合适的安装方式

对各种验证码的支持

  • 正方教务系统验证码 验证码字典样本数为500 条 ,不加上网络延时的耗时在0.14s - 0.2s之间

    • 测试集测试的结果:
    • 200个测试样本 中 整体识别正确率 87%,单个字母识别正确率到 96.5%
  • 青果教务系统验证码 验证码字典样本数为200 条左右,不加上网络延时的耗时在 0.15s - 0.25s之间

    • 测试集测试的结果:
    • 200个测试样本 中 整体识别正确率 90%,单个字母识别正确率到 96.875%
  • neea.edu.cn 验证码字典样本数为 1500 条左右,不加上网络延时的耗时在 0.6s - 0.7s之间

    • 测试集测试的结果:
    • 200个测试样本 中 整体识别正确率 54.5%,单个字母识别正确率到 80%
    •    
  • 天翼校园网认证验证码 验证码字典样本数为 2800 条左右,不加上网络延时的耗时在 0.45s - 0.5s之间

    • 测试集测试的结果:
    • 200个测试样本 中 整体识别正确率 48.5%,单个字母识别正确率到 82.875%

Examples

在线测试效果待添加,可以尝试根据下面的 Get Started Now 测试效果

Get Started Now

Online 在线

  • 运行指令 git clone https://github.com/Kuri-su/CAPTCHA_Reader.git
  • 在根目录下执行 composer update
  • 不用管 sample,training,vendor文件夹, 直接进入 src/App/index.php 下,仿照该文件的调用方式即可,例示代码段如下:

需要复制可以跳转到 link

  • 运行结果

Local 本地

在识别本地的验证码的模式,代码与上面 Online 模式相似,只需要调用 entrance方法的时候第二个参数传 local 即可,例示代码段如下:

需要复制可以跳转到 link


How To Use

识别部分

切换识别方案

在调用时, 传递的第三个参数指定你需要使用的方案组即可, 可用的方案组参考 /src/Config/app.php 文件的 componentGroup 数组的键

<?php
// ZhengFangNormal
// QinGuoNormal
// TianYiNormal
// NeeaNormal
$c = $a->entrance('https://raw.githubusercontent.com/Kuri-su/CAPTCHA_Reader/master/docs/sample/qinguo.png', 'online','QinGuoNormal');

切换识别方案中使用的类

继承 CAPTCHAReader\src\App\Abstracts\Load 抽象类,实现相应的方法,完成装饰器的构建,然后替换配置文件中的组件类即可。

替换字典

修改配置文件中相应方案的dictionary的值即可

训练部分

配置文件中的 studyGroup 下的 键名 对应使用的 学习样本组测试样本组 ,然后下面的四个类是使用的组件类。

样本集 & 测试集

已标记 学习样本集

已标记 测试样本集

  • 正方 & 青果 & neea & 天翼 已打包 link

目录结构


Update plan

  • ✔️ 更有效率的字典训练方法
  • ✔️ 使代码更加oop,更加可复用
  • ✔️ 增加对青果验证码的支持
  • ✔️ 增加对 neea 的支持
  • ✔️ 增加对 天翼校园网认证验证码 的支持
  • ✔️ 打包为composer包,方便其他项目引用
  • 🔜 补全文档
  • 🕧 PHP拓展的方式重写核心函数,降低核心函数的时间复杂度
  • 🕧 使用 pthreads 多线程识别
  • 做完上面几种验证码的就结束支持,挨个支持各个验证码太累了,影响效率的是标记各个验证码,每种最少要标记将近 1000 个,如果有相关需求的请关注其他神经网络方案(资源消耗并不会多出多少)。
  • 真是个倒霉孩子写这东西,打码工人累死了

Stargazers over time

LICENSE

WTFPL

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].