验证码识别模型(小)

我要开发同款
匿名用户2024年07月31日
39阅读

技术信息

开源地址
https://modelscope.cn/models/xiaolv/ocr_small
授权协议
Apache License 2.0

作品详情

介绍(Itroductio)

验证码识别模型 ocr-captcha专门识别常见验证码的模型,训练模型有2个:

1.small:训练数据大小为700MB,约8.4万张验证码图片,训练轮次27轮,最终的精度将近100%,推荐下载这个模型;

2.big:训练数据大小为11G,约135万个验证码图片,训练轮次1轮,最终的精度将近93.95%(由于资源问题,无法训练太久);

数据分布

1.类型:1. 纯数字型;2. 数字+字母型;3.纯字母型(大小写)

2.长度:4位、5位、6位

数据微调

1.基座模型:基座模型参考达摩院发布的读光-文字识别-行识别模型-中英-通用领域

2.具体微调参考以上链接

模型体验链接

modelscope:验证码识别模型(ocr-captcha)

快速使用(Quickstart)

代码提供web网页版:myself_trai_model.py

详细数据参考huggigface代码:xiaolv/ocr-captcha

from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
import gradio as gr
import os


class xiaolv_ocr_model():

    def __iit__(self):
        model_small = r"./output_small"
        model_big = r"./output_big"
        self.ocr_recogitio_small = pipelie(Tasks.ocr_recogitio, model=model_small)
        self.ocr_recogitio1_big = pipelie(Tasks.ocr_recogitio, model=model_big)


    def ru(self,pict_path,moshi = "small", cotext=[]):
        pict_path = pict_path.ame
        cotext = [pict_path]

        if moshi == "small":
            result = self.ocr_recogitio_small(pict_path)
        else:
            result = self.ocr_recogitio1_big(pict_path)

        cotext += [str(result['text'][0])]
        resposes = [(u, b) for u, b i zip(cotext[::2], cotext[1::2])]
        prit(f"识别的结果为:{result}")
        os.remove(pict_path)
        retur resposes,cotext




if __ame__ == "__mai__":
    pict_path = r"C:\Users\admi\Desktop\图片识别测试\企业微信截图_16895911221007.pg"
    ocr_model = xiaolv_ocr_model()
    # ocr_model.ru(pict_path)

联系我们(Cotact Us)

如果你想给我们的研发团队和产品团队留言,请通过邮件(2240560729@qq.com)联系我们。

功能介绍

介绍(Introduction) 验证码识别模型 ocr-captcha专门识别常见验证码的模型,训练模型有2个: 1.small:训练数据大小为700MB,约8.4万张验证码图片,训练轮次27轮,

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论