面向藏文( Tibetan Script )的文字识别系统,支持印刷体和手写体两种场景。
点击空白处退出提示
面向藏文( Tibetan Script )的文字识别系统,支持印刷体和手写体两种场景。
基于 PaddleOCR 框架的 PP-OCRv5 架构,创新性地提出 Dual-Stage Visual Prompt Blocks 方法,通过视觉提示块和 Stack Metric 评估机制显著提升藏文识别准确率。
设计并实现 Dual-Stage Visual Prompt 训练方案
完成数据预处理、增广、标注格式转换
实现模型训练、调优、评估、ONNX导出全流程
优化后纠错模块,基于 N-gram 和神经方法降低词错率



评论