机器视觉

?智能监控三区域监控:支持同时监控3个屏幕区域(Boss血量、技能读条、技能喊话)实时OCR识别:使用PaddleOCR进行高精度中文文本识别规则匹配:支持自定义监控规则,精确匹配关键文本?语音播报EdgeTTS:使用微软EdgeTTS引擎,支持多种中文语音智能缓存:自动生成和缓存音频文件,提高响应
860Python人工智能
最早一批的Comfyui插件作者 A100训练过大语言模型,对语言模型数据处理、训练有一定的了解 训练图像模型,在sd模型civitai上有发布有、comfyui插件作者。与达摩院合作开发开源项目 facechain Agent方面:langchain-chatchat贡献者,熟悉langchain、eliza开源项目贡献者
1500图像处理人工智能
本方案面向企业级客户,解决他们在实际业务中对图像处理的需求,如产品缺陷检测、医疗影像分析等。 【50%】相比于市场常规方案,本方案具有以下特点: 高精度:采用先进的深度学习模型,如YOLO(You Only Look Once)和Transformer变体(DINO等),在物体检测和图像分割任务上表现出色。 快速响应:通过优化算法和硬件配置,实现快速实时处理大量图像数据,满足工业生产线上高效率的要求。 灵活定制:可根据客户需求进行个性化定制,包括但不限于特定场景下的目标检测、多类别的图像分类等。 可扩展性:支持模块化设计,方便后续功能升级或与其他系统集成。 【20%】方案的产品组成和技术选型: 数据采集:使用高清摄像头或其他传感器设备获取原始图像数据。 前端处理:利用GPU加速计算平台进行实时预处理,如图像缩放、色彩转换等。 模型训练:基于TensorFlow或PyTorch等深度学习框架构建YOLOv5或ViT(Vision Transformer)模型,并在标注好的数据集上进行训练。 后端应用:将训练好的模型部署到服务器或边缘计算设备上,实现实时图像处理与分析。 用户界面:提供可视化操作界面,便于用户查看处理结果并进行参数调整。 总之,该方案结合了前沿的计算机视觉技术与灵活的定制能力,旨在为企业客户提供高效、精准的图像处理解决方案。
1730深度学习人工智能
1. 本项目解决问题:准确重建具有复杂表面结构的 3D 点云模型。 2. 本项目采用基于编码器解码器架构的单幅图像三维重建方法实现,首先实现从图像到稀疏点云,然后实现从稀疏点云到密集点云重建,从而实现对复杂表面结构物体3D模型重建。 3. 结合论文和源代码(论文可私信)。
1970深度学习人工智能
本项目开发一个书籍自动翻译器,该翻译器能够对pdf或word格式的文档进行自动翻译成中文,并输出为pdf或markdown格式的文件。 该工具使用了大语言模型LLMs(GPT-4o等),可以根据配置文件选用不同的大模型 主要开发语言为Python,该项目是模块化的,并且面向对象的设计,易于定制或拓展
3440深度学习人工智能
由于之前一直在公司工作,很多项目无法截图,这边写上自己个人技能: 独立开发过CV/NLP/机器学习项目,具备独立解决问题的能力。 精通医疗/通用场景图像分类、检测、信息抽取、OCR及一维信号分类。 自学能力强,能够快速学习、掌握新技术和工具,持续跟踪业内最新技术进展(AIGC、LLM)。 熟悉BERT相关预训练模型的使用及其NLU任务定制等通用NLP技术及LLM大模型的微调。 在天池CBLUE医疗信息大数据比赛中排名第27名,KAGGLE毒性评论打分比赛获得银牌。 熟练使用PYTHON开发,熟悉C、MATLAB。
2300深度学习人工智能
1.懂目标检测,语义分割,物体分类的基本范式代码实现,pytorch框架为基础的深度学习代码调试,复现,改进;目标检测的yolo,fasterrcnn,detr等算法 2.进阶框架openmmlab系列,包括mmdetection,mmseg,mmcls,mmfewshot熟练使用和实现想法;yolo官方代码库ultralytics的熟练使用和实现想法;paddlepaddle的基础使用(熟练待学); 3.还在自学大模型相关知识和java全套 4.语言:python,java,c++
1111深度学习目标检测
• 参与建立车辆轨迹数据集,并将其存储在AWS S3中以实现高可用性 • 创建带有GPU的AWS EC2实例,并在其上进行Fast R-CNN模型的训练和验证 • 基于Angular框架开发动态响应的前端网页,以显示模型的预测结果 • 使用Docker容器和local repositories来构建Docker镜像
2690深度学习深度学习
当前共8个项目more
×
寻找源码
源码描述
联系方式
提交