机器视觉

利用pytorch训练图片集，模型选用mobilenet，识别率95%以上。结合yolov8使用预训练模型，可视频动态识别物品的材质。yolo可以自己搜集图片集训练自己的模型

2390深度学习人工智能

编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose（人体姿态估计） + ST-GCN（时空图卷积网络）工具链: OpenCV（视频处理）硬件平台: NVIDIA GTX3060 以下是根据您提供的信息整理的项目经历描述模板，突出技术亮点和应用价值：项目名称基于深度学习的家庭老人健康监护系统——实时动作识别与危险预警项目简介针对居家老人安全监护场景，开发一套基于计算机视觉的智能监测系统，利用AI技术实时分析视频流中老年人的行为特征，精准检测跌倒、抽搐等高风险动作并触发紧急报警。系统采用轻量化模型部署于边缘设备，兼顾实时性与准确性，为家庭提供7×24小时主动防护解决方案。技术栈编程语言: Python 深度学习框架: PyTorch 核心算法: AlphaPose（人体姿态估计） + ST-GCN（时空图卷积网络）工具链: OpenCV（视频处理）、TensorRT（模型加速）、Flask（Web服务）、MySQL（数据存储）硬件平台: NVIDIA Jetson Nano（嵌入式部署）核心实现细节多模态数据采集与标注整合公开数据集（如HMDB51、UCF-101）与自采家庭场景视频，构建包含10k+标注样本的数据集，覆盖正常动作（行走、坐立）及异常动作（跌倒、颤抖）。使用LabelImg工具进行精细化标注，同步记录时间戳与动作类型标签。 AlphaPose优化与适配基于OpenPose改进人体关键点检测模型，引入动态权重调整机制提升复杂背景下的鲁棒性（如遮挡、低光照）。通过ONNX格式转换实现模型轻量化，推理速度降低至

5070深度学习人工智能

视频处理/特效产品系统

视频处理系统，在实时处理视频流时，检测、识别、分割等操作均可实时，精准捕捉画面中的关键元素。不仅如此，还能为用户一键美颜，瞬间提升颜值，或是添加趣味贴纸特效，让视频瞬间变得生动有趣，广泛适用于直播、短视频创作、社交娱乐等众多场景，全方位助力精彩呈现。

2170深度学习人工智能

图片生成产品系统

我们的图片视频生成能力具备强大的角色与风格掌控力，能生成精美图片与视频。在小说推文领域，瞬间将精彩情节可视化，吸引读者目光；用于绘本创作，赋予故事鲜活生命力。支持多角色同屏生成，轻松构建复杂场景，换脸、换装随心所 “变”，甚至可按需精准输出文字，全方位助力创意落地。

1810深度学习人工智能

物理隔离单向数据摆渡系统产品系统

项目简介：旨在解决传统物理隔离传输系统中外部网络到内部私有网络的单向信息传输面临速度慢、效率低、误码率高等问题。具体为通过对文件进行特殊的编码算法处理，使传输数据以伪二维码图像矩阵的形式呈现，单张图像承载信息容量25KB；通过设计多通道编码展示和拍摄解码方式，实现多进程异步编解码，实现传输速度峰值达700KB/s，是当前国内同类竞品的7倍。项目业绩：1.攻克传统物理隔离传输系统中单向信息传输速度慢、效率低及误码率高的难题，开发出创新性的物理隔离文件单向传输系统，提升企业与外部网络文件交互的效率与可靠性。 2.运用比特流加密、比特流图像转换编码算法将文件转化为伪二维码矩阵图像，实现高效信息承载与传输，有效减少传输过程中的数据错误与丢失，误码率较传统方式降低70%。3.基于现代计算机视觉和图像处理技术构建多通道展示与拍摄机制，实现多进程异步编解码，使系统传输速度峰值达 700KB/s，远超同类竞品。4.设计并实现系统与上层应用的交互接口，达成实时数据传输管控功能。通过此接口，上层应用能够对传输文件数据进行实时监控、调度与管理，提升数据传输的灵活性与可控性。

3731机器学习人工智能

AI绘画工具1.0产品系统

1.本软件面向使用AI绘画的用户，解决了用户在本地电脑使用AI工具进行绘画的问题。 2.相比于同类型的AI绘画产品，使用本软件的用户无需联网使用第三方提供的API即可在本地机器进行AI绘画，且出图质量高能够达到商用或者准商用水准。 3.本软件使用了目前较先进的绘画模型，可以由AI生成单张图片也可以批量生成图片。

2460深度学习人工智能

Orange-AI产品系统

Orange 是中国首个通用人工智能（AGI）系统，旨在通过创新的算法和深度学习技术，推动人工智能的发展。作为一个跨领域的智能平台，Orange 不仅具备强大的数据处理能力，还能够在多种复杂任务中进行自主学习和适应，从而实现超越传统人工智能的智能水平。 Orange 的设计理念是模仿人类思维方式，具备理解、推理和创造的能力。它能够处理各种信息，从语言理解到图像识别，再到复杂的决策制定，为各行各业提供智能解决方案。无论是在教育、医疗、金融还是制造业，Orange 都致力于通过智能化手段提升效率，优化决策，推动业务转型。随着技术的不断进步，Orange 将持续进化，力求成为推动社会进步和经济发展的重要引擎。它不仅是中国在人工智能领域的一个重要里程碑，更是全球 AGI 研究的先锋，标志着人工智能从单一应用走向全面智能化的新时代。

5250机器学习人工智能

基于深度学习的人脸识别门禁系统产品系统

该系统包含了三个模块，人脸检测模块、数据训练模块和人脸预测模块，三个模块相辅相成，共同组成识别系统。人脸检测模块使用YOLOv3网络获取人脸，对人脸图像预处理并修改尺寸（96*112）并保存；人脸训练模块使用FcaeNet网络（MobileNetV1为主干特征提取网络），MobileNetV1 具有参数少的优势，可以加快训练速度；人脸识别模块使用Pytorch 预测模型对人脸进行预测并识别，如果遇到陌生人将会通过喇叭报警或者保存下陌生人的人脸图像。目前为人脸识别系统设计了三个GUI界面，通过GT creator的UI设计功能实现。

3880python人工智能

基于YOLO的火灾监测预警系统产品系统

火灾探测是该领域的一个重要分支的对象检测。在当今快速发展的信息中技术，火灾探测在安防预警中的应用正变得越来越普遍。不断增长的需求因为火灾探测要求它向高精度发展，效率和性能。YOLO系列模型被广泛使用，应用于交通违章检测、住宅区等领域安全监控、工业组件缺陷检测，以及农业害虫和农作物检测。因此，我们在火灾数据上进行了特定训练。

3470深度学习人工智能

基于YOLO V8的目标检测产品系统

1.使用C++开发，可以部署到QT中 2.基于YOLO V8目标检测算法 3.模型训练 4.模型转换 5.可以使用GPU检测，也可使用CPU检测 6.可生成DLL动态库，支持其他语言调用 7.OpenCV版本需大于4.9.0

2560C/C++人工智能

游泳防溺水系统产品系统

泳护神是一款基于人工智能技术的泳池防溺水产品。泳护神经过多年研发，研发团队超过30人，投入研发金额超过数千万，模型训练样本上千万张，模型标注上面投入成本超过数百万。泳护神在研发过程中，实地考察了全国近300家泳池，对每家泳池进行精确测量，获取了全国泳池构型的精确数据。研发过程中，研发团队与近百位一线救生员、泳池安全管理负责人和泳池经营者进行了交流，收集了大量关于泳池安全管理流程的第一手资料。同时还在网络中搜集了近百个溺水视频，采访了有过溺水救援经历的救生员数十人，获取了溺水征兆的第一手资料。经过整个研发团队的努力，泳护神能够有效识别多种溺水征兆。目前泳护神覆盖全国14个省和直辖市，其中覆盖26个城市和地区。实现签约客户100+，安装客户62个，已完成验收用户50个。目前产品运行稳定且高度成熟，随时可以服务客户。核心团队会持续ALL IN于该项目。泳护神与市场同类产品相比具有以下优点： 1. 研发投入大。泳护神研发周期超过七年，研发团队超过30人，用于训练模型的显卡数千张，前后投入了大量资金和时间。 2. 模型训练样本多。用于训练识别模型的样本超过千万，每张图均由专业标注团队进行标注，标注成本超过数百万。 3. 实地勘测泳池数量较多，掌握中国和全球绝大多数泳池的构型，先后实地考察泳池超过300个，每个泳池均详细记录其构造参数。基于这些参数，定制了专业的摄像头安装位置工艺参数表。 4. 安装客户数量和覆盖范围广。 5. 支持多种模型，为了获取更好的识别精度，根据摄像头的安装位置和安装角度，有针对性地训练了上百个模型，识别精度大幅度提高。 6. 报警信息接收终端类型多样，支持智能手表、手机、电脑、平板电脑、智慧大屏等多种终端设备。为每种终端设备定制了相应的APP。 7. 报警信息智能化，所有报警接收终端均支持基于人工智能的报警语音提示，将溺水征兆以语音形式播报。报警信息包括泳池区域、泳道和危险行为，还可以加入泳池中的相关特征，方便救生员迅速定位危险位置。 8. 提供全面的溺水管理系统，能够及时了解泳池中的安全动态，并能够自动统计特定时间段内的泳池安全管理情况，生成月度、季度、年度等报告。应用人工智能算法，为下阶段泳池安全管理工作提供建议。系统可以运行在PC、手机、平板电脑等多种设备上。 9. 内置防溺水教学系统，能够收集系统报警信息，供救生组长筛选出有价值的内容，在对救生员进行培训时使用。 10. 根据泳池中的动态提供多种预警信息，比如遇到以下情况可以发出预警信息： 1) 深水区人数超过阀值； 2) 深水区长时间抓岸不动； 3) 浅水区长期站立岸边不动（预防老年人突发疾病）； 4) 泳池某区域人数超过上限阀值，可以根据客户需求定制相关场景。 11. 价格优惠。我们支持以下合作模式： 1) 直接购买技术方案（包括软件和硬件）。 2) 仅购买软件。 3) 如果客户希望建立自己的品牌，我们可以帮助客户贴牌。 4) 根据客户需求对产品进行二次开发。联系方式：微信：同手机邮箱：411321681@qq.com 手机：18616874518

3130hyperledger人工智能

书籍自动翻译器开源项目

本项目开发一个书籍自动翻译器，该翻译器能够对pdf或word格式的文档进行自动翻译成中文，并输出为pdf或markdown格式的文件。该工具使用了大语言模型LLMs（GPT-4o等），可以根据配置文件选用不同的大模型主要开发语言为Python，该项目是模块化的，并且面向对象的设计，易于定制或拓展

4990深度学习人工智能

茶芽检测产品系统

负责设计并实现一个基于无人机的茶园监测系统，利用计算机视觉技术自动检测茶芽的生长情况。利用无人机搭载的高分辨率相机收集茶园图像数据。开发了图像处理算法，包括图像预处理、特征提取和分类算法，以识别和计数茶芽。通过机器学习模型优化检测精度，实现了茶园生长状态的实时监控和评估

3501机器学习人工智能

医疗心电图房颤、st改变识别算法+超声甲状腺病变识别+试卷识别算法等开源项目

由于之前一直在公司工作，很多项目无法截图，这边写上自己个人技能：独立开发过CV/NLP/机器学习项目，具备独立解决问题的能力。精通医疗/通用场景图像分类、检测、信息抽取、OCR及一维信号分类。自学能力强，能够快速学习、掌握新技术和工具，持续跟踪业内最新技术进展（AIGC、LLM）。熟悉BERT相关预训练模型的使用及其NLU任务定制等通用NLP技术及LLM大模型的微调。在天池CBLUE医疗信息大数据比赛中排名第27名，KAGGLE毒性评论打分比赛获得银牌。熟练使用PYTHON开发，熟悉C、MATLAB。

3950深度学习人工智能

车载视觉系统

采用普通的白光摄像头作为传感器、海思Hi3559A作为开发板。构建一套以计算机视觉为主的，汽车车载视觉系统。主要功能有，目标识别（例如、行人识别）；基于双目视觉算法可以计算出与目标的距离达到预警、紧急避障等效果；保持车道巡航功能；基于图像拼算法的360°全景系统。

2760深度学习人工智能

语言增强的零样本多模态物体识别模型

当前越多越多的业务开始使用多模态大模型，尤其是视觉-语言预训练模型。在实际使用中，我们通常需要对预训练模型进行调优来适配实际的业务场景，而这需要大量的资源介入且费时费力，尤其是对视觉基座的调优在资源有限的情形下几乎是不可行的。本项目探索了在不调优视觉基座的前提下，仅通过对语言端进行调优并优化推理过程，实现语言增强的零样本多标签分类任务 (Zero-shot Multi-label Classification)。本项目为国际比赛获奖项目。

3550深度学习图像(Image)

校园异常行为检测

项目主要是分为前端、后端和算法三个模块，我主要负责算法部分 1、对挥手求助等2D图像进行yolo目标检测，对跌到等3D视频流进行C3D检测，然后将检测出的异常行为类型给于对应标签，再与其他相关信息一起传给后端进行存储 2、其中对算法也进行改进，例如C3D加入视频流缓冲池等，基于项目需求进行改进 3、算法的识别精度高、系统运行的流畅度好

4790深度学习视频流检测