人工智能

修改 PaddleOCR-V5 部署包的 JNI 层,将其移植到安卓系统,并做了 Autojs Pro 的适配,解决了一些子线程上下文与栈内存问题。 本项目成功将PaddleOCR-V5部署包的JNI层进行改造,实现了在Android系统上的完整移植,并针对AutoJS Pro环境进行了专门适配。重点解决了autojs子线程环境下的上下文管理问题和栈内存溢出等关键技术难题,使OCR功能能够在移动端高效稳定运行。 注:在 autojs 环境内可以使用 opencl 驱动 gpu,在原生环境下的解决方案欠研究,但使用四核cpu并行速度差不了太多
480C/C++Android200.00元
视觉断触源文件源码
通过领导客户的要求定制完成的部分产品 设计出的部分要求作品因合同无法作为商用以及展示。 特殊作品,以及logo等可以自行查看。
1170人工智能
K均值算法源文件源码
项目:Unity中的K均值算法应用 角色:首席开发人员 - 开发了一个Unity应用程序,利用K均值算法进行数据聚类和边缘识别。 - 实现了两个主要功能: 1. 鸢尾花数据聚类:使用K均值聚类将鸢尾花数据集样本分类为不同的组,展示机器学习技能。 2. 边缘识别:通过检测颜色变化来识别图像中的边缘,提高图像处理能力。 - 克服了颜色识别的挑战,通过提取图像纹理并创建位图来实现精确的边缘检测。 - 这个多功能应用程序不仅限于鸢尾花数据,还可以用于各种数据聚类和图像处理任务。 - 使用的技术:Unity、C#、K均值算法、图像处理、机器学习。
3850游戏类
一、STM32F103集成蓝牙串口模块HC05项目设计说明 该项目采用最小化设计原则,以最小化的方式开发出的源码可以让用户很轻松地学习,并可以再源码项目上轻松进行二次开发。 该项目源码没有一行多余代码,每一行代码经过认真处理,代码注释详细,代码可读性非常高。 该项目源码配有硬件接线图,能够快速将代码运行起来。同时可以加深对STM32的串口开发知识的理解,了解如何收发文本数据包。 二、HC05蓝牙串口模块测试说明 AT模式 进入AT模式的方法:先按住HC05蓝牙模块上的按键,再给蓝牙模块通电。蓝牙模块上面的LED进入慢闪模式(约1秒钟闪烁一次),即可进行AT命令测试。 AT模式波特率为38400,8个数据位,1个停止位,无校验。 每条指令输入完成后,必须按一下回车键再发送! 正常通讯模式 进入正常通讯模式的方法:直接给蓝牙模块通电,无需按住HC05蓝牙模块上面的按键。 正常通信时波特率为9600。 三、相关资料和技术支持 【HC05蓝牙串口模块测试实验】 https://www.bilibili.com/video/BV1xD4y1t7xf/?share_source=copy_web&vd_source=ec02247c3bd8301690fdae0a1305ca8c 【STM32F103蓝牙串口模块HC05编程实验】 https://www.bilibili.com/video/BV1GG4y187hf/?share_source=copy_web&vd_source=ec02247c3bd8301690fdae0a1305ca8c 四、更多内容请关注碧华科技: 【碧华科技的个人空间-哔哩哔哩】 https://b23.tv/yD0ogtt
2760IT
AI助你公众号源文件源码
1210微信小程序
1. 本项目主要分为以下功能模块: - 数据集准备:收集和标注包含不同车型的图像数据集,包括样本图像和对应的标签数据。 - 特征提取:使用深度学习模型(如卷积神经网络)对车型图像进行特征提取,获取代表车型特征的向量表示。 - 车型识别:利用训练好的分类模型,通过对车型图像的特征向量进行分类,实现车型识别功能。 对于使用者来说,该项目能实现以下功能: - 对输入的车型图像进行识别,快速准确地判断出车型。 2. 在本项目中我负责如下任务: - 收集、清洗和标注车型图像数据集,为训练模型做准备工作。 - 使用深度学习技术(如卷积神经网络)进行特征提取,将车型图像转换为特征向量表示。 - 使用Python编程语言和相关深度学习框架(如PyTorch)实现车型识别的代码。 - 进行模型的训练和调优,提高车型识别的准确率和泛化能力。 最终达到的成果是一个能够对输入的车型图像进行准确识别的系统,可以迅速给出车型类别的判断结果。 3. 在本项目中的难点主要包括: - 数据集多样性:车型种类繁多且外观差异大,如何收集全面且具有代表性的车型图像数据集是一个挑战。我们通过广泛搜集不同来源的图像数据,并进行手工标注,构建了较为多样化的数据集。 - 特征提取的准确性:车型图像的特征表达不同,如何提取出能够准确区分不同车型的特征向量是一个难题。我们采用了预训练的深度学习模型,借助其在大规模数据集上学到的特征表示能力来提取车型图像的特征。 - 模型训练的效果:如何通过训练和调优模型提高车型识别的准确率和泛化能力是一个关键问题。我们采用了数据增强、模型结构调整和超参数优化等方法,不断改善模型在训练集和测试集上的性能。 通过以上解决方案,我们的系统能够实现对输入车型图像的准确识别,具备较高的识别准确率和鲁棒性,可应用于交通管理、智能监控等领域。
2680人工智能
1. 本项目主要分为以下功能模块: - 数据集准备:收集和标注包含行人和车辆的视频数据集,包括样本视频和对应的标签数据。 - 目标检测:使用YOLOv8算法对视频中的行人和车辆进行目标检测,实现实时的多目标检测。 - 多目标跟踪:利用ByteTrack算法对检测到的行人和车辆进行多目标跟踪,保持目标的连续性并给出每个目标的轨迹。 - 行人车辆计数:根据跟踪结果统计行人和车辆的数量,实现实时的计数功能。 - 越界识别:基于目标的运动轨迹和预定义的区域,识别出行人和车辆的越界行为。 对于使用者来说,该项目能实现以下功能: - 对行人和车辆进行实时的目标检测和多目标跟踪。 - 实时计数行人和车辆的数量。 - 检测并识别行人和车辆的越界行为。 2. 我在本项目中负责如下任务: - 收集、清洗和标注视频数据集,为训练模型做准备工作。 - 使用YOLOv8算法进行目标检测,并使用ByteTrack算法进行多目标跟踪。 - 使用Python编程语言和相关深度学习框架(如PyTorch)实现目标检测和多目标跟踪的代码。 - 设计并实现行人车辆计数和越界识别的算法,结合目标的轨迹和区域判断目标是否越界。 最终达到的成果是一个可以实时进行行人和车辆目标检测、跟踪和计数的系统,并能够识别出行人和车辆的越界行为。 3. 在本项目中的难点主要包括: - 目标检测的准确性:由于视频中行人和车辆数量众多且姿态多变,如何通过YOLOv8算法实现高准确性的目标检测是一个挑战。我们采用了大规模数据集的训练和调优网络结构的方法,提高了目标检测的准确率。 - 多目标跟踪的连续性:在动态场景下,如何保持行人和车辆的连续跟踪是一个难点。我们结合了多种跟踪算法,并通过目标的特征匹配和运动预测等方法提高了跟踪的连续性和准确性。 - 越界识别的精度:在不同场景下,如何准确地判断行人和车辆是否越界是一个挑战。我们设计了基于轨迹分析和区域判定的算法,综合考虑目标的运动特征和区域约束,提高了越界识别的精度。 以上解决方案使得我们的系统能够对行人和车辆进行实时监测、计数和越界识别,具有较高的准确率和效果,可以广泛应用于人流统计、交通管理等领域。
9690人工智能
1. 本项目主要分为以下功能模块: - 数据集准备:收集和标注自己的数据集,包括样本图片和对应的标签数据。 - 模型训练:使用YOLOv8算法对数据集进行训练,得到训练好的模型。 - 模型测试:利用训练好的模型对新数据进行目标检测,并输出检测结果。 - 模型优化:根据测试结果对模型进行优化,使得目标检测的准确率和效率都有所提升。 对于使用者来说,该项目能实现以下功能: - 制作自己的数据集,并训练自己的模型,实现目标检测任务。 - 通过可视化界面查看目标检测结果,方便直观。 2. 我在本项目中负责如下任务: - 收集、清洗和标注数据集,为训练模型做准备工作。 - 使用Python编程语言和YOLOv8算法对数据集进行训练,并根据训练结果对模型进行调整和优化。 通过这些任务的实现,我最终得到了一个可以对自己的数据集进行目标检测的模型,使得该模型可以方便地应用于实际生产环境中。 3. 在本项目中,最大的难点是如何标注数据集和如何优化模型以提升目标检测的准确率和效率。 针对数据集标注的难点,我们采用了多人标注+众包的方式,让多个标注者同时对同一张图片进行标注,取标注结果的交集作为最终标签数据。这样可以有效避免单个标注者的主观误差和盲区,提高标注数据的质量。 针对模型优化的难点,我们结合了多种优化方法,包括调整超参数、采用不同的激活函数、增加/减少网络层数、使用模型融合等,同时考虑模型的准确率和效率,最终成功提升了目标检测的性能。 以上解决方案得到了良好的实验效果,并被应用于实际生产环境中,得到了用户的高度认可和好评。
5580人工智能
实时语音源文件源码
降麦克风的语言翻译成其他国家的语音(支持200多个国家的语音,详细情况可以参考https://help.aliyun.com/document_detail/215387.html)。可通过OBS,tiktok完成实时直播,需要配置阿里语音接口,遇到问题或者其他需求可以联系V x372282810
1620语音识别
随着我国高等教育事业的发展,高等学校不断扩大招生规模,学生数量急剧增大,学生素质良莠不齐,高校学生的学业问题越来越突出,课程成绩不能及时反馈给学生本人,导致学生管理难度加大。因此,针对这一问题需要建立完善和可靠的学习预警系统,以便及时发现和解决教学中潜在问题,加强学生对课程的总体情况了解,提高学生的学习质量和完成学业情况。 学生预警系统主要是通过收集学院过往的课程过程性数据,以此训练一个基于boosting集成学习模型,模型经过反复调差和训练,准确率已经达到了百分之九十以上,具有极强的可信度。模型根据学生的过程性学习数据进行课程成绩预测,从而预防和解决学生在学习过程中可能遇到的问题,促进学生学习成果的提高。 系统将学生每门课的预测结果在学生端可视化展示,并对教师可视化展示其每门课的平均成绩和不及格人数,对于教务管理员会可视化展示学院每各系的学期预警、学年预警和毕业预警的人数,还有学期预警、学年预警和毕业预警的百分比。
2150webapp
设计绘画源文件源码
项目名称:数字藏品平台 项目功能模块(60%): 1.1 用户管理模块:用户注册、登录、个人信息管理。 1.2 数字藏品上传模块:用户可以上传数字化的艺术品、文化遗产等藏品,包括图像、音频、视频等多媒体形式。 1.3 藏品展示模块:用户可以浏览、搜索、筛选数字藏品,查看详细信息,并进行收藏、评论和分享。 1.4 藏品交易模块:支持用户之间的数字藏品交易,包括拍卖、购买、出售功能。 1.5 数据保护和版权管理:确保数字藏品的版权保护,以及用户隐私和数据的安全性。 1.6 社交互动模块:用户可以互相关注、私信交流,建立数字藏品相关的社交圈子。 1.7 后台管理模块:管理员可以对用户、藏品、交易等进行管理和监督,确保平台的正常运营。 1.8 数据分析与推荐模块:利用机器学习算法分析用户行为,为用户推荐个性化的数字藏品。 我的任务和技术栈(40%): 2.1 我的任务:作为项目负责人,我的任务包括项目规划、团队协调、前端和后端开发、数据库设计、用户体验设计、测试与部署。 2.2 技术栈:项目采用了以下技术栈: 前端开发:使用React.js框架构建用户界面,HTML/CSS进行页面布局,JavaScript实现交互功能。 后端开发:使用Node.js搭建服务器,Express.js框架处理请求和路由,MongoDB作为数据库存储数字藏品信息。 安全性:采用加密技术确保用户数据的安全传输和存储,使用OAuth等协议进行身份验证。 云服务:利用AWS或Azure等云平台提供的托管服务和存储,确保系统的高可用性和扩展性。 数据分析:使用Python编写数据分析脚本,采用机器学习算法为用户提供个性化的数字藏品推荐。 敏捷开发:采用Scrum敏捷开发方法,迭代式开发,持续集成和持续交付,确保项目按时交付并满足用户需求。 2.3 最终成果:经过团队的共同努力,我们成功搭建了一个功能强大的数字藏品平台,用户可以自由上传、浏览、交易数字化的艺术品和文化遗产。平台在用户数量、交易量和用户满意度方面取得了显著的成果,为数字文化资产的保护和推广提供了有力支持。 难点与解决方法(选填): 3.1 数据安全与隐私:确保用户数据的安全性和隐私保护是一个重要的挑战。我们采用了数据加密、访问控制和定期安全审查等措施来解决这个问题。 3.2 版权管理:数字藏品涉及到复杂的版权问题,我们建立了一个版权管理系统,确保数字藏品的上传和交易都遵守版权法律法规。 3.3 用户体验设计:为了提供更好的用户体验,我们进行了用户调研和界面优化,不断改进平台的用户界面和交互。 3.4 扩展性和性能:随着用户数量的增加,我们需要不断优化平台的性能和扩展性,采用了云计算和负载均衡等技术来解决这个问题。 3.5 数据分析和推荐:为了提供个性化的数字藏品推荐,我们不断优化机器学习算法,采用大数据分析方法来提高推荐的准确性。 通过这个数字藏品平台,我们希望为用户提供一个全新的数字文化交流和交易平台,促进文化遗产的传承和创新。
2400UI设计
520表白源文件源码
1、项目分为读取图片、图片生成器、解析模板、功能模块 2、我负责软件框架的搭建、UI效果实现、520图片合成,使用了Python语言开发,最终实现了根据用户提供的图片合成一张520图片。
2740图片合成
基于医疗大模型,提供医疗问诊、病例知识等服务及相关医疗报告资料来源。医疗领域问答测试效果优于 gpt4 。 负责产品原型、架构设计、核心代码开发等。
6220人工智能
chrome 的浏览器AI插件,基于 chatgpt 3.5/4.0 模型,结合提示词工程,提供法律、医疗、代码检测、旅行攻略等人工智能服务。 负责产品原型、架构设计、核心代码研发等
6340人工智能
有企业需要展示图表数据后台系统网站的话,可以考虑下我这个系统网站源码,里面所有的图表功能和图表类型应有尽有,有柱状图、折线图、饼图、雷达图、高德地图、中国地图、表格、等等多种类型图表,可以支持几十种图表动画,数据格式是json数据格式,可以随意修改,每个图表都有属于自己的属性面板,可以修改图表的皮肤坐标大小等等之类
5410游戏类
EfficientNet-TensorRT源文件源码
EfficientNet-TensorRT EfficientNet-TensorRT Environment:Ubuntu20.04 、CUDA>11.0 、cudnn>8.2 、cmake >3.1 、TensorRT>8.0 环境:Ubuntu20.04 、CUDA>11.0 、cudnn>8.2 、cmake >3.1 、TensorRT>8.0 TensorRT building model reasoning generally has three ways: TensorRT构建模型推理一般有三种方式: (1) use the TensorRT interface provided by the framework, such as TF-TRT and Torch TRT; (1)使用框架提供的TensorRT接口,如TF-TRT、Torch TRT; (2) Use Parser front-end interpreter, such as TF/Torch/... ->ONNX ->TensorRT; (2)使用Parser前端解释器,如TF/Torch/... ->ONNX ->TensorRT; (3) Use TensorRT native API to build the network. (3) 使用TensorRT原生API构建网络。 Of course, the difficulty and ease of use must be from low to high, and the accompanying performance and compatibility are also from low to high. Here we will introduce the third method directly. 当然,难度和易用性肯定是从低到高,附带的性能和兼容性也是从低到高。这里我们直接介绍第三种方法。 Construction phase 施工阶段 Logger、Builder、BuilderConfig、Network、SerializedNetwork Logger、Builder、BuilderConfig、网络、SerializedNetwork Run Time 运行 Engine、Context、Buffer correlation、Execute 引擎、上下文、缓冲区关联、执行 what TensorRT have did? TensorRT做了什么? TensorRT deeply optimizes the operation efficiency of reasoning TensorRT深度优化推理运行效率 Automatically select the optimal kernel 自动选择最优内核 There are multiple CUDA implementations for matrix multiplication and convolution, and the optimal implementation is automatically selected according to the size and shape of the data 矩阵乘法和卷积有多种CUDA实现,根据数据的大小和形状自动选择最佳实现 Calculation chart optimization 计算图表优化 Generate network optimization calculation diagram by means of kernel integration and reducing data copy 通过内核集成,减少数据拷贝,生成网络优化计算图 Support fp16/int8 支持fp16/int8 Precision conversion and scaling of numerical values, making full use of hardware's low precision and high throughput computing capabilities 数值的精确转换和缩放,充分利用硬件的低精度和高吞吐量的计算能力 How to build?? 怎么搭建?? Warning ! some path you have to change: 警告 !你必须改变一些路径: CMakeLists.txt CMakeLists.txt # tensorrt include_directories(xxx/TensorRT-8.4.3.1/include/) link_directories(xxx/TensorRT-8.4.3.1/lib/) efficientnet.cpp 高效网.cpp ///line40:define your model global params static std::map global_params_map = { // input_h,input_w,num_classes,batch_norm_epsilon, // width_coefficient,depth_coefficient,depth_divisor, min_depth {"b3_flower", GlobalParams{300, 300, 17, 0.001, 1.2, 1.4, 8, -1}}, }; //add your own efficientnet train params ///line274: your onw model wts and name std::string wtsPath = "/home/zjd/clion_workspace/efficientnet_b3_flowers.wts"; std::string engine_name = "efficientnet_b3_flowers.engine"; std::string backbone = "b3_flower"; ///line327: input image cv::Mat img = cv::imread("/home/zjd/clion_workspace/OxFlower17/test/17/1291.jpg", 1); ///line370: maybe a json file to save the class labels string json_fileName("/home/zjd/tensorrtx/efficientnet/flowers_labels.txt"); Then make build ! ! ! 然后进行构建! ! ! cd ./EfficientNet-TensorRT mkdir build cd build cmake .. make ./efficientnet #filrst build engine [output]:build finisd ./efficientnet #second run inference [output]:Class label:xxxx
1900人工智能
是一个用于自动图像标注的开源工具,特别适用于计算机视觉和深度学习项目。它也允许用户手动绘制边界框和添加标签,以标识图像中的对象。以下是有关LabelImg的相关信息:
2930人工智能
CV/NLP/多模态源文件源码
主要在大厂做一些目标检测、语义分割、OCR、图像检索等CV任务以及多模态和LLM相关的结构化、理解类任务。 曾参加过一些竞赛,获奖如下: Grand Challenge WSSS4LUAD竞赛第一; 之江杯零样本目标物体识别竞赛第一; 公众号运营:https://mp.weixin.qq.com/s/mwstJ8FsR2KYbCBFQoF89A等
3820人工智能
项目模块: 用户骑行起点终点展示地理位置信息, 形成用户骑行列表记录. 负责任务: 根据经纬度获取定位点信息. 调用谷歌API,费用较为昂贵, 且针对线上骑行用户统计,起点终点一般变更范围不大. 使用redis的GEO进行点位相关信息存储. 同时对key按照系数进行拆分,防止分布式redis单个key体谅过大影响响应.
1600人工智能
当前共65个项目
×
寻找源码
源码描述
联系方式
提交