Torch

Torch是一个开源的机器学习框架,最初由纽约大学团队开发并以Lua语言实现,因其灵活性和强大的张量计算能力在学术研究中广受欢迎。其核心设计以​​动态计算图​​为特色,支持交互式调试和直观的模型构建方式,尤其适合深度学习领域的快速原型设计和实验迭代。2017年,PyTorch作为Torch的Python版本正式发布,继承了Torch的灵活性与核心理念,同时依托Python丰富的科学生态(如NumPy)和更广泛的开发者社区,迅速成为主流。PyTorch通过​​自动微分(Autograd)​​、​​GPU加速张量运算​​以及​​模块化的神经网络构建接口(torch.nn)​​,为研究人员提供了极致的灵活性和控制力,其动态图机制使得模型调试和修改更为直观便捷。尽管后续版本增加了对生产部署的优化(如TorchScript),但其核心优势始终体现在研究和实验阶段的高效性上。PyTorch现已与TensorFlow并列成为深度学习领域最具影响力的框架之一,被广泛应用于学术研究、工业探索以及各类AI模型的原型开发。
医用PVC卷材在线实时缺陷检测主要功能如下:1、2个8K高速线扫相机,最宽可以覆盖2m的产品;速度最高60m/min2、配方管理,方便客户快速切换型号3、友好的参数调整界面,方便客户快速调整算法准确度4、历史数据存储&查询功能,轻松追溯历史数据5、使用神经网络(Resnet)进行缺陷分类
360C++机器深度学习
开放域视觉定位:支持通过自然语言指令,在图像中定位任意指定的物体、人物或场景元素。思维链增强推理:利用大模型的内在推理能力,通过多步思考提升复杂场景下的定位准确性。参数高效微调:采用LoRA技术对Qwen2.5-VL-7B模型进行微调,仅训练少量参数即可显著提升在目标领域的效果。完整训练流水线:实现
1190Python人工智能
Myolotrain开源项目
Myolotrain是一个可视化管理yolo视觉模型训练的系统,为计算机视觉任务提供了直观的图形界面。该平台集成了在线标注、数据集管理、模型管理、训练管理和目标检测功能,支持windows、linux、docker等多种部署方式,使用户能够轻松地训练和部署YOLOv8模型,支持CPU和GPU,使用t
761Flask人工智能
AI动态大脑API产品系统
API接口安全分析POST/api/analyze:安全分析POST/api/meta-cognition:元认知分析POST/api/intelligent-reasoning:智能推理POST/api/decision:决策生成实验管理POST/api/experiment/create:创建实
320Caffe人工智能
项目介绍:本项目旨在解决复杂网络中的链路预测问题及增强模型的可解释性,提出了一种结合图神经网络(GNN)和贝叶斯网络的创新框架。通过多层次的图神经网络提取节点的局部和全局结构特征,并结合节点属性信息,利用贝叶斯网络进行概率推理,在SCHOLAT数据集上实现了93%的准确率,在YST数据集上实现了81
800Python人工智能
●项目介绍:本项目设计并实现了一个从单张人脸图像预测BMI的端到端系统。我们自行爬取数据并制作数据集,设计并实现了一个轻量级CNN。最终,模型在独立测试集上取得了4.39的平均绝对误差(MAE),并使用Flask框架将其封装成一个可交互的Web应用,完整实现了从数据获取、模型训练到服务部署的全流程。
970Python人工智能
1.基础蒸烤功能模块实现蒸、烤、蒸烤组合等核心烹饪功能温度控制(室温至最高温度的精准调节)时间设定与控制多种预设烹饪模式(如烘焙、烤肉、蒸鱼等)安全保护机制(过热保护、超时保护等)2.菜谱功能模块内置多种菜品的菜谱数据库菜谱分类与检索功能分步烹饪指导食材与调料用量建议用户自定义菜谱存储与分享3.摄像
880Python人工智能
AI文生图开源项目
基于StableDiffusion开源接口构建的AI视觉创作平台,在交互与功能层面实现全链路优化:前端采用Vue框架打造直观流畅的操作界面,用户可轻松完成参数配置、模型选择与生成预览;模型应用支持双模式——既提供经过性能优化的系统预置模型,满足快速出图需求;也开放用户自定义训练通道,允许上传专属数据
1150Python人工智能
非接触式监测:使用医用级摄像头对保温箱内早产儿进行持续视频采集,避免传感器接触对婴儿造成的刺激深度学习姿态识别:基于改进的YOLOv4/YOLOv5算法,实现对早产儿关键身体部位(头部、四肢、躯干)的精准定位和姿态分类异常行为检测:通过时序分析识别异常姿态模式(如持续性异常体位、活动减少等),及时预
740C++人工智能
1.自动爬取下载信息,将人工流程的点击,复制粘贴等操作全部通过脚本实现。2.“AI建议”与“AI决策”双模式切换,AI建议模式通过AI预测和人工筛选结果进行模型增量学习。AI决策模式实现全流程自动化,并设计阈值,将模糊AI无法判断的博主保存到人工复审数据库。设计复审功能,人工审核模糊的博主3.设计数
900Python机器深度学习
实时语音识别 (Real-time Speech Recognition): 能够捕捉麦克风输入,并将用户的语音实时、准确地转换为文本。 自然语言理解 (Natural Language Understanding - NLU): 分析转换后的文本,理解用户的意图和关键信息(例如指令、询问的对象、参数等)。 对话管理 (Dialogue Management): 在多轮交互中维护对话状态和上下文,使对话更加连贯自然。 任务执行与技能调用 (Task Execution & Skill Invocation): 根据理解的用户意图,执行相应的操作,例如: 信息查询: 获取天气预报、时间、百科知识、新闻等。 媒体控制: 播放/暂停音乐、调整音量。 简单助理任务: 设置提醒、创建待办事项。 语音合成 (Text-to-Speech - TTS): 将助手的文本回复通过 edge-tts 转换成清晰自然的语音进行播放。 Web 界面交互 (Web Interface Interaction): 提供一个用户友好的网页界面,可以: 显示语音识别的文本和助手的回复。 允许用户通过文本输入与助手交互。 (可能) 展示图片、链接等多媒体信息。 多模态反馈 (Multimodal Feedback): 结合语音、文本以及可能的视觉元素(在Web界面上)来呈现信息和交互结果。 图像分析(Image Analysis): 可以通过pygame.camera调用摄像头或者截图当前页面,并与llm互动获取想要的信息 剪切板提取(Clipboard Management): 可以通过pypercli获取剪切板中的文本内容并自动判断是否需要进行执行 上下文管理(Context management): 通过EnhancedConversationContext类管理对话记录,支持记住或者遗忘特定信息,根据相似度判断是否清除旧的上下文,能够根据对话历史生成更相关的回复 日志记录(Logging): 使用rich库美化日志输出,并将日志保存到文件中 网页搜索(Search): 使用DuckDuckGo搜索用户指定的内容,并返回搜索结果摘要
970Torch机器学习/深度学习
项目技术:数据增强(镜像反转、左右各旋转30度、增加噪点、MSRCR处理光线)、迁移学习、ReduceLROnPlateau缩小学习率、Xception/InceptionResNet-V2特征融合 项目成果:从Kaggle中获取999条数据,采用迁移学习及微调模型比较多个深度学习模型的准确率后,得到Xception模型最高仅为95.6%,对模型进行特征融合,模型准确率提升至98.4%
790Python机器学习
项目技术:随机森林、LSTM、SVR 项目成果:总计1825条数据20个特征,构建了4个新特征总计24个特征,绘制饼状图、箱形图等对特征选择并比较不同特征效果,随机森林、SVR采用R2、MAE、MSE评估指标,LSTM采用MAE、MSE评估指标,比较两个模型的结果后,最终采用LSTM模型,MAE与MSE分别为0.01416,0.0026
790Python机器学习
本程序致力于提供一个强大且实用的人群计数工具,其核心目标在于精准地检测图像或视频流中出现的人体目标,并高效地统计其数量。为实现这一任务,程序采用了当前深度学习领域的主流框架——PyTorch,构建并部署了一个经过优化的YOLOv3 (You Only Look Once, version 3) 目标检测模型。 YOLOv3 被选为本程序的核心算法,主要得益于其卓越的性能平衡。作为一种单阶段(one-stage)检测器,YOLOv3 以其显著的速度优势闻名,能够在保持较高检测精度的同时,满足实时处理的需求。其核心原理是将目标检测视为一个回归问题,通过单次前向传播即可预测图像中所有目标的边界框位置及所属类别概率。本程序特别利用了 YOLOv3 的 Darknet-53 骨干网络提取深度特征,并结合其多尺度预测机制(在三个不同尺度的特征图上进行检测),使其能够有效应对人群计数中常见的尺度变化大(如近处个体大、远处个体小)和密集遮挡等挑战,精准捕捉不同大小的人体目标。
2050Python源文件源码
ADAS(Advanced Driver Assistance System,高级驾驶辅助系统))是一套集成传感器、算法和车辆控制技术的智能化系统,旨在通过实时环境感知、风险预警和部分自动化控制,显著提升行车安全性、驾驶舒适性和能源效率。作为自动驾驶(L1-L3级)的核心技术基础,ADAS已成为现代智能汽车的标配,并逐步推动汽车产业从“被动安全”向“主动智能”转型。
800C/C++机器学习/深度学习
车牌识别源文件源码
本代码基于YOLO(You Only Look Once)算法实现了高效的车牌识别系统。YOLO作为单阶段目标检测模型,通过卷积神经网络同时预测边界框和类别概率,显著提升了检测速度。系统首先利用YOLO模型定位图像中的车牌区域,随后通过OCR技术识别车牌字符。实验表明,该方案在复杂场景下仍能保持较高的准确率和实时性,平均识别精度达90%以上,单帧处理时间低于50ms。该方法克服了传统车牌识别算法受光照、角度影响的缺陷,为智能交通、车辆管理等应用提供了可靠的技术支持。
1030Torch机器学习/深度学习
1.本方案面向使用三坐标测量机(CMM)进行工业测量作业的技术人员,特别是在高精度、重复性操作场景中工作的一线测量员。传统测量流程需频繁使用鼠标键盘进行操作,效率低且容易出错。该语音助手系统通过自然语音交互替代传统输入方式,显著简化操作流程,解放双手,提高测量效率,并减少人为误操作的可能性,特别适用于复杂环境下的辅助操作和高频重复任务。 2.完全本地化运行:无需联网,适用于厂房、保密实验室等网络受限环境,保障数据安全。 高定制化指令系统:内置约60条基础指令,支持模糊语义识别与上下文理解,结合测量业务深度优化。 跨平台集成能力:通过 Python 调用 COM 接口与三坐标测量软件深度集成,可快速部署到现有工业系统。 大模型推理:加入大模型增强语音推理,提升智能化 人性化语音反馈机制:集成本地 TTS(语音合成)模块,增强交互感与用户体验,贴近手机语音助手的使用习惯。
1290Python机器学习/深度学习
1. kaggle平台数据集(自杀倾向问卷数据集),要求使用stacking方式在测试集上达到90%以上分类(2分类)正确率。 2. 使用随机森林、SVM、KNN以及逻辑回归等模型作为基础学习器,使用accuracy、recall、F1 score作为评估标准,选出3个指标最高的基础学习器。 3. 对基础学习器进行参数搜索,并使用逻辑回归作为stacking方式的最终学习器。
920Python机器学习
随着人脸识别技术在智能安防、金融支付等隐私敏感场景的大规模部署,传统集中式训练模式导致的用户数据泄露风险成为技术发展的主要瓶颈。本文提出一种基于联邦学习与差分隐私的混合架构人脸识别系统。通过构建支持非独立同分布(Non-IID)数据的联邦学习框架,结合动态隐私预算管理策略,在保护用户数据隐私的同时提升模型泛化能力。实验结果表明,在 Olivetti 人脸数据集上,系统在 ε=1.0 的隐私预算下达到 92.3% 的准确率,较传统联邦学习方法提升 4.7%,验证了隐私保护与模型性能的高效平衡。
1800Apache机器学习/深度学习
本科专业为信息工程,曾经开发过多个微信小程序,结合各种单片机代码;精通微信小程序前后端搭建。 研究生专注于计算机视觉,尤其是医疗影像方向。深度学习方面代码熟练,使用Pytorch框架。擅长处理自然图像、CT、MRI、超声图像均有涉足。
1420Django微信小程序
当前共77个项目more
×
寻找源码
源码描述
联系方式
提交