Torch

Torch是一个开源的机器学习框架,最初由纽约大学团队开发并以Lua语言实现,因其灵活性和强大的张量计算能力在学术研究中广受欢迎。其核心设计以​​动态计算图​​为特色,支持交互式调试和直观的模型构建方式,尤其适合深度学习领域的快速原型设计和实验迭代。2017年,PyTorch作为Torch的Python版本正式发布,继承了Torch的灵活性与核心理念,同时依托Python丰富的科学生态(如NumPy)和更广泛的开发者社区,迅速成为主流。PyTorch通过​​自动微分(Autograd)​​、​​GPU加速张量运算​​以及​​模块化的神经网络构建接口(torch.nn)​​,为研究人员提供了极致的灵活性和控制力,其动态图机制使得模型调试和修改更为直观便捷。尽管后续版本增加了对生产部署的优化(如TorchScript),但其核心优势始终体现在研究和实验阶段的高效性上。PyTorch现已与TensorFlow并列成为深度学习领域最具影响力的框架之一,被广泛应用于学术研究、工业探索以及各类AI模型的原型开发。
aloha复现产品系统
人类示范的模仿学习在机器人技术中表现出令人印象深刻的性能。然而,大多数成果专注于桌面操作,缺乏执行一般实用任务所需的移动性和灵巧性。在这项工作中,我们开发了一个模仿移动操作任务的系统,这些任务是双手的,并且需要全身控制。我们首先介绍MobileALOHA,这是一个低成本的全身远程操作系统,用于数据收
140Torch人工智能
项目实现了完整的AlphaZero训练与推理流程,包括自我博弈数据生成、基于MCTS的策略改进、策略-价值联合网络训练以及模型评估对弈。支持多种棋类环境扩展(如井字棋、Connect4),结构清晰,模块解耦,便于替换网络结构或搜索策略,用于强化学习与博弈算法的研究与实验。
390Python人工智能
核心算法:采用最新的YOLOv11算法,兼顾检测速度与精度。一站式流程:集成环境检测、数据集配置、模型训练、结果可视化等全流程功能。多模态检测:支持图片文件、视频文件以及实时摄像头画面的目标检测。可视化交互:通过直观的GUI界面展示检测结果(边界框、置信度、类别),并支持训练过程中的参数配置与日志监
340C++人工智能
实时预警:100%全量监控,自动标识NG多维筛选:按机器号、膜色、时间范围灵活查询,支持编号搜索和趋势图点击联动智能诊断:每个异常样本提供光谱曲线对比、三通道分数、具体诊断建议趋势追踪:日/周/月粒度的稳定性趋势分析,Top15机台性能排名,支持工艺优化
240Python机器深度学习
核心功能模块包括数据处理模块、知识检索模块、模型训练模块、预测与评估模块、支撑功能模块。主要功能描述:数据处理模块支持Excel/CSV与JSONL格式自动转换,完成数据清洗、无效样本过滤及按题型比例拆分训练/验证集;知识检索模块实现知识库标准化处理、高维向量生成与FAISS索引构建,精准匹配“问题
550Python人工智能
图像处理程序产品系统
以目标检测为例:1.对监控摄像头或工业相机采集的图像进行几何变换、直方图均衡、图像分割等预处理2.对预处理的图像进行基于深度学习的模型推理,检测是否含有目标对象3.如果检测出目标对象,标记框选检测到的目标对象4.收集更多实际应用场景中的图片,进行深度学习训练5.使用训练好的模型进行推理检测,提高检测
870Python项目任务
视觉数据采集模块:负责获取单目/双目相机的原始图像数据,支持实时视频流采集或离线图像序列导入。包含相机参数校准(内参、外参)功能,修正镜头畸变,为后续深度计算提供精准基础数据。支持图像预处理(去噪、曝光校正、白平衡调整),提升原始数据质量,减少环境干扰。深度估计模块:双目视觉分支,通过结合神经网络和
1490Caffe人工智能
医用PVC卷材在线实时缺陷检测主要功能如下:1、2个8K高速线扫相机,最宽可以覆盖2m的产品;速度最高60m/min2、配方管理,方便客户快速切换型号3、友好的参数调整界面,方便客户快速调整算法准确度4、历史数据存储&查询功能,轻松追溯历史数据5、使用神经网络(Resnet)进行缺陷分类
1050C++机器深度学习
开放域视觉定位:支持通过自然语言指令,在图像中定位任意指定的物体、人物或场景元素。思维链增强推理:利用大模型的内在推理能力,通过多步思考提升复杂场景下的定位准确性。参数高效微调:采用LoRA技术对Qwen2.5-VL-7B模型进行微调,仅训练少量参数即可显著提升在目标领域的效果。完整训练流水线:实现
3130Python人工智能
Myolotrain开源项目
Myolotrain是一个可视化管理yolo视觉模型训练的系统,为计算机视觉任务提供了直观的图形界面。该平台集成了在线标注、数据集管理、模型管理、训练管理和目标检测功能,支持windows、linux、docker等多种部署方式,使用户能够轻松地训练和部署YOLOv8模型,支持CPU和GPU,使用t
2141Flask人工智能
AI动态大脑API产品系统
API接口安全分析POST/api/analyze:安全分析POST/api/meta-cognition:元认知分析POST/api/intelligent-reasoning:智能推理POST/api/decision:决策生成实验管理POST/api/experiment/create:创建实
770Caffe人工智能
项目介绍:本项目旨在解决复杂网络中的链路预测问题及增强模型的可解释性,提出了一种结合图神经网络(GNN)和贝叶斯网络的创新框架。通过多层次的图神经网络提取节点的局部和全局结构特征,并结合节点属性信息,利用贝叶斯网络进行概率推理,在SCHOLAT数据集上实现了93%的准确率,在YST数据集上实现了81
1200Python人工智能
●项目介绍:本项目设计并实现了一个从单张人脸图像预测BMI的端到端系统。我们自行爬取数据并制作数据集,设计并实现了一个轻量级CNN。最终,模型在独立测试集上取得了4.39的平均绝对误差(MAE),并使用Flask框架将其封装成一个可交互的Web应用,完整实现了从数据获取、模型训练到服务部署的全流程。
1430Python人工智能
1.基础蒸烤功能模块实现蒸、烤、蒸烤组合等核心烹饪功能温度控制(室温至最高温度的精准调节)时间设定与控制多种预设烹饪模式(如烘焙、烤肉、蒸鱼等)安全保护机制(过热保护、超时保护等)2.菜谱功能模块内置多种菜品的菜谱数据库菜谱分类与检索功能分步烹饪指导食材与调料用量建议用户自定义菜谱存储与分享3.摄像
1360Python人工智能
AI文生图开源项目
基于StableDiffusion开源接口构建的AI视觉创作平台,在交互与功能层面实现全链路优化:前端采用Vue框架打造直观流畅的操作界面,用户可轻松完成参数配置、模型选择与生成预览;模型应用支持双模式——既提供经过性能优化的系统预置模型,满足快速出图需求;也开放用户自定义训练通道,允许上传专属数据
1650Python人工智能
非接触式监测:使用医用级摄像头对保温箱内早产儿进行持续视频采集,避免传感器接触对婴儿造成的刺激深度学习姿态识别:基于改进的YOLOv4/YOLOv5算法,实现对早产儿关键身体部位(头部、四肢、躯干)的精准定位和姿态分类异常行为检测:通过时序分析识别异常姿态模式(如持续性异常体位、活动减少等),及时预
1270C++人工智能
1.自动爬取下载信息,将人工流程的点击,复制粘贴等操作全部通过脚本实现。2.“AI建议”与“AI决策”双模式切换,AI建议模式通过AI预测和人工筛选结果进行模型增量学习。AI决策模式实现全流程自动化,并设计阈值,将模糊AI无法判断的博主保存到人工复审数据库。设计复审功能,人工审核模糊的博主3.设计数
1350Python机器深度学习
实时语音识别 (Real-time Speech Recognition): 能够捕捉麦克风输入,并将用户的语音实时、准确地转换为文本。 自然语言理解 (Natural Language Understanding - NLU): 分析转换后的文本,理解用户的意图和关键信息(例如指令、询问的对象、参数等)。 对话管理 (Dialogue Management): 在多轮交互中维护对话状态和上下文,使对话更加连贯自然。 任务执行与技能调用 (Task Execution & Skill Invocation): 根据理解的用户意图,执行相应的操作,例如: 信息查询: 获取天气预报、时间、百科知识、新闻等。 媒体控制: 播放/暂停音乐、调整音量。 简单助理任务: 设置提醒、创建待办事项。 语音合成 (Text-to-Speech - TTS): 将助手的文本回复通过 edge-tts 转换成清晰自然的语音进行播放。 Web 界面交互 (Web Interface Interaction): 提供一个用户友好的网页界面,可以: 显示语音识别的文本和助手的回复。 允许用户通过文本输入与助手交互。 (可能) 展示图片、链接等多媒体信息。 多模态反馈 (Multimodal Feedback): 结合语音、文本以及可能的视觉元素(在Web界面上)来呈现信息和交互结果。 图像分析(Image Analysis): 可以通过pygame.camera调用摄像头或者截图当前页面,并与llm互动获取想要的信息 剪切板提取(Clipboard Management): 可以通过pypercli获取剪切板中的文本内容并自动判断是否需要进行执行 上下文管理(Context management): 通过EnhancedConversationContext类管理对话记录,支持记住或者遗忘特定信息,根据相似度判断是否清除旧的上下文,能够根据对话历史生成更相关的回复 日志记录(Logging): 使用rich库美化日志输出,并将日志保存到文件中 网页搜索(Search): 使用DuckDuckGo搜索用户指定的内容,并返回搜索结果摘要
2110Torch机器学习/深度学习
项目技术:数据增强(镜像反转、左右各旋转30度、增加噪点、MSRCR处理光线)、迁移学习、ReduceLROnPlateau缩小学习率、Xception/InceptionResNet-V2特征融合 项目成果:从Kaggle中获取999条数据,采用迁移学习及微调模型比较多个深度学习模型的准确率后,得到Xception模型最高仅为95.6%,对模型进行特征融合,模型准确率提升至98.4%
1180Python机器学习
项目技术:随机森林、LSTM、SVR 项目成果:总计1825条数据20个特征,构建了4个新特征总计24个特征,绘制饼状图、箱形图等对特征选择并比较不同特征效果,随机森林、SVR采用R2、MAE、MSE评估指标,LSTM采用MAE、MSE评估指标,比较两个模型的结果后,最终采用LSTM模型,MAE与MSE分别为0.01416,0.0026
1270Python机器学习
当前共84个项目more
×
寻找源码
源码描述
联系方式
提交