机器深度学习

机器学习,深度学习是人工智能的核心分支,致力于让计算机系统通过数据驱动的方式自动学习和改进性能,而无需显式编程。其核心是从数据中识别模式或规律,构建数学模型,使计算机能完成预测、分类、聚类等任务。主要类型包括监督学习、无监督学习和强化学习。机器学习广泛应用于自然语言处理、计算机视觉、推荐系统等领域,正重塑各行各业,是当前AI爆发的核心技术之一。
Myolotrain开源项目
Myolotrain是一个可视化管理yolo视觉模型训练的系统,为计算机视觉任务提供了直观的图形界面。该平台集成了在线标注、数据集管理、模型管理、训练管理和目标检测功能,支持windows、linux、docker等多种部署方式,使用户能够轻松地训练和部署YOLOv8模型,支持CPU和GPU,使用t
761Flask人工智能
AI文生图开源项目
基于StableDiffusion开源接口构建的AI视觉创作平台,在交互与功能层面实现全链路优化:前端采用Vue框架打造直观流畅的操作界面,用户可轻松完成参数配置、模型选择与生成预览;模型应用支持双模式——既提供经过性能优化的系统预置模型,满足快速出图需求;也开放用户自定义训练通道,允许上传专属数据
1150Python人工智能
本项目是一个面向计算机视觉领域的算法库,聚焦于图像分类任务,旨在为科研开发者提供简洁、可复用的模型实现与实验基础。其主要功能模块包括:核心模型集:提供多种经典卷积神经网络实现,包括LeNet、AlexNet、VGG、GoogLeNet、ResNet、Inception系列、DenseNet等,涵盖从
2530Python人工智能
实时语音识别 (Real-time Speech Recognition): 能够捕捉麦克风输入,并将用户的语音实时、准确地转换为文本。 自然语言理解 (Natural Language Understanding - NLU): 分析转换后的文本,理解用户的意图和关键信息(例如指令、询问的对象、参数等)。 对话管理 (Dialogue Management): 在多轮交互中维护对话状态和上下文,使对话更加连贯自然。 任务执行与技能调用 (Task Execution & Skill Invocation): 根据理解的用户意图,执行相应的操作,例如: 信息查询: 获取天气预报、时间、百科知识、新闻等。 媒体控制: 播放/暂停音乐、调整音量。 简单助理任务: 设置提醒、创建待办事项。 语音合成 (Text-to-Speech - TTS): 将助手的文本回复通过 edge-tts 转换成清晰自然的语音进行播放。 Web 界面交互 (Web Interface Interaction): 提供一个用户友好的网页界面,可以: 显示语音识别的文本和助手的回复。 允许用户通过文本输入与助手交互。 (可能) 展示图片、链接等多媒体信息。 多模态反馈 (Multimodal Feedback): 结合语音、文本以及可能的视觉元素(在Web界面上)来呈现信息和交互结果。 图像分析(Image Analysis): 可以通过pygame.camera调用摄像头或者截图当前页面,并与llm互动获取想要的信息 剪切板提取(Clipboard Management): 可以通过pypercli获取剪切板中的文本内容并自动判断是否需要进行执行 上下文管理(Context management): 通过EnhancedConversationContext类管理对话记录,支持记住或者遗忘特定信息,根据相似度判断是否清除旧的上下文,能够根据对话历史生成更相关的回复 日志记录(Logging): 使用rich库美化日志输出,并将日志保存到文件中 网页搜索(Search): 使用DuckDuckGo搜索用户指定的内容,并返回搜索结果摘要
980Torch机器学习/深度学习
项目技术:数据增强(镜像反转、左右各旋转30度、增加噪点、MSRCR处理光线)、迁移学习、ReduceLROnPlateau缩小学习率、Xception/InceptionResNet-V2特征融合 项目成果:从Kaggle中获取999条数据,采用迁移学习及微调模型比较多个深度学习模型的准确率后,得到Xception模型最高仅为95.6%,对模型进行特征融合,模型准确率提升至98.4%
790Python机器学习
项目技术:随机森林、LSTM、SVR 项目成果:总计1825条数据20个特征,构建了4个新特征总计24个特征,绘制饼状图、箱形图等对特征选择并比较不同特征效果,随机森林、SVR采用R2、MAE、MSE评估指标,LSTM采用MAE、MSE评估指标,比较两个模型的结果后,最终采用LSTM模型,MAE与MSE分别为0.01416,0.0026
800Python机器学习
项目内容:使用k-prototypes聚类方法对好大夫在线网站获取的医生数据进行分析,构建用户画像分析互联网医疗行业的分级诊疗情况。 项目技术:Scrapy爬虫、SWOT分析、哈工大LTP分词、K-prototypes聚类、PCA/t-sne降维可视化、构建用户画像、文献调研 项目成果:根据2952447条数据29个特征建立模型,识别8类核心用户群体,为互联网+医疗促进分级诊疗制度的实施提供数据支持
520Pythonnlp
传统视频特征提取高度依赖领域知识,切鲁棒性差,泛化能力也不够。深度学习的方法通过多层非线性变换,从原始数据中学习层次化的特征表示,从而实现更准确、更鲁棒的特征提取。操作步骤如下: (1)对原始短视频做简单的预处理,使用FFmpeg工具快速将视频按照帧抓取图片; (2)依照准确率和时间的需求决定输入模型的图片的数目N,以相等的间隔均匀地从所有图像中抽取输入图像,组成一段有序的输入帧,并剪切成224像素×224像素的大小; (3)将步骤(2)中处理好的图片输入二维卷积神经网络,输出浅层特征表示图; (4)将步骤(3)的输出结果,输入伪三维卷积神经网络,进行时间信息和高维空间信息学习.
950Python机器学习/深度学习
知识问答平台开源项目
项目介绍 silc-client 是一个基于 Vue 3 + TypeScript 构建的现代化前端应用项目。该项目使用了最新的前端技术栈,提供了一个响应式、高性能的用户界面。 技术栈 框架: Vue 3.5.13 (Composition API) 语言: TypeScript 5.8.0 构建工具: Vite 6.2.4 状态管理: Pinia 3.0.2 路由: Vue Router 4.5.0 UI组件库: Element Plus 2.9.9 图表库: ECharts 5.6.0 HTTP客户端: Axios 1.9.0 工具函数: Lodash 4.17.21 日期处理: Day.js 1.11.13 项目特性 ? 基于 Vue 3 Composition API 的现代化开发体验 ? 使用 Element Plus 提供的丰富UI组件 ? 集成 ECharts 支持数据可视化 ? 使用 Pinia 进行状态管理 ?️ Vue Router 实现单页应用路由 ? TypeScript 提供类型安全 ⚡ Vite 提供快速的开发服务器和构建
2280Python机器学习/深度学习
词袋模型只考虑是否出现,而不考虑词与词之间的顺序,导致文本中很多语义关联的丢失。 本项目用Dirichlet分布α中取样生成文档di的主题分布θi(主题分布θi由超参数为α的Dirichlet分布生成),从主题的多项式分布θi中取样生成文档di的第j个词的主题z(i,j),并将其对应的词语分布∳(z,j)由参数为β的Dirichlet分布生成,依次作为一个词是否出现在前一个词的概率。 该项目简化了语料库或数据框与大语言模型(LLMs)的对接过程,通过确定最佳主题数,支持文本分类、摘要生成、评分以及分析等多种任务。
1100Python机器学习/深度学习
想比较传统的消歧方法(如:基于词典的消歧),本文通过上下文的频繁项挖掘进行判别。将环境信息作为可信证据,包括特征选择、参数优化和集成学习等相关技术。 项目思路:手动标记部分训练示例或一小部分确定的规则,用于训练监督方法的初始分类器。然后让分类器用于未标记的语料库,以获取一个更大的训练集。这个过程重复进行,每个新分类器都在一个逐渐变大的训练语料库上进行训练,直到整个语料库被标记,或者达到给定的最大迭代次数。 效果如作品图片所示:
880机器学习/深度学习
该项目主要分为三部分,算法、前端和后端,算法读取摄像头数据并实时处理,将处理后的结果发给后端保存,处理后的视频经流媒体发给前端显示;前端使用Vue框架,结合element-ui、Echarts实现了对人流量数据的图表分析功能。后端采用SpringBoot,实现数据的接收发送与用户权限管理。
1400Java建站系统CMS
• 程序分析:用AST树(语法分析树)对源代码进行静态分析,提取出代码中的变量、函数和类的结构信息 • 工具实现:独立开发了基于VS Code的类型标注插件工具LLMinfer,实现自动化类型推断功能 • 数据收集:训练并测试Type4Py模型 • 模型比较:比较传统模型(Type4Py)、混合模型(Type4Py+Deepseek-coder)、大模型(Deepseek-coder)的Python类型预测准确率 • 论文撰写:作为主要作者参与立项、结项论文撰写 • 项目获奖省级优秀项目
2070java人工智能
百度PaddlePaddle开源项目
百度飞桨(PaddlePaddle)是中国首个自主研发的开源深度学习框架,解决了从模型训练到部署的全流程难题,提供多样化的工具(如PaddleOCR、PaddleNLP、PaddleSlim),优化中文任务及低资源设备上的AI应用。其灵活的动态图与静态图结合、强大的分布式训练与模型压缩能力,使其在性能和产业落地中表现优异。通过简单的安装和丰富的预训练模型,用户可以快速上手并实现高效开发。
2030深度学习人工智能
该科研项目提出并且通过实验证实了一种通过向Stable Diffusion模型增加一个基于CNN特征提取网络的人物形象编码器来实现让Stable Diffusion在生成模型未见过的形象时可以不需要额外训练或者微调主模型或者Lora模型。 文中提出了三种技术路线,最终在其中一种技术路线中成功实践并且在较少数据集上得出了有效的结果,证明了技术路线的可行性。 论文摘要: The current state-of-the-art Diffusion model has demonstrated excellent results in generating images. However, the images are monotonous and are mostly the result of the distribution of images of people in the training set, making it challenging to generate multiple images for a fixed number of individuals. This problem can often only be solved by fine-tuning the training of the model. This means that each individual/animated character image must be trained if it is to be drawn, and the hardware and cost of this training is often beyond the reach of the average user, who accounts for the largest number of people. To solve this problem, the Character Image Feature Encoder model proposed in this paper enables the user to use the process by simply providing a picture of the character to make the image of the character in the generated image match the expectation. In addition, various details can be adjusted during the process using prompts. Unlike traditional Image-to-Image models, the Character Image Feature Encoder extracts only the relevant image features, rather than information about the model's composition or movements. In addition, the Character Image Feature Encoder can be adapted to different models after training. The proposed model can be conveniently incorporated into the Stable Diffusion generation process without modifying the model's ontology or used in combination with Stable Diffusion as a joint model.
1980python人工智能
决策支持系统开源项目
通过大量数据分析实现最适合的方案,决策支持系统(Decision Support System, DSS)是一种信息系统,它结合了计算机科学、数据管理和人工智能技术,旨在帮助决策者收集和分析信息,从而做出更好的决策。DSS通常包括以下组件: 数据管理:用于存储和管理数据的系统,包括数据库管理系统(DBMS)和其他数据仓库技术。 模型管理:包括用于处理和分析数据的统计和数学模型。 用户界面:使用户能够与系统交互,输入参数、查询信息以及查看结果的界面。 在您的工作中,如果涉及到植物科研测量和数据分析,一个决策支持系统可以帮助您更有效地管理数据、分析结果,并基于这些信息做出更明智的决策。
1570html5大数据
基于现在比较流行的ECAPA-TDNN神经网络进行改进,提取语音的声学特征并据此进行语种判别,实现了一个更加方便 高效的语种识别系统。 主要工作: 1、理解任务,阅读相关论文以了解语音相关的研究成果和技术,明确研究方法 2、准备合适的数据集,对数据集进行预处理,提取声学特征 3、深入理解 ECAPA-TDNN 模型并设计进行实验 4、分析模型的输出结果,根据模型与问题、数据的匹配性调整参数和训练策略 5、诊断问题、分析错误后积极与导师讨论,合力解决问题
2290深度学习人工智能
本项目提出了一种深度强化学习算法(多约束的PPO算法)以提高车辆的控制稳定性,本项目基于UE4实现了一个自动驾驶仿真环境,在该环境中跑通了车辆自动驾驶模型的训练、评估,证明了本项目提出算法的有效性。 深度强化学习(DRL)已经在各种具有挑战性的决策任务中进行了研究,例如自动驾驶。然而,DRL通常存在动作抖动问题,这意味着即使状态只有轻微差异,代理也可以选择具有很大差异的动作。这个问题的一个关键原因是DRL奖励的不当设计。在本文中,为了解决这个问题,我们提出了一种新的方法来将动作的平滑性纳入奖励中。具体来说,我们引入了子奖励,并添加了与这些子奖励相关的多个约束。此外,我们提出了一种多约束近端策略优化(MCPPO)方法来解决多约束DRL问题。大量的仿真结果表明,所提出的MCPPO方法在动作平滑性方面优于传统的比例-积分-微分(PID)和主流的DRL算法。
2050深度学习人工智能
本项目开发一个书籍自动翻译器,该翻译器能够对pdf或word格式的文档进行自动翻译成中文,并输出为pdf或markdown格式的文件。 该工具使用了大语言模型LLMs(GPT-4o等),可以根据配置文件选用不同的大模型 主要开发语言为Python,该项目是模块化的,并且面向对象的设计,易于定制或拓展
3560深度学习人工智能
由于之前一直在公司工作,很多项目无法截图,这边写上自己个人技能: 独立开发过CV/NLP/机器学习项目,具备独立解决问题的能力。 精通医疗/通用场景图像分类、检测、信息抽取、OCR及一维信号分类。 自学能力强,能够快速学习、掌握新技术和工具,持续跟踪业内最新技术进展(AIGC、LLM)。 熟悉BERT相关预训练模型的使用及其NLU任务定制等通用NLP技术及LLM大模型的微调。 在天池CBLUE医疗信息大数据比赛中排名第27名,KAGGLE毒性评论打分比赛获得银牌。 熟练使用PYTHON开发,熟悉C、MATLAB。
2370深度学习人工智能
当前共334个项目more
×
寻找源码
源码描述
联系方式
提交