语音识别

小智语音对话产品系统
语音对话,角色定制,兼容小智系统,可直接使用小智服务器系统。未来会增加智能家居控制系统,利用红外线控制电视,空调等。可以定制外壳,作为商品销售。兼容乐鑫esp32开发板。
1710语音识别人工智能
1)精听播放器:支持中英双语字幕、逐句播放、自动下一句、AB循环、倍速、静音/后退/前进、收藏句子等;提供完整快捷键(空格、方向键、A、F、Enter等)提升操作效率。2)学习记录:登录后自动保存学习进度、已学篇目、收藏句子与打卡天数;未登录场景下用localStorage做临时记忆。3)内容管理/
1130Java在线教育
涉及到目标识别和数据库存储、rk3588开发板目标识别、语音识别、语音合成、数据库查询等。基于语音交互+rkllm大模型:数据查询延迟在2.5秒以内,资源占用率高;基于语音交互+正则匹配:数据查询2秒以内,资源占用率低。
630C++人工智能
智能过磅程序产品系统
1:小程序登记信息司机可通过扫码进入小程序登记相应信息,获取到过磅凭证2:扫码过磅司机提供小程序过磅凭证刷码过磅3:手机端签收验料员手机端签收4:过磅抓拍通过抓拍相机留存过磅证据5:语音提示(文本语音转换)完成过磅、错误或者警告提示
890C#物流仓储
情智星球产品系统
情智星球是一款基于情感大模型的AI心理咨询产品,创造性的将人工智能与心理学和情感辅导相结合,打造了国内首个达到二级心理咨询师水平的AI智能体。通过用户与自主研发的多模态AI心理咨询师一对一对话模式,测(测评)询(咨询)练(练习)一体,帮助广大心理亚健康人群进行情绪压力疏导、自我探索提升、情感问题解决,并提升心理健康水平。
930java人工智能
本方案面向做AI项目的企业团队,同时面向AI小白,刚接手新项目而缺少经验的朋友; 本方案优势在于具备丰富的AI算法及行业落地相关经验,包括计算机视觉、多模态、大模型等; 本方案基于yolo、ByteTrack、ReID、llava、SAM、CLIP、docker、fast-api等相关技术组成!
1350深度学习人工智能
数字人直播产品系统
在数字化时代,直播行业已成为信息传播、娱乐互动和商业推广的重要平台。然而,传统直播模式面临着人力成本高、直播时间受限、内容单一等问题。数字人直播系统应运而生,它结合了人工智能、计算机图形学和实时渲染技术,通过高度智能化、个性化的数字人主播,为用户提供全新的直播体验。该系统不仅能够实现24小时不间断直播,还能根据不同的场景和需求进行个性化定制,为直播行业带来创新和变革,推动其向智能化、高效化方向发展。 1、开发2D口型驱动算法; 2、开发TTS语音生成算法; 3、实现数字人实时推流;
1300深度学习人工智能
1、随着大模型技术的不断发展,其在智能工程质检系统中的应用前景广阔。大模型不仅能有效解决传统质检方法中存在的效率低下、成本高昂等问题,还能克服小模型在数据标注和识别率方面的局限性。因此,构建基于大模型的智能工程质检系统成为提升工程质量检测水平的关键路径之一。这样的系统不仅可以提高质检工作的自动化程度和准确性,还能为企业节省大量的人力物力资源,促进工程建设行业的数字化转型和技术升级; 2、实时视频交互,大模型与小模型结合,完善整个质检流程,提升识别率;
790深度学习大模型
音频算法源文件源码
3、对音频数据进行处理,做一些音频实验 4、熟悉webrtc3A算法,调整参数保证音频底噪,拾音,破音等符合标准。 5、基于CNN进行简单的指令识别 6、训练二分类模型,部署到生产软件上,熟悉Postman,写Python接口,测试端口 8、熟悉Audition 9、提取webrtcANS中噪声估计模块,熟悉封装dll与lib
920C/C++TTS/语音合成和处理1.90元
照护师系统产品系统
个性化照护是其显著亮点。依据患者病史、基因数据、生活习惯等海量信息,AI 照护师量身定制专属照护方案。从饮食搭配到康复训练计划,从用药提醒到心理疏导,满足个体差异需求,让每位患者都能得到最契合自身的关怀,增强康复信心与效果。 不知疲倦的特性更是一大优势。它可 24 小时不间断工作,时刻守护患者,尤其在夜间等医护人员相对忙碌时段,能持续监测病情,及时预警突发状况,保障患者安全,减轻医护压力,优化医疗资源分配。 而且,AI 照护师还能高效整合医疗资源。与医院信息系统无缝对接,快速获取病历、检查报告等资料,辅助医护人员全面了解患者情况,促进多学科协作,为患者打造连贯、高效的照护服务闭环,推动医疗服务向智能化、精细化迈进,为人类健康保驾护航,成为未来照护领域不可或缺的得力助手,开启智能照护新时代,书写医疗关怀新篇章。
980深度学习医疗
通过防霸凌系统可以有效的保护学生的在校安全情况,能够实时的检测是否有睡课、打闹、翻墙、吸烟、摔倒等危险行为,同时能够对学生进行行为轨迹追踪,在发生风险时第一时间通知相关责任人进行处理,同时与请销假系统进行联通,学生的考勤、请假情况通过小程序联动通知学生家长。
1280java教育
小智产品系统
本方案面向大部分有需求的群体,解决了中少年们解决问题的速度和准确性; 本方案与市面上的其他方案相比,接入了deepseek大模型,依靠强大的语言理解能力和生成能力来实现更智能的交互 本方案运用大量传感器模块,以实现多功能扩展
730深度学习人工智能
智能会议系统从会议预约、会议展示、会议室设备控制、会议签到、门禁控制、会议录音、ASR语音转文字、会议摘要生成、会议摘要转发进行全流程管控,确保会议安全,提供会议室利用率,并减少办公室人员的工作负担,提高会议的转发效率。
1050java人工智能
智能语音服务产品系统
总体:视频/音频提取文字、双语配音;字幕配音、文本配音、图文转视频 详细如下: 语音识别 生成字幕:上传音频或视频,系统根据声音,生成字幕,支持23国语言和19省方言,可下载字幕文件或文本文件 字幕翻译:生成好的字幕,支持23国语言相互翻译,比如将英语视频变成中文字幕或日文字幕 字幕校对:对生成好的字幕进行校对编辑,可对识别有误或翻译不准的字幕,进行重新翻译和反向翻译 字幕配音:配合语音合成模块,可为生成好的字幕进行配音,比如操作说明类的视频,可将自己的声音换成自然流畅的男女声音 合成字幕:可将字幕合进视频里,比如上传英语视频,最终下载:带中英文字幕的视频 视频配音:结合字幕配音和合成字幕功能,比如上传英语视频,最终下载:中文字幕+普通话配音视频 错词替换:可以替换口头禅、错词、专业词、敏感词等,比如把【暴力】替换成【BL】或【BaoLi】 高级配置:可配置一行字幕最长时长,默认8秒,可配置合成字幕的样式:大小、位置、颜色等 语音合成 文本转语音:为一段文本配音,101种声音可选,男、女、童等多种声音,适合解说、广告、新闻、有声书等多种场景 字幕转语音:为一段字幕配音,按每一句的时间点来合成声音,适合为自己录制的视频换成另一个声音 图文转视频:准备好多张图片或小视频和多段文字,最终可下载带有字幕和配音的视频,适合快速制作新闻资讯、讲故事类的视频 单句重新合成:如果有些句子文字有错导致配音错误,或男声想换成女声,可修改该句文字,或换个声音,重新合成 单句声音定制:每个句子可单独定制声音,适合对话场景,比如有声音书朗读,总体是男声,对话的部分使用女声
1630java人工智能
同声传译产品系统
基于大模型实现英语,德语,法语,中文,日语相互同声传译。 输入一个音频,输出一个对应文字的文件,音频按流式输入给模型。 通过大量数据训练模型,使其能够识别语言模式和结构。深度学习则进一步利用神经网络模拟人脑处理信息的方式,提高翻译的准确性和流畅性。 神经机器翻译(Neural Machine Translation, NMT)是当前最先进的翻译技术。与传统统计机器翻译(SMT)相比,NMT使用深层神经网络,能够更好地捕捉语言的复杂性和上下文信息。NMT模型通常包括编码器(Encoder)和解码器(Decoder)两部分:编码器将源语言文本转换为向量表示,解码器则将这些向量转换为目标语言文本。
2200深度学习人工智能
一、提供个性化大模型解决方案咨询(指令咨询、POC) 服务内容全部包含: 1、大模型咨询服务:针对企业流程,提供个性化的大模型解决方案咨询,包括指令咨询、POC概念验证等。 2、大模型项目实施:帮助企业实施大模型应用,涵盖数据分析、流程自动化、预测模型等。 3、AI培训与落地:为企业内部人员提供大模型及AI技术培训,确保技术落地和持续优化。 4、Python模型应用开发:精通Python开发,能够快速为企业搭建大模型应用。 服务优势: 曾在智谱AI担任指令工程师,在使用大模型能力赋能传统企业完成流程再造方面具有丰富经验,曾负责知识库问答、NL2SQL、智能体、汽车座舱助手、信息抽取、AIPC、AI手机、营销报告生成、PPT生成、金融快讯生成等项目,覆盖汽车、手机、电商、金融、传媒、电信运营商等领域。 服务前需客户提供的信息: 1、选用的模型是什么; 2、部署方式:API/云端私有化/本地私有 3、客户提供不少于50条测试用例、输入输出范例、评测标准,响应速度等技术要求。 二、计算机视觉算法解决方案 服务内容全部包含: 1000+算法集成,可自由定制 智慧园区: 明火与烟雾检测、电梯间电动车识别、写字楼消防门堵塞、越界检测、离岗检测、垃圾桶满溢识别、攀爬识别 智慧工地:安全帽识别、反光衣识别、抽烟识别、打电话识别、离岗检测、明火与烟雾检测 智慧充电站:新能源车位燃油车驶入、跨位停车检测、车牌特征与车牌识别 智慧交通:车辆违停识别、机动车占道识别、电动车头盔识别、车牌识别 服务优势: 低成本 1、局域网环境本地部署,无数据安全风险; 2、充分利旧,不改造任何硬件; 3、1000+成熟算法,赋能千行百业; 4、作品:https://www.kancloud.cn/vinsonwang/aigc/3224775 服务前需客户提供的信息: 你的摄像头都有哪些品牌 你需要的部署环境是什么样的 你的需求场景的详细描述 你需要开发的功能有哪些 你预计需要哪几种算法
1930图像识别人工智能
最早一批的Comfyui插件作者 A100训练过大语言模型,对语言模型数据处理、训练有一定的了解 训练图像模型,在sd模型civitai上有发布有、comfyui插件作者。与达摩院合作开发开源项目 facechain Agent方面:langchain-chatchat贡献者,熟悉langchain、eliza开源项目贡献者
1590图像处理人工智能
AI家庭助理产品系统
AI家庭助理是一款软硬件结合的智能家庭产品,它具有人脸识别,语音识别,智能聊天,智能提醒等多种功能。 它是将多种AI功能融合在一台笔记本中,或者也可以集成到一个小型机器人中。 它可以作为一款智能家居助手来使用,可以识别到各位家庭成员,提供聊天,打招呼,日程提醒,天气播报等。
1880图像处理人工智能
Orange-AI产品系统
Orange 是中国首个通用人工智能(AGI)系统,旨在通过创新的算法和深度学习技术,推动人工智能的发展。作为一个跨领域的智能平台,Orange 不仅具备强大的数据处理能力,还能够在多种复杂任务中进行自主学习和适应,从而实现超越传统人工智能的智能水平。 Orange 的设计理念是模仿人类思维方式,具备理解、推理和创造的能力。它能够处理各种信息,从语言理解到图像识别,再到复杂的决策制定,为各行各业提供智能解决方案。无论是在教育、医疗、金融还是制造业,Orange 都致力于通过智能化手段提升效率,优化决策,推动业务转型。 随着技术的不断进步,Orange 将持续进化,力求成为推动社会进步和经济发展的重要引擎。它不仅是中国在人工智能领域的一个重要里程碑,更是全球 AGI 研究的先锋,标志着人工智能从单一应用走向全面智能化的新时代。
3170机器学习人工智能
中保云广播产品系统
云广播方案,云平台部署系统支持实时音视频,广域网场景音频时延低于80ms,视频时延低于200ms,支持双向互通,支持语音播报、定时任务播报、音频播放,支持TTS,支持视频联动,支持视频AI分析包括但不限于:人脸检测、人脸识别、智慧工地安全帽、工衣识别等扩展场景检测识别播报 设备端使用arm linux嵌入式开发,支持离线tts,支持4G/5G联网,视频通话、语音寻呼、音乐播放 支持app、小程序操作远程查看、控制
1250java物联网
当前共76个项目more
×
寻找源码
源码描述
联系方式
提交