Gemini多模态bot产品系统

我要开发同款
全栈工程师2026年01月16日
5阅读

技术信息

语言技术
Python
系统类型
Web
行业分类
人工智能开发工具
参考价格
5000
演示地址
https://huggingface.co/spaces/cymatt/gemini-gradio-app-multimodalities/tree/main

作品详情

行业场景

gemini模型支持文字和图片两个模态的分析,因此需要构建一个应用进行测试模型的稳定性和准确性。

功能介绍

这个应用是在hugging face构建的应用,主要是后端的代码功能实现后用gradio构建了一个简易的UI,用户可以上传照片在prompt部分可以让识别内容或画bounding box等。

项目实现

主要调用了google gemini的api,用于图片的大模型分析。同时使用gradio简化用户操作

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论