gemini模型支持文字和图片两个模态的分析,因此需要构建一个应用进行测试模型的稳定性和准确性。
点击空白处退出提示
语言技术
Python系统类型
Web行业分类
人工智能、开发工具参考价格
5000演示地址
https://huggingface.co/spaces/cymatt/gemini-gradio-app-multimodalities/tree/main
gemini模型支持文字和图片两个模态的分析,因此需要构建一个应用进行测试模型的稳定性和准确性。
这个应用是在hugging face构建的应用,主要是后端的代码功能实现后用gradio构建了一个简易的UI,用户可以上传照片在prompt部分可以让识别内容或画bounding box等。
主要调用了google gemini的api,用于图片的大模型分析。同时使用gradio简化用户操作




评论