支持与openai,anthropic,ollama兼容的大模型对接的ai中台项目
点击空白处退出提示
支持与openai,anthropic,ollama兼容的大模型对接的ai中台项目
1. jwt 用户登录认证功能
2. 用户与大模型对话功能(文本和语音)
3. RAG检索增强功能
4. 语音转文本功能:集成faster-whisper-small模型实现实时语音转写
5. 对话上下文管理策略功能
1. 用户认证系统实现了JWT Token认证机制
2. 对话功能:设计了灵活的上下文管理策略:全量上下文、滑动窗口、摘要压缩、混合策略;实现了流式和非流式对话响应;支持多模型配置(OpenAI、Anthropic、Ollama等)
3. 检索增强生成(RAG):构建了完整的RAG管道:向量检索、去噪、重排、压缩;集成BAAI/bge-m3文本嵌入模型;支持多种文档格式处理(PDF、Word、Markdown等)
4. 语音转文本功能:集成faster-whisper-small模型实现实时语音转写
5. 文档存储:实现了文件上传、元数据管理和分块存储;支持本地存储和MinIO对象存储;使用Redis-Stream消息队列异步处理文档向量化
6. 系统架构设计:采用依赖注入容器管理服务组件;实现全局异常处理和国际化支持;配置多进程部署和健康检查机制




评论