随着生成式 AI(如 ChatGPT、Stable Diffusion)的普及,虚假信息传播风险日益增加。本项目开发了一套多模态检测系统,用于识别文本、图像及混合内容是否由 AI 伪造。适用于内容审核平台、版权验证及金融反欺诈等对内容真实性要求极高的场景。
点击空白处退出提示
随着生成式 AI(如 ChatGPT、Stable Diffusion)的普及,虚假信息传播风险日益增加。本项目开发了一套多模态检测系统,用于识别文本、图像及混合内容是否由 AI 伪造。适用于内容审核平台、版权验证及金融反欺诈等对内容真实性要求极高的场景。
1. 文本真实性检测:基于 BERT 模型进行微调(Fine-tuning),通过提取深层语义特征识别 AI 生成文本,准确率达 87.3%;
2. 图像伪造识别:融合 ConvNeXt 与 Swin Transformer 的多尺度特征,利用迁移学习实现对 AI 生成图片的精准检测;
3. 多模态特征融合:设计加权融合策略处理图文混合内容,F1-Score 达到 91.2%;
4. 全异步 Web 架构:采用 FastAPI + Pydantic 实现高性能数据校验与检测接口,前端基于 Vite 提供流畅的可视化交互体验。
我独立完成了从多模态模型设计到 Web 系统的搭建。针对大模型生成文本的统计特征设计了专门的特征工程,并通过对比学习提升了模型泛化能力。在后端实现上,充分利用了 FastAPI 的异步特性以支撑多用户并发检测的需求。






评论