*多模态
1.audio_text多模态相关,实现对语音-文本相似度匹配,绕开传统的tts,实现直接从audio到text的匹配,满足快速阅报中的多项信息的快速推荐功能。
2.a.负责搭建模型的backbond,借鉴clip模型,audioencoder端借鉴whisper的encoder
b.模型整体代码,预测接口开发
b.显存优化相关工作
*知识图谱
1.依赖相关数据构建的知识图谱,包括对实体的抽取,实体关系抽取
2.a.定义相关实体类别,实体-实体关系的scheme
b.模型选择,模型构建,实体抽取采用传统的bert-bilstm-crf,5类实体,f1 0.87
关系抽取使用mhs(多头选择) 70种关系f1 0.73
点击空白处退出提示












评论