达观底层NLP框架

我要开发同款
old wang2022年07月05日
95阅读

作品详情

项目描述:整个公司的核心NLP底层框架由我们开发,包括Wordseg、POS、NER、Tagging、Summary5个子模块,用Python的class封装,供安装调用。工作内容:上述5子模块的开发、升级、维护对于Wordseg,根据词库构建词图,针对连续单字,使用HMM、CRF、Bi-LSTM-CRF进行未登录词识别加入词图,计算最优分词路径;对于POS,先分词,再从词库或模型中找出词的词性标签,对于存在一词多词性问题,计算最优词性路径;对于NER,使用CRF和DL模型识别实体,再融合词库中的实体,返回;对于Tagging,使用TF-IDF、TextRank、LDA多种模型提取;对于Summary,主要考虑的是抽取式摘要,计算句子的bm25分数,进行TextRank;
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论