HanLP 自然语言处理开源项目

我要开发同款
匿名用户2015年03月28日
35阅读
开发技术Java
所属分类人工智能、自然语言处理
授权协议Apache

作品详情

HanLP:HanLanguageProcessing汉语言处理包

HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

HanLP提供下列功能:

中文分词 

最短路分词

N-最短路分词

CRF分词

索引分词

极速词典分词

用户自定义词典

 词性标注

命名实体识别 

中国人名识别

音译人名识别

日本人名识别

地名识别

实体机构名识别

关键词提取 

TextRank关键词提取

自动摘要 

TextRank自动摘要

短语提取 

基于互信息和左右信息熵的短语提取

拼音转换 

多音字

声母

韵母

 声调

简繁转换 

繁体中文分词

简繁分歧词

文本推荐 

语义推荐

拼音推荐

字词推荐

依存句法分析 

MaxEnt依存句法分析

CRF依存句法分析

语料库工具 

分词语料预处理

词频词性词典制作

BiGram统计

词共现统计

CoNLL语料预处理

CoNLLUA/LA/DA评测工具

在提供丰富功能的同时,HanLP内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料。

查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论