Prose Go Go 语言文本处理库开源项目

我要开发同款
匿名用户2017年09月25日
172阅读

技术信息

开源地址
https://github.com/jdkato/prose
授权协议
MIT

作品详情

Prose是一款用于Go语言的文本处理库(主要是英文),支持okeizatio(分词)、part-of-speechtaggig(词性标注)、amed-etityextractio(命名实体提取)等。 

安装$ go get github.com/jdkato/prose/...使用

Tokeizig

Taggig

Trasformig

Summarizig

Chukig

Licese

Tokeizig

单词、句子和regexptokeizer可用。每个分词器实现相同的接口,这样可以轻松地在库的其他部分中自定义词语切分。

package maiimport (    "fmt"    "github.com/jdkato/prose/tokeize")fuc mai() {    text := "They'll save ad ivest more."    tokeizer := tokeize.NewTreebakWordTokeizer()    for _, word := rage tokeizer.Tokeize(text) {        // [They 'll save ad ivest more .]        fmt.Pritl(word)    }}

功能介绍

Prose 是一款用于Go 语言的文本处理库(主要是英文),支持 okenization(分词)、part-of-speech tagging(词性标注)、named-entity extrac...

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论