StanfordCoreNLP提供了一套用Java编写的自然语言分析工具。它最初是为英语开发的,但现在也为(现代标准)阿拉伯语、中文、法语、德语和西班牙语提供不同程度的支持。StanfordCoreNLP是一个集成的框架,可以很容易地将一堆语言分析工具应用于一段文本。它的分析为更高层次和特定领域的文本理解应用提供了基础性的构建块。StanfordCoreNLP是一套稳定的、经过良好测试的自然语言处理工具,被学术界、工业界和政府的各种团体广泛使用。
使用Ant构建确保你已经安装了Ant使用以下命令编译代码:cdCoreNLP;ant然后运行此命令以使用最新版本的代码构建一个jar:cdCoreNLP/classes;jar-cf../stanford-corenlp.jaredu这将在包含最新代码的CoreNLP文件夹中创建一个名为stanford-corenlp.jar的新jar与最新代码一起使用的依赖项位于CoreNLP/lib和CoreNLP/liblocal中,因此请确保将它们包含在您的CLASSPATH中。使用最新版本的代码时,请确保下载最新版本的corenlp-models、english-models和english-models-kbp并将它们包含在你的CLASSPATH中。使用Maven构建确保你已经安装了Maven如果您在CoreNLP目录中运行此命令:mvnpackage,它应该运行测试并构建这个jar文件:CoreNLP/target/stanford-corenlp-4.4.0.jar使用最新版本的代码时,请确保下载最新版本的corenlp-models、english-extra-models和english-kbp-models并将它们包含在您的CLASSPATH中。如果您想将StanfordCoreNLP用作Maven项目的一部分,您需要将模型jar安装到您的Maven仓库中。下面是安装西班牙模型jar的示例命令。对于其他语言,只需更改命令中的语言名称。安装stanford-corenlp-models-current.jar你需要设置-Dclassifier=models.这是西班牙语的示例命令:mvninstall:install-file-Dfile=/location/of/stanford-spanish-corenlp-models-current.jar-DgroupId=edu.stanford.nlp-DartifactId=stanford-corenlp-Dversion=4.4.0-Dclassifier=models-spanish-Dpackaging=jar
评论