Java

java是1995年由Sun公司推出一门面向对象的编程语言。[1]Java具有简单性、面向对象、分布式等特点,可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序等。[1]
elasticsearch-jieba-plugin 是 Jieba 中文分词插件。试用 Elasticsearch 5.1.2 版本,基于 huaban 开源的的 jieba java 实现。...
680Java网页组件
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本。 结巴分词的原始版本为python编写,目前该项目在github上的关注量为17...
640Java中文分词库
X-Hive/DB是一个为需要高级XML数据处理和存储功能的软件开发者设计的强大的专属XML数据库。X-Hive/DB Java API包含存储、查询、检索、转换和发表XML数据的方法。 本文转...
1090Java开源XML数据库
DataSphere Studio(简称DSS)是微众银行大数据平台——WeDataSphere,自研的一站式数据应用开发管理门户。 基于 Linkis 计算中间件构建,可轻松整合上层各数据应用...
1450Java大数据
imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究...
520Java中文分词库
博文的 java 实现,可以自动抽取语料库中的词汇,可以作为自然语言处理的第一步,准备词典。 成词条件 互信息 左右熵 位置成词概率 ngram 频率 运行方法 下载或者gradle distT...
770Java中文分词库
Reduce 为 Coody Framework+Minicat 首秀,短网址服务平台。部署在服务器,使用短域名解析即可提供服务。全项目打包后(带前端页面)大小约:2.5M,非常精简。 前端采用...
1700Java短网址服务
该软件是基于IK analyzer中文分词系统,以及基于知网的词语相似度计算一文,开发的能够将普通话转换为方言的分词翻译系统。软件采用基于词库的中文方言分词,对普通话的句子进行最大分词,从而进行...
810Java中文分词库
中文分词器分词效果评估对比 使用说明: 如何建立开发环境? 如果是使用Netbeans、IDEA,则直接打开项目 如果是使用Eclipse、MyEclipse,则要执行导入操作 推荐使用IDEA...
600Java中文分词库
1、mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的 a...
620Java中文分词库
Apache Tapestry 5.4 即将发布,它将完美支持Jquery,我个人偏好 Jquery EasyUI,于是开发出基于 Tapestry 5.4版本的 Jquery EasyUI 组...
560Java网页组件
DocViewer 是类似百度文库、豆顶书屋的在线文档阅读程序。基于JAVA语言,跨平台的文档在线阅读器。 一个文档在线阅读的JAVA企业级解决方案。 程序需要openoffice(或Libre...
720Java网页组件
IK中文分词器在Elasticsearch上的使用。原生IK中文分词是从文件系统中读取词典,es-ik本身可扩展成从不同的源读取词典。目前提供从sqlite3数据库中读取。es-ik-plugi...
790Java中文分词库
spring-boot-klock-starter 基于redis的spring boot分布式锁组件,有了这个组件,使得项目拥有分布式锁能力变得异常简单,支持spring boot,和spir...
570Java网页组件
Ansj 中文分词开源项目
Ansj中文分词 这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化 内存中中文分词每秒钟大约100万字(...
550Java中文分词库
jeasyui项目是对Easyui控件库的JSP封装,将easyui组件封装成JSP标签库。简化easyui的使用难度,学习成本,更少的代码量。友好的IDE提示,类似JSF,Asp控件的写法,提...
560Java网页组件
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未...
660Java中文分词库
smallseg -- 开源的,基于DFA的轻量级的中文分词工具包 特点:可自定义词典、切割后返回登录词列表和未登录词列表、有一定的新词识别能力。 Python 示例代码: s3 = file(...
720Java中文分词库
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件,本身并不包含爬虫功能,但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtracto...
560Java网页组件
C-OCR是携程自研的OCR项目,主要包括身份证、护照、火车票、签证等旅游相关证件、材料的识别。 项目包含4个部分,拒识、检测、识别、后处理。
1710JavaOCR开发包
当前共17920个项目
×
寻找源码
源码描述
联系方式
提交