通过用户上传或扫描路径方式输入原始数据,主要是html页面。
使用jsoup解析html页面,获取到页面的标题,正文内容。
使用lucene创建索引。英文页面使用标准分词器,中文页面使用ik分词器。
支持关键字搜索,搜索结果高亮,分页,跳转到内容展示页面。
类似百度搜索功能。
负责解析原始数据、创建lucene索引和关键字搜索等核心功能开发以及维护阶段的问题支撑。编写开发手册和问题定位相关博客。
点击空白处退出提示
通过用户上传或扫描路径方式输入原始数据,主要是html页面。
使用jsoup解析html页面,获取到页面的标题,正文内容。
使用lucene创建索引。英文页面使用标准分词器,中文页面使用ik分词器。
支持关键字搜索,搜索结果高亮,分页,跳转到内容展示页面。
类似百度搜索功能。
负责解析原始数据、创建lucene索引和关键字搜索等核心功能开发以及维护阶段的问题支撑。编写开发手册和问题定位相关博客。




评论