本项目提供一个用户界面,通过网络爬虫搭建热词词库,并提供多种功能模块,包括数据爬取、数据可视化处理和扩展功能。
模块一——爬虫模块: 能够有针对军事网站 dvidshub 中的视频进行爬取,获取相关数据。
该模块功能成功申请了软件著作权
模块二——数据处理模块:
1、生成热词词云:提供多种形态的热词词云生成,直观展示关键词。
2、实意词提取:从文本中提取实体词,便于深入理解文本的主题。
3、高频词提取:统计文本中的高频词汇,帮助用户快速把握文本关键信息。
模块三——算法模块:CR 文字识别:应用光学字符识别技术,提取并识别图片中的文字信息。
点击空白处退出提示


















评论