1.清洗爬虫数据,已将 26 万条爬虫数据去 html 标签化2. 运用 baiduAip 接口对虎嗅文章提取一级和二级标签并可视化,对虎嗅最近一年文章进行了自动细度归类3. 用机器学习算法进行文章相似度分析以及分类,已上线
评论