介绍:从Github以及Stackoverflow爬取技术数据,建立排序逻辑,统计近几年最热门的编程语言以及预测未来趋势。根据公司内部员工的技术特点,为其推荐科学系的热门技术
利用python进行数据的爬取并储存至MongoDB数据库;
通过时间序列模型预测未来趋势,根据最准确的模型提取数据并建立预测数据集;
建立推荐逻辑并测试可行性;
通过DBSCAN以及Tf-idf对测试的文字描述数据做聚类分析并应用推荐系统;
与团队,前端工程师沟通需求以及具体实现细节;
点击空白处退出提示
介绍:从Github以及Stackoverflow爬取技术数据,建立排序逻辑,统计近几年最热门的编程语言以及预测未来趋势。根据公司内部员工的技术特点,为其推荐科学系的热门技术
利用python进行数据的爬取并储存至MongoDB数据库;
通过时间序列模型预测未来趋势,根据最准确的模型提取数据并建立预测数据集;
建立推荐逻辑并测试可行性;
通过DBSCAN以及Tf-idf对测试的文字描述数据做聚类分析并应用推荐系统;
与团队,前端工程师沟通需求以及具体实现细节;
评论