1、内容创作者不知道什么样的视频组合(分类、投币、点赞、弹幕)更容易成为爆款,运营策略全靠感觉
2、内容平台/自媒体/MCN机构
3、技术栈:Python, Pandas, NumPy, mlxtend (Apriori), Matplotlib, Seaborn
点击空白处退出提示
1、内容创作者不知道什么样的视频组合(分类、投币、点赞、弹幕)更容易成为爆款,运营策略全靠感觉
2、内容平台/自媒体/MCN机构
3、技术栈:Python, Pandas, NumPy, mlxtend (Apriori), Matplotlib, Seaborn
1、数据采集:爬取B站热门视频数据(标题、分类、播放量、投币/点赞/收藏等互动指标)
2、数据预处理:清洗数据、计算互动率、离散化数值指标为高/中/低等级标签
3、关联规则挖掘:使用Apriori算法挖掘视频属性与互动指标之间的隐藏关联规则
4、可视化与导出:生成规则质量图表,自动导出CSV结果和PNG可视化图
负责任务:独立完成爬虫开发、数据清洗、特征工程、Apriori建模、可视化分析全流程
技术栈:Python、Pandas、NumPy、mlxtend(Apriori)、Matplotlib、Seaborn、Requests
亮点难点:
将连续型数值离散化为等级标签,使挖掘结果对运营人员可读
限制最大项集长度+合理设置支持度阈值,平衡计算效率与规则质量
配置中文图表字体,解决matplotlib中文乱码问题
面向对象封装,参数可配置,一键运行产出完整分析报告



评论