微短剧作为数字经济催生的新兴内容形态,已从“野蛮生长”迈入“千亿级”产业赛道。2024年我国微短剧市场规模首次超越全年电影票房,截至2025年6月用户规模达6.96亿,占网民总数近七成。“快节奏+强情绪+短篇幅”的叙事特征精准契合了移动互联网时代碎片化消费习惯。与此同时,国家层面大力推动“微短剧+”战略,鼓励与文旅、科普、品牌营销等领域深度融合。长沙作为“后发者”,2024年全省微短剧产量仅占全国3%、七成剧集在外省取景,亟需了解本地消费生态以支撑“短剧之都”建设。本项目旨在通过系统调研,厘清长沙短剧用户行为特征、付费逻辑与城市IP联动机制,解决产业基础薄弱、付费转化断层、城市元素植入粗糙等核心痛点,为政府精准施策、园区错位发展提供数据支撑。
调研围绕三大核心板块展开。用户行为特征分析:运用K-Means聚类识别两类核心群体——“本土情怀·潜在共鸣者”(44.4%,从未付费但对长沙本土元素偏好强、情感共鸣显著)与“多元尝鲜·付费行动派”(55.6%,付费行为普遍、题材偏好广泛、价格接受度较高),并通过决策树模型挖掘年龄、学生身份、居住时长等关键驱动变量。用户行为与付费意愿结构方程模型:揭示内容吸引力通过情绪价值负向影响观看频率(β=-0.357),呈现“高强度-低频率”刷剧模式;而价格感知是付费行为的唯一显著直接驱动因素(β=0.071),揭示“好看不等于愿意花钱”的核心消费逻辑。城市元素影响机制:融合文本挖掘(词云、共现网络、LDA主题模型)、情感分析(12429条评论)与因果森林模型,揭示地标与美食元素如何构建“内容种草-文旅向往”认知迁移路径,并量化本土短剧对打卡意愿的异质性处理效应。市场潜力指数:通过验证性因子分析与层次分析法构建“用户基础-变现潜力-文旅联动”三因子综合评价体系,聚类识别高潜力(41.3%)、中潜力(44.2%)、低潜力(14.5%)三层市场结构。
独立完成了全流程数据获取与分析,12429条评论数据的爬取与清洗、K-Means聚类与决策树群体识别、结构方程模型理论框架搭建与AMOS建模、文本挖掘全流程(分词/词云/共现网络/LDA/情感分析)代码编写、因果森林模型训练与解读(基于Python econml库)、以及AHP层次分析法赋权与潜力指数计算。
技术栈与架构亮点:数据采集使用Python网络爬虫与手工整理相结合;统计分析采用SPSS+AMOS;机器学习部分使用Python的scikit-learn(K-Means、决策树)、econml(因果森林)、SnowNLP(情感分析)、gensim(LDA主题模型)。方法论创新主要体现在三方面:一是引入因果推断方法突破相关分析局限,因果森林模型揭示ATE接近于零但CATE分布范围-0.13至0.14,识别出正向效应与负向效应分化人群;二是构建“态度-表达”双轨验证体系,将问卷数据与评论数据融合,显著提升结论稳健性;三是多模型深度耦合——K-Means聚类后接决策树实现从“是什么”到“为什么”的递进分析,SEM理论验证后接因果森林探索个体异质性。核心难点包括问卷质量控制(逻辑陷阱题+IP校验+时长管控三重筛查)、因果关系与相关关系的区分(通过因果森林识别异质性处理效应)、文本分析的语义噪声过滤(哈工大停用词表+人工校验)、以及预测模型与业务策略的衔接(通过AHP将多维数据转化为可操作的市场潜力指数)。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论