平台注册用户数突破1500万,可日活仅4万左右,每当平台大量优惠卷后,活跃人数明显高于平时,且个别用户邀新达5人以上。我们意识到羊毛党对公司的运营、营销等来说是一个巨大的隐患。最终对羊毛党用户实施下单返现优惠活动,日活提高了10%左右,利润提高了7%。
1. 与业务部门商讨羊毛党的相关特征,基于业内的普遍认知(会员经验低,折扣订单数大,登陆次数少,拉新数量大、访问到下单时间短的用户为羊毛党可能性较大)确定需要从数据库中提取的维度。
2. SQL 提取一年各月的订单数据,总计144万个样本,构建订单信息。
3. 构建用户信息特征:会员编号、会员姓名、性别、会员经验、折扣订单数、年登录次数、下单量、年消费额、折扣订单数占比、平均访问到下单时间、与上次登录的时间差(天)等、拉新用户数。
4. 选取训练模型需要的特征:会员经验、年登录次数、年下单量、年消费额、折扣订单数、折扣订单数占比、总折扣额、访问-下单时间、与上次登录的时间差(天)等、拉新用户数。
5. 特征处理:处理异常值、重复值、空值。数据标准化。
6. 模型选择:使用K-means聚类模型分别测试不同参数 cluster(簇)值,将