大数据挖出:谁在薅互联网金融的羊毛
导读:羊毛党,起源于互联网金融的P2P平台,是指那些专门选择互联网渠道的优惠促销活动,以低成本甚至零成本换取物质上的实惠的人。拼抢这些促销活动的行为被称为“薅羊毛”。
卒于“羊毛党”,P2P公司的一大死因
2014年6月,广州新成立一家互联网金融公司。为了吸引消费者购买自己的理财产品,这家公司发行了价值2个亿的各类优惠券。但仅仅不到半年的时间,公司便宣告倒闭。原来这些优惠券,全部都被一个“人”抢走了,确切的说,是一个5000人的“羊毛党”团队。
他们抢了优惠券后,全部用于购买期限在半年内兑换的理财产品,而金融公司在短期内没有足够的资金应对,最终导致破产。
在互联网金融行业中,类似这样被“羊毛党”伤害的例子还有很多。
羊毛党,起源于互联网金融的P2P平台,是指那些专门选择互联网渠道的优惠促销活动,以低成本甚至零成本换取物质上的实惠的人。拼抢这些促销活动的行为被称为“薅羊毛”。具体到互联网金融公司的业务,就是很多在手机App中抢红包、代金券的羊毛党对互联网金融有什么影响?有什么办法可以识别出他们么?
进阶的羊毛党,已开始规模化专业化
根据羊毛党的不同特点将他们划分成了四个类型。
初级羊毛党多是一些“爱占小便宜”的散客,他们常常是零散进行薅羊毛活动。中级羊毛党常通过一些羊毛群获得相关资讯 ,积极参加薅羊毛活动,开始呈现出一种松散的组织形态。初级和中级羊毛党都属于第一代羊毛党,是“业余玩家”。
第三类是“专职羊毛党”,他们是工具化的“职业玩家”,属于第二代羊毛党。 一方面,他们会使用代理IP让反欺诈系统无法判断它的位置;另一方面,他们还使用大量的虚拟号自动注册。甚至有专门的收码平台帮你输入验证码,费用从每次1毛到2.5毛不等。
最高级的第四类是“团长羊毛党”,属于第三代羊毛党。他们是羊毛党中的“正规军”,有组织、有纪律,利用手中的羊毛联盟等资源进行刷单刷量,获取经济效益。 有一家团长羊毛党公司,凭借几千万个苹果账号刷单规模,他们可以决定每日App store中游戏的下载排名。一个月仅App刷量业务就可以达到两三个亿的流水,收入非常可观。
“大数据”羊毛党,靠大数据识别
越过层层反欺诈手段、利用大量的id和帐号进行刷单……仔细一看,这些羊毛党也可以算是“大数据公司” 了。那么对付“大数据公司”,当然也要用大数据的手段。针对不同客户的需求,我们在实践中总结出了一套完整的“羊毛党反欺诈评分模型”。
我们从设备物理地址、App内部行为信息、交易信息、App竞品安装情况等四个维度大数据信息,构建了评分模型。这套模型主要用了图数据库(graph database)技术,它可以通过点和边把所有数据连在一起,便于发现数据中的关系。Neo4j是目前较优秀的一款图数据库开源软件,在处理关系型数据时效率很高。
如果想看一个设备上有多少个用户数。原始的数据库是很难看出规律的,但如果用关系型数据库做一些图谱计算和可视化处理,模型就好看多了。
其次,App内的点击行为也可以是判断依据。由于羊毛党都是机器操作,它们在App中浏览优惠券并点击的时间间隔要远小于普通用户,而且往往一旦抢到红包就再也不登录了。通过这些特点我们可以找出一些疑似羊毛党。
此外,注册和交易时间间隔,单个用户参与活动频率,交易频次,提现频率、营销返现、刷订单等行为,都是羊毛党反欺诈评分模型的判断依据。通过这个模型,公司就可以将所有用户打分,找出不同类型的羊毛党。
让人“又爱又恨”的羊毛党
羊毛党虽然让很多互联网金融公司遭受了巨大损失,但是这些公司也并不想将羊毛党们“赶尽杀绝”。因为一定数量的羊毛党能够有效帮助那些处在成长期的互联网金融公司,为它们快速积累用户规模和交易规模,推动平台快速发展。这些数据的提升可以作为企业下一步找风投的融资筹码。
但这也是一枚硬币的正反面: 羊毛党如果太多,就会大大加大互联网金融公司的获客成本,使他们无法接触到自己的目标客户,甚至发生恶性挤兑,导致公司破产。
所以互联网金融公司对于羊毛党的感情是爱恨交织的:一方面要屏蔽掉那些“专职羊毛党”和“团长羊毛党”,另一方面又要吸引第一代羊毛党帮助提升流量和用户数。基于图数据库的“羊毛党反欺诈评分模型”能够帮助企业识别出它“爱”的羊毛党,拒绝那些它“恨”的羊毛党。