神刀安全网

每天记录一款新的数据产品或者新的数据案例

每天记录一款新的数据产品或者新的数据案例

今天要写的一本书的读书笔记的一小部分。

书名:为数据而生:大数据创新实践;

作者:周涛注;

整体概述:

车品觉老师的书,可以感受到他做为一个企业中的人,对数据从采集、处理到呈现、发挥价值等,每一步都碰到问题,并进行深深的思考。

而对于周涛老师,做为创业和投资的大数据公司价值已过百亿的人,虽然他也提了很多大数据的观点,但是我觉得更有价值的是这本书的案例,都是他身边的人的,是活生生的如何创造数据价值的案例,而不是道听途说的整理。另外,此书覆盖的行业比较多,有助于了解其他行业的数据应用,开阔眼界。

话说周涛老师的朋友圈真的丰富啊,把自己和朋友、学生、老师们的项目整一整,就成了一本书。

观点:

大数据真正的精髓,还不是数据量的爆炸性增长和数据形态的多样性,而是数据与数据之间关联形式的变化。

分析是贯穿一切大数据创新实践的核心,甚至可以说是挖掘大数据价值的唯一工具。缺少分析的思路与方法,数据就只是成本而非价值。和传统商务智能的简单报表统计分析不同,大数据时代对分析要求更高。

笔记: 最近对此深有感触。在职业生涯前几年,都处于各种专业技术的学习,比如数据分析、页面设计、项目管理甚至ppt制作等等。但是到了现在,都是不同行业的人来找我咨询和交流,发现一个数据产品经理的核心,是自己所沉淀的分析思路,以及让数据产生价值的思路。这才是别人所需要的。

另一方面,大数据的分析也是有章可循的。

首先,我们通过基本的统计,对数据产生宏观的认识,捕捉到一些异常数据点;

接下来,通过关联分析,有望找到各种特征和我们所关心的结果之间的关系,如果运气足够好,我们能够从这些关联关系;

利用这些关联或者因果关系,我们就可以建立预测模型,对未知的部分或未来的趋势进行预测;

最后,上述的关联关系、因果关系和预测结果,都可以用来帮助我们进行决策;

笔记: 这个思路基本靠谱,只是写的比较抽象,执行中需要更加详细,更加有技巧,更加复杂。我曾经专门在一个大数据论坛上分享过,后来整理了部分,还在整理中。

案例:抓出非法的MCC(POS行业码)套用:

背景:

商家使用POS机要缴纳一定的费用,不同行业区别很大。比如说“洗浴、按摩”的费率是1.25%,“百货商店”是0.78%;这个差异比较可观。一个商家如果每天有10万元流水,费率相差0.5%,一年差额就接近20万元。所以商家通过各种手段,将pos的mcc码认证为低费率的行业。

这个项目的宗旨就是利用大数据分析的办法,自动检测出非法MCC套用。

方法:

1、  统计每一个POS机每天的平均收入,就可以发现套用“报亭”的“洗浴、按摩”中心,因为一个报亭每天的POS机收款额远低于“洗浴、按摩”中心的收入。商家对应策略:选择一些费率比较低、但是营业额类似的行业,每天的平均刷卡额度很接近;

2、  观察商家POS机消费记录在一天24小时上的分布情况,很多M套用的行为就无所遁形了。

3、  很多经营业务在假日、特定节庆日、寒暑假和特别的天气状况下都会出现消费的高峰和低谷,要想模仿可不容易。

4、  不可能奢望有一种方法能够抓住所有的不良用户,只要大数据分析能够让获取非法利益变得非常困难,也就起到作用了。

每天记录一款新的数据产品或者新的数据案例

笔记:

实际上最开始看到这个案例的时候,我觉得很普通,酒仙网自己判断虚假流量的规则都比这个复杂,更不用说大的公司的反作弊系统的规则了,所以只是在我自己的案例库里做了个记录。

第二天我和朋友吃饭,有两个朋友提出的问题里,竟然都可以用这个思路解决。

一个朋友在北京海关工作,他的问题是:不同的交易流水的企业,享受到的政策优惠是不同的,所以,怎么样可以用数据处理刷单?

我当时就想到了这个案例,于是介绍给了他。

旁边另外一个朋友也插嘴说:我最近去参加了阿里农业电商的会议,级别很高,各地政府都想抓住这个风头,让阿里带着装逼带着飞。有的地方政府开出条件来:你要是卖农产品500万,政府奖励你100万,(听完我都想去做农业电商了,零毛利运营,然后赚政府20个点的纯利润好了,星星眼~),所以动刷单的人的心思很多,防范刷单,也是这项政策能否正常推行的关键。

所以我又重新看了一遍这个案例。因为发现应用场景真的很多。当然,他写的很简陋,因为写太详细了就变成刷单教程了o(╯□╰)o。所以具体分析思路还是要看书的人自己总结。

作者:杨楠楠(中国统计网特邀专栏作者)

本文为中国统计网原创文章,需要转载请联系中国统计网(info@itongji.cn ),转载时请注明作者及出处,并保留本文链接。

转载本站任何文章请注明:转载至神刀安全网,谢谢神刀安全网 » 每天记录一款新的数据产品或者新的数据案例

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址