记一次神奇的数据大赛见闻
昨天去参加了一家汽车厂商举办的数据大赛。大致流程是厂商给出一堆数据,然后参赛队伍想办法找到其中的联系,搞点创新出来。我们呢,负责去围观一下,看能不能写一篇算法的小文章。
经过一个月的筹备、邀请十多家媒体和10支参赛队伍、29小时的黑客马拉松后,参赛选手们发现:
数据是有错误且无联系的。
厂商给出了四类数据:物流、二手车、行车轨迹和搜索痕迹。但这四组数据不仅本身有缺陷,而且是毫无联系的。套用倒数第二组选手展示时的话:我们本以为是大众给我们造一座桥的材料,然后让我们过河;结果发现是面前有一条河,然后大众把桥给砸了。
这还算好的。这一组至少发现了数据有问题,结果根本做不出来。而其他几组“黑客”经历了29小时的马拉松,在看不懂数据的情况下,到底做了什么呢?
第一组
数据我们没做出来,因为我们认为数据收集比分析更重要。所以我给大众提供这几个收集数据的方法:uber大众体验日、爱车上门保养日、传感器收集……
评委:Demo呢?
选手:哦我们是给大众提数据收集的意见的,我们这叫整合营销,所以没Demo……
第二组
我们最年轻啊,都是90后、95后,然后我们团队都很牛,我本人是中国第一个受邀参加戛纳创新大赛的大学生。
那我们做了什么呢?
我们也没用数据,我们要“打造汽车社交新形态”!
我们把挡风玻璃变成移动巨屏,然后司机在等红绿灯、拥堵时可以发弹幕啊!
(是的,发弹幕。)
而且当你等车时,你的车头抵达了前一辆车的车屁股,我们就能把你们链接起来,你们可以开始加入一个群组发弹幕了。
然后演示了一个视频:上面内容基本上都是日了狗了、王思聪、尼玛……
这样就实现了以车为主体,以车载屏幕为载体,以……(参照任意一本文科类教科书)我们的盈利模式也就成型了!大众汽车的消费者都老有钱了,消费力巨大,购买欲望强,而且基于群组的社交特别容易实现广告的精准投放。
(在他们眼里,消费者都是牛氓、乌合之众、分分钟恨不得毁家纾难、支持国货的。等等,大众好像不是国货?)
奥迪软件工程经理:车上社交我们也考虑过,唯一的担忧就是安全性。
选手:安全性我说过了啊,我们可以通过握方向盘的力度、踩油门的力度、车流量等来判断驾驶环境安全与否。比如这个司机是很慢很慢地踩的刹车,那就比急刹车要安全是不是,紧握方向盘的……
(真想把刚才第一条弹幕送给他们)
第三组
这是一家有经验而且很诚实的团队。他们专门花了几分钟去说数据哪里出问题了(演讲+Demo一共给了15分钟)。
比如,某个比率包含了大中小三种汽车购买者,分别以15、50辆为界,但大众提供的数据中,small分组是有意义的,其他两组都是null。
他们也尝试了利用物流数据来做销售权重或关联分析,但都失败了。已给出的数据无法从车还原到人的行为。
这一组没有得到任何奖项。
第四组
4个MBA学生。要做智慧车联网服务平台。
听着很玄。实际也很玄:
我们要把车联网变成O2O平台,满足车主个性化需求,比如保养啊,餐饮啊,美甲啊。
(对,美甲。)
女司机在堵车时无聊,那就叫个美甲来做。而且还能和金融结合,互联网+金融。
(具体怎么结合没听清,反正PPT写得密密麻麻,上面全是概念,这一营销,那一融合)
评委:如果要找餐馆,为什么用大众汽车不用大众点评……
选手:入口为王啊!渠道为王啊!我们大众有车就有数据,这就是入口啊!
听到这里,我忍不住给编辑发了条微信:VC和创业潮把现在的年轻人都变成傻子和骗子了…
编辑:好像都是来宣布未来的……
我:不要因此鄙视我们90后(哭脸)
编辑:哪敢(害羞)
第五组
大概是为了自驾游做的数据搜集,能简化汽车设计和生产。
原理没听懂,但大道理不少:
“2013年互联网对金融行业颠覆之后……”——不要把支付宝就看成金融!
“根据马斯洛需求层次理论”——心理学早已经有了对此的系统批判,比如需求层次并不是逐层上升的。你不一定非要实现了底层需求(性、安全)才能自我实现和尊重。以及,这一理论已经70年了…so what's next? Freud?
“因为租车业的诞生,汽车总量大体上会有减少。”——信口开黄,不,开河。
总而言之,大众给了个题目,上半场四组选手除了解题本身,什么都做了。
第六组
把数据做成了热力图。
评委:为什么没结论?
选手:大众提供的数据关联性不强,没有合适的组件来串联。
主持人:我们就是希望你们创造组件的。
……
第七组
简而言之,做了个可估值二手车 app。
选手先上台把二手车市场的掮客批判了一番:穿着花衬衫,斜挎个包,满不正经的样子。然后他掷地有声地说:简直是池浅王八多,遍地是大哥!
i feel like living in a talk show.
如果21世纪还有比做个app更没创意的事,那就是推广app了。这一小组也不甘人前,提出了自己的推广思路:“遇到二手车车主,然后让他们扫一扫,互相加个微信好友,关注一下我们的微信公众号就得啦。”
我以为我会看到很多精通数据和算法的理科生,不济也能看到一些逻辑清晰的文科生,结果只看到了想做刘强东、马云和陈一舟的年轻人。
而且他们下台后说话声音很大(不特指某一队),我开始坐第二排,都听不清台上演示者说了什么。途中还有台下演示完了的选手手机铃声都没关,大众德国和印度高管、媒体以及台上选手就共同欣赏了一首劲爆金曲,“回首爱……”
第八组
清华代表队。主持人专门介绍了这支队伍来自清华计算机系,而且聊了几句,因为比赛支持方一个是清华的X-LAB,所以可能之前就比较熟。
他们的创意也很平常,但非常像大公司的提案,所以打动了在场嘉宾:做Carlife和CarAI,分别负责个性化推荐和行车保险。
当然,在阐述车保市场定价不合理时,演示者把女司机嘲笑了一番:你说一个女魔头,女性、磨合期、头天上路,怎么能和一个老司机一个车险价位呢?
(可能从扎克伯格处学到了专攻政治不正确吧。果然是老司机)
然后给出的风险特征系数有:行车速度、加速度、转弯角度,一些非常细微的东西。
(我不知道为什么不能根据历史事故记录来评测安全程度?可能有其他客观原因?)
他们的有效性检验有点无厘头。选手指着一张正相关的直线图说,你看,速度越快越不安全……
yes! because it’s fucking common sense!
然后“行车保”对每天的行程安全度会有评估,安全的话能奖励“保币”——这是360+QQ的思路啊……
但对POI有效性的检测看上去似乎是可行的,不过我没看出来相对于百度地图有什么创新。据说可以结合开到某个停车场是否需要转弯、每个餐厅的当前人流量,权衡之后再打分更科学。
评委们都很激动,两个提问评委都说:我被你们打动了。
结束后,评委之一、清华某老师(至少提问很有水平)非常热切地和这支代表队打招呼。
不知道是不是太高兴了,与这位50岁左右的老师告别时,清华代表队的队长居然说:师姐再见……
看来他们夺冠是理所应当了。冠军奖励是去德国大众公园参观的机会,亚军是去广州车展,然后还有两个小奖项。
第九组
这一组一上来就说大众给的数据很“坑”。鉴于该团队某男成员长发飘飘的发型,他们说出这种话也就不足为奇了。反而我觉得他们是最符合我心中“黑客”定义的人。
于是他们花了很大力气“清理”,并且把许多条行车轨迹“假设”到一个人身上。这样才实现了从车到人的维度转化。
最终结论是,我们通过trace,然后能告诉你这条trace想做什么,比如早上八点从天宫院出发到中关村这批人,意图上有什么共性。
他们引用了一句话:software eats everything。印象颇深。
第十组
都是术语和概念,增值服务、立体营销策略、marketing包含4P云云云云,我大学就听够了,所以没听进去。
然后是媒体采访,我问大众负责人:为什么数据没关联?当时怎么选出来的?
他说:我们把可能泄露隐私的数据剔除了,把涉及商业机密的剔除了,最后选了一部分能用的,我们也不知道有没有联系,就交给选手,期望他们……
我开始觉得汽车厂商的IT部门和我们理解的IT不一样了。
最后颁奖环节。清华代表队特别兴奋,一直在交头接耳、互相打气。我坐在他们前面。
颁奖是从低往高。主持人邀请嘉宾上台宣布:第一个获奖者,数据火车!正是清华代表队。他们获得了时下最in的电子产品!(大众宣传广告原话。in……?硬?)
他们一下子蔫了,我也很震惊。因为这队根正苗红、落落大方,提案也中规中矩。在场所有人可能都认定他们会夺冠了。
拿到奖项下台后,他们连奖状都没再看一眼。都不说话,捏着奖杯,各自沉默。
然后亚军、季军分别是MBA代表队和最后一只立体营销代表队,冠军……是第九组。在展示时公开说数据很坑的……长发飘飘哥很开心,我也很替他开心。而且觉得大众真是有自黑精神,难不成微博上官微发的高科技“遥控电子锁”也是?
anyway,我们就去吃晚餐了。原来数据创新实验室的负责人、今天的主持人,招呼我们去看晚宴表演。我们没去,因为会饿死,想加餐。然后就听到那边传来他《我的未来不是梦》的歌声,想起他委屈的表情(“我明明是个IT人,现在就像个助理”),大家又发出快活的笑声。
经过一个月的筹备、邀请十多家媒体和10支参赛队伍、29小时的黑客马拉松后,参赛选手们发现:
数据是有错误且无联系的。
厂商给出了四类数据:物流、二手车、行车轨迹和搜索痕迹。但这四组数据不仅本身有缺陷,而且是毫无联系的。套用倒数第二组选手展示时的话:我们本以为是大众给我们造一座桥的材料,然后让我们过河;结果发现是面前有一条河,然后大众把桥给砸了。
这还算好的。这一组至少发现了数据有问题,结果根本做不出来。而其他几组“黑客”经历了29小时的马拉松,在看不懂数据的情况下,到底做了什么呢?
第一组
数据我们没做出来,因为我们认为数据收集比分析更重要。所以我给大众提供这几个收集数据的方法:uber大众体验日、爱车上门保养日、传感器收集……
评委:Demo呢?
选手:哦我们是给大众提数据收集的意见的,我们这叫整合营销,所以没Demo……
第二组
我们最年轻啊,都是90后、95后,然后我们团队都很牛,我本人是中国第一个受邀参加戛纳创新大赛的大学生。
那我们做了什么呢?
我们也没用数据,我们要“打造汽车社交新形态”!
我们把挡风玻璃变成移动巨屏,然后司机在等红绿灯、拥堵时可以发弹幕啊!
(是的,发弹幕。)
而且当你等车时,你的车头抵达了前一辆车的车屁股,我们就能把你们链接起来,你们可以开始加入一个群组发弹幕了。
然后演示了一个视频:上面内容基本上都是日了狗了、王思聪、尼玛……
这样就实现了以车为主体,以车载屏幕为载体,以……(参照任意一本文科类教科书)我们的盈利模式也就成型了!大众汽车的消费者都老有钱了,消费力巨大,购买欲望强,而且基于群组的社交特别容易实现广告的精准投放。
(在他们眼里,消费者都是牛氓、乌合之众、分分钟恨不得毁家纾难、支持国货的。等等,大众好像不是国货?)
奥迪软件工程经理:车上社交我们也考虑过,唯一的担忧就是安全性。
选手:安全性我说过了啊,我们可以通过握方向盘的力度、踩油门的力度、车流量等来判断驾驶环境安全与否。比如这个司机是很慢很慢地踩的刹车,那就比急刹车要安全是不是,紧握方向盘的……
(真想把刚才第一条弹幕送给他们)
第三组
这是一家有经验而且很诚实的团队。他们专门花了几分钟去说数据哪里出问题了(演讲+Demo一共给了15分钟)。
比如,某个比率包含了大中小三种汽车购买者,分别以15、50辆为界,但大众提供的数据中,small分组是有意义的,其他两组都是null。
他们也尝试了利用物流数据来做销售权重或关联分析,但都失败了。已给出的数据无法从车还原到人的行为。
这一组没有得到任何奖项。
第四组
4个MBA学生。要做智慧车联网服务平台。
听着很玄。实际也很玄:
我们要把车联网变成O2O平台,满足车主个性化需求,比如保养啊,餐饮啊,美甲啊。
(对,美甲。)
女司机在堵车时无聊,那就叫个美甲来做。而且还能和金融结合,互联网+金融。
(具体怎么结合没听清,反正PPT写得密密麻麻,上面全是概念,这一营销,那一融合)
评委:如果要找餐馆,为什么用大众汽车不用大众点评……
选手:入口为王啊!渠道为王啊!我们大众有车就有数据,这就是入口啊!
听到这里,我忍不住给编辑发了条微信:VC和创业潮把现在的年轻人都变成傻子和骗子了…
编辑:好像都是来宣布未来的……
我:不要因此鄙视我们90后(哭脸)
编辑:哪敢(害羞)
第五组
大概是为了自驾游做的数据搜集,能简化汽车设计和生产。
原理没听懂,但大道理不少:
“2013年互联网对金融行业颠覆之后……”——不要把支付宝就看成金融!
“根据马斯洛需求层次理论”——心理学早已经有了对此的系统批判,比如需求层次并不是逐层上升的。你不一定非要实现了底层需求(性、安全)才能自我实现和尊重。以及,这一理论已经70年了…so what's next? Freud?
“因为租车业的诞生,汽车总量大体上会有减少。”——信口开黄,不,开河。
总而言之,大众给了个题目,上半场四组选手除了解题本身,什么都做了。
第六组
把数据做成了热力图。
评委:为什么没结论?
选手:大众提供的数据关联性不强,没有合适的组件来串联。
主持人:我们就是希望你们创造组件的。
……
第七组
简而言之,做了个可估值二手车 app。
选手先上台把二手车市场的掮客批判了一番:穿着花衬衫,斜挎个包,满不正经的样子。然后他掷地有声地说:简直是池浅王八多,遍地是大哥!
i feel like living in a talk show.
如果21世纪还有比做个app更没创意的事,那就是推广app了。这一小组也不甘人前,提出了自己的推广思路:“遇到二手车车主,然后让他们扫一扫,互相加个微信好友,关注一下我们的微信公众号就得啦。”
我以为我会看到很多精通数据和算法的理科生,不济也能看到一些逻辑清晰的文科生,结果只看到了想做刘强东、马云和陈一舟的年轻人。
而且他们下台后说话声音很大(不特指某一队),我开始坐第二排,都听不清台上演示者说了什么。途中还有台下演示完了的选手手机铃声都没关,大众德国和印度高管、媒体以及台上选手就共同欣赏了一首劲爆金曲,“回首爱……”
第八组
清华代表队。主持人专门介绍了这支队伍来自清华计算机系,而且聊了几句,因为比赛支持方一个是清华的X-LAB,所以可能之前就比较熟。
他们的创意也很平常,但非常像大公司的提案,所以打动了在场嘉宾:做Carlife和CarAI,分别负责个性化推荐和行车保险。
当然,在阐述车保市场定价不合理时,演示者把女司机嘲笑了一番:你说一个女魔头,女性、磨合期、头天上路,怎么能和一个老司机一个车险价位呢?
(可能从扎克伯格处学到了专攻政治不正确吧。果然是老司机)
然后给出的风险特征系数有:行车速度、加速度、转弯角度,一些非常细微的东西。
(我不知道为什么不能根据历史事故记录来评测安全程度?可能有其他客观原因?)
他们的有效性检验有点无厘头。选手指着一张正相关的直线图说,你看,速度越快越不安全……
yes! because it’s fucking common sense!
然后“行车保”对每天的行程安全度会有评估,安全的话能奖励“保币”——这是360+QQ的思路啊……
但对POI有效性的检测看上去似乎是可行的,不过我没看出来相对于百度地图有什么创新。据说可以结合开到某个停车场是否需要转弯、每个餐厅的当前人流量,权衡之后再打分更科学。
评委们都很激动,两个提问评委都说:我被你们打动了。
结束后,评委之一、清华某老师(至少提问很有水平)非常热切地和这支代表队打招呼。
不知道是不是太高兴了,与这位50岁左右的老师告别时,清华代表队的队长居然说:师姐再见……
看来他们夺冠是理所应当了。冠军奖励是去德国大众公园参观的机会,亚军是去广州车展,然后还有两个小奖项。
第九组
这一组一上来就说大众给的数据很“坑”。鉴于该团队某男成员长发飘飘的发型,他们说出这种话也就不足为奇了。反而我觉得他们是最符合我心中“黑客”定义的人。
于是他们花了很大力气“清理”,并且把许多条行车轨迹“假设”到一个人身上。这样才实现了从车到人的维度转化。
最终结论是,我们通过trace,然后能告诉你这条trace想做什么,比如早上八点从天宫院出发到中关村这批人,意图上有什么共性。
他们引用了一句话:software eats everything。印象颇深。
第十组
都是术语和概念,增值服务、立体营销策略、marketing包含4P云云云云,我大学就听够了,所以没听进去。
然后是媒体采访,我问大众负责人:为什么数据没关联?当时怎么选出来的?
他说:我们把可能泄露隐私的数据剔除了,把涉及商业机密的剔除了,最后选了一部分能用的,我们也不知道有没有联系,就交给选手,期望他们……
我开始觉得汽车厂商的IT部门和我们理解的IT不一样了。
最后颁奖环节。清华代表队特别兴奋,一直在交头接耳、互相打气。我坐在他们前面。
颁奖是从低往高。主持人邀请嘉宾上台宣布:第一个获奖者,数据火车!正是清华代表队。他们获得了时下最in的电子产品!(大众宣传广告原话。in……?硬?)
他们一下子蔫了,我也很震惊。因为这队根正苗红、落落大方,提案也中规中矩。在场所有人可能都认定他们会夺冠了。
拿到奖项下台后,他们连奖状都没再看一眼。都不说话,捏着奖杯,各自沉默。
然后亚军、季军分别是MBA代表队和最后一只立体营销代表队,冠军……是第九组。在展示时公开说数据很坑的……长发飘飘哥很开心,我也很替他开心。而且觉得大众真是有自黑精神,难不成微博上官微发的高科技“遥控电子锁”也是?
anyway,我们就去吃晚餐了。原来数据创新实验室的负责人、今天的主持人,招呼我们去看晚宴表演。我们没去,因为会饿死,想加餐。然后就听到那边传来他《我的未来不是梦》的歌声,想起他委屈的表情(“我明明是个IT人,现在就像个助理”),大家又发出快活的笑声。
热门话题 · · · · · · ( 去话题广场 )
- 我在网络上感受到的陌生人善意 新话题
- 一人一杯一口入魂的夏日特饮 4277次浏览
- 现代人的“卡夫卡时刻” 356次浏览
- 身边的科普现场 新话题
- 维系精神生活的北京角落 358次浏览
- 歌手2024直播 4.6万次浏览