“数据分析”在现实生活中的应用:用数据智斗偷车贼
本文为 Neeraj Madan 在2017 Dallas Data Science Conference上的演讲内容
原文标题:Real-life Application of Analytics: Fighting the Underworld of Bike Theft with Data
2016年2月19日,两副没有车轮的自行车架被锁住留在了停车架旁。(来源:http://wordpress.com)
我在亚利桑那州立大学的朋友频繁丢失自行车, 这引起了我对校园内自行车被盗事件的兴趣和这背后的原因。我想既然在亚利桑那都有如此多自行车盗窃,更不用说整个美国。通过分析,我取得了一下几个有趣的发现:
1. 在亚利桑那州立大学的tempe,downtown,west和polytechnic四个校区每年都有约490辆自行车被盗,价值约157,596美金。
2. 在2010到2014年期间,总计2447辆自行车被盗,价值约787,984美金。
3. 45%自行车被盗的人没有报案。
4. 近五年来的盗窃指数回升了4.37%(107 out of 2447),是近五年来丢失自行车价值的3.64% 。
于是我们针对亚利桑那州立大学进行了调查,发现四个校区中学生数最多的tempe校区,丢失自行车价值也最高(91%)。并且通过分析我们发现,春季和秋季是自行车丢失的高发季节,因为此时正是新生入学的繁忙季节。
根据以上背景调查,我们确定了一下几个目标:
1. 确定一种方法来跟踪和报告关键的时间点
2. 确认自行车盗窃事件中的关键因素
3. 分析利益相关人士分享的案情
4. 规划出合理的建议来解决自行车盗窃
5. 吸收利益相关人的反馈并且分享一个项目报告
然后我们开始分析校园里自行车的管理人员,停车场等,试着找出哪一些是影响车辆被盗的关键因素?最终我们确定下来,地理位置,车辆的价值,时间,环境,天气,使用的车锁等重要影响因素,并且决定分析前三个最重要的因素。
1. 找出自行车丢失最多的“热门”地点,建筑。
我们找出了丢失自行车最多的10个建筑,丢失了占总价值40%的自行车。
2. 测试校园中四处安全存车处是否有效
我们发现其中两处存在很大的安全隐患,很多起盗窃发生在这里。
3. 根据这几条原则,在步行区域三区提议一个新的安全存车点
1) 安全存车点应该设置在步行区域
2) 安全存车点不应该靠近现有的安全存车点
3) 安全存车点不应该靠近学生住宿区
4. 探索潜在的被盗车辆销售市场
我们发现许多自行车被同一个手机号买到了亚利桑那州的不同城市。许多相同的号码被指出既是卖自行车的人,又是买自行车的人。我们将某些号码的使用者锁定成犯罪嫌疑人,并且与警方讨论进一步筛选。
5. 我们试着去理解现在学生们是如何认为校园停车安全的.
我们向学生们问了几个问题:
1) 你觉得你的自行车在校园里被偷的可能性多大?
总结:60%的学生认为很大可能被偷。
2) 你的自行车被偷时是如何上锁的?
总结:大多数学生因为赶时间,简单的将U型锁锁在了车胎上,而没有锁在更安全的车架上。在恰当使用U型锁的前提下,Y型锁没有U型锁安全。
3) 你觉得校园中哪里放自行车最安全?
总结:学生们觉得安全的地方与事实恰恰相反。
当我们整理研究中的其他发现,试图总结出一些给学生们的建议时,我们意识到一件时事,停车场的编号并不能带来帮助。举个例子,就停车场来说,每个停车场都有一个编号,但是由于每年都可能会有新增的停车场,因此停车场的名字每年都可能会变,所以无法确定这个停车场的编号,也就没有主关键字(primary key)来锁定这个停车场。
其二,60%的学生对自己的自行车感到不安全,学校也应该采取一些措施。其中一个推荐是在使用gps自行车。
其三,45%的学生自行车丢失之后都没有像警察局报案。由于春秋季新生入学时是自行车被盗的高发时段,为了减少被盗后不报案的情况,我们应该在新生orientation时加入相关的声明,让学生防患于未然。
以上就是我们针对亚利桑那州立大学自行车被盗的调查分析,希望对大家有所启示,谢谢大家!