数据应用学院对话阿里云,中国联通, Greylock:云计算与大数据(多图+趋势总结)

数据应用学院对话阿里云,中国联通, Greylock:云计算与大数据(多图+趋势总结)

9月30–10月1日,数据应用学院CEO Jason耿携团队一行参展硅谷高创会,并作为嘉宾参加Panel Discussion, 与阿里云,Greylock, 中国联通高管对话“云计算与大数据”。

本届高创会的主题演讲嘉宾包括前美国能源部部长朱棣文,中华人民共和国驻旧金山副总领事邓繁华,创新工场CEO李开复,金山软件CEO张宏江。斯坦福大学教授,今年诺贝尔物理学奖有力竞争者张首晟为本届高创会主席。规格非常高。

前能源部长朱棣文在大会上发表了关于新能源方面的演讲。同一天的讨论会中,还有嘉宾专门探讨三星电池爆炸事件,并指出,这是技术发展的瓶颈所致。

数据应用学院CEO Jason耿以演讲嘉宾身份参加本次高创会
数据应用学院CEO Jason (左三)参加了主会场的云计算与大数据的Panel Discussion。参与嘉宾包括主持人 Rana Gujral (TechCrunch & Forbes 左一),中国联通美洲高级副总裁 Ben Chen (左二),Greylock Partners驻企执行官徐皞(左四),阿里云北美总经理 Michael Tsang (左五),

主持人向各位嘉宾抛出了若干问题,Jason和众位嘉宾就云计算和大数据发展趋势给出了自己的观点。


1. 除了技术,还要有business insight

Jason谈到,‘大数据’的应用不是仅仅靠几个工具(Hadoop, Spark)就能成功的,而是一套成体系的技术,人才和流程,必须将数据安全,数据ETL,数据分析结合在一起,帮助企业挖掘商业价值。注意,必须落实到商业价值的挖掘上。一个成功的商业模式从来不是靠一两个技术亮点实现的,而是要能更高效的带来商业价值。

这并不简单,这对人才的MindSet要求很高,既要懂技术,又要有business insight,还要对企业管理有所了解,这并不容易。这是对‘技术流’选手的一个提醒。


2. AI/机器学习与大数据的结合将是关键

最近几个月的大趋势越来越明显,就是结合人工智能来分析大数据,挖掘商业价值。一方面,人工智能的大规模应用是以大数据的廉价大规模推广为前提的。反过来,人工智能和机器学习又为大数据的进一步发展提供至关重要的分析工具,这为数据科学家提供了广阔的舞台。阿里云的Mke Tsang也强调要落实到商业价值挖掘上,不管是企业高管还是工程师,都要有数据的mindset,就是要同时具备数据分析能力和business insight,还要能够从数据中去发掘方法,而不是局限于已有的方法。

总的来说,我们现在依然处于大数据的早期发展阶段,打造实时流处理架构,非关系型数据库存储数据是第一步。AI和Machine Learning的加入,是迈向大数据应用层面的一个大趋势。大数据与人工智能/机器学习的结合,产生的效应很可能远超我们的想象。


3. 混合式云服务与数据分析外包

通过分布式系统,‘计算’已经被分散到了‘数据’一侧。现在,一般的数据被放到了‘云端’,所以数据的‘计算’与‘分析’,也可以放到‘云端’。然而,并不是所有公司都会‘All-in’地把所有服务都放到云上,而是出于谨慎原则,分两条腿走路,‘一部分服务放到云上,一部分依然在地上’。大型云服务的提供商现在也不再强调必须‘全部放到云上’,而是为这种混合式的发展提供更多的便利。

而对于数据的分析,现在的要求是越来越高,很多中小公司在处理和分析数据的能力上已经捉襟见肘,需要更专业的公司来协助他们,于是数据分析的外包会进一步发展。

4. 在对数据人才的需求上,中国和美国都是疯狂的

各个嘉宾屡次谈到,现在对人才的跨境需求,是一个不可忽视的现象。别光看到美国这边对大数据和数据科学人才趋之若鹜,中国国内照样是疯狂的追求,完全是在抢人,不仅在国内抢,还要到美国来抢人。最近的中国AI公司北美技术交流暨人才巡回招聘,就反应出了这样的趋势。

大数据+AI/机器学习的年代,不要光悲观地提‘机器替代人’,更要看到人才的不可替代的作用。在对大数据人才的渴求上,国内和美国是一样的。

5. 数据应用学院的教学+实践模式是最理想的

Jason 表示,由于大数据快速发展的技术特点与对人才较为全方位的要求,对数据人才的培养成为一个重要的话题。在这方面,数据应用学院的教学+实践培养模式经过若干期的检验,被证明是最有效的。这得到了各个嘉宾的认同,并在讨论环节后得到人民网的专访。

首先,教学内容需要及时反应出数据技术的变化。像2015年-2016年,大数据最显著的技术进步肯定要数Spark的应用与推广,那么这就应该反映到教学里面来,我们确实也是这么做的。

其次,大数据与数据科学对实践要求很高,需要紧密结合案例与项目,通过真正的动手,才能理解大数据应用中的问题。不动手,不对比一下100M的数据和100G的数据的区别,肯定就不会理解分布式系统的必要;不做一个项目,就不知道数据采集,清理,和储存的困难,不知道如何结合商业目的来分析数据。有句话说得最好:“纸上学来终觉浅,绝知此事要躬行。”