数据科学,预测分析2016年的发展和2017年的趋势
我们曾经做过一期数据科学领域的专家对2017年科学发展新趋势的预测,这一次有更多的行业专家带来他们新的见解。
Kirk D. Borne
BoozAllen的首席数据科学家,天文物理博士
在2016年,我看到了几个有关数据科学的显著发展,其中包括:
- 更多数据科学家的出现,以及用于分析和数据科学的自助服务工具的增长;
- 深度学习被广泛应用于各种案例(包括文本分析);
- 人工智能驱动的聊天机器人在客户呼叫中心和客户服务接触点出现;
- 不同机构愈发需求看到真正的投资回报以及大数据和数据科学带来的收益,关注“价值证明”而不是“概念证明”;
- 机器智能成为加工,产品和技术在各种案例中的重要组成部分:连接汽车,物联网,智能城市,制造,供应链,规定设备维护等。
在2017年,我们希望看到边缘分析用例的更大扩展:嵌入传感器或接近数据收集点的机器学习 – 机器学习可以通过API或靠近数据收集器的处理器调用,或集成到传感器芯片架构上。在接近边缘发现的模式,趋势,异常和突生现象将有助于更好,更快速的实现预测性分析和规则性分析应用到不同领域:包括网络安全,数字营销,客户体验,医疗保健,应急响应,发动机性能,无人驾驶车,制造,供应链等。
Tom Davenport
Babson College杰出教授,国际分析研究所联合创始人和德勤分析高级顾问
2016发展
分析组的分散:在一段时间的整合之后,公司开始将分析任务分散到 不同的单位和部门,并在不同情况下保持企业协调。
专有和开源技术的组合:很多大型企业正在把专有和开源分析以及大数据技术结合在单个应用程序中使用。
认知技术的分段:大的,单片的认知技术已经被分解为一系列单功能API,可以组合形成完整的系统。
模糊职称:定量分析师,数据科学家和认知应用开发人员职位属性变得更加模糊; 明确的职称和工作角色已成过去。
2017趋势
运营认知应用:认知将从“科学项目”转向运营应用。
模型假设的质疑:2016年总统选举中的投票失败将导致更多的管理者质疑分析模型背后的假设。
认知工具的分类:更多机构会理解并分类他们可用的不同认知工具,并将其应用于适当的业务。
推动透明度:机器学习应用程序的所有者将推动其应用更大的透明度,并将避开不透明的算法。
Tamara Dull
SAS 新兴技术总监
今年的“大数据”活动应该是在美国选举期间,因为它将大数据/数据科学/预测分析带到了公众讨论的平台。当然,这也许不是大部分人使用的词语,但是在美国,我们都近距离接触到了数据:它的角色,它的使用和误用,它带来的见解和偏见,对和错。
随着数据继续渗透到我们的专业和个人生活的各个方面,不管是私人还是公众的领域,在物联网中每一方都应该确保数据的收集,使用,分析是安全,可靠,道德的。如果一个公司无法保证这点,那么这样的公司是不应该存在的。
ohn Elder
美国最大分析咨询公司Elder Research创始人和主席
一年前,《科学》杂志将“2015年度科学突破亚军”的奖项颁发给了一项试图复制100个心理学实验的研究。但是研究人员只复制了其中39个实验。 尽管如此,这也比流行病的研究成果要好很多,因为发表的流行病医学“发现”通常只有5%-35%是正确的。我认为,发现虚假相关性的大多数问题都是由于数据科学不当造成的。基于研究人员大量的调查和挖掘,使用重复采样比如目标重组来替代陈旧的公式,可以更好的校准随机结果和明显发现出现的可能性。 有价值的科研发表需要新的标准,而且结果应该是更准确可靠和节省资源的。
Anothony Goldbloom
顶尖数据科学竞赛平台Kaggle的创始人和首席执行官
Airbnb, Climate Corporation(现在的Monsanto)和Opendoor 等公司证明了数据科学可以产生巨大影响。他们拥有强大的数据科学团队来影响公司决策。在2017年,我们会看到这些公司采用相应的工具和流程来解决数据科学中的一些难点:尤其是数据科学工作流程中的共享和协作,以及把模型推向生产。在2016年,学术研究的热门包括了从深度神经网络到强化学习和生成模型等不同话题。
在2017年,我们应该会看到这些技术被应用到其他公司的案例。在强化学习一些值得关注的领域包括算法交易和广告定位。
Thomas Joseph
Quadrant 4 System Corporation数据科学主管
当“开拓者”(谷歌,亚马逊,Facebook,…)和“早期同化”公司通过广泛的制度化获得实质性的好处,有大量的组织(“Masses”)在边缘密切关注。 我看到的2017年和未来的大趋势是数据科学作为“大众”的一种实践被越来越多地采用。 在这些公司中采用数据科学领域的规模相对较小,就像“概念证明”项目一样,需要先了解数据科学可以为他们做什么。许多组织看到了他们小项目的早期成功,并且位于制度化他们收益的尖端。 从我们与许多客户的对话中,我们可能看到在2017年数据科学会在各种组织内成为一个火爆的领域。
Carla Gentry
数据科学家,人才分析
Pasha Roberts
人才分析公司首席科学家
Gregory Piatetsky-Shapiro
KDnuggets总裁,KDD会议的联合创始人,ACM SIGKDD的联合创始人和曾任主席
Karl Rexer
Rexer Analytics总裁
Bill Schmarzo
大数据图书(大数据MBA)作者,戴尔EMC服务CTO,前雅虎分析与商业项目VP
Eric Siegel
预测分析,创始人,Predictive Analytics World和作者