数据的视角——如何用理性思维看待数据

数据的视角——如何用理性思维看待数据

数据的概念在现代社会已存在许久,至少从软件的角度来看是这样。每个人都多多少少了解数据方面的基础知识,知道如何保存数据,知道如何使用数据。作为数据科学家和计算机程序员,我们与数据的关系会复杂地多,有时甚至是非常浪漫的。我们可以从许多不同的角度来看待数据的概念,但通常情况下,无论用户是否为软件工程师,都是是无法看到计算机内部的大部分数据传输的。

作为数据科学家,我们不断学习,我们最需要了解的就是数据。我们可以从不同的角度来看待数据。例如,从一个从未做过任何分析的软件工程师角度出发,他可能甚至都不太了解正在看的数据有哪些特征。今天,我想展示一些与数据有关的观点,以及一些有助于在数据科学领域取得成功的思维方式。通过了解这些想法和思维方式,也许你会发现,在不同场景中处理数据时能更加得心应手。如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
基于真实数据,公司是如何用数据科学预测用户差评的?
ETL管道——管理数据科学工作流程的好方法
用数据科学技术,分析用户产品倾向
数据可视化Data Visualization需要哪些图表技能?

№1:硬件视角

第一个观点从硬件角度出发。许多数据科学家在其他方面都很出色,但从硬件角度看待数据时,那些信心满满的工程师却备受打击,因为他们想要开发与众不同的东西。所以,如果你想在客制化机器学习网络上工作,首先,你需要了解硬件设备。

话虽如此,对于从事数据分析的数据科学家来说,从该角度看待数据来说可能不太合适。我们从不同的角度看待事物时,我们都是在看待特征以及观察结果,但从硬件角度来看,我们把重点放在了写入内存,侧重编程、随机存取存储器或 RAM。与其从特征和观察结果看待数据视,不如我们从堆栈和队列的角度来看待数据。

堆栈是内存中一堆数据的名称。这堆数据有很多层,本质上是一堆字节。例如,我们的计算机有 4GB 的内存,即 4,000 兆字节,或 4e+9 字节。每当内存被移动至堆栈时,都会在旧堆栈的顶部放置一个新的“堆”。从某种程度而言,就像是将一堆华夫饼叠在一起。更重要的是,每个华夫饼都是独一无二的。关于堆栈,最重要的就是,堆栈是没有组织的。我们可以添加华夫饼,也可以拿掉华夫饼。但如果我们想要中间的华夫饼,我们需要先从顶部取出数据,然后才能访问。我们从内存中删除字节的行为被称之为弹出,我们添加字节时,我们采用“推送数据”的注册表命名法。

队列就像一个堆栈,唯一的区别是最新版本应该在最前面。了解数据如何存储在内存中,可以提高你的编程技能。如果你使用的是底层编程语言(如 C 语言或汇编语言),那你就更需要了解这些知识了。

№2:软件视角

另一角度时从软件视角出发。在我看来,这是介于纯分析角度和硬件角度之间的中间环节。在大多数情况下,以这种方式看待数据可能是最理想的,因为我们所处理的数据类型通常不仅仅是简单的特征集。有时,除非通过计算机分析,我们根本无法解释某些数据,例如分解(Decomposition)

从软件角度分析数据时,其实是在处理文件,有时是处理数据类型,但通常不是处理结构化数据集。换句话说,这种思维方式通常出现在分析数据集之前。如果有人完全不了解数据科学领域,我可能会建议首先从软件的角度学习数据,因为该领域的大多数初级数据科学家很可能以这种方式工作。

№3:分析视角

最后一种方式,是从分析角度出发。这是一种更加典型的科学方法,但对于那些和软件相比,对科学更感兴趣的人来说,这也可能非常致命。然而,分析视角非常重要,因为数据科学家可以通过该角度,看待数据特征及观察结果,而不是位和字节。为了正确了解数据,将数据和其所具备的特性建立某种联系非常重要。

但你需要了解该领域内经常使用的语言。正如我之前提到的,数据科学是许多不同领域和专业领域的结合体。虽然这部分让数据科学领域多了一些乐趣,但一个重要的问题是,所有专业对不同事物命名法都不一样。话虽如此,从分析的角度来看,我们不想以软件工程师的身份看待数据,而是以数据科学家的身份做这件事。这里指的不是“列”和“行”,而是特征及观察结果。

结论

数据是一个复杂的工具,贯穿数据科学领域(Data Science)。如果你想成功构建多个项目,你需要了解多个领域的数据。对于某些公司,有些人可能勉强合格,他们对数据的了解只停留在表面,但是,如果你想要成为更优秀的数据科学家,我认为,扩大理解层面及深度是个非常不错的想法。

感谢你的阅读!希望这篇文章让你对数据的看待有新的启发!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Emmett Boufreau
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/data-perspectives-how-to-look-at-data-more-intellectually-31da4fd3afb6