数据分析师工作现状:理想与现实间差了100M的SQL文件辣么大

数据分析师工作现状:理想与现实间差了100M的SQL文件辣么大

在学校待了将近5年之后,我终于要毕业了,我已经做好了充分的准备来测试我的技能。我并不完全确定我想要什么职位,我只知道我喜欢处理数据和解决复杂的问题。后来我意识到我想从事数据科学方面的工作,但也是后话了。

毕业后不久,我在本地一家公司获得了一份数据分析师的工作。它似乎与我的技能和我对数据处理的热情完美契合,所以我立刻接受了。我已经可以想象自己坐在桌子上,做销售预测,制作惊人的报告和可视化。

我被喜悦蒙蔽了双眼,最终会被推入现实世界。我从来没有花一秒钟的时间,放慢脚步,喘口气,“降低我的期望”。

我做数据分析师的头几个月很少涉及数据分析,主要是长时间争论数据。下面这些是我不止一次使用的一些短语,它们完美地总结了最初的几个月。

“我在哪里可以再找到它?”

尽管在分配给我项目前我已经受了相关培训,但我还有很多要提高。我发现自己很难记住每个文件的位置以及不同需要跟进的进程。缺乏可用的文档是一个巨大的挫折,最终我不得不依靠我的同事来应对。

“那太久了!”

最大的挑战之一是无法访问“正确”的基础设施或工具来处理和分析大型数据集。尽管Excel不能满足我们所有的需求,但它几乎用于整个公司的报告中。公司里的每个人都要求可以用更多工具,而我们的这些要求根本无法满足。

“我们不应该手动操作!”

我们的一些日常工作包括从不同的网站下载CSV文件和刷新Excel报告。这些任务浪费了我们太多的时间,我们急需自动化。

“我们还不能100%相信这些数据……”

由于我们的数据来自很多不同的来源,而且报告并不总是由数据团队处理,所以很难相信我们公司会议上不断抛出的数据的准确性。

我的公司发展很快,所以我们需要依靠数据来做决定。问题是我们现有的基础设施不能满足我们的需求,一路上需要太多的补救解决方案,不足也开始显现。我的团队由3名数据分析师(包括我自己)组成,但在某种程度上,我们也被要求扮演数据工程师和数据科学家的角色。我们没有足够的预算来引进更多的人才,所以我们要做的就是打好基础,确保我们能够满足股东的期望。

尽管我的工作没有达到我的预期(至少在最初的几个月里),但我学到了比我想象的还要多的东西。我有机会体验一下从零开始一个项目的真实感受,并在这个过程中处理不同的障碍,相信我,有很多障碍。你看,为了将数据转化为洞察力或预测,需要做很多工作来准备这些数据。我记得在学校里学过这些,但直到我亲身经历过,我才真正体会到这一点。

当我在学校的时候,我从来没有真正花很多时间问这样的问题:“我能相信这些数据吗?”或者“存储数据最有效的方法是什么?”我更专注于学习数据分析中令人兴奋的部分,比如可视化、预测等等,所有你可能在互联网上见过的流行语。

但是这份工作,伴随着所有的挫折,给我上了重要的一课,我相信,随着我事业的发展,它将是非常宝贵的。

永远愿意做“脏”的工作

我指的不是肮脏、无用或令人不快的工作,我指的是那种经常被搁置一边的工作,因为它可能没有预测未来那么令人兴奋,也没有创造视觉化那么浮华。但是不要搞错,做“脏”工作是处理数据的一个重要部分。

无论您是一名有抱负的数据分析师还是数据科学家,如果你愿意清理所有数据、测试数据、编写所有文档并清理所有代码,那么你在数据团队中总是占有一席之地。你不仅能让你的团队走向成功,还能成为他们可以依靠的人。

如果你对我和我的团队如何克服我之前提到的一些障碍感到好奇,那么看看我写的另一篇文章:

When Excel isn’t enough: Using Python to clean your Data, automate Excel and much more…
How a Data Analyst can survive in a spreadsheet-driven organizationtowardsdatascience.com

原文作者:Andres Vourakis

翻译作者:Vera

美工编辑:过儿

校对审稿:冬冬

原文链接:https://towardsdatascience.com/my-first-job-as-a-data-analyst-expectations-vs-reality-3a598412cd52