数据团队入职培训白皮书

数据团队入职培训白皮书

如何建立一个简化的入职体验,让你的数据工程师和分析师在入职第一天就感觉很棒。

对很多人来说,刚刚入职新公司的时候体验都不太好,你可能会在前两周只是试着访问电子邮件。

但事情不必如此,也不应该如此。

入职培训应该被视为任何团队和公司流程的重要组成部分。对于分析和数据工程师这样的技术岗来说更是如此。

这些职位需要访问多个系统,理解业务环境,并访问关键数据集。延迟或抑制这些角色入职过程的顺利程度可能会带来高昂的成本,并导致留任率低下。

因此,创建一个顺利的入职过程是一项很值得的投资。在本文中,我将回顾我过去的一些入职经验,并讨论数据团队在入职过程中应该采取的一些关键步骤和注意事项。

如果你想了解更多关于数据科学的相关内容,可以阅读以下这些文章:
数据科学面试中你应该知道的10个高级SQL概念
数据科学家/分析师应该避免的5大编程错误
数据科学算法如何将商业计划变现?
Ins 数据科学、机器学习及AI宝藏博主推荐

回顾我过去的一些入职经验 ……

当你作为一个新员工加入一个新的团队或公司,可能是一个有压力的经历。

你越快地理解你的新角色的技术和人员方面,你就能越快有信心地做出好的决策。

经验1:问题在于,大多数公司都不会提供一条清晰的路径,告诉你如何从无知走向自信。相反,我曾经历过这样的情况:公司成立于1867年,入职需要一两天时间来了解公司以及公司的原则。

然后,我花了接下来的三周时间,访问一个数据库,而这个数据库甚至不是我应该访问的实际数据库,在与各种员工和高级团队成员进行多次讨论后,如上所述。

经验2:而Facebook在第一天就能让数百人加入,将你连接到所有你需要的系统,并且有整整四周的时间让你快速了解他们的各种技术(被称为数据训练营)。我们花时间在像大学一样的房间里学习各种技术和教程,以跟上进度。

我们学习了Facebook特有的技术,如DevServers(EC2)、Dataswarm(Airflow)、iData(data catalog)和Daiquery(Snowsight)。

当我加入团队时,我已经很适应在Facebook的基础设施中工作,我知道如何提交代码,查找数据集,并独自遍历多个代码目录。

更重要的是,这段经历总是被重新审查,来评估是否可以做得更好。这意味着,我能够在与团队合作的第一天就做出正确的决定,而不必去不断地询问其他团队成员了解发生了什么。

新员工培训的目标……

要建立一个出色的数据团队入职体验,你需要了解总体目标是什么。不仅仅是技术目标,还要了解你希望新员工在入职培训结束时处于什么状态。

以下是我认为很重要的几个目标:

  • 理解业务目标和XFN需求——仅仅从技术角度关注新员工的培训并不能提供如何正确的协调如何使用这些工具。新员工入职时应该是了解团队的目标以及他们如何与业务保持一致、团队在其他部门更大的生态系统中所扮演角色的机会。
  • 生产力——任何新员工入职过程的一个关键目标是使新员工具有生产力。如果他们需要不断地问问题,或者不断地被他们无法访问的数据集所阻碍,那么他们的工作效率可想而知。
  • 增强团队成员的决策能力——最终目标是让员工不仅仅是做被安排的任务,而是能够舒服地打电话和在未来的数据项目上下大赌注。这要求一个人不仅要了解他们所从事的技术,还需要了解业务目标,需要看到可能的差距和机会。

数据团队的入职培训……

有公司的入职培训,也有团队的入职培训。一般来说,我发现大多数公司只花一天或两天的时间对所有员工进行培训。Facebook会进行为期两天的介绍(至少对我来说是这样),在那里你会听到不同的人讲述公司的使命、原则和指导方针,以及其他更多的任务。

之后,就是加入团队的时候了。

下面我将引用的一些内容需要根据公司规模的大小进行调整,初创公司没有那么多的时间和资源花在新员工培训上,也不需要这样做。

但这并不意味着可以什么都不做,而是需要建立一个初步的工作文档和手册,其他人可以在加入团队时查看。

了解什么对企业或团队是重要的是至关重要的。特别是在数据团队中,许多人需要平衡他们的业务和技术知识来产生影响。

这不仅需要理解数据团队正在创建的关键指标、项目和报告,还需要理解谁是外部团队的关键利益相关者和驱动因素(在Facebook,他们被称为 XFNs )

从新入职的角度来看,新员工应该被介绍给:XFNs(跨职能伙伴)——除了被介绍给团队成员和越级主管之外,你还需要知道:

  • 你的XFNs是谁
  • 他们团队的目标是什么
  • 他们扮演什么角色
  • 当前的项目和计划——数据团队很容易陷入临时的困境。数据请求、维护和数据质量问题,都可能阻碍数据团队进行真正有影响力的工作。如果新的数据团队成员不能很好地了解正在进行的项目和推动团队的主动性工作,就会使这个问题变得更糟。
  • KPI——解释什么对企业是重要的一个很好的方法是看它的KPI和其他指标。如果操作正确,它们应该为企业提供值得跟踪和提出问题的背景。
  • 关键报告和数据管道——了解什么是关键报告以及什么管道支持它们。它提供了团队支持谁的进一步背景,但也为有经验的团队成员提供了一个机会,向新团队成员解释所述报告和管道的任何问题。

环境设置……

当一个团队的新成员入职时,最起码要有一份手册,包含如何设置环境的明确指南,可以是一个基本的清单或一组wiki页面的形式。

甚至在我工作的只有12个人的初创公司,也有一个从0到1的环境设置指南。

以下是你在环境设置文档中应该考虑的一些关键问题。

  • VPN -大多数数据和云服务需要使用VPN来管理对内部网的访问。第一天不能访问vpn就意味着新员工可能会被锁在关键系统之外。
  • 数据库访问——显然,不要在文档中存储各种数据库的密码和主机。但是,一定要参考个人应该如何设置任何形式的数据仓库帐户,或者他们可以从哪里获得源数据库的机密和信息(通常通过某种形式的密码管理器)。
  • 云API密钥和令牌设置——与数据库访问有一定联系的是API密钥设置。无论是S3还是Cloud Storage,大多数数据团队都依赖于云提供商来存储和提供数据。
  • 代码权限——无论你使用的是Github、Gitlab还是其他,确保工程师在第一天就有权限访问,以确保他们能够快速熟悉你的代码库。
  • 二进制和自定义库下载——一些公司有特定的库和包,这是为了运行他们的定制软件或遗留应用程序所必需的。
  • Jira Account -或者任何你用来管理票务和项目管理的工具。

从第一天就开始做事……

对许多公司来说,第一天就提交代码是一个反复出现的主题。Adam在上面提到过,但我也知道Gitlab和Facebook也让他们的新工程师做同样的事情。

在数据项目中有足够的模糊性,创建清晰的标准和风格指南,在新员工入职期间给他们,可以帮助他们快速跟上进度。新数据工程师不需要花费大量其他队友的时间来审核他们的代码,而是可以创建PR,然后让他们知道标准是什么。

无论是SQL还是代码,拥有某种形式的风格指南都能带来很多好处。最棒的是,你不需要从头开发一个。有几家公司分享了他们的风格指南,如下所示:

  • Brooklyn Data Co
  • dbt
  • GitLab
  • Matt Mazur
  • Kickstarter

手册和流程指南……

在初创公司的早期阶段,特别容易避免文档化策略。因为在团队成员很少的情况下,可以通过会议、Slack或电子邮件让每个人都了解情况。但长期来看,这种疏忽会变得越来越有害。

随着团队规模的扩大,对文档的需求与不这样做的成本同时增加。换句话说,随着公司的发展和成熟,实施文档化战略变得更加困难,但也更加重要。

Gitlab……

许多团队在项目管理、变更管理和数据治理方面都有具体的流程。所有这些都是最终需要传递给新员工的信息。由于初创公司规模小,这主要是口头传播。然而,当出现一个转折点时,记录所有这些不同的过程就变得有意义了。

Run Books – Run Books不是确切的手册,但它们属于类似的类别。随着团队的成熟,开始有大量的工作以维护为重点,运行手册就变得非常有帮助。他们通常会回答如下问题:

  • 如何让一个系统下线,然后再重新上线(而不下线AWS)
  • 如何管理需要更安全的数据的数据请求
  • 如何调试那个似乎一个月就会崩溃一次的一次性管道

所有这些都可以在运行簿中记录下来,帮助新团队成员跟上进度。它们还能让更有经验的成员保持清醒,这样他们就不必记住重启内部系统的每一步。

在我看来,入职并不会在环境设置好或 XFN 介绍会议结束后停止。相反,这是一个持续的过程,会渗透到最初的一些工作中,甚至可能是交付第一个项目。

这是因为,如上所述,入职培训的目标之一是培养自信和独立性。做到这一点的一个好方法是完成你的第一个小项目,并获得反馈。

从我的经验来看,早期的详细反馈是非常有用的。它有助于为新团队所关心和期望的东西定下基调。

入职是你的第一印象……

如果第一印象很重要,那么入职就很重要。所有的小细节都很重要,如果处理不当,可能会因此付出代价。

你认为一个好的入职过程是怎样的呢?感谢阅读。你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Ben Rogojan
翻译作者:过儿
美工编辑:过儿
校对审稿:明慧
原文链接:https://medium.com/coriers/onboarding-for-data-teams-100e041a012c