初级与高级数据科学家有什么区别?

初级与高级数据科学家有什么区别?

目录

  • 1. 介绍
  • 2. 产品经理协作
  • 3. 项目生命周期管理
  • 4. 总结
  • 5. 参考

01 介绍

正如标题所暗示的那样,初级和高级数据科学家之间存在很多明显的差异,但还有哪些鲜为人知的差异呢?在本文中,我们将讨论这两种职位的差异以及一些高级数据科学家可能会代替初级数据科学家履行的关键职责或流程。如果你想了解更多关于数据科学的相关内容,可以阅读以下这些文章:
如何明确和解决模糊的数据科学问题?
构建数据科学管道的 4 个步骤
2022年,我们给数据科学初学者推荐这5本书
Kaggle 还是 Github?哪个对数据科学家更有用?

首先,需要注意的是,并不是每家公司都设置了初级、普通和高级员工的总数,因此比较仅在这些情况下有效。然而,经验丰富与经验不足的比较可以遵循相同的方向。说到这里,让我们深入了解下面这两个角色。

注:

了解这两个职位的差异不仅有助于你决定哪一级别的职位适合你,还有助于招聘人员和经理招聘不同资历级别的员工。有了这些信息,你还可以更多地了解作为学生应该学习哪些课程(例如,你会更加专注于编程,还是会更多地参与业务和通信?)

另一方面,经理和招聘人员可以使用这些信息来设计和编辑工作描述。此外,这些区别对其他利益相关者也有帮助(例如——软件工程师、数据工程师、业务分析师和产品经理),他们可能与不同资历级别的数据科学一起工作,以便在工作场所设定适当的期望。

02 产品经理协作

ThisisEngineering RAEng在Unsplash上拍摄的照片[2]

正如所料,初级数据科学家的思维方式倾向于遵循机器学习算法的学术界,而高级数据科学家的思维方式则侧重于业务影响和协作。

例如,以下是初级与高级数据科学家的典型日/周的示例:

初级数据科学家

  • 接收来自数据科学经理的任务,例如清洗或预处理数据,以及比较算法
  • 使用 SQL 从数据库表中查询数据
  • 从现有数据创建新特征
  • 为模型准确性创建可视化

以上只是作为初级或普通级别的数据科学家每天想做的一些步骤。你可能会专注于任务本身,而不是为他人创建和组织任务。

高级数据科学家

与产品经理、其他利益相关者合作,制定自己的任务、路线图和流程 — 讨论在模型准确性和错误之外推动模型开发的重要 KPI(关键绩效指标)例如,不只是优化 MAE,而是优化位于中间分位数两侧的预测。

在某些公司,这个角色可能更类似于数据科学经理,而在其他公司,高级数据科学家的职位不管理任何人,而是管理项目本身。它也可能取决于你周围的团队。

你的合作对象和业务:

现在我们对这些角色的日常任务有了更好的了解,通过一些示例可以看到高级数据科学家与产品经理的合作更多。并不是每个与您共事的人都会了解MAE、MAPE、RMSE、调整参数、过拟合等。业务问题的最佳模型是作为高级数据科学家需要阐明的内容,而初级或普通级别的数据科学家往往只关注于降低错误本身。然而,一些公司的这些任务可能会重叠。

总而言之,高级别工作者会更多地与他人合作,而初级工作者可以更加谦虚好学。再次声明,这只是我收集的经验,在不同的公司可能会有所不同。

03 项目生命周期管理

照片由Erlend Ekseth在Unsplash 上拍摄 [3]

与上述观点类似,高级数据科学家期望从头到尾管理更多的项目,而初级数据科学家可能会专注于整个过程的前半部分或中半部分。例如:

  • 初级数据科学家项目示例

用于数据集的 SQL 数据库、数据预处理、特征工程、模型比较

  • 高级数据科学家项目示例

收集利益相关者的需求,问题是什么,为什么数据科学是一个可能的解决方案?从 API/SQL 获取数据、预处理数据、特征工程、模型比较、部署模型——可能与机器学习运维工程师或软件工程师合作,或自己动手,自动化任务、指标,报告指标,讨论模型如何帮助客户,节省资金、时间等。

正如你所看到的,有一个比模型本身更大的生命周期,整个过程都围绕着它。初级数据科学家关注的是模型,但高级数据科学家除了关注这一点,更关注为什么需要模型。

04 总结

虽然我可以列出更明显的差异,比如多年经验、教育、更多的编程语言、使用更多的平台等,但我认为讨论整体差异同样重要,比如和谁一起工作以及在业务中的主要责任。

总而言之,以下是数据科学角色的两个领域,根据你的工作地点可能会有所不同:

  • 产品经理合作
  • 项目生命周期管理

我希望你觉得我的文章既有趣又有用。无论你是否认同,请随时在下面发表评论。为什么认同?为什么不认同?在数据科学资历方面还有哪些其他重要差异?这些可以进一步说明,但我希望我能够阐明初级和高级数据科学家之间更独特的差异。

订阅链接: 

https ://datascience2.medium.com/subscribe

推荐链接:

 https ://datascience2.medium.com/membership

(如果你在 Medium 上注册会员,我将获得佣金)

05 参考

[1] Photo by Liz Sanchez-Vegas on Unsplash, (2019)
[2] Photo by ThisisEngineering RAEng on Unsplash, (2020)
[3] Photo by Erlend Ekseth on Unsplash, (2015)

我希望你觉得我的文章既有趣又有用。无论你是否认同,请随时在下面发表评论。你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Matt Przybyla
翻译作者:明慧
美工编辑:过儿
校对审稿:Miya
原文链接:https://towardsdatascience.com/junior-vs-senior-data-scientist-whats-the-difference-d13afedd8ec