实操大法:自学成为数据科学家之前,你考虑过这4个问题吗?
如果你曾经在家里工作过,你就会深有体会,这种体验并不像大多数人想象的那么自由和美好。你要时刻保持自己充沛的体力和热情,并让同事参与其中并不像大多数人想象的那么容易。但幸运的是,在家办公的问题已经引起了广泛关注:很多针对这个问题的博客里都给出了非常可行的解决办法。
但是吧,有一个类似的问题并没有被经验丰富的博客主们翻牌,那就是如何在家里学习。在家里学习与在家里工作需要完全不同的心境,因为在家学习是自我主导(特别是在数据科学领域,电脑里不会有一个manager告诉你必须学什么)和开放式成果(你能学习的内容是无穷尽的,你常常不知道学什么内容最好,学到哪里该结束)
伴随着现在越来越多的Mooc课程、Boot Camps以及线上各渠道免费的学习资料,我们该如何自我学习就格外重要了。
背景介绍:我的公司正运营着一个数据科学导师项目,该项目的设计理念是远程优先,我们的目标是确保我们的学员不会感受到远程学习带来的痛苦。我希望我们学到的经验教训能对其他人有所帮助,所以我把它们整理在这里。
01 问题:我总容易被其他外界事物干扰
解决办法:尽管它是个顽疾,但仍然有些措施可以采取
1. 每次使用完社交媒体后,都全身而退。这样做不会消除你的数据记录,但每次都强迫你登入Twitter 或者Instagram的这种行为能够让你更加珍惜使用他们的时间。
2. 不要在家里学习,去咖啡店或者公共图书馆坐坐。将你的工作环境和生活环境分开能帮助你明确学习时间和休闲时间,以及让你的大脑保持学习的状态。
3. 和别人一起学习。任何人都可以,但如果那个人也热衷于数据科学,那效果会非常惊人。监督对方学习进度,共同鞭策前进。但不需要每次都面基,换种聊法,比如face time, video chat 都能达到共同进步的效果。
4. 读一读生产率鸡汤文。例如《Atomic Habits》这类书和类似的博客都能激发内心想学习的小宇宙。
02 问题: 我没动力了也看不到明显的进步
解决办法:这常常是因为你好高骛远,制定的学习计划是不现实的。你需要考虑两点:1.从你现有的职业向数据科学转型,需要几个月甚至是几年的时间;2.认定了数据科学这条路,就要坚持到底。
1. 制定明确的学习目标。专注于短期目标更现实:今天我想要学习什么
2. 让你的学习目标公之于众,接受群众的审判。将你每天的学习内容更新到Twitter或者LinkedIn上(如果你没有,就赶紧注册吧)。如果你认识行业专家,就问问他们能不能添加他们到你最新工作的weekly newsletter里。当你有了给专家和followers展示自己每周学习内容的压力时,你就一定有学习的动力。
3. 赶紧开始你的项目。当你还在迷茫彷徨时,不如直接开始你的项目,有了好的成果就能激励你继续往前走,前方的路也更加宽广。给自己的项目做个博客,像演讲家一样,将成果展示给自己的朋友。结果驱动,能给自己成就感和满足感,也能激发满满的动力。
03 问题: 我不知道什么时候继续
解决办法:这在数据科学里是个大问题,因为项目常常时open-ended。你常常需要考虑:什么样的模型才足够好?你怎么知道EDA的过程结束啦?你是否需要尝试另外的encoding strategy?
1. 最好的项目,就是有明确的观众和特定的使用群体。提前想好你项目要服务的“祖宗们”是谁,并且在后续项目中一直努力为他们创造有价值的产品。当你在进行EDA时,时刻牢记:你能从数据中挖掘哪些有用的信息,以便你能解决顾客痛点。
2. 提前制定你的项目标准。例如你想要学什么,你的模型需要达到什么精准程度。很多的项目都有明确的限定,你的项目也需要有。
3. 提前规划项目进程。在开始项目前,明确它的截止时间。这也是提前模拟你作为数据科学家,需要面对的时间限制和分类决策等问题。
04 问题: 我不知道从哪里开始
解决办法:如果你还非常非常的年轻(小编已经老了),你需要做的第一件事情,就是找到你的兴趣所在。
1. 上一节免费的MOOC课。如果你才刚刚开始,那么就专注于一些能让你建立Python 技巧的课,例如介绍Jupyter notebooks, scikit-learn 和pandas.
2. 了解了一些基础内容后,需要问自己:自己想做什么类型的数据科学家?当然,既然是选择题,就需要了解选项嘛,这里列举了一些数据科学家的类型。https://towardsdatascience.com/why-you-shouldnt-be-a-data-science-generalist-f69ea37cdd2c
3. 从前辈那里吸取经验。和一些有类似职业发展的人交流,了解下他们成功的秘诀。这里有一些最常见的数据科学职业发展路径,看看能不能匹配的上。https://towardsdatascience.com/3-common-data-science-career-transitions-and-how-to-make-them-happen-588c3618942f
从SharpestMinds Mentees经历来看,这些学习大法还是非常有效的。但最重要的事情,就是对自己要有耐心,学习不可能一蹴而就。
当你第一次,第二次尝试这些策略,可能依旧很难赶上自己设置的进度,这没有问题。在一次次的尝试中,不断调整策略,找到最有效最适合你的办法。就像任何完美的machine learning 模型,也是在不断重复的调试和尝试中,得到那个最优解。
原文作者:Jeremie Harris
翻译作者:Zixin Huang
美工编辑:Miya
校对审稿:冬冬
原文链接:https://towardsdatascience.com/how-to-learn-data-science-on-your-own-a-practical-guide-1a871fec2034