Blog

Oct
12

数据团队入职培训白皮书

入职培训应该被视为任何团队和公司流程的重要组成部分。对于分析和数据工程师这样的技术岗来说更是如此。这些职位需要访问多个系统,理解业务环境,并访问关键数据集。延迟或抑制这些角色入职过程的顺利程度可能会带来高昂的成本,并导致留任率低下。因此,创建一个顺利的入职过程是一项很值得的投资。在本文中,我将回顾我过去的一些入职经验,并讨论数据团队在入职过程中应该采取的一些关键步骤和注意事项。

By Zhang Bonnie | Blog
DETAIL
Oct
07

数据科学面试中你应该知道的10个高级SQL概念

随着数据量的不断增长,对专业数据人员的需求也在增长。具体来说,对精通SQL而非初学者水平的专业人员的需求日益增长。因此,我和StrataScratch的创始人Nathan Rosidi回顾了我认为最重要的10个中高级SQL概念。

By Zhang Bonnie | Blog
DETAIL
Oct
07

TikTok进军硅谷!选址南湾雅虎办公楼!

在别的大厂纷纷退租、裁员的时候,字节跳动直接拿下硅谷今年最大手笔的办公室租赁交易。字节跳动美国新总部和深圳总部面积齐平,面积大,人力需求自然大幅飙升。在硅谷正在经历最大裁员潮的情况下,TikTok入驻硅谷对求职者们来说是一个重大利好消息!

By Zhang Bonnie | Blog
DETAIL
Oct
06

数据科学家/分析师应该避免的5大编程错误

我目前的职位是数据科学经理,与多个数据科学家一起工作,我看到他们中的许多人在研究大数据时犯了一些基本的数据操作错误(我以前也犯过一些这样的错误)。这些错误会导致代码执行时间大幅度增加,有时还会导致大量返工,浪费时间和精力。

By Zhang Bonnie | Blog
DETAIL
Oct
06

高盛开启大规模裁员,华尔街凛冬将至?

美国劳动力市场日渐低迷,连高盛这样的华尔街巨头也顶不住了。高盛将重新开启末位淘汰制、削减福利和薪酬,本月起拟裁员数百人。裁员意味着高盛在疫情期间基本暂停的淘汰机制重新开启(该计划通常会裁掉1%至5%的员工)。美国市场认为,高盛这波裁员,意味着美国金融业也感受到了当前市场的阵阵寒意,分析师们预计高盛今年的利润将下降40%以上。

By Zhang Bonnie | Blog
DETAIL
Oct
03

SQL & NoSQL,掌握这7点就够了

在许多现实生活场景中,为了便于管理,我们将数据存储在不同的文件中,经常需要将它们合并成一个更大的DataFrame进行分析。Pandas为我们提供了各种方法来合并DataFrame,如concat和merge。此外,它还提供了用于比较的实用程序。我们将通过示例来了解这两种方法的工作原理。对于本教程,我们将假设你具备Python和Pandas的基本知识。

By Zhang Bonnie | Blog
DETAIL
Oct
03

决策树剪枝101

决策树是一种非监督学习方法,可用于分类和回归任务。目标是建立一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。决策树是机器学习算法之一,容易过度拟合。剪枝是一种技术,它删除了决策树中阻止其生长到完全深度的部分。它从树中移除的部分是不提供对实例进行分类的功能的部分。一个被训练到其最大深度的决策树很可能会导致过度拟合训练数据,因此剪枝是很重要的。

By Zhang Bonnie | Blog
DETAIL
Oct
02

快速上手Pandas数据结构合并

在许多现实生活场景中,为了便于管理,我们将数据存储在不同的文件中,经常需要将它们合并成一个更大的DataFrame进行分析。Pandas为我们提供了各种方法来合并DataFrame,如concat和merge。此外,它还提供了用于比较的实用程序。我们将通过示例来了解这两种方法的工作原理。对于本教程,我们将假设你具备Python和Pandas的基本知识。

By Zhang Bonnie | Blog
DETAIL