数据科学家

Dec
22

担任数据科学经理的前半年,我学到了什么?

结合自身情况,我写下了这篇文章,希望能帮助到大家。在这篇文章中,我将先写在工作后我面临的最大挑战:1.适应非科技性的公司2.招聘和雇用(在某些情况下,与1相关)。当然,这并不是全部,但我想从这两条讲起,因为它们至少占用了我一天的四分之三。

By Zhang Bonnie | Blog
DETAIL
Dec
14

数据科学家应知的三个回归事项

一个模型的好坏取决于你对它的理解,我担心很多人都在运行模型时看到它的最初的结果就浅尝辄止了。当谈到回归建模——最常见的建模形式之一,如果你能了解一些关于这些模型的工作原理以及它们设置方式的简单信息,你将成为更好的数据科学家。

By Zhang Bonnie | Blog
DETAIL
Dec
11

提升数据科学水平的五个必备知识

如果你对重新研究数学有点犹豫,这是个好消息。成为一名成功的数据科学家,你不需要正式的数学学位,也不需要成为抽象证明的专家。你真正需要的是数据科学中能实际应用的统计概念知识,(例如设计用户研究、运行假设测试、有效使用机器学习模型等)。

By Zhang Bonnie | Blog
DETAIL
Dec
06

使用Python和R的五个简单快捷的技巧——让你成为高效数据科学家

我最近的一个发现是许多数据科学家同时使用Python和R。在限定的一天内,大量的数据科学家在两种语言之间切换,这意味着需要通过提供如何更好地管理定期使用两种语言的技巧来填补数据科学教育的空白。本文我将介绍几个简单的技巧,这些技巧可以在不到10分钟的时间内作为日常工作的一部分来实现,它们也将帮助你成为一个在Python和R之间切换的更高效的数据科学家。

By Zhang Bonnie | Blog
DETAIL
Dec
02

使用SQL总结A/B实验结果

我曾在大大小小的科技公司做过应用程序、产品和营销A/B实验。虽然每个实验的特性和目标各不相同,但我为总结这些产品实验的结果而编写的SQL每次都是相同的。它们都是一种设计模式!建立一个用户级别的表,然后根据该表计算汇总指标。这种方法对我来说就像是第二天性,但我很惊讶的是我需要经常向其他开始做实验的人展示它,因为没有太多东西可以解释这种方法。所以我写了这本指南!

By Zhang Bonnie | Blog
DETAIL
Dec
01

认识Julia:数据科学的未来

作为一名数据爱好者,你可能听说过:Julia——“未来数据科学编程语言”。有人声称,Julia将在数据科学领域取代Python和R,因为它在性能、效率和易用性方面具有显著优势。在本文中,我们将研究Julia是什么,它的应用及它是否值得数据科学家去学习。

By Zhang Bonnie | Blog
DETAIL
Dec
01

以数据科学家或机器学习工程师的身份逐步构建数据管道

在面试或作为数据科学家时,我们经常被要求构建一个能够对连续流动数据执行机器学习预测的应用程序。我们的老板经常期望我们将按时交付结果,并使用机器学习和数据科学来生成这些高质量的预测。在本文中,我们将研究数据管道以及如何构建它们,并确保我们在构建机器学习预测方面做得还不错。本文将逐步介绍如何构建重要的数据管道。

By Zhang Bonnie | Blog
DETAIL
Oct
31

Kumu的ML工程:将模型转化为产品

机器学习工程(MLE)是将软件工程和数据科学技能相结合的过程,目的是将机器学习模型转化为可用的产品。它包括训练模型并通过Inference endpoints公开这些模型,以及优化数据处理和数据检索,以实现生产的延迟性和稳定性。

By Zhang Bonnie | Blog
DETAIL