Blog

Aug
27

疫情期间大火的Instacart是如何使用数据科学来解决复杂的业务问题的?

作为一名数据科学家,你已经学习了算法和技术,但是如何将它们应用到可能带来或损失数百万美元的企业世界中呢?在本文中,我们将了解Instacart如何使用数据科学方法来解决其极其复杂的后端系统背后的导入业务问题。

By Zhang Bonnie | Blog
DETAIL
Aug
27

长文总结在机器学习中处理倾斜数据集

这篇文章的目的就是回顾可以解决分类模型中倾斜数据问题的不同方法。

By Zhang Bonnie | Blog
DETAIL
Aug
27

不可不知的数据科学基础 ——AB Testing

我们将用一个简单的例子来探索A/B测试的投入和产出 (也可称为, 假设检验)。

By Zhang Bonnie | Blog
DETAIL
Jul
22

PyTorch应用:用ResNet进行交通标志分类

德国交通标志识别基准数据集:可能是自动驾驶汽车领域最受欢迎的图像分类数据集。

By Zhang Bonnie | Blog
DETAIL
Jul
22

如何用Pandas 三步清洗数据?

以下我们将展示需要清理数据集的3个最关键的步骤。

By Zhang Bonnie | Blog
DETAIL
Jul
22

爬了《权游》7季剧本,话最多的人居然是?

这篇开篇的文章将展示一些我初步的发现。其中很多发现都很有趣,因为他们都很好地代表了这个电视剧中的角色和情节。

By Zhang Bonnie | Blog
DETAIL
Jul
22

5步上手教你绘制Heatmap

在这篇文章里,我会带着你通过五个简单步骤,自己绘制一张标注好数据值的相关矩阵的Heatmap。

By Zhang Bonnie | Blog
DETAIL
Jul
21

使用 PySpark 和 MLlib 构建线性回归预测波士顿房价

Apache Spark已经成为机器学习和数据科学中最常用和受支持的开源工具之一。

By Zhang Bonnie | Blog
DETAIL