Blog

Aug
27

长文总结在机器学习中处理倾斜数据集

这篇文章的目的就是回顾可以解决分类模型中倾斜数据问题的不同方法。

By Zhang Bonnie | Blog
DETAIL
Aug
27

不可不知的数据科学基础 ——AB Testing

我们将用一个简单的例子来探索A/B测试的投入和产出 (也可称为, 假设检验)。

By Zhang Bonnie | Blog
DETAIL
Aug
27

谷歌地震预警系统登陆加州

谷歌宣布,首款大规模预警系统于周二在加州发布,Android手机将被用于感知世界各地的地震,或许有一天能够提供全球预警。

By Zhang Bonnie | Blog
DETAIL
Jul
22

PyTorch应用:用ResNet进行交通标志分类

德国交通标志识别基准数据集:可能是自动驾驶汽车领域最受欢迎的图像分类数据集。

By Zhang Bonnie | Blog
DETAIL
Jul
22

如何用Pandas 三步清洗数据?

以下我们将展示需要清理数据集的3个最关键的步骤。

By Zhang Bonnie | Blog
DETAIL
Jul
22

爬了《权游》7季剧本,话最多的人居然是?

这篇开篇的文章将展示一些我初步的发现。其中很多发现都很有趣,因为他们都很好地代表了这个电视剧中的角色和情节。

By Zhang Bonnie | Blog
DETAIL
Jul
22

5步上手教你绘制Heatmap

在这篇文章里,我会带着你通过五个简单步骤,自己绘制一张标注好数据值的相关矩阵的Heatmap。

By Zhang Bonnie | Blog
DETAIL
Jul
21

使用 PySpark 和 MLlib 构建线性回归预测波士顿房价

Apache Spark已经成为机器学习和数据科学中最常用和受支持的开源工具之一。

By Zhang Bonnie | Blog
DETAIL