Blog

Oct
03

决策树剪枝101

决策树是一种非监督学习方法,可用于分类和回归任务。目标是建立一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。决策树是机器学习算法之一,容易过度拟合。剪枝是一种技术,它删除了决策树中阻止其生长到完全深度的部分。它从树中移除的部分是不提供对实例进行分类的功能的部分。一个被训练到其最大深度的决策树很可能会导致过度拟合训练数据,因此剪枝是很重要的。

By Zhang Bonnie | Blog
DETAIL
Oct
02

快速上手Pandas数据结构合并

在许多现实生活场景中,为了便于管理,我们将数据存储在不同的文件中,经常需要将它们合并成一个更大的DataFrame进行分析。Pandas为我们提供了各种方法来合并DataFrame,如concat和merge。此外,它还提供了用于比较的实用程序。我们将通过示例来了解这两种方法的工作原理。对于本教程,我们将假设你具备Python和Pandas的基本知识。

By Zhang Bonnie | Blog
DETAIL
Sep
25

数据科学算法如何将商业计划变现?

数据科学能让品牌以一种迷人而有力的方式传达他们的故事,这是它日益受欢迎的最大原因。当品牌和公司综合利用数据时,可以与目标受众分享他们的目标,从而建立更好的品牌连接。毕竟,没有什么比一个能灌输所有人类情感的有效而有力的故事更能打动消费者了。

By Zhang Bonnie | Blog
DETAIL
Sep
25

数据岗位求职:2022秋招,多家北美大厂停止招聘,还有哪些数据岗位在招人?

疫情之后,美国的经济也遇到一些罕见的情况,很多公司都开始缩减招聘预算,在这种复杂的情况下,我们很有必要看看还有哪些公司在招人?哪些行业还在持续增加招聘预算?准备这些企业的面试需要注意哪些问题?怎样提升面试的成功率?

By Zhang Bonnie | Blog
DETAIL
Sep
24

处理不平衡数据的7个小技巧

在这些领域使用的数据通常只有不到 1% 的罕见但“有趣”的事件(例如使用信用卡的欺诈者、用户点击广告或损坏的服务器扫描其网络)。然而,大多数机器学习算法不能很好地处理不平衡的数据集。本文介绍的七种技术可以帮你训练分类器来检测异常类。

By Zhang Bonnie | Blog
DETAIL
Sep
24

区块链技术是如何影响人们的投资方式的?

与传统资产相比,投资者更容易买入加密货币。任何人都可以下载免费的比特币(BTC)或多种加密货币钱包,并注册许多可用的加密货币交易所之一。许多交易所仍然不要求用户验证身份,而其他一些交易所只在达到一定限度时才要求验证身份。

By Zhang Bonnie | Blog
DETAIL
Sep
21

如何在方差和偏差中取舍,找到平衡点?

无论哪种方式,偏差-方差权衡都是监督机器学习和预测建模中的一个重要概念。当你想训练预测模型时,可以选择各种监督机器学习模型。它们都是独一无二的,有相似之处——但最大的区别是它们的偏差和方差程度。

By Zhang Bonnie | Blog
DETAIL
Sep
18

机器学习中的文本分类是什么?

随着文本/文档数据比其他数据类型更加丰富,利用它们的新方法势在必行。由于数据本质上是非结构化的,且极其丰富,因此以易于理解的方式组织数据,可以大大提高其价值。将文本分类与机器学习结合,可以用更快、更具成本效益的方式自动构建相关文本。我们将定义文本分类、它的工作原理、一些常见的算法,并提供可能有助于开始文本分类之旅的数据集。

By Zhang Bonnie | Blog
DETAIL