机器学习

Dec
26

七个实用的Python机器学习库

谚语说“你不必重新发明轮子”,数据库就是最好的例子。它帮助你以简单的方式编写复杂而耗时的功能。根据我的说法,一个好的项目需要一些最好的数据库。在这里,我整理了七个有用的Python库,这些数据库将有效帮助你进行机器学习的开发。

By Zhang Bonnie | Blog
DETAIL
Dec
20

DeepAR——通过深度学习掌握时间序列预测

几年前,时间序列模型只适用于一个序列。因此,如果我们有多个时间序列,一个选项是为每个序列创建一个模型。或者,如果我们能够将数据“表格化”,我们就可以应用梯度增强的树模型——即使在今天也能有很大的作用。第一个可以在多个时间序列上运行的模型是DeepAR,这是亚马逊开发的自回归递归网络。在本文中,我们将了解DeepAR是如何深入工作的,以及为什么它是时间序列社区的里程碑。

By Zhang Bonnie | Blog
DETAIL
Dec
08

哪些特征工程技术改善了机器学习预测?

当涉及到机器学习时,人们可以做的事情是选择正确的特征,并删除那些对模型性能影响可忽略不计的特征,以改进ML模型预测。因此,选择正确的特征可能是数据科学家或机器学习工程师最重要的步骤之一,他们经常要做许多工作,尤其是构建那些能够分别在测试数据集上很好地泛化的复杂模型。

By Zhang Bonnie | Blog
DETAIL
Nov
06

2022 年科学家必须知道的顶级MLOps工具数据

MLOps 的主要优势是高效率、可扩展性和可再现性。MLOps 包括从数据流到机器学习模型部署的所有内容。在某些情况下,MLOps 只是用于模型部署,但你也可以找到更成熟的企业,它们已经在各种 ML开发领域实现了MLOps,如探索性数据分析(EDA)、数据预处理、模型训练等。

By Zhang Bonnie | Blog
DETAIL
Oct
31

Kumu的ML工程:将模型转化为产品

机器学习工程(MLE)是将软件工程和数据科学技能相结合的过程,目的是将机器学习模型转化为可用的产品。它包括训练模型并通过Inference endpoints公开这些模型,以及优化数据处理和数据检索,以实现生产的延迟性和稳定性。

By Zhang Bonnie | Blog
DETAIL
Oct
24

8种防止过拟合的技术

当模型在训练集上表现良好但在测试集表现不佳时,就会发生过拟合。过拟合是机器学习中一个非常常见的问题,并且有大量文献致力于研究防止过拟合的方法。在本文中,将描述八种简单的方法来防止过拟合,通过在每种方法中只对数据、模型或学习算法进行改进来缓解过拟合。

By Zhang Bonnie | Blog
DETAIL
Oct
16

一文了解机器学习中的F1分数(F1 Score)

F1分数是机器学习中用于分类模型的评估指标。尽管分类模型存在许多评估指标,但在本文中,你将了解如何计算F1分数以及何时使用它才更有意义。F1分数是对两个简单评估指标的改进。因此,在深入了解F1分数之前,我们先回顾一下F1分数的基础指标。

By Zhang Bonnie | Blog
DETAIL
Sep
18

机器学习中的文本分类是什么?

随着文本/文档数据比其他数据类型更加丰富,利用它们的新方法势在必行。由于数据本质上是非结构化的,且极其丰富,因此以易于理解的方式组织数据,可以大大提高其价值。将文本分类与机器学习结合,可以用更快、更具成本效益的方式自动构建相关文本。我们将定义文本分类、它的工作原理、一些常见的算法,并提供可能有助于开始文本分类之旅的数据集。

By Zhang Bonnie | Blog
DETAIL