机器学习

Dec
08

哪些特征工程技术改善了机器学习预测?

当涉及到机器学习时,人们可以做的事情是选择正确的特征,并删除那些对模型性能影响可忽略不计的特征,以改进ML模型预测。因此,选择正确的特征可能是数据科学家或机器学习工程师最重要的步骤之一,他们经常要做许多工作,尤其是构建那些能够分别在测试数据集上很好地泛化的复杂模型。

By Zhang Bonnie | Blog
DETAIL
Nov
06

2022 年科学家必须知道的顶级MLOps工具数据

MLOps 的主要优势是高效率、可扩展性和可再现性。MLOps 包括从数据流到机器学习模型部署的所有内容。在某些情况下,MLOps 只是用于模型部署,但你也可以找到更成熟的企业,它们已经在各种 ML开发领域实现了MLOps,如探索性数据分析(EDA)、数据预处理、模型训练等。

By Zhang Bonnie | Blog
DETAIL
Oct
31

Kumu的ML工程:将模型转化为产品

机器学习工程(MLE)是将软件工程和数据科学技能相结合的过程,目的是将机器学习模型转化为可用的产品。它包括训练模型并通过Inference endpoints公开这些模型,以及优化数据处理和数据检索,以实现生产的延迟性和稳定性。

By Zhang Bonnie | Blog
DETAIL
Oct
24

8种防止过拟合的技术

当模型在训练集上表现良好但在测试集表现不佳时,就会发生过拟合。过拟合是机器学习中一个非常常见的问题,并且有大量文献致力于研究防止过拟合的方法。在本文中,将描述八种简单的方法来防止过拟合,通过在每种方法中只对数据、模型或学习算法进行改进来缓解过拟合。

By Zhang Bonnie | Blog
DETAIL
Oct
16

一文了解机器学习中的F1分数(F1 Score)

F1分数是机器学习中用于分类模型的评估指标。尽管分类模型存在许多评估指标,但在本文中,你将了解如何计算F1分数以及何时使用它才更有意义。F1分数是对两个简单评估指标的改进。因此,在深入了解F1分数之前,我们先回顾一下F1分数的基础指标。

By Zhang Bonnie | Blog
DETAIL
Sep
18

机器学习中的文本分类是什么?

随着文本/文档数据比其他数据类型更加丰富,利用它们的新方法势在必行。由于数据本质上是非结构化的,且极其丰富,因此以易于理解的方式组织数据,可以大大提高其价值。将文本分类与机器学习结合,可以用更快、更具成本效益的方式自动构建相关文本。我们将定义文本分类、它的工作原理、一些常见的算法,并提供可能有助于开始文本分类之旅的数据集。

By Zhang Bonnie | Blog
DETAIL
Aug
29

机器学习在安全领域撒过的美丽的谎言

一个成功的ML示例是自然语言处理 (NLP)。NLP允许计算机“理解”人类语言,包括习语和隐喻。在许多方面,网络安全面临着与语言处理相同的挑战。攻击者可能不会使用习语,但许多技术类似于同音异义词,即拼写或发音相同但含义不同的单词。一些攻击者技术是类似于系统管理员出于完全善意的原因而采取的行动。

By Zhang Bonnie | Blog
DETAIL
Jul
09

深度学习——一个努力勤奋学习理解人类的智能系统

什么是深度学习 (DL)?什么是人工神经网络?深度学习是如何工作的?DL与 ML:深度学习和机器学习之间的差异?本文带你了解机器学习、深度学习以及深度学习的现状。

By Zhang Bonnie | Blog
DETAIL