2022 年科学家必须知道的顶级MLOps工具数据
MLOps 的主要优势是高效率、可扩展性和可再现性。MLOps 包括从数据流到机器学习模型部署的所有内容。在某些情况下,MLOps 只是用于模型部署,但你也可以找到更成熟的企业,它们已经在各种 ML开发领域实现了MLOps,如探索性数据分析(EDA)、数据预处理、模型训练等。
Kumu的ML工程:将模型转化为产品
机器学习工程(MLE)是将软件工程和数据科学技能相结合的过程,目的是将机器学习模型转化为可用的产品。它包括训练模型并通过Inference endpoints公开这些模型,以及优化数据处理和数据检索,以实现生产的延迟性和稳定性。
8种防止过拟合的技术
当模型在训练集上表现良好但在测试集表现不佳时,就会发生过拟合。过拟合是机器学习中一个非常常见的问题,并且有大量文献致力于研究防止过拟合的方法。在本文中,将描述八种简单的方法来防止过拟合,通过在每种方法中只对数据、模型或学习算法进行改进来缓解过拟合。
一文了解机器学习中的F1分数(F1 Score)
F1分数是机器学习中用于分类模型的评估指标。尽管分类模型存在许多评估指标,但在本文中,你将了解如何计算F1分数以及何时使用它才更有意义。F1分数是对两个简单评估指标的改进。因此,在深入了解F1分数之前,我们先回顾一下F1分数的基础指标。
机器学习中的文本分类是什么?
随着文本/文档数据比其他数据类型更加丰富,利用它们的新方法势在必行。由于数据本质上是非结构化的,且极其丰富,因此以易于理解的方式组织数据,可以大大提高其价值。将文本分类与机器学习结合,可以用更快、更具成本效益的方式自动构建相关文本。我们将定义文本分类、它的工作原理、一些常见的算法,并提供可能有助于开始文本分类之旅的数据集。
机器学习在安全领域撒过的美丽的谎言
一个成功的ML示例是自然语言处理 (NLP)。NLP允许计算机“理解”人类语言,包括习语和隐喻。在许多方面,网络安全面临着与语言处理相同的挑战。攻击者可能不会使用习语,但许多技术类似于同音异义词,即拼写或发音相同但含义不同的单词。一些攻击者技术是类似于系统管理员出于完全善意的原因而采取的行动。
深度学习——一个努力勤奋学习理解人类的智能系统
什么是深度学习 (DL)?什么是人工神经网络?深度学习是如何工作的?DL与 ML:深度学习和机器学习之间的差异?本文带你了解机器学习、深度学习以及深度学习的现状。
Correlation相关性 VS Regression回归:它们有什么区别?
在这篇文章中,我将用具体例子解释相关性(Correlation)和回归(Regression)这两个名词之间的区别。相关性表示的是变量之间的关系,而不是因果关系!在物理世界中,我们需要定义来衡量事物,一个好问题是:我们如何衡量相关性?而回归分析是一种数学技术,用于分析一些数据,包括一个因变量和一个(或多个)自变量,目的是找到因变量和自变量之间的最终函数关系。