机器学习

Jan
10

新的聊天机器人ChatGPT擅长和不擅长的

重要的是不要被这种炒作冲昏了头脑,因为最终这并不是一个新的感知智能——它只是一个经过更好训练的大型语言模型。大型语言模型随着每一个版本的发布而变得更好,而这个版本无疑在真正帮助人们并节省人们时间的方面开辟了新的天地。但在许多情况下,这种新模型的实用性会失效,依赖它将是愚蠢的。让我们来看看一些它擅长和不擅长的领域。

By Zhang Bonnie | Blog
DETAIL
Jan
10

Google Sheets引入简易ML(机器学习)

ML不是某些人的专利,我们一直在为此努力。简易ML是TensorFlow团队为Google Sheets开发的一个插件,能让所有人都使用上ML。任何一个哪怕是不具备编程或ML专业知识的人,只需点击几下,就可以在Google Sheets中使用ML。

By Zhang Bonnie | Blog
DETAIL
Dec
26

七个实用的Python机器学习库

谚语说“你不必重新发明轮子”,数据库就是最好的例子。它帮助你以简单的方式编写复杂而耗时的功能。根据我的说法,一个好的项目需要一些最好的数据库。在这里,我整理了七个有用的Python库,这些数据库将有效帮助你进行机器学习的开发。

By Zhang Bonnie | Blog
DETAIL
Dec
20

DeepAR——通过深度学习掌握时间序列预测

几年前,时间序列模型只适用于一个序列。因此,如果我们有多个时间序列,一个选项是为每个序列创建一个模型。或者,如果我们能够将数据“表格化”,我们就可以应用梯度增强的树模型——即使在今天也能有很大的作用。第一个可以在多个时间序列上运行的模型是DeepAR,这是亚马逊开发的自回归递归网络。在本文中,我们将了解DeepAR是如何深入工作的,以及为什么它是时间序列社区的里程碑。

By Zhang Bonnie | Blog
DETAIL
Dec
08

哪些特征工程技术改善了机器学习预测?

当涉及到机器学习时,人们可以做的事情是选择正确的特征,并删除那些对模型性能影响可忽略不计的特征,以改进ML模型预测。因此,选择正确的特征可能是数据科学家或机器学习工程师最重要的步骤之一,他们经常要做许多工作,尤其是构建那些能够分别在测试数据集上很好地泛化的复杂模型。

By Zhang Bonnie | Blog
DETAIL
Nov
06

2022 年科学家必须知道的顶级MLOps工具数据

MLOps 的主要优势是高效率、可扩展性和可再现性。MLOps 包括从数据流到机器学习模型部署的所有内容。在某些情况下,MLOps 只是用于模型部署,但你也可以找到更成熟的企业,它们已经在各种 ML开发领域实现了MLOps,如探索性数据分析(EDA)、数据预处理、模型训练等。

By Zhang Bonnie | Blog
DETAIL
Oct
31

Kumu的ML工程:将模型转化为产品

机器学习工程(MLE)是将软件工程和数据科学技能相结合的过程,目的是将机器学习模型转化为可用的产品。它包括训练模型并通过Inference endpoints公开这些模型,以及优化数据处理和数据检索,以实现生产的延迟性和稳定性。

By Zhang Bonnie | Blog
DETAIL
Oct
24

8种防止过拟合的技术

当模型在训练集上表现良好但在测试集表现不佳时,就会发生过拟合。过拟合是机器学习中一个非常常见的问题,并且有大量文献致力于研究防止过拟合的方法。在本文中,将描述八种简单的方法来防止过拟合,通过在每种方法中只对数据、模型或学习算法进行改进来缓解过拟合。

By Zhang Bonnie | Blog
DETAIL