机器学习

Jan
03

5种机器学习的分类器算法

分类是一项依赖于机器学习算法(Machine Learning Algorithm)的自然语言处理任务。分类是识别、理解,并将想法、对象分到预设类别或“子群”的过程。机器学习程序使用预先分类的训练数据集,通过各种算法对未来的数据集进行分类。使用分类算法,文本分析软件可以执行情绪分析的任务,根据主题和意见的极性对非结构化文本进行分类。

By Zhang Bonnie | Blog
DETAIL
Dec
16

Python机器学习库:pycarets新增时间序列模块

PyCaret 是一个开源、低代码的 Python 机器学习库,可实现机器学习工作流的自动化。PyCaret 新增了时间序列模块,现已开始了测试阶段。该Beta版保留了 PyCaret 操作简单的特点,与现有 API 保持一致,附加许多其他模块,例如统计测试、模型训练和选择(30 多种算法)、模型分析、自动超参数调优、实验记录、云部署等。

By Zhang Bonnie | Blog
DETAIL
Dec
12

机器学习VS深度学习:有什么区别?

机器学习是人工智能的一种应用,其中包括解析数据、从数据中学习,然后应用他们所学到的知识来做出明智决策的算法。但大家经常把机器学习(ML)和深度学习(DL)混淆,因为这两者都属于数据科学的范畴。虽然机器学习和深度学习存在相似之处,但它们之间也存在主要的区别。本文将通过三个示例为你解答ML和DL的区别所在。

By Zhang Bonnie | Blog
DETAIL
Nov
24

如何回答ML机器学习的面试问题?

机器学习面试中,除了答案以外,面试官还想看到你对该主题/问题更深层次的了解。在回答问题时,简单地陈述答案是不够的,你应该将问题展开讲述,例如陈述利弊、讨论替代模型/算法、编写方程式、甚至建议如何生产模型等。让我们来看看下面的几个例子,帮助我们了解应该如何回答 ML 面试问题。

By Zhang Bonnie | Blog
DETAIL
Nov
22

Huber回归和Ridge回归:如何处理Python中的异常值?

在处理数据中的异常值时,传统的线性回归(Linear Regression)可能存在一些缺点。如果一个数据点离集合中的其他点很远,这会极大地影响最小二乘回归线,接近集合数据点的总体方向的线将因异常值的存在而发生偏移。本文将介绍如何处理数据样本中的异常值、Huber回归和Ridge回归的区别、如何在Huber回归中修改异常值敏感度、以及如何用 RMSE 确定模型。

By Zhang Bonnie | Blog
DETAIL
Nov
20

神经网络——不止是深度学习

神经网络(Neural Networks)是计算智能(Computational Intelligence)的一个分支,比深度学习更加高级。然而,神经网络不仅仅是深度分类/回归算法。神经网络研究领域包括前馈神经网络、循环神经网络、自组织神经网络、深度学习、卷积神经网络等。这篇文章会对三种不同类型的神经网络——卷积神经网络、自组织特征图、和极限学习机进行高度概括。

By Zhang Bonnie | Blog
DETAIL
Oct
28

机器学习面试,你必须知道这些数学知识

机器学习是指训练计算机程序,以建立基于数据的统计模型的过程。 机器学习 (ML) 的目标是转换数据,并从数据中识别关键模式或获得关键见解。而数学是机器学习面试中的一大重点。为了练习,我们汇总了机器学习面试问题中的数学相关的函数和问题。这份ML最重要数学的指南会对大家的求职很有帮助。

By Zhang Bonnie | Blog
DETAIL
Sep
15

数据中常见的偏见问题有哪些?

数据科学家的工作是弄清事实。 不过在进行这种分析时,又不得不必须做出主观决定。 因此,即使处理确凿的事实和数据,数据科学也有很强的解释性成分。因此,数据科学家需要格外小心避免受到认知偏见的影响。在这篇文章中,会列举出几种最常见的偏见类型。 同时还提供了一些避免它们的方法,并做出更好、更合理的决策的建议。

By Zhang Bonnie | Blog
DETAIL