机器学习

Sep
18

机器学习中的文本分类是什么?

随着文本/文档数据比其他数据类型更加丰富,利用它们的新方法势在必行。由于数据本质上是非结构化的,且极其丰富,因此以易于理解的方式组织数据,可以大大提高其价值。将文本分类与机器学习结合,可以用更快、更具成本效益的方式自动构建相关文本。我们将定义文本分类、它的工作原理、一些常见的算法,并提供可能有助于开始文本分类之旅的数据集。

By Zhang Bonnie | Blog
DETAIL
Aug
29

机器学习在安全领域撒过的美丽的谎言

一个成功的ML示例是自然语言处理 (NLP)。NLP允许计算机“理解”人类语言,包括习语和隐喻。在许多方面,网络安全面临着与语言处理相同的挑战。攻击者可能不会使用习语,但许多技术类似于同音异义词,即拼写或发音相同但含义不同的单词。一些攻击者技术是类似于系统管理员出于完全善意的原因而采取的行动。

By Zhang Bonnie | Blog
DETAIL
Jul
09

深度学习——一个努力勤奋学习理解人类的智能系统

什么是深度学习 (DL)?什么是人工神经网络?深度学习是如何工作的?DL与 ML:深度学习和机器学习之间的差异?本文带你了解机器学习、深度学习以及深度学习的现状。

By Zhang Bonnie | Blog
DETAIL
Jun
03

Correlation相关性 VS Regression回归:它们有什么区别?

在这篇文章中,我将用具体例子解释相关性(Correlation)和回归(Regression)这两个名词之间的区别。相关性表示的是变量之间的关系,而不是因果关系!在物理世界中,我们需要定义来衡量事物,一个好问题是:我们如何衡量相关性?而回归分析是一种数学技术,用于分析一些数据,包括一个因变量和一个(或多个)自变量,目的是找到因变量和自变量之间的最终函数关系。

By Zhang Bonnie | Blog
DETAIL
May
18

5种有效方法:提高机器学习模型的准确性

如果想让你的机器学习模型尽可能准确,你需要知道一些改进的方法。在这篇文章中,我们将讨论五种方法,通过使用特征工程、调整超级参数和尝试多种算法等,你可以为自己创造一个真正准确的模型。最重要的是,要不断尝试并从错误中学习,对你的数据和你使用的算法了解的越多,你的模型性能就越好。

By Zhang Bonnie | Blog
DETAIL
May
17

机器学习的一站式library清单

Library(库)可以定义为专门用于执行特定任务的,可重复使用功能和模块的集合。不同的库提供不同类型的函数来达到所需的目标。尽管它们在许多方面彼此不同,但大多数库都有一个标准流程,通过这个流程,可以将它们安装并导入到系统中进行处理。本文将带你了解不同可用的库,他们在数据世界中经常被使用。

By Zhang Bonnie | Blog
DETAIL
Apr
28

数据科学必备技能:一小时学会Random Forest随机森林

随机森林(Random Forest)是一种由决策树算法构建的监督机器学习算法,被数据科学家们用来解决回归和分类问题。 随机森林利用集成学习,结合了许多分类器,为复杂的问题提供解决方案。现在,随机森林算法已被应用于银行和电子商务等各个行业,用来预测行为和结果。本文将向你介绍随机森林的基本原理和一些应用。

By Zhang Bonnie | Blog
DETAIL
Mar
07

群体学习(Swarm Learning)的工作原理——结合区块链和机器学习的更优解决方案

群体学习(Swarm Learning)是一个数据隐私保护框架,通过区块链技术,分散基于机器学习的系统。群体学习 (SL) 没有中心位置,数据或“学习成果”不会被送到中心位置,新节点通过区块链智能合约注册,获取模型,并进行本地模型训练,直到满足定义的同步条件。本文将带你了解群体学习的工作原理。

By Zhang Bonnie | Blog
DETAIL