5种有效方法:提高机器学习模型的准确性
如果想让你的机器学习模型尽可能准确,你需要知道一些改进的方法。在这篇文章中,我们将讨论五种方法,通过使用特征工程、调整超级参数和尝试多种算法等,你可以为自己创造一个真正准确的模型。最重要的是,要不断尝试并从错误中学习,对你的数据和你使用的算法了解的越多,你的模型性能就越好。
机器学习的一站式library清单
Library(库)可以定义为专门用于执行特定任务的,可重复使用功能和模块的集合。不同的库提供不同类型的函数来达到所需的目标。尽管它们在许多方面彼此不同,但大多数库都有一个标准流程,通过这个流程,可以将它们安装并导入到系统中进行处理。本文将带你了解不同可用的库,他们在数据世界中经常被使用。
数据科学必备技能:一小时学会Random Forest随机森林
随机森林(Random Forest)是一种由决策树算法构建的监督机器学习算法,被数据科学家们用来解决回归和分类问题。 随机森林利用集成学习,结合了许多分类器,为复杂的问题提供解决方案。现在,随机森林算法已被应用于银行和电子商务等各个行业,用来预测行为和结果。本文将向你介绍随机森林的基本原理和一些应用。
群体学习(Swarm Learning)的工作原理——结合区块链和机器学习的更优解决方案
群体学习(Swarm Learning)是一个数据隐私保护框架,通过区块链技术,分散基于机器学习的系统。群体学习 (SL) 没有中心位置,数据或“学习成果”不会被送到中心位置,新节点通过区块链智能合约注册,获取模型,并进行本地模型训练,直到满足定义的同步条件。本文将带你了解群体学习的工作原理。
最先进的技术:基于 AI 的图像压缩
深度学习 (DL) 一直被用于图像压缩,并且已经扩展至多层感知器、随机神经网络、卷积神经网络和生成对抗网络等技术。无论你是经营网点还是博主,加快网页页面的加载速度对于网站性能至关重要,更快的页面速度有助于改善用户体验和 SEO。本文就将带你了解基于AI的图像压缩。
5种机器学习的分类器算法
分类是一项依赖于机器学习算法(Machine Learning Algorithm)的自然语言处理任务。分类是识别、理解,并将想法、对象分到预设类别或“子群”的过程。机器学习程序使用预先分类的训练数据集,通过各种算法对未来的数据集进行分类。使用分类算法,文本分析软件可以执行情绪分析的任务,根据主题和意见的极性对非结构化文本进行分类。
Python机器学习库:pycarets新增时间序列模块
PyCaret 是一个开源、低代码的 Python 机器学习库,可实现机器学习工作流的自动化。PyCaret 新增了时间序列模块,现已开始了测试阶段。该Beta版保留了 PyCaret 操作简单的特点,与现有 API 保持一致,附加许多其他模块,例如统计测试、模型训练和选择(30 多种算法)、模型分析、自动超参数调优、实验记录、云部署等。
机器学习VS深度学习:有什么区别?
机器学习是人工智能的一种应用,其中包括解析数据、从数据中学习,然后应用他们所学到的知识来做出明智决策的算法。但大家经常把机器学习(ML)和深度学习(DL)混淆,因为这两者都属于数据科学的范畴。虽然机器学习和深度学习存在相似之处,但它们之间也存在主要的区别。本文将通过三个示例为你解答ML和DL的区别所在。