Blog

Jan
10

红酒数据集Case Study:一个分类问题

本文以一个红酒的Case Study为例,为你讲解数据分析中的分类问题。我们的目标是找到一个设计模型,根据提供的13个测量参数,预测红酒品种,并找出他们之间的主要差异。这是一个分类问题,而本文会列举四种模型,并评估每个模型的准确性。此外,我还会使用主成分分析,识别并探索三种红酒之间的差异。

By Zhang Bonnie | Blog
DETAIL
Jan
09

假期将近——旅游行业是如何应用数据分析的?

数据科学为许多行业带来了新的机遇—— 旅游业也是其中之一。作为一个不断发展的行业,持续增加的消费者需要大量的数据处理。 这也是数据科学算法在旅游业如此重要的原因。 旅游相关的行业,如航空公司、酒店行业、预订和预订网站等,每天都面临着不断扩大的旅游客户群的挑战。本文将为大家讲解数据分析在旅游行业中的应用。

By Zhang Bonnie | Blog
DETAIL
Jan
05

数据分析新工具MindsDB–用SQL预测用户流失

市场营销、销售及客户保留部门需要确保客户满意度,鼓励客户消费,减少客户流失。 MindsDB 作为一个新的机器学习工具,可以通过分析大量客户的数据及必要交互,识别并评估客户流失风险,以减少客户流失;帮助市场营销、销售团队确定最佳鼓励措施,及最佳提供报价时机,帮助公司最大限度地减少客户流失率。

By Zhang Bonnie | Blog
DETAIL
Jan
05

如何编写出优秀的 Python Class

Python 是大多数数据科学和机器学习项目的首选语言,它的语言结构以及面向对象的方法能帮助程序员为各种项目编写清晰、合乎逻辑的代码。 本文主要会讨论dunder-、special- 或 magic 方法,帮助你提升 Python 知识水平,编写更多的优秀代码,给你的伙伴或同事留下深刻印象,并从中获得更多乐趣!

By Zhang Bonnie | Blog
DETAIL
Jan
04

如何在分类算法中使用逻辑回归

逻辑回归(Logistic Regression)是一种监督学习算法,尽管它包含“回归”这个词,但主要用于解决二元“分类”任务。“回归”与“分类”相矛盾,但逻辑回归的重点其实是在“逻辑”这个词,它指的是逻辑函数,在算法中实际上用于完成分类任务。本文将带你了解逻辑回归和相关的概率知识。

By Zhang Bonnie | Blog
DETAIL
Jan
04

ETL管道——管理数据科学工作流程的好方法

数据科学家(Data Scientists)通过日志、测试编写良好的模块化代码,确保代码按正常运行。但不幸的是,无论在设计上花费多少心思,都不可能得到完美的数据提取(Extraction)、转换(Transformation)和加载( Loading)管道。本文将介绍Prefect工具, 可帮助你熟练地且透明化地处理工作流管理,以及构建简单 ETL 管道的一些基本概念。

By Zhang Bonnie | Blog
DETAIL
Jan
03

5种机器学习的分类器算法

分类是一项依赖于机器学习算法(Machine Learning Algorithm)的自然语言处理任务。分类是识别、理解,并将想法、对象分到预设类别或“子群”的过程。机器学习程序使用预先分类的训练数据集,通过各种算法对未来的数据集进行分类。使用分类算法,文本分析软件可以执行情绪分析的任务,根据主题和意见的极性对非结构化文本进行分类。

By Zhang Bonnie | Blog
DETAIL
Dec
23

Streamlit 数据科学必备工具

Streamlit 是一个基于 Python 的 Web 应用程序框架,致力于以更高效、更灵活的方式可视化数据,并分析结果。 Streamlit是一个开源库,可以帮助数据科学家和学者在短时间内开发机器学习 (ML) 可视化仪表板。只需几行代码,我们就可以构建并部署强大的数据应用程序。本文将带你了解Streamlit这个工具以及初始操作步骤。

By Zhang Bonnie | Blog
DETAIL