Blog

Jan
05

如何编写出优秀的 Python Class

Python 是大多数数据科学和机器学习项目的首选语言,它的语言结构以及面向对象的方法能帮助程序员为各种项目编写清晰、合乎逻辑的代码。 本文主要会讨论dunder-、special- 或 magic 方法,帮助你提升 Python 知识水平,编写更多的优秀代码,给你的伙伴或同事留下深刻印象,并从中获得更多乐趣!

By Zhang Bonnie | Blog
DETAIL
Jan
04

如何在分类算法中使用逻辑回归

逻辑回归(Logistic Regression)是一种监督学习算法,尽管它包含“回归”这个词,但主要用于解决二元“分类”任务。“回归”与“分类”相矛盾,但逻辑回归的重点其实是在“逻辑”这个词,它指的是逻辑函数,在算法中实际上用于完成分类任务。本文将带你了解逻辑回归和相关的概率知识。

By Zhang Bonnie | Blog
DETAIL
Jan
04

ETL管道——管理数据科学工作流程的好方法

数据科学家(Data Scientists)通过日志、测试编写良好的模块化代码,确保代码按正常运行。但不幸的是,无论在设计上花费多少心思,都不可能得到完美的数据提取(Extraction)、转换(Transformation)和加载( Loading)管道。本文将介绍Prefect工具, 可帮助你熟练地且透明化地处理工作流管理,以及构建简单 ETL 管道的一些基本概念。

By Zhang Bonnie | Blog
DETAIL
Jan
03

5种机器学习的分类器算法

分类是一项依赖于机器学习算法(Machine Learning Algorithm)的自然语言处理任务。分类是识别、理解,并将想法、对象分到预设类别或“子群”的过程。机器学习程序使用预先分类的训练数据集,通过各种算法对未来的数据集进行分类。使用分类算法,文本分析软件可以执行情绪分析的任务,根据主题和意见的极性对非结构化文本进行分类。

By Zhang Bonnie | Blog
DETAIL
Dec
23

Streamlit 数据科学必备工具

Streamlit 是一个基于 Python 的 Web 应用程序框架,致力于以更高效、更灵活的方式可视化数据,并分析结果。 Streamlit是一个开源库,可以帮助数据科学家和学者在短时间内开发机器学习 (ML) 可视化仪表板。只需几行代码,我们就可以构建并部署强大的数据应用程序。本文将带你了解Streamlit这个工具以及初始操作步骤。

By Zhang Bonnie | Blog
DETAIL
Dec
21

用数据科学技术,分析用户产品倾向

在所有商业营销策略中,公司的首要任务始终是为产品吸引正确的受众群体,从而提高销售额、降低营销费用。建模可以让数据科学家利用购买交易、调查和产品评论的大量消费者数据来找出描述、规定和预测消费者选择行为的模型,从而使企业能够制定更好的策略。本文将介绍如何运用数据科学方法,分析用户的产品选择倾向。

By Zhang Bonnie | Blog
DETAIL
Dec
21

假期将至!旅游业常见的7个数据科学应用

数据科学为许多行业带来了新的机遇—— 旅游业也是其中之一。作为一个不断发展的行业,持续增加的消费者需要大量的数据处理。 这也是数据科学算法在旅游业如此重要的原因。 旅游相关的行业,如航空公司、酒店行业、预订和预订网站等,每天都面临着不断扩大的旅游客户群的挑战。本文将带大家了解为大家讲解数据分析在旅游行业中的应用。

By Zhang Bonnie | Blog
DETAIL
Dec
19

DS数据科学家和DA数据分析师:要学习什么不同内容?

数据科学家(Data Scientist)和数据分析师(Data Analyst)的工作职责存在许多共同之处,但在日常工作中也存在很大的区别。岗位对教育程度和工作经验的要求一直在改变,对这两个岗位也是如此。本文中,我们将用一些例子说明数据科学家或数据分析师的学习区别,以及他们的共通点和区别所在。

By Zhang Bonnie | Blog
DETAIL