python

Aug
10

自2014年以来数据工程的发展历程

在本文中,我将探讨数据编排和数据建模的演变趋势,重点介绍工具的发展及其对数据工程师的核心优势。

By Zhang Bonnie | Blog
DETAIL
Jun
26

Graph ML:图遍历算法简述

广度优先搜索(BFS)和深度优先搜索(DFS)是许多Graph ML算法(如Node2vec、图神经网络等图嵌入技术)的基础。因此,我在这里提供一个简要但完整的介绍,介绍它们是什么、如何工作以及Python实现。在这篇文章中,我只关注与Graph ML相关的信息,以提供对算法工作原理的良好理解(不涉及所有的算法和数据结构课程细节)。

By Zhang Bonnie | Blog
DETAIL
Apr
10

Power BI现已与Jupyter Notebooks集成

今天,我想和你分享一些令人兴奋的消息:Power BI现在与Jupyter Notebooks集成了! 作为一个喜欢与数据打交道的人,这种集成将改变游戏规则。在本文中,我将为你提供如何使用此集成的分步指南,并分享一些示例用例来帮助你入门。

By Zhang Bonnie | Blog
DETAIL
Mar
04

Pandas2.2中的新功能

pandas2.2于2024年1月22日发布。让我们来看看这个版本带来了哪些变化,以及它将如何帮助我们改善pandas的工作负载。它包含一系列改进,将改善用户体验。

By Zhang Bonnie | Blog
DETAIL
Jan
31

五种你从未听说过的Jupyter黑客技术

Jupyter Notebook是最受追捧的集成开发环境之一。然而,尽管Python被广泛使用,但许多用户并没有充分发挥其潜力。他们倾向于使用Jupyter的默认界面/功能,而在我看来,Jupyter的默认界面/功能可以大大改进,以提供更丰富的体验。因此,在本文中,我将介绍5个很酷的Jupyter hack,你可能从来都不知道它们的存在。

By Zhang Bonnie | Blog
DETAIL
Jan
25

所有数据科学家都应该知道的三个常见假设检验

假设检验是推论统计学中最基本的元素之一。在像Python和R这样的现代语言中,进行这些检验往往很容易——通常只需要一行代码。但令我困惑的是,很少有人使用它们或理解它们的工作原理。在本文中,我想用一个例子来展示三个常见的假设检验及其工作原理,以及如何在R和Python中运行它们,并理解结果。

By Zhang Bonnie | Blog
DETAIL
Dec
27

神奇的Python装饰器:可将代码减少一半!

今天,我将与你分享一些神奇的Python装饰器,它们可以将你的代码减少一半。Python装饰器是一种强大而优雅的方法,可以在不改变源代码的情况下修改函数或类的行为。它们可以帮助你减少一半的代码,提高代码的可读性,重用代码,分离关注点,并扩展现有代码的功能。

By Zhang Bonnie | Blog
DETAIL
Dec
13

pandas中的4种if-else技术,你应该使用哪一种?

在这篇博客中,我们探索了不同的方法来有效地将if-elif-else逻辑应用于Pandas数据帧。尽管选择的方法可能取决于具体的用例,但性能分析显示df.loc[]或pd.cut()对于较大的数据集通常是最高效的。然而,其他方法更灵活,可能在需要更复杂的条件逻辑或自定义分箱的情况下更受欢迎。

By Zhang Bonnie | Blog
DETAIL