数据科学

Mar
21

使用Makefile为你的数据科学项目提供代码开发的最佳实践

当一个数据科学家团队参与一个项目时,每个人都有自己的代码编写风格。此外,不同开发人员对脚本不同部分的实验可能会在合并时引入未分组或重复的软件包导入。在这种情况下,制定一个每个人都必须遵守的规定无疑是保持代码一致性的好方法。在这篇文章中,你将学习如何使用市场上热门的工具来样式化和格式化你的代码。

By Zhang Bonnie | Blog
DETAIL
Feb
21

2024年最受欢迎的8种技术技能,让你成为炙手可热的宝贵人才!

变化是永恒的,保持领先不仅是一种选择,也是追求充实而充满活力的职业生涯的必要条件。随着我们踏上2024年的征程,对特殊技术技能的需求达到了前所未有的水平。具备这些抢手能力的专业人士不仅吸引了人们的目光,而且还能获得可观的薪酬。本文将深入探讨最热门的8大技术技能的复杂细节。

By Zhang Bonnie | Blog
DETAIL
Jan
25

所有数据科学家都应该知道的三个常见假设检验

假设检验是推论统计学中最基本的元素之一。在像Python和R这样的现代语言中,进行这些检验往往很容易——通常只需要一行代码。但令我困惑的是,很少有人使用它们或理解它们的工作原理。在本文中,我想用一个例子来展示三个常见的假设检验及其工作原理,以及如何在R和Python中运行它们,并理解结果。

By Zhang Bonnie | Blog
DETAIL
Jan
04

如何开始自己的第一个数据科学项目?

完成第一个项目可能是数据科学旅程中最重要的里程碑。然而,要知道这项工作的第一步是什么,往往充满了挑战。我在这里要向你灌输的是,事情并不一定是这样的。在本文中,我将与你分享开始第一个项目所需的确切知识。我的目标是消除你对第一个项目可能存在的任何误解,让你有信心尽快开始。这六条基本见解将消除你对项目的忧虑。最后一条有可能改变你整个职业生涯的轨迹。让我们深入了解一下!

By Zhang Bonnie | Blog
DETAIL
Jan
01

世界上最好的人工智能模型:谷歌DeepMind的Gemini已经超过了GPT-4!

本文选自The Algorithmic Bridge,一个旨在弥合人工智能与人类之间差距的教育项目,今天我们一起学习如何应对已经到来的未来。这篇文章是对我们目前所掌握的信息的一个快速概述(分为易于浏览的部分),以及我对所读内容的第一印象(尚未测试该模型)。在接下来的几天里,我将更深入地了解Gemini可以做什么,它是如何构建的(希望如此),它是如何工作的,以及它对人工智能的未来意味着什么。

By Zhang Bonnie | Blog
DETAIL
Dec
27

神奇的Python装饰器:可将代码减少一半!

今天,我将与你分享一些神奇的Python装饰器,它们可以将你的代码减少一半。Python装饰器是一种强大而优雅的方法,可以在不改变源代码的情况下修改函数或类的行为。它们可以帮助你减少一半的代码,提高代码的可读性,重用代码,分离关注点,并扩展现有代码的功能。

By Zhang Bonnie | Blog
DETAIL
Dec
27

数据清理101:避免在数据中陷入这5个陷阱

据清理并不像创建漂亮的图表或ML模型那样令人兴奋。但是所有的数据科学家都花费大量时间(而且是相当大的一部分,说实话!)来进行数据清理。没有它,数据科学项目的其他每个阶段都不存在。因此,首先要做基础工作,掌握数据清洗。只有在此之后,你才能学习其他更有趣的数据科学任务。

By Zhang Bonnie | Blog
DETAIL
Dec
24

导航数据驱动时代:为什么你需要掌握数据科学基础

在21世纪,数据科学不仅仅是一种工具,这是各行各业领导者的共同语言。加入革命,拥抱数据驱动的思维方式,并将自己定位在创新的最前沿。掌握数据科学的旅程从这里开始!

By Zhang Bonnie | Blog
DETAIL