数据科学

Jan
29

每个数据科学家都应该养成的15个好习惯

技术人员和非技术人员都在尝试掌握数据科学技能。因此,数据科学工作的竞争已经增加了很多。如今,要想获得一份数据科学家的工作,你需要的不仅仅是顶级机构的认证。在这篇文章中,我将分享一些每个数据科学家都应该采用的好习惯,这些习惯可以节省大量的时间和处理成本。

By Zhang Bonnie | Blog
DETAIL
Jan
19

Consumer Journeys?你需要的是Persuasion Journey

试着设身处地为受众着想,不偏不倚为受众服务。你可以把自己当作其中一个受众去购物,去自己的商店逛一圈,去买一张你的电影票。在此过程中,别忘了问问自己:我在真正去“做”之前,心里想的是什么?

By Zhang Bonnie | Blog
DETAIL
Jan
15

GPT-4:让智能更智能

应用程序编程接口(API)是计算机之间或计算机程序之间的连接。(ref.) 简单地说,API是一套用于不同程序和计算机之间交互和数据交换的方法和规则。API用于其他程序和信息系统,这些程序和信息系统以严格指定的格式交换信息,这使得具有完全不兼容的配置系统能够进行互动(用不同的编程语言编写,位于本地或远程,等等)。

By Zhang Bonnie | Blog
DETAIL
Jan
12

你的第一份数据科学工作中要避免的错误

开始数据科学的职业生涯可能令人兴奋的,但也可能具有挑战性的。作为一名新的数据科学家,你可能不确定会发生什么或如何驾驭你的第一份工作。在这篇文章中,我将讨论数据科学家在第一份工作中应该避免的七个常见错误。

By Zhang Bonnie | Blog
DETAIL
Jan
10

新的聊天机器人ChatGPT擅长和不擅长的

重要的是不要被这种炒作冲昏了头脑,因为最终这并不是一个新的感知智能——它只是一个经过更好训练的大型语言模型。大型语言模型随着每一个版本的发布而变得更好,而这个版本无疑在真正帮助人们并节省人们时间的方面开辟了新的天地。但在许多情况下,这种新模型的实用性会失效,依赖它将是愚蠢的。让我们来看看一些它擅长和不擅长的领域。

By Zhang Bonnie | Blog
DETAIL
Jan
10

关于时间序列分析(TSA),你需要知道这15个词

一个时间序列,就是在不同时间戳收集的数据点序列,而这些数据点序列则是以相同的时间间隔从相同的数据源收集的连续测量。利用这一技术,我们可以使用这些按时间顺序收集的读数来监测一段时间内的变化趋势。时间序列模型可以是单变量,也可以是多变量——当因变量是单个时间序列时,使用单变量时间序列模型;当有多个因变量时,可以使用多变量时间序列模型。

By Zhang Bonnie | Blog
DETAIL
Jan
04

只会Pandas?来学习这25种Pandas变SQL的方法,让你的数据分析更得心应手!

毫无疑问,SQL和Pandas都是数据科学家处理数据的强大工具。一般来说,SQL是一种用于管理和操作数据库中数据的语言,而Pandas是Python中的数据操作和分析库。此外,SQL通常用于从数据库中提取数据,在Python中进行分析(主要使用Pandas)。它的工具和功能齐全,能很好地处理表格数据,如数据操作、数据分析和可视化等。将SQL和Pandas一起使用,我们就能清理、变换和分析大型数据集,创建复杂的数据管道和模型,这对作为数据科学家大有裨益,也因此,我们必须精通它们。在本文中,我将带你一步一步走,一起将最常见的Pandas操作变为SQL查询。

By Zhang Bonnie | Blog
DETAIL
Jan
01

带你读懂Go语言

Go是Google于2009年创建的一种编程语言。作为一种静态语言,它的语法类似于C,专为高性能和并发程序而设计。Go通常用于构建Web应用、分布式系统等其他类型的软件。优点如下:易于学习和使用(Go的语法简单干净,很容易上手)、高性能(Go是一种编译语言,可以生成快速高效的代码)、伸缩性和并发性强(Go内置了相关系统,帮助处理大型工作负载和工作扩展)、标准库性能全(Go拥有一个性能全面的标准库,能为开发应用提供特性和功能便利)、“后劲足”(Go的开发群体庞大又活跃,他们在不断推进语言的发展进步,为用户提供各种帮助)

By Zhang Bonnie | Blog
DETAIL