数据科学

Jul
18

适合初级数据科学家的十大机器学习算法

经过十年的不断探索和应用,机器学习已经成为数据科学家工具包中的一个重要工具,并且已经广为人知。为了有效地利用机器学习的力量,理解其基本概念及其实际应用至关重要。在本文中,我们将探讨最适合数据科学入门者的十大机器学习算法,以及如何应用它们。让我们开始吧!

By Zhang Bonnie | Blog
DETAIL
Jul
15

数据解读终极指南

我将介绍以下内容:追踪哪些指标:如何为你的业务建立收入方程和驱动树;如何追踪:如何设置监控并避免常见陷阱。我们将讨论如何选择合适的时间范围,处理季节性变化,掌握分组数据等;提取见解:如何以结构化和可重复的方式识别问题和机会。我们将介绍你可能遇到的最常见的趋势类型,以及如何解读它们。听起来很简单,但细节决定成

By Zhang Bonnie | Blog
DETAIL
Jul
15

MMM:用于营销组合建模和广告支出回报率的贝叶斯框架

在本文中,我们的重点有两个方面。首先,我们开发了一个贝叶斯模型,以提高每个媒体渠道表现的透明度。其次,我们优化预算分配,以最大化我们的关注变量,这里是收入。除了详细介绍贝叶斯方法在MMM中的应用外,我们还提供了使用公共数据集的实现和应用演练。我们测试了模型的准确性,并计算了每个渠道的广告支出回报率(ROAS)。最后,我们优化了一个假设的预算在三个渠道之间的分配,以最大化收入。

By Zhang Bonnie | Blog
DETAIL
May
09

面向数据团队的ML和Gen AI

在这篇文章中,我们将探讨如下问题:数据团队中的AI现状——数据从业者如何使用和期望使用ML和AI;AI和ML用例——数据团队应用不同类型模型的最流行方式;AI和ML系统中的数据质量——常见的数据质量问题以及如何发现它们;获得可靠数据的五个步骤——如何构建适合关键业务用例的AI和ML系统。

By Zhang Bonnie | Blog
DETAIL
Apr
17

谁将赢得生成式人工智能竞赛?

Bing的用户流量只有Google的十分之一,Bing永远只能限制在一个较小的洞察窗口中,留给其微调搜索算法的信息也少得多。因此,这是关于生成式人工智能竞争未来的最佳猜测。获得最多数据并将其纳入持续改进循环中的人将是赢家。

By Zhang Bonnie | Blog
DETAIL
Apr
10

Power BI现已与Jupyter Notebooks集成

今天,我想和你分享一些令人兴奋的消息:Power BI现在与Jupyter Notebooks集成了! 作为一个喜欢与数据打交道的人,这种集成将改变游戏规则。在本文中,我将为你提供如何使用此集成的分步指南,并分享一些示例用例来帮助你入门。

By Zhang Bonnie | Blog
DETAIL
Apr
03

如何学习数据科学所需的数学知识?

要成为一名高水平的数据科学家,你必须对基础数学有高标准的了解。这就是残酷的事实。然而,所需的数学知识并不是博士学位甚至硕士学位的水平。其中大部分内容在高中后几年和许多本科课程的前几年就已涉及。因此,在本文中,我想详细介绍数据科学真正需要的数学知识,以及你应该学习的内容和有用的资源。

By Zhang Bonnie | Blog
DETAIL
Mar
21

使用Makefile为你的数据科学项目提供代码开发的最佳实践

当一个数据科学家团队参与一个项目时,每个人都有自己的代码编写风格。此外,不同开发人员对脚本不同部分的实验可能会在合并时引入未分组或重复的软件包导入。在这种情况下,制定一个每个人都必须遵守的规定无疑是保持代码一致性的好方法。在这篇文章中,你将学习如何使用市场上热门的工具来样式化和格式化你的代码。

By Zhang Bonnie | Blog
DETAIL