数据

Jan
14

数据科学行业的工资变化与未来

本文是为那些对2024年美国数据科学领域薪资细分感兴趣的人准备的。如果你已经关注我几年了,这篇文章可能会让你感到熟悉。这次的分析对比了2022年和2024年的平均水平,揭示了一些有趣的变化趋势。无论是帮助你评估当前职位,还是为新工作的面试做准备,这些信息都可能非常有用。

By Zhang Bonnie | Blog
DETAIL
Dec
24

2025年十大数据和人工智能趋势

以下是未来学家和投资者 Tomasz Tunguz 对2024年底数据与人工智能现状的总结,同时加入了我自己对2025年的一些预测。

By Zhang Bonnie | Blog
DETAIL
Jul
15

数据解读终极指南

我将介绍以下内容:追踪哪些指标:如何为你的业务建立收入方程和驱动树;如何追踪:如何设置监控并避免常见陷阱。我们将讨论如何选择合适的时间范围,处理季节性变化,掌握分组数据等;提取见解:如何以结构化和可重复的方式识别问题和机会。我们将介绍你可能遇到的最常见的趋势类型,以及如何解读它们。听起来很简单,但细节决定成

By Zhang Bonnie | Blog
DETAIL
Dec
13

为什么数据管道无法实现100%自动化?

无论您的数据管道在技术上多么完美、多么富有弹性,即使是最优秀的数据团队也无法预测或超越摄取的某些方面。我遇到过的两个最重要的“无法控制”的挑战是:(1)与供应商相关的故障或“上游”故障,我们所能做的就是提交工单并等待回复。(2)无法预测的加载时间。我确实想讨论一下无法预测的加载时间,重点是以不可预测的时间间隔或通过非常规渠道接收数据源。

By Zhang Bonnie | Blog
DETAIL
Dec
13

pandas中的4种if-else技术,你应该使用哪一种?

在这篇博客中,我们探索了不同的方法来有效地将if-elif-else逻辑应用于Pandas数据帧。尽管选择的方法可能取决于具体的用例,但性能分析显示df.loc[]或pd.cut()对于较大的数据集通常是最高效的。然而,其他方法更灵活,可能在需要更复杂的条件逻辑或自定义分箱的情况下更受欢迎。

By Zhang Bonnie | Blog
DETAIL
Dec
11

Meta的数据工程:内部技术栈的高级概述

本文概述了我们作为Meta数据工程师日常使用的内部技术栈。我们的想法是阐明我们所做的工作,以及工具和框架如何使我们的日常数据工程工作更高效,并分享我们在此过程中做出的一些设计决策和技术权衡。

By Zhang Bonnie | Blog
DETAIL
Nov
30

大数据源终极指南

作为一名有抱负的数据分析师或数据科学家,你可能会很快意识到,拥有大型数据集来训练和测试您的解决方案是多么重要。以下是我的一些尝试,希望能为寻找用于ML、统计分析和测试的结构化数据的朋友们提供方便,这些数据集是由慷慨向公众提供这些数据集的个人和公司汇编而成的。

By Zhang Bonnie | Blog
DETAIL
Oct
19

Netflix系统设计:构建高可用、可扩展的流媒体平台

Netflix是一种让用户订阅的流媒体服务,允许会员在互联网设备上观看电视节目和电影。它可在Web、iOS、Android、电视等平台上使用。让我们设计一个类似Netflix的视频流媒体服务,类似于亚马逊Prime Video、Disney Plus、Hulu、YouTube、Vimeo等服务。

By Zhang Bonnie | Blog
DETAIL