数据

Oct
19

Netflix系统设计:构建高可用、可扩展的流媒体平台

Netflix是一种让用户订阅的流媒体服务,允许会员在互联网设备上观看电视节目和电影。它可在Web、iOS、Android、电视等平台上使用。让我们设计一个类似Netflix的视频流媒体服务,类似于亚马逊Prime Video、Disney Plus、Hulu、YouTube、Vimeo等服务。

By Zhang Bonnie | Blog
DETAIL
Oct
07

解读10个常见的管理术语

嘿,各位技术爱好者和数据向导!我是Gabe,一个数据迷,擅长处理数据并将其转化为有意义的见解。但今天,我要帮助你们解读经理们的神秘语言。你知道,他们在会议上抛出的术语常常让我们摸不着头脑,想知道,“他们到底在说什么?”所以,当我们深入研究10个最常见的管理术语并揭示它们背后的真相时,请做好准备。

By Zhang Bonnie | Blog
DETAIL
Sep
13

关系数据库系统正在成为一个问题——如何解决它?

如果你不喜欢SQL,你就不会喜欢RDBMS,因为SQL本身就是一个奇幻的世界。并不是所有的SQL都是相同的,你了解MySQL和它自己的术语,你了解微软的T-SQL和世界著名的Oracle PL/SQL,也许不必在意它们彼此都不兼容。这些我都见过——金融、交通、酒店、社交媒体、视频流服务等等。无论你去哪里,都可能找到关系数据库,这个世界似乎完全是在关系数据库上运行的。

By Zhang Bonnie | Blog
DETAIL
May
17

2023年你需要知道的13个数据行业流行语

2022年,数据处于所有技术进步的前沿。这一年都是关于小数据、日常工作的自动化、对云的更强依赖、对业务的强大预测模型,以及高管们只希望看到仪表板。我们在2022年听到了对新数据术语的介绍,它们在2023年成为我们词汇的一部分,这篇博客是关于那些肯定会在我们生活中出现的数据和技术专业人士的热门词汇。

By Zhang Bonnie | Blog
DETAIL
Apr
26

实战项目必备的5个高级SQL技巧!

在这篇文章中,我想分享我在日常工作中最常用的五种高级SQL技术。通过掌握这些技术,你将能够完成近80%的生产级SQL查询,使你成为任何数据驱动项目的宝贵资产。我有意不包括一些其他常用的技术,例如事务。如果你担任的是分析角色而不是软件工程师角色,此方法列表将非常有用。在整篇文章中,我假设我们在Postgres数据库中。但是现在每个主要的关系数据库都提供类似的功能。

By Zhang Bonnie | Blog
DETAIL
Nov
22

Google BigLake是Snowflake、Redshift & Co.的杀手吗?

由于大多数企业数据源存储在不同的数据孤岛中,如不同的云存储,数据平台等,利用这些数据的首要需求是数据湖(data lake)或数据湖仓(data lakehouse)。通过 BigLake,谷歌引入了一个引擎,其中可以将所有企业数据以及耦合数据源聚集在一起。这包括 Snowflake 等数据仓库技术,Tableau 等商业智能工具,以及 AWS 和 Azure 等公共云存储中最重要的内容。

By Zhang Bonnie | Blog
DETAIL
Sep
11

SQL数据清理及准备 – 看这一篇就够了

为清理和准备数据进行分析所采取的步骤:检查重复数据并将其删除、删除多余的空格、在需要时分离或组合单元格中的值、检查某些列中的值是否在适当的范围内、检查异常值、纠正拼写或输入错误的数据、向数据中添加新的相关行、如果缺少初始条件,则检查空值并根据其他条件检索记录,检查值是否遵循准确的模式。

By Zhang Bonnie | Blog
DETAIL
Aug
05

谷歌正在打击微软 Azure 及其数据服务

凭借其谷歌云,谷歌可能落后于AWS和Azure,但在数据分析方面它与领导者并驾齐驱。因此,谷歌现在希望通过其旗舰BigQuery提供独立于云和平台的数据分析,这是合乎逻辑的,因为你使用哪种云存储并不重要。

By Zhang Bonnie | Blog
DETAIL