数据科学家

Mar
20

如果你的数据科学生涯只能用3个libraries,学这三个

数据科学库(Data Science Library)无处不在。从数据清理到可视化、机器学习模型的创建到超参数的调优,数据科学库都在发挥着重要作用。每个库的目标都是简化并加快任务,它们涵盖大量常见和基本任务,提供易于使用且直观的语法。本文将带你了解最值得学习的三个数据科学库,满足你在数据操作和分析、数据可视化和机器学习方面的大部分需求。

By Zhang Bonnie | Blog
DETAIL
Mar
18

一篇清单,带你了解决策树Decision Tree术语

如果你刚刚接触学习机器学习领域,你可能会感到非常困惑,尤其是袋装法(Bagging)、提升法(Boosting)、集成方法(ensemble methods)和随机森林(Random forest)这些决策树相关的术语和概念,也难免会抗拒学习这些深奥的知识。 本文创建了一个备忘单(Cheat-Sheet),可以作为快速参考,围绕了决策树学习方法主题做了总体概述。

By Zhang Bonnie | Blog
DETAIL
Mar
18

微软数据科学家面试,都问什么SQL问题?

数据库管理系统 (RDBMS) 是企业们最常用的数据库形式,这也使 SQL 成为必备技能。Microsoft 的数据分析师职位主要设计并构建数据模型,为公司团队提供有意义的数据和模型。本文将展示Microsoft 的面试中可能遇到的真实场景。我们将向你展示如何分解遇到的问题,逐步了解解决问题的逻辑,并讨论如何优化解决方案,提高性能。

By Zhang Bonnie | Blog
DETAIL
Mar
17

一小时学会SVM 支持向量机

在机器学习中,支持向量机(SVM,Support-Vector Machines)是具有学习算法的监督学习模型,用于分析数据以进行分类和回归分析。将数据进行分类是机器学习中的一项常见任务。支持向量机在高维或无限维空间中构造超平面或超平面集合,可以用于分类、回归或其他任务。本文将带大家全面了解关于SVM的机器学习算法。

By Zhang Bonnie | Blog
DETAIL
Mar
08

使用 SafeGraph ,获取智能位置解析

SafeGraph 是一个新兴数据分析工具,可帮助你查看位置或社区的客流量趋势。 它成功聚合了交易数据和丰富 POI 数据,让你能够了解人们在特定地点的消费方式和时间。在SafeGraph 官网上有 1100 万多条兴趣点 (POI) 记录,包括位置、品牌、模式等数据。本文将通过一个实际案例,带你了解SafeGraph 的数据用例。

By Zhang Bonnie | Blog
DETAIL
Mar
05

能帮助数据科学家的软件工程概念

一个了解自己的代码质量的数据科学家是一个更能感同身受的专业人士——这类数据科学家关心的是那些之后要调试、部署或改进其模型的人,这样做也可以帮助他们避免大量的技术债(Technical Debt)。这篇文章将分享一些非常炫酷的概念,这些概念可以帮助提高编程技能,帮助你成为一名更加全能的数据科学家。

By Zhang Bonnie | Blog
DETAIL
Mar
01

元宇宙(Metaverse)揭秘——数据科学将如何应用在元宇宙?

近来,元宇宙成为了大家讨论的一个热词。根据维基百科的定义,元宇宙是一个虚拟的世界,主要发展社交网络。元宇宙的技术和应用并不是现在才出现,它有长久的发展过程。那什么是元宇宙,元宇宙这个领域对我们的生活以及周围的商业机会会产生哪些影响?今天,我们就一起从几个角度来聊聊元宇宙。

By Zhang Bonnie | Blog
DETAIL
Feb
23

如何在2022年成为全栈数据科学家?

在 2021 年前,数据科学职位快速增长,特别是在新冠疫情高峰期间,许多行业都在利用数据科学的力量为其产品带来最大价值。在人工智能的帮助下,数据科学正在不断创新,如自动驾驶汽车、强大的产品推荐系统、虚拟现实和远程任务等,该行业需要更多的人才处理大量数据。数据科学会在 2022 年和未来几年还会一直如此受欢迎吗?

By Zhang Bonnie | Blog
DETAIL