Blog

Jun
14

初学数据科学常犯的三个SQL错误

SQL是是数据库的查询语言,语法结构简单,同时也是数据科学家们的一项基本技能。SQL的入门对比其他的编程语言是相对快速容易的,但是,很多初学的数据科学家往往会在细节上犯错误,而这些则需要长时间的经验累积来完善。本文介绍了三种常见的SQL错误,并通过实例带你了解错误产生的原因和解决办法,让你快速上手数据库!

By Zhang Bonnie | Blog
DETAIL
Jun
14

数据科学面试Case Study问题的回答技巧

数据科学岗位的面试会涉及到方方面面,包括编程, 数据库, 可视化,案例分析(Case Study) 等不同内容。其中,案例分析可能是大多数面试者最头疼的部分,而它又往往在面试中占有很大比重。本文详细介绍了Case Study的准备方法,带你全方位突破难点,轻松应对面试中的案例分析,斩获理想Offer!

By Zhang Bonnie | Blog
DETAIL
Jun
14

数据科学家V.S数据分析师面试全对比

很多人都听说过数据分析师和数据科学家,但它们之间到底有什么区别?简单来讲,数据分析师是从现有数据中获得意义,而数据科学家在此基础上,还能进行机器学习,熟练掌握高级编程,为数据建模创建新的流程等。本文介绍了DS和DA这两个职位面试的相关内容,包括流程,要求技能,以及其他异同点等等。

By Zhang Bonnie | Blog
DETAIL
Jun
10

Machine Learning知识点:机器学习里的聚类分析技巧

聚类分析是将一组对象以某种方式分组,让同组中的对象彼此之间比其他组更相似。 它是探索性数据分析的主要工具,也是统计数据分析的常用技术,应用于许多领域,包括模式识别、图像分析、信息检索、计算机图形学和机器学习等等。本文介绍了不同种类的聚类分析和它们的使用场景,带你迅速了解Clustering Techniques!

By Zhang Bonnie | Blog
DETAIL
Jun
10

Google 数据科学家面试全纪录

你想在Google做数据科学家吗?这是许多人的梦想——它是一个难得的机会,你可以对现实生活产生真正的影响,与一家出色的公司合作,还能获得丰厚的薪水。而谷歌的数据科学家并不是个容易的工作,需要在编程、解决问题、统计、机器学习、建模、实验、ML 设计问题、行为问题等方面得心应手。 本文介绍了谷歌数据科学家的面试流程,为你的面试准备打下基础!

By Zhang Bonnie | Blog
DETAIL
Jun
06

如何在Pandas里写SQL查询语句?

Python和SQL是数据分析的两大重要工具。随着数据科学的发展,更多版本的文件和数据需要我们进行分析,不同工具间的切换也越来越频繁。本文简单介绍了两种工具;为了帮助提高工作效率,也介绍了如何利用Pandas工具包在Python中实现SQL的功能,帮你给工作和学习带来拓展的可能。

By Zhang Bonnie | Blog
DETAIL
Jun
06

推荐系统101:Recommender System 入门

推荐系统(Recommender System)本质上是对用户的不同行为,从海量物料中选取用户可能感兴趣的物料,提供商品信息和建议,通过策略、算法、规则等途径帮助用户决定购买的产品,产生点击或其他交互行为。本文会带大家了解推荐系统的原理和目的,以及个性化和非个性化推荐系统的区别和实用案例。

By Zhang Bonnie | Blog
DETAIL
Jun
05

Sampling 101:详解统计学中的抽样技术

说到统计学,很多人会认为是经济学或者数学的专利。然而,随着科学技术的发展和机器智能的普及,统计学在数据科学中的作用越来越重要,基于统计和数学模型也对机器智能发挥着重大的作用。本文会列举几种统计学中的抽样调查,用浅显易懂的案例让你迅速了解不同抽样的用法和区别。

By Zhang Bonnie | Blog
DETAIL