SQL面试常考题有哪些?

SQL面试常考题有哪些?

作为互联网的程序员也好,数据科学家也罢,没有听说过SQL,没有写过SELECT.. FROM …WHERE的肯定很罕见。SQL是如此广泛的应用在我们整个软件行业的方方面面,每个人或多或少都打过交道,也是我们面试中躲不过的一关:

What is the difference between view and table?
What is the difference between where and having?
What is the difference between inner join and outer join?
What is the point of using a foreign key constraint?

你经得住上面SQL题目的轰炸么?如果你觉得有些吃力,那就拿出一杯咖啡的时间,乖乖打磨自己SQL的能力吧!

上周六的公开课,我们数据应用学院的老师就为大家介绍了SQL的重要性以及面试的常考题目。

为什么会考核SQL?

其实这很好理解。数据分析都是以数据为基础的,要想进行分析,首先要把数据从数据库中提取出来;而SQL又是最常用的数据库查询语言,所以,不考才怪‍️。

SQL面试考核的内容和范围有哪些?

关于SQL的考核内容,首先当然是一些high-level的概念,比如view和table的区别,inner join和outer join的区别等等。需要注意的是,在最近的面试中,有的公司第一轮的HR面试也开始考察SQL的基础概念了,可能是因为竞争越来越激烈了,公司想在第一轮提高筛选的效率。题一般不会很难,但是建议同学们心中有数,不要遇到这种情况的时候突然懵掉。

考察完概念之后,随之而来的就是coding了,更多以Data Manipulation Language(DML)为主,也就是对数据进行select,aggregation的过程。这一部分内容也是之后在公司里做的主要工作,提取数据,对数据进行计算和聚合,所以要着重准备。由于现在公司数据库中的数据量一般都比较大,在这方面的考察也有了新的趋势,那就是对performance有了更高的要求。在你写出你的答案后,通常会让你在此基础上进行改善,写出效率更高的代码。如果你的竞争对手的代码只需要跑两天,而你的代码要跑两个礼拜,那你的下场就可想而知了‍️。

那么,要提高code的performance,应该如何思考呢?最重要的事情,就是看这一步操作有没有必要。比如有几列数据不需要进行某步计算,或者之后不会用到这些数据,那么在进行calculation或者join之前就应该进行dimension reduction,将这些数据处理掉;再有就是如果一个小表join一个大表,可以将小表放在前面,大表放在后面,这样效率会高一些。总之,要在理解SQL背后操作原理的基础上来思考performance的问题就对啦!

SQL题目长什么样子?

接下来就通过case让大家具体感受一下SQL面试的风格。

首先,比较基础的可能是让你select出所需的column,然后通过BI tool,以图表的形式表现出来;再就是像第二小题这种,需要先对数据进行聚合和计算,然后才能得到想要的结果。

再复杂一点呢,就是针对user-behavior进行分析了,比如对用户进行分组,或者对用户每次下单的时间间隔进行分析。这经常要用到self-join或者SQL windows function来解决,大家要注意重点掌握哦。

类似的题目还有这种,大家可以尝试一下自己能否handle。

其实SQL不难,但你在现场面试的有时候可能会被问懵。这时候不要慌,首先要跟面试官保证足够的沟通,让他知道你的思路,如果具体的语法不记得了,但思路正确,其实也是可以理解的。另外,对于需要先提取一个中间表,再进行计算的题目,可以分步处理,想好每一步需要得到什么数据,就更容易做到心中有数。

如果大家想获得公开课中的case题目,欢迎大家来参加我们数据应用学院提供的Online assessment。只要你完成了测试,我们就会把solution发给你。想快速检验自己SQL实力的同学,欢迎邮件咨询:training@dataapplab.com;或点击阅读原文查看完整视频。

原文作者:Zihuan

美工编辑:过儿