本篇节选自书籍《对比Excel,轻松学习SQL数据分析》一书,主要讲解数据分析面试中常见的30道SQL面试题。
1 查询每个班学生数
现在有一张全校学生信息表stu_table,这张表存储了每位学生的id、name(姓名)、class(班级)、sex(性别)以及一些其他信息,现在我们想知道每个班有多少学生,该怎么实现呢?
stu_table表如下所示:
自己先想一下代码怎么写,然后再参考我的代码。
select class ,count(id) as stu_numfrom demo.stu_tablegroup by class
解题思路:
我们是要获取每个班的学生数,首先需要对班级进行分组,使用的是group by;然后再对每个组内的学生进行计数聚合运算,使用的count。最后运行结果如下:
2 查询每个班男女学生数
还是前面的全校学生信息表stu_table,现在我们想知道每个班男生女生分别有多少个?
自己先想一下代码怎么写,然后再参考我的代码。
select class ,sex ,count(id) as stu_numfrom demo.stu_tablegroup by class ,sex
解题思路:
与第一题不同的是,不仅需要每个班级的信息,还需要每个班级里面男女生分别的信息,主要考察的就是按照多列分组聚合的知识,直接在group by后面指明要分组的多列即可,且列与列之间用逗号分隔开。最后运行结果如下:
3 姓张的同学有多少个
还是前面的全校学生信息表stu_table,现在我们想知道这张表中姓张的同学有多少个?
自己先想一下代码怎么写,然后再参考我的代码。
select count(id) as stu_numfrom demo.stu_tablewhere name like "张%"
解题思路:
我们是要获取姓张的同学有多少个,首先需要思考的是怎么去判断同学是否姓张,假设我们表里面存储的姓名都是先姓后名的形式,那就可以用到字符串匹配函数like;知道怎么判断同学是否姓张,接下来就是把这些同学筛选出来,使用的是where条件;最后针对筛选出来的同学进行计数,使用的是count。最后运行结果如下:
4 筛选出id第3-5的同学
还是前面的全校学生信息表stu_table,现在我们要获取id从小到大排序以后第3-5位的同学的信息。
自己先想一下代码怎么写,然后再参考我的代码。
select *from demo.stu_tableorder by id asclimit 2,3
解题思路:
我们要获取id从小到大排序以后第3-5位的同学,因为不确定id是否连续,所以我们没法直接用where条件来筛选id。我们先对id进行升序排列,然后再利用limit进行筛选。最后运行结果如下:
5 筛选出挂科的同学
现在有一张学生成绩表score_table,这张表存储了每位学生的id、name(姓名)、class(班级)、score(成绩),现在我们想要把挂科(成绩小于60)的同学信息筛选出来。
score_table表如下所示:
自己先想一下代码怎么写,然后再参考我的代码。
select *from demo.score_tablewhere score < 60
解题思路:
我们要获取挂科同学的信息,只需要加一个where条件用来限定挂科这个条件即可。最后运行结果如下:
6 筛选姓张的且挂科的同学
我们现在需要根据学生成绩表score_table查找出姓张的且挂科的同学的信息。
自己先想一下代码怎么写,然后再参考我的代码。
select *from demo.score_tablewhere score < 60 and name like "张%"
解题思路:
这里面主要是用到了多条件筛选,多个条件之间用and进行关联即可。最后运行结果如下:
7 查询销冠获得次数
我们有一张表month_table记录了每月的销售冠军信息,这张表存储了每月销冠的id、name(姓名)、month_num(月份),现在需要获取销冠次数超过2次的人以及其对应的做销冠次数。
month_table表如下所示:
自己先想一下代码怎么写,然后再参考我的代码。
select id ,name ,count(month_num) numfrom demo.month_tablegroup by id ,namehaving count(month_num) > 2
解题思路:
我们要获取销冠次数超过2次的人以及其对应的做销冠次数,首先需要获取每个人做销冠的次数,对id进行group by,然后在组内对month_num进行计数即可;然后再对分组聚合后的结果利用having进行条件筛选。最后结果如下:
8 获取每个部门一整年业绩提升幅度
现在有一个月份销售额记录表sale_table,这个表记录了每年每月的销售额,现在我们想看下今年(2019年),月销售额最高涨幅是多少?
sale_table表如下所示:
自己先想一下代码怎么写,然后再参考我的代码。
select max(sales) as max_sales ,min(sales) as min_sales ,max(sales)-min(sales) as cha ,(max(sales)-min(sales))/min(sales) as growthfrom demo.sale_tablewhere year_num = 2019
解题思路:
我们要获取今年的最大月涨幅,首先需要通过where条件把今年的每月数据销售额筛选出来;然后再在今年的月销售额里面寻找最大和最小的销售额,对两者进行做差,就是我们想要的结果。最后运行结果如下:
9 查找每科成绩大于70的学生
我们有一张学生科目成绩表score_info_table,这张表记录了每一位同学每一科目的成绩,每一位同学的每科成绩是一行,现在我们想要通过这张表获取到每科成绩都大于70分的学生。
score_info_table表如下所示:
自己先想一下代码怎么写,然后再参考我的代码。
select id ,name from demo.score_info_table group by id ,name having min(score) > 70
解题思路:
我们是要获取每科成绩大于70的学生,只要能够保证最小成绩是大于70分的,就说明这位同学每科成绩都大于70分.所以第一步就是先获取每位同学的最小成绩,先对name进行group by分组,再在组内求最小值,然后将最小成绩大于70分的同学通过having筛选出来即可。最后运行结果如下:
10 删除重复值
现在有一个学生信息表stu_info_table,这张表存储了每位学生id、name(姓名)、class(班级)、grade(年级),现在我们想获取这个学校所有年级以及所有班级的信息,即哪些年级有哪些班级,该怎么获取?
stu_info_table表如下所示:
自己先想一下代码怎么写,然后再参考我的代码。
select grade ,classfrom demo.stu_info_tablegroup by grade ,classorder by grade
解题思路:
stu_table表中id列是主键,即不重复的,但是class和grade是重复的,多个id会属于同一个class和grade。我们只要class和grade信息,所以是需要对这两列进行去重,去重我们除了用distinct以外,还可以用group by。最后运行结果如下:
End.爱数据网专栏作者:张俊红作者介绍:一个数据科学路上的学习者、实践者、传播者个人公众号:俊红的数据分析之路
- 我的微信公众号
- 微信扫一扫
-
- 我的微信公众号
- 微信扫一扫
-
评论