文本描述
上海银行项目的甲方面试问题
初中级
SQL相关问题:
1.ETL层级划分;
2.有无数据表设计/模型设计相关经验(星型模型和雪花模型的区别);
3.delete等几种删除方式的差异;refresh table;
4.数据库,数据仓库有什么区别?数据仓库的底层/分层架构?数仓主题分层?
5.有无做过业务需求分析;
6.到岗时间:
7.对其主要项目进行详细解释;
8.现在工作数仓建模相关流程;
9.hive内部表及外部表的区别;
10..常用函数、自定义函数、开窗函数;
row_num() over、rank() over、dense_rank() over;
count(1)、count(*)区别;union、union all的区别;
sort by、order by的区别
11.行转列,列转行函数使用;
12.hive内部表及外部表的区别;
13.各种排序性能消耗;
14.hdoop了解;
15.星型模型和雪花模型的区别,建模方面;
16.有无遇到数据倾斜的问题,解决方案;
17.SQL调优,SQL开发时性能方面的考量;?
18. ETL加载策略F1-F5;
19.拉链表,使用场景;
20.跑批调度任务,调度控制,调度原理,调度依赖关系;
21.数据问题排查方法
22.任务上线流程
23. ER图介绍
24. BI报表指标加工方式举例