教程-Spark安装与环境配置 其他

教程-Spark安装与环境配置

Spark是一种通用的大数据计算框架,是基于RDD(弹性分布式数据集)的一种计算模型。那到底是什么,可能还不是太理解,通俗讲就是可以分布式处理大量极数据的,将大量集数据先拆分,分别...
阅读全文

Flink 监控

基本的需求:1、监控 job 的内存、网络、CPU 的使用情况;2、监控 job 的状态,running or dead;3、监控 job exception
阅读全文
PowerQuery 进阶之 M 函数学习 其他

PowerQuery 进阶之 M 函数学习

之前我们学习 Power Query 都是用鼠标就完成了很多复杂的操作。虽然 PowerQuery 已经将大部分常用功能内置成到功能区。基本能完成我们大部分的报表自动化功能。但是总...
阅读全文
使用 PowerQuery 的添加列功能丰富数据 其他

使用 PowerQuery 的添加列功能丰富数据

我们前面学的数据清洗都是在原数据上进行整理,将脏的数据处理成为适合我们分析的数据。在数据分析实践中,常常还需要在原数据上进行扩展加工出辅助的列,最常的需求是加入新的列。今天向大家介...
阅读全文