数据仓库是什么、有哪些相关知识及常见认识误区?

爱数据精选
爱数据精选
爱数据精选
464
文章
0
评论
2021-07-0216:44:21 评论 25 1152字
摘要

数据分析师必备的数据仓库相关知识及常见认识误区。

数据仓库是什么、有哪些相关知识及常见认识误区?

一、数据仓库是什么?

数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

二、数据仓库有哪些特点?

1、效率高

数据仓库的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析

2、扩展性

之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,未来不用太快花钱去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。

3、面向主题

操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。主题是与传统数据库的面向应用相对应的,是一个抽象概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。每一个主题对应一个宏观的分析领域。数据仓库排除对于决策无用的数据,提供特定主题的简明视图。

4、集成性

面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

5、反映变化

操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

三、数据仓库的一些常见认识误区

1、数据仓库的建设是一次性工程。数据仓库实际上需要每年、每月、每周甚至每日都要进行更新,不是说一次性录入了历史的数据就可以完成的工作。

2、数据仓库是一个很大的仓库。其实衡量一个数据仓库的质量如何,并不是用数据量来衡量的,有一些优质的数据仓库项目,数据量并不是很大。

3、只要数据仓库建立和使用了,问题就解决了。

4、聚焦于内部的档案型数据,而忽视了外部数据以及图象、音频和视频文件的潜在价值。

5、数据仓库是将所有的业务数据存在一起的。数据仓库的一个目标是将分散的业务整合在一起的,但它往往是有目的地按分析需去实施的,并不是将全部的业务数据统统都集成在一起。

End.

本文转自: Smartbi

转载如果涉及作品问题请联们第一时间删除(微信lovedata0520

更多文章前往首页浏览http://www.itongji.cn/

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: