大数据分析平台需要具备的6大功能

爱数据精选
爱数据精选
爱数据精选
524
文章
0
评论
2021-07-0216:39:27 评论 126 1320字
摘要

具备这6个关键功能才称得上大数据分析平台!

 

销售报表、市场调研、盈利分析……随着信息量的不断丰富,相信各大企业已经为各种业务需求存储了大量的数据,数据的规模可能达到数GB或者数TB。随着网络科技的不断发展,这些信息量可能还会达到数PB、EB甚至是ZB的数据量……

大数据分析平台需要具备的6大功能

那么大家选择的大数据分析平台能否跟上步伐呢?

在某公司近期的采访调查中,大部分的受访者表示目前的大数据分析平台无法分析大量的数据;部分受访者表示,查询程序运行非常缓慢;少部分受访者表示目前所使用的的系统已经达到了使用极限。但是,从海量的数据中提取深刻见解的需求仍在持续的增长。

所以,在数字化时代,对大数据分析平台的选择必须满足广泛的需求,最好是能够提供以下6个关键功能:

1、必须能够容纳海量数据

如果大数据分析平台无法存储或管理海量数据,那么仅仅靠提高速度所带来的作用相当有限。所以大数据分析平台必须能够容纳海量的数据。

2、运行速度必须非常快

在数字化时代,用户不喜欢长时间的等待运行查询结果,他们比较希望能够即时得到结果,与此同时还不会影响到其他工作负载。想要达到以上效果,那么大数据分析平台必须增强现有应用程序的性能,提高运行速度。

3、必须兼容传统工具

如果您的大数据分析平台依赖于"提取、转换、加载"(ETL)工具或基于SQL的可视化工具,就得确保这些平台已经通过认证,可与所有这些工具而不仅仅是主要供应商的工具搭配使用。

4、应利用Hadoop并增加Hadoop的价值

Hadoop是由Apache Software Foundation管理的开源软件平台,已经成为大数据分析领域中的主要平台。许多数据库专业人员将Hadoop评估为可解决其原数据仓库系统中存在的分析限制的潜在解决方案。遗憾的是,他们通常会发现,相对于基于MPP的列式大数据分析平台,Hadoop在即时查询和SQL分析方面的性能严重不足。所以,需要寻求一种符合以下条件的大数据分析平台:可利用Hadoop作为用于持久性和轻量型数据管理的高效益平台,并且可同时加快传统型数据仓库工作负载和高级分析程序的速度。

5、必须为数据科学家提供支持

数据科学家在企业IT中拥有着更高的影响力和重要性,因此大数据分析平台应在下述两个关键方面支持数据科学家。首先,新一代数据科学家采用Java、Python和R等工具来执行预测式分析。底层分析数据库应支持和加速创新型预测分析的创建过程。其次,此平台应有助于将数据科学家的工作与业务目标联系起来。快速、高效、易于使用和广泛部署的大数据分析平台可以帮助拉近商业人士和技术专家之间的距离。

6、应提供高级分析功能

根据某些特定使用情况,可能有必要深入查看由大数据分析引擎提供的内置SQL分析功能。那么就必须从底层查看,以了解究竟提供了何种SQL分析,而不用对该数据执行分析。例如,如果要对从设备获得的数据执行分析(如在物联网中),则需要诸如"时间序列分析"和"差距分析"等分析功能。如果没有这些功能,就可能需要花费时间整理数据或编写自定义代码。

End.

本文转自:数据小达人 

转载如果涉及作品问题请联们第一时间删除(微信lovedata0520

更多文章前往首页浏览http://www.itongji.cn/

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: