集群监控与管理
毫无疑问集群是需要能够进行统筹的管理及监控的能力,否则运维团队在做运维时将无从下手。
资源接入
数据是一个企业的核心资源,我们对业务模型的建立,分析,挖掘都需要建立在原始数据之上,而这些数据来源多(日志,关系数据库,爬虫等),类型杂(结构化,半结构化,非结构化数据),体量大,所以大数据平台需要能够对接各种来源及各种类型的海量数据。
数据存储及查询
数据接入之后,就需要根据不同的应用场景进行存储,例如关系型数据模型,非关系型数据模型,文档数据模型,大数据平台需要能够提供不同的存储模型及不同的查询手段。
数据计算
根据不同的应用场景会有不同的计算要求,简单的可以分为离线计算和实时计算,机器学习,多维分析。在数据对时效性要求不高且数据量大的情况下可以选择离线计算。
关于大数据平台需要具备哪些能力,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。