大数据分析师学习经验分享
一、大数据分析师不是JAVA程序员
Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快带地进入了这个行业,成为了最先的大数据分析师。但IT人士的宿命就在于他们太IT了,他们热衷于计算更快、处理更高效的程序设计,而忽略了大数据分析的本意,为企业带来商业价值,因此他们只能是大数据分析工程师,而正真的大数据分析师应当了解和熟悉Hadoop技术架构和算法设计,但不必成为一个优秀的JAVA程序员,就象我们只需要知道面包的生产过程,了解某些生产的细节,就能成为一名合格的营养师,而更多的细节性的规程则是一名优秀的面包师份内之事。
二、大数据分析师区别于普通的数据分析师
普通的数据分析师具有一定的数理统计基础,熟悉业务逻辑,能熟练地操作传统的数据分析软件,能使数据成为企业的智慧。他们通常遇到的都是一些结构化、体量小的小数据。而大数据分析师更专注数据获取的架构设计、数据分析模型的选择、指标的选取,他们具有数据分析师的理论素养和业务能力,面对大数据,他们有一整套分布式的数据获取、整理、处理和分析的方案,而且这个方案最终的目标是为数据分析服务,他们具有大数据分析的利器,如mahout、Spark等软件,他们做的更多的工作是如何将非结构化和结构化的大数据过滤成结构化的小数据,从而使更多的普通数据分析师有用武之地。