问答详情

数据分析师要学什么内容?

2722次观看
标签: 数据分析师 数据分析师学习内容
老师回答

数据分析师需要学习统计学、编程能力、数据库、数据分析方法、数据分析工具等内容,还要熟练使用 Excel,至少熟悉并精通一种数据挖掘工具和语言,具备撰写报告的能力,还要具备扎实的 SQL 基础。

统计学

对于互联网的数据分析来说,并不需要掌握太复杂的统计理论。所以只要按照本科教材,学一下统计学就够了。

编程能力

学会一门编程语言,会让你处理数据的效率大大提升。如果你只会在 Excel 上复制粘贴,动手能力是不可能快的。我比较推荐 Python,上手比较快,写起来比较优雅。

数据库

数据分析师经常和数据库打交道,不掌握数据库的使用可不行。学会如何建表和使用 SQL 语言进行数据处理,可以说是必不可少的技能。

数据仓库

许多人分不清楚数据库和数据仓库的差异,简单来说,数据仓库记录了所有历史数据,专门设计为方便数据分析人员高效使用的。

数据分析方法

对于互联网数据分析人员来说,可以看一下《精益创业》和《精益数据分析》,掌握常用的数据分析方法,然后再根据自己公司的产品调整,灵活组合。

数据分析工具

SAS、Matlab、SPSS 这些工具经常有人推荐,我要说的是在互联网公司一般都用不上。做可视化的 Tableau,统计分析的友盟、百度统计,还有像我们神策分析等。

免费直播

    相关推荐
    数据分析方法论有哪些?
    刘老师 数据分析师

    1、PEST分析法

    PEST,也就是政治(Politics)、经济(Economy)、社会(Society)、技术(Technology),能从各个方面把握宏观环境的现状及变化趋势,主要用户行业分析。

    宏观环境又称一般环境,是指影响一切行业和企业的各种宏观力量。

    对宏观环境因素作分析时,由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治、经济、技术、社会,这四大类影响企业的主要外部环境因素进行分析。

    政治环境:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策等。

    社会环境:人口规模、性别比例、年龄结构、生活力式、购买习惯、城市特点等。

    技术环境:折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度等。

    经济环境:GDP 及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。

    2、5W2H分析法

    5W2H,即为什么(Why)、什么事(What)、谁(Who)、什么时候(When)、什么地方(Where)、如何做(How)、什么价格(How much),主要用于用户行为分析、业务问题专题分析、营销活动等。

    该分析方法又称为七何分析法,是一个非常简单、方便又实用的工具,以用户购买行为为例:

    Why:用户为什么要买?产品的吸引点在哪里?

    What:产品提供的功能是什么?

    Who:用户群体是什么?这个群体的特点是什么?

    When:购买频次是多少?

    Where:产品在哪里最受欢迎?在哪里卖出去?

    How:用户怎么购买?购买方式什么?

    How much:用户购买的成本是多少?时间成本是多少?

    3、SWOT分析法

    SWOT分析法也叫态势分析法,S (strengths)是优势、W (weaknesses)是劣势,O (opportunities)是机会、T (threats)是威胁或风险。

    SWOT分析法是用来确定企业自身的内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析。

    运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而将公司的战略与公司内部资源、外部环境有机地结合起来。

    4、4P营销理论

    4P即产品(Product)、价格(Price)、渠道(Place)、推广(Promotion),在营销领域,这种以市场为导向的营销组合理论,被企业应用最普遍。

    可以说企业的一切营销动作都是在围绕着4P理论进行,也就是将:产品、价格、渠道、推广。通过将四者的结合、协调发展,从而提高企业的市场份额,达到最终获利的目的。

    产品:从市场营销的角度来看,产品是指能够提供给市场,被入们使用和消费并满足人们某种需要的任何东西,包括有形产品、服务、人员、组织、观念或它们的组合。

    价格:是指顾客购买产品时的价格,包括基本价格、折扣价格、支付期限等。影响定价的主要因素有三个:需求、成本与竞争。

    渠道:是指产品从生产企业流转到用户手上全过程中所经历的各个环节。

    促销:是指企业通过销售行为的改变来刺激用户消费,以短期的行为(比如让利、买一送一,营销现场气氛等等)促成消费的增长,吸引其他品牌的用户或导致提前消费来促进销售的增长。广告、宣传推广、人员推销、销售促进是一个机构促销组合的四大要素。

    5、逻辑树法

    逻辑树又称问题树、演绎树或分解树等。它是把一个已知问题当成“主干”,然后开始考虑这个问题和哪些相关问题有关,也就是“分支”。逻辑树能保证解决问题的过程的完整性,它能将工作细分为便于操作的任务,确定各部分的优先顺序,明确地把责任落实到个人。

    逻辑树的使用必须遵循以下三个原则:

    要素化:把相同的问题总结归纳成要素。

    框架化:将各个要素组织成框架。遵守不重不漏的原则。

    关联化:框架内的各要素保持必要的相互关系,简单而不独立。

    6、AARRR模型

    AARRR模型是所有运营人员都要了解的一个数据模型,从整个用户生命周期入手,包括获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和传播(Refer)。

    每个环节分别对应生命周期的5个重要过程,即从获取用户,到提升活跃度,提升留存率,并获取收入,直至最后形成病毒式传播。

    大数据核心算法有哪些?
    刘老师 数据分析师

    1、A* 搜索算法——图形搜索算法,从给定起点到给定终点计算出路径。其中使用了一种启发式的估算,为每个节点估算通过该节点的最佳路径,并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此,A*搜索算法是最佳优先搜索的范例。

    2、集束搜索(又名定向搜索,Beam Search)——最佳优先搜索算法的优化。使用启发式函数评估它检查的每个节点的能力。不过,集束搜索只能在每个深度中发现最前面的m个最符合条件的节点,m是固定数字——集束的宽度。

    3、二分查找(Binary Search)——在线性数组中找特定值的算法,每个步骤去掉一半不符合要求的数据。

    4、分支界定算法(Branch and Bound)——在多种最优化问题中寻找特定最优化解决方案的算法,特别是针对离散、组合的最优化。

    5、Buchberger算法——一种数学算法,可将其视为针对单变量最大公约数求解的欧几里得算法和线性系统中高斯消元法的泛化。

    6、数据压缩——采取特定编码方案,使用更少的字节数(或是其他信息承载单元)对信息编码的过程,又叫来源编码。

    7、Diffie-Hellman密钥交换算法——一种加密协议,允许双方在事先不了解对方的情况下,在不安全的通信信道中,共同建立共享密钥。该密钥以后可与一个对称密码一起,加密后续通讯。

    8、Dijkstra算法——针对没有负值权重边的有向图,计算其中的单一起点最短算法。

    9、离散微分算法(Discrete differentiation)。

    注册电脑版

    版权所有 2003-2020 广州环球青藤科技发展有限公司