1. R
该工具是用于统计和数据建模的领先分析工具。R可以在UNIX、Windows和Mac OS等各种平台上编译和运行,它还提供了根据用户要求自动安装所有软件包的工具。
2. Python
Python是一种开源的,面向对象的编程语言,易于阅读,编写和维护。它提供了各种机器学习和可视化库,例如 Scikit-learn、TensorFlow、Matplotlib、Pandas、Keras等。
它还可以在任何平台上进行组装,例如SQL Server、MongoDB数据库或JSON。
3. Tableau
这是一个免费软件,可连接到任何数据源,例如Excel、公司数据仓库等。然后通过网络实时更新创建可视化效果、地图、仪表板等。
4. QlikView
该工具提供内存中数据处理,并将结果快速传递给最终用户。它还提供数据关联和数据可视化功能,数据压缩到其原始大小的近10%。
5. SAS
一种用于数据处理和分析的编程语言和环境,该工具易于访问,并且可以分析来自不同来源的数据。
6. Excel
此工具是数据分析中使用最广泛的工具之一。该工具通常用于客户的内部数据,它 通过透视表的预览来分析汇总数据的任务。
7. RapidMiner
一个功能强大的集成平台,可以与任何数据源类型(例如Acess、Excel、Microsoft SQL、Tera数据、Oracle、Sybase等)集成。该工具主要用于预测分析,例如数据挖掘、文本分析、机器学习。
8. KNIME
Konstanz Information Miner(KNIME)是一个开放源数据分析平台,可让您分析和建模数据。利用可视化编程的优势,KNIME通过其模块化数据管道概念提供了一个报告和集成平台。
9. OpenRefine
也称为GoogleRefine,此数据清理软件将帮助您清理数据以进行分析,用于清除凌乱的数据,转换数据以及从网站解析数据。
10. Apache Spark
最大的大型数据处理引擎之一,该工具在Hadoop群集中执行应用程序的内存速度快100倍,磁盘速度快10倍,该工具在数据管道和机器学习模型开发中也很流行。
关于数据分析可能会用到哪些工具,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。