数据分析与知识发现
    主页 > 综合新闻 >

数据分析工具大全|我就不信,看完这篇还找不到

提及数据分析工具相信小伙伴们都不陌生但是很多人都会有个疑惑

数据分析工具这么多它们有什么区别哪个更好哪个更强我应该学习哪个数据分析工具的使用还是看需求每个企业应用的选择和方式都不同。数据分析的概念很广站在IT的角度实际应用中可以把数据分析工具分成两个维度

第一维度数据存储层——数据报表层——数据分析层——数据展现层

第二维度用户级——部门级——企业级——BI级

1、数据存储层

数据存储涉及到数据库的概念和数据库语言这方面不一定要深钻研但至少要理解数据的存储方式数据的基本结构和数据类型。SQL查询语言必不可少精通最好。可从常用的selece查询update修改delete删除insert插入的基本结构和读取入手。

Access2003、Access07等这是最基本的个人数据库经常用于个人或部分基本的数据存储MySQL数据库这个对于部门级或者互联网的数据库应用是必要的这个时候关键掌握数据库的库结构和SQL语言的数据查询能力。

SQL Server2005或更高版本对中小企业一些大型企业也可以采用SQL Server数据库其实这个时候本身除了数据存储也包括了数据报表和数据分析了甚至数据挖掘工具都在其中了

DB2Oracle数据库都是大型数据库主要是企业级特别是大型企业或者对数据海量存储需求的就是必须的了一般大型数据库公司都提供非常好的数据整合应用平台

BI级别实际上这个不是数据库而是建立在前面数据库基础上的企业级应用的数据仓库。Data Warehouse建立在DW机上的数据存储基本上都是商业智能平台整合了各种数据分析报表、分析和展现BI级别的数据仓库结合BI产品也是近几年的大趋势。

2、报表/BI层?

企业存储了数据需要读取需要展现报表工具是最普遍应用的工具尤其是在国内。过去传统报表大多解决的是展现问题如今像思迈特软件Smartbi的企业报表平台也会和其他应用交叉做数据分析报表通过接口开放功能、填报、决策报表功能能够做到打通数据的进出涵盖了早期商业智能的功能。



可视化BI工具可分在报表层也可分为数据展现层涵盖了数据整合、数据分析和数据展现。近年来陆陆续续也出现过很多BI工具可作为可视化数据分析软件目前较为常用的Smartbi和TableauSmartbi是使用者上传数据Smartbi再从数据库中取数进行报表和可视化分析。若是比较追求可视化方面则是Tableau更优但Smartbi不仅仅只有可视化这一方面在大数据处理方面的能力更胜一筹。



3、数据分析层

这个层其实有很多分析工具当然我们最常用的就是Excel。

Excel软件首先版本越高越好用这是肯定的当然对excel来讲很多人只是掌握了5%Excel功能Excel功能非常强大甚至可以完成所有的统计分析工作但是我也常说有能力把Excel玩成统计工具不如专门学会统计软件

SPSS软件当前版本是18名字也改成了PASW Statistics我从3.0开始Dos环境下编程分析到现在版本的变迁也可以看出SPSS社会科学统计软件包的变化从重视医学、化学等开始越来越重视商业分析现在已经成为了预测分析软件

SAS软件SAS相对SPSS其实功能更强大SAS是平台化的EM挖掘模块平台整合相对来讲SAS比较难学些但如果掌握了SAS会更有价值比如离散选择模型抽样问题正交实验设计等还是SAS比较好用另外SAS的学习材料比较多也公开会有收获的

JMP分析SAS的一个分析分支

XLstatExcel的插件可以完成大部分SPSS统计分析功能

4、表现层?

表现层也叫数据可视化以上每种工具都几乎提供了一点展现功能。Smartbi和Tableau的可视化功能上文有提过。其实近年来Excel的可视化越来越棒配上一些插件使用感更佳。

PPT办公常用用来写数据分析报告

Xmind&百度脑图梳理流程帮助思考分析展现数据分析的层次

Xcelsius软件Dashboard制作和数据可视化报表工具可以直接读取数据库在Excel里建模互联网展现最大特色还是可以在PPT中实现动态报表。

最后需要说明的是这样的分类并不是区分软件只是想说明软件的应用。有时候我们把数据库就用来进行报表分析有时候报表就是分析有时候分析就是展现当然有时候展现就是分析分析也是报表报表就是数据存储了