数据分析:修订间差异

(创建页面,内容为“ ==数据分析过程== ==思维== ==工具== ===统计学=== ===基础工具=== ===数据库=== ===分析工具=== {| class="wikitable" style="width: 100%; !…”)
 
无编辑摘要
第1行: 第1行:


==数据分析过程==
==分析步骤==
 
===目标需求===
==思维==
===获取数据===
===处理数据===
===分析数据===
===展示输出===


==工具==
==工具==
第20行: 第23行:
|-  
|-  
| [[Python]]
| [[Python]]
| 是一门简单易学的计算机编程语言,搭配一些开源的Python库可实现数据统计分析、数据挖掘和预测等。<br \> [[Numpy]],科学计算的基本软件包。<br \>[[Pandas]],用于数据分析的Python库。
| 是一门简单易学的计算机编程语言,搭配一些开源的Python库可实现数据统计分析、绘图、数据挖掘和预测等。<br \> [[Numpy]],科学计算的基本软件包。<br \>[[Pandas]],用于数据分析的Python库。 <br \>[[Matplotlib]],Python的一个绘图库,常用于数据可视化。  <br \><br \>常用代码编辑器:<br \>[[Jupyter]],这款软件在数据分析中很常用。<br \>[[Pycharm]],是由JetBrains打造的一款Python IDE。 <br \>[[VS  Code]],是由微软开发,同时支持Windows 、 Linux和macOS等操作系统的免费开源代码编辑器。
|-  
|-  
| [[R语言]]
| 是一计算机编程语言,主要用于统计分析、绘图、数据挖掘等。R内置多种统计学及数字分析功能,还可以通过安装包(Packages)增强。
|}
===可视化===
{| class="wikitable"  style="width: 100%;
! 分类
! 名称
! 描述
|-
| rowspan="3"|软件
| [[Excel]]
|
|-
| [[Tableau]]
|
|-
|
|
|-
| rowspan="3"|在线可视化分析平台
| [[神策数据]]
|
|-
| [[Quick BI]]
|  
|  
|-
| [[海致BDP]]
|
|-
| rowspan="4"|开源可视化库
| [[D3.js]]
| 基于 [[JavaScript]],
|-
| [[ECharts]]
| 基于 JavaScript,最初由百度开源,后捐赠给Apache基金会,成为Apache顶级项目。
|-
| [[g2]]
| 基于 JavaScript,阿里巴巴开源可视化库,[https://g2.antv.vision/zh/ g2官网]
|-
| [[Matplotlib]]
| 基于 Python,常用于Python数据可视化。
|-
| rowspan="3"|开源可视化平台
| [[Superset]]
|  
|  
|-
| [[Grafana]]
|
|-
| [[Kibana]]
|
|}
|}
===可视化===


==思维方法==


==数据分析分类==
==分类==


==资源==
==资源==
第36行: 第88行:
===相关文章===
===相关文章===
*[https://www.zhihu.com/question/29265587 知乎:如何快速成为数据分析师?]
*[https://www.zhihu.com/question/29265587 知乎:如何快速成为数据分析师?]
*[https://www.jianshu.com/p/5a8f01fe7f2a 简书:老树之见 - 数据驱动决策的13种思维方式]


==参考==
==参考==
*[https://en.wikipedia.org/wiki/Data_analysis Wikipedia:Data analysis]
*[https://en.wikipedia.org/wiki/Data_analysis Wikipedia:Data analysis]

2021年5月22日 (六) 08:09的版本

分析步骤

目标需求

获取数据

处理数据

分析数据

展示输出

工具

统计学

基础工具

数据库

分析工具

名称 描述
SPSS 全称是Statistical Product and Service Solutions,IBM公司推出的用于统计分析、数据挖掘、预测分析等软件。简单易用,价格不便宜。
Python 是一门简单易学的计算机编程语言,搭配一些开源的Python库可实现数据统计分析、绘图、数据挖掘和预测等。
Numpy,科学计算的基本软件包。
Pandas,用于数据分析的Python库。
Matplotlib,Python的一个绘图库,常用于数据可视化。

常用代码编辑器:
Jupyter,这款软件在数据分析中很常用。
Pycharm,是由JetBrains打造的一款Python IDE。
VS Code,是由微软开发,同时支持Windows 、 Linux和macOS等操作系统的免费开源代码编辑器。
R语言 是一计算机编程语言,主要用于统计分析、绘图、数据挖掘等。R内置多种统计学及数字分析功能,还可以通过安装包(Packages)增强。

可视化

分类 名称 描述
软件 Excel
Tableau
在线可视化分析平台 神策数据
Quick BI
海致BDP
开源可视化库 D3.js 基于 JavaScript
ECharts 基于 JavaScript,最初由百度开源,后捐赠给Apache基金会,成为Apache顶级项目。
g2 基于 JavaScript,阿里巴巴开源可视化库,g2官网
Matplotlib 基于 Python,常用于Python数据可视化。
开源可视化平台 Superset
Grafana
Kibana

思维方法

分类

资源

相关网站

相关文章

参考