数据分析:修订间差异
无编辑摘要 |
无编辑摘要 |
||
第13行: | 第13行: | ||
===数据库=== | ===数据库=== | ||
{| class="wikitable" style="width: 100%; | |||
! 分类 | |||
! 名称 | |||
! 描述 | |||
|- | |||
| rowspan="2"| 基础 | |||
|[[SQL]] | |||
| 一种数据库查询和程序设计语言,简单易用。各个数据库管理软件的SQL语言实现大部分相同。 | |||
|- | |||
| | |||
| | |||
|- | |||
| rowspan="5"|关系数据库软件 | |||
|[[MySQL]] | |||
| | |||
|- | |||
|[[MariaDB]] | |||
| | |||
|- | |||
|[[PostgreSQL]] | |||
| | |||
|- | |||
|[[SQLite]] | |||
| | |||
|- | |||
|[[Microsoft Access]] | |||
| | |||
|} | |||
===分析工具=== | ===分析工具=== | ||
第92行: | 第120行: | ||
==参考== | ==参考== | ||
*[https://en.wikipedia.org/wiki/Data_analysis Wikipedia:Data analysis] | *[https://en.wikipedia.org/wiki/Data_analysis Wikipedia:Data analysis] | ||
[[分类:数据分析]] |
2021年5月22日 (六) 11:05的版本
分析步骤
目标需求
获取数据
处理数据
分析数据
展示输出
工具
统计学
基础工具
数据库
分类 | 名称 | 描述 |
---|---|---|
基础 | SQL | 一种数据库查询和程序设计语言,简单易用。各个数据库管理软件的SQL语言实现大部分相同。 |
关系数据库软件 | MySQL | |
MariaDB | ||
PostgreSQL | ||
SQLite | ||
Microsoft Access |
分析工具
名称 | 描述 |
---|---|
SPSS | 全称是Statistical Product and Service Solutions,IBM公司推出的用于统计分析、数据挖掘、预测分析等软件。简单易用,价格不便宜。 |
Python | 是一门简单易学的计算机编程语言,搭配一些开源的Python库可实现数据统计分析、绘图、数据挖掘和预测等。 Numpy,科学计算的基本软件包。 Pandas,用于数据分析的Python库。 Matplotlib,Python的一个绘图库,常用于数据可视化。 常用代码编辑器: Jupyter,这款软件在数据分析中很常用。 Pycharm,是由JetBrains打造的一款Python IDE。 VS Code,是由微软开发,同时支持Windows 、 Linux和macOS等操作系统的免费开源代码编辑器。 |
R语言 | 是一计算机编程语言,主要用于统计分析、绘图、数据挖掘等。R内置多种统计学及数字分析功能,还可以通过安装包(Packages)增强。 |
可视化
分类 | 名称 | 描述 |
---|---|---|
软件 | Excel | |
Tableau | ||
在线可视化分析平台 | 神策数据 | |
Quick BI | ||
海致BDP | ||
开源可视化库 | D3.js | 基于 JavaScript, |
ECharts | 基于 JavaScript,最初由百度开源,后捐赠给Apache基金会,成为Apache顶级项目。 | |
g2 | 基于 JavaScript,阿里巴巴开源可视化库,g2官网 | |
Matplotlib | 基于 Python,常用于Python数据可视化。 | |
开源可视化平台 | Superset | |
Grafana | ||
Kibana |