全国专线咨询

18428357207

QQ:1443745438

当前所在位置:主页 > 大数据技术 > 大数据教程 >

从大数据分析的角度出发该如何选择数据库?

2017-06-15 11:05 来源:未知 编辑: admin 点击:
导读  数据分析师都想使用数据库作为数据仓库处理并操作数据,那么从大数据分析的角度出发该如何选择数据库勒?

  数据分析师都想使用数据库作为数据仓库处理并操作数据,那么从大数据分析的角度出发该如何选择数据库勒?

  百万级的数据,无论侧重OLTP还是OLAP,当然就是MySql了。

  过亿级的数据,侧重OLTP可以继续Mysql,侧重OLAP,就要分场景考虑了。

  实时计算场景:强调实时性,常用于实时性要求较高的地方,可以选择Storm;

  批处理计算场景:强调批处理,常用于数据挖掘、分析,可以选择Hadoop;

  实时查询场景:强调查询实时响应,常用于把DB里的数据转化索引文件,通过搜索引擎来查询,可以选择solr/elasticsearch;

  企业级ODS/EDW/数据集市场景:强调基于关系性数据库的大数据实时分析,常用于业务数据集成,可以选择Greenplum;

从大数据分析的角度出发该如何选择数据库?

  数据库系统一般分为两种类型:

  一种是面向前台应用的,应用比较简单,但是重吞吐和高并发的OLTP类型;

  一种是重计算的,对大数据集进行统计分析的OLAP类型。

  传统数据库侧重交易处理,即OLTP,关注的是多用户的同时的双向操作,在保障即时性的要求下,系统通过内存来处理数据的分配、读写等操作,存在IO瓶颈。

  OLTP(On-Line Transaction Processing,联机事务处理)系统也称为生产系统,它是事件驱动的、面向应用的,比如电子商务网站的交易系统就是一个典型的OLTP系统。

  OLTP的基本特点是:

  数据在系统中产生;

  基于交易的处理系统(Transaction-Based);

  每次交易牵涉的数据量很小;

  对响应时间要求非常高;

  用户数量非常庞大,主要是操作人员;

  数据库的各种操作主要基于索引进行。

  分析型数据库是以实时多维分析技术作为基础,即侧重OLAP,对数据进行多角度的模拟和归纳,从而得出数据中所包含的信息和知识。

  OLAP(On-Line Analytical Processing,联机分析处理)是基于数据仓库的信息分析处理过程,是数据仓库的用户接口部分。OLAP系统是跨部门的、面向主题的,其基本特点是:

  本身不产生数据,其基础数据来源于生产系统中的操作数据(OperationalData);

  基于查询的分析系统;

  复杂查询经常使用多表联结、全表扫描等,牵涉的数据量往往十分庞大;

  响应时间与具体查询有很大关系;

  用户数量相对较小,其用户主要是业务人员与管理人员;

  随着信息管理内容的不断扩展,出现了丰富多样的数据模型(层次模型,网状模型,关系模型,面向对象模型,半结构化模型等),新技术也层出不穷(数据流,Web数据管理,数据挖掘等)。想要了解大数据更多资讯欢迎免费咨询在线专家老师

标题
专题推荐
标题
标题
大数据热门标签
图书推荐