大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進行分析。大數(shù)據(jù)可以概括為5個V, 數(shù)據(jù)量大(Volume)、速度快(Velocity)、類型多(Variety)、價值(Value)、真實性(Veracity)。大數(shù)據(jù)作為時下最火熱的IT行業(yè)的詞匯,隨之而來的數(shù)據(jù)倉庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點。隨著大數(shù)據(jù)時代的來臨,大數(shù)據(jù)分析也應運而生。
開源大數(shù)據(jù)生態(tài)圈
1. Hadoop HDFS、Hadoop MapReduce, HBase、Hive 漸次誕生,早期Hadoop生態(tài)圈逐步形成。
2. Hypertable是另類。它存在于Hadoop生態(tài)圈之外,但也曾經(jīng)有一些用戶。
一體機數(shù)據(jù)庫/數(shù)據(jù)倉庫
IBM PureData(Netezza), OracleExadata, SAP Hana等。
數(shù)據(jù)倉庫
Teradata AsterData, EMC GreenPlum, HP Vertica等。
數(shù)據(jù)集市
Style Intelligence, QlikView, Tableau等。