iis 7.5 网站谷歌推广代理
大数据实时分析领域的黑马是ClickHouse,一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
clickhouse背景
俄罗斯的“百度”叫做Yandex,覆盖了俄语搜索超过68%的市场,有俄语的地方就有Yandex;有中文的地方,就有百度么?好像不一定 : )
Yandex在2016年6月15日开源了一个数据分析的数据库,名字叫做ClickHouse,这对保守俄罗斯人来说是个特大事。更让人惊讶的是,这个列式存储数据库的跑分要超过很多流行的商业MPP数据库软件,例如Vertica。如果你没有听过Vertica,那你一定听过 Michael Stonebraker,2014年图灵奖的获得者,PostgreSQL和Ingres发明者(Sybase和SQL Server都是继承 Ingres而来的), Paradigm4和SciDB的创办者。Michael Stonebraker于2005年创办Vertica公司,后来该公司被HP收购,Vertica成为MPP列式存储商业数据库的代表。
clickhouse特性刨析
1、支持SQL&丰富的数据和聚合函数
作为一个DBMS,肯定是要支持SQL的。虽然不能完全支持ANSI SQL,但是ClickHouse提供的数组和聚合函数,更适用于分析型场景。
2、列式存储
列式存储特别适用于在分析型场景下
大部分分析场景下,只用到了数据集中少量的列。例如,如果查询需要100列中的5列,在面向列的数据库中,通过只读取所需的数据,I/O可能会减少20倍;
同样类型的数据也更容易压缩,这进一步减少了I/O量;
3、真正的面向列的 DBMS 在一个真正的面向列的 DB