翻译自 clickhouse 官方入门教程第二节:https://clickhouse.yandex/tutorial.html
将 clickhouse 部署到集群
ClickHouse 集群是一个 homogenous 集群. 设置步骤是:
- 在集群内所有机器上安装 ClickHouse 服务端
- 在配置文件中设置集群相关的配置
- 在集群内每台机器上创建本地表
- 创建分布式表(Distributed table)
在 ClickHouse 集群中分布式表事实上是一种关联到每台机器本地表的 view
。对分布式表执行查询将使用集群中所有分片(译者注:一个分片即为集群中的一台机器)的资源。可以为多个集群指定配置,并创建多个分布式表以提供对不同集群的 view
。
下面的配置是一个有三个分片的集群,每个分片将数据保存到一个副本中(译者注:数据只有一份,没有副本):
1 | <remote_servers> |
创建本地表(译者注:待确定是否在所有分片上都创建本地表):
1 | CREATE TABLE ontime_local (...) ENGINE = MergeTree(FlightDate, (Year, FlightDate), 8192); |
创建分布式表,提供集群中本地表的 view: