监控
可以监控到:
- 硬件资源的利用率。
- ClickHouse 服务的指标。
硬件资源利用率
ClickHouse 本身不会去监控硬件资源的状态。
强烈推荐监控以下监控项:
ClickHouse 服务的指标。
ClickHouse服务本身具有用于自我状态监视指标。
要跟踪服务器事件,请观察服务器日志。 请参阅配置文件的 logger部分。
ClickHouse 收集的指标项:
- 服务用于计算的资源占用的各种指标。
- 关于查询处理的常见统计信息。
可以在系统指标,系统事件以及系统异步指标等系统表查看所有的指标项。
可以配置ClickHouse向Graphite推送监控信息并导入指标。参考Graphite监控配置文件。在配置指标导出之前,需要参考Graphite官方教程搭建Graphite服务。
此外,您可以通过HTTP API监视服务器可用性。将HTTP GET请求发送到/ping
。如果服务器可用,它将以 200 OK
响应。
要监视服务器集群的配置,应设置max_replica_delay_for_distributed_queries参数并使用HTTP资源/replicas_status
。 如果副本可用,并且不延迟在其他副本之后,则对/replicas_status
的请求将返回200 OK
。 如果副本滞后,请求将返回503 HTTP_SERVICE_UNAVAILABLE
,包括有关待办事项大小的信息。