TiDB-v4.0.x支持OLAP场景的一些实践经验

由于个人工作经验的局限性，本文将仅分享我个人最近两个月在TiDB支持OLAP场景(BI系统)遇到的一些问题及调优方法。不足之处请大家批评、补充。

这类业务场景有一下特点:

Case1: tidb节点系统盘使用量超过80%报警

现象： tidb节点 系统盘 使用量超过80%报警

原因：

调优方案:

调整 tmp-storage-path 或者 tmp-storage-quota

Case2: 单条SQL超过内存使用限制被cancel

原因：

调优方案：

调大 mem-quota-query

Case3: 海量empty-region

现象：监控PD->RegionHealth->empty-region-count较大

原因：频繁drop-partition造成

调优方案：(这里注意: 升级到4.0.x的集群region-merge默认未打开)

Case4: TiKV-CPU & TiKV-ThreadCPU->RaftStoreCPU 居高不下

现象: TiKV-CPU & TiKV-ThreadCPU->RaftStoreCPU 居高不下

原因: region-count过大，集群负载高

调优方案：

Case5: Transection too large

现象： insert into select from 、 delete from 等操作报错 Transection too large

原因：

调优方案：