rocksdb性能调优

一、关键参数

create_if_missing:创建缺失表

num_levels:层次数量,默认是7。如果L0大小有512MB,6层能容纳512M+512M+5G+50G+500G+5T,如果配置是7,在数据量少于前面计算的5T+的数据之前,最后一层是不会被使用的。如果num_levels配置为6,那么最下面一层数据量会大于5T

max_background_flushes:memtable dump成sstable的并发线程数。默认是1,线程数小,当写入量大时,会导致无法写入。

max_background_compactions:底层sst向高层sst compact的并发线程数。并发compaction会加快compaction的速度,如果compaction过慢,达到soft_pending_compaction_bytes_limit会发生阻塞,达到hard_pending_compaction_bytes会停写。

max_write_buffer_number:指定memtable和immutable memtable总数。当写入速度过快,或者flush线程速度较慢,出现memtable数量超过了指定大小,请求会无法写入

write_buffer_size:单个memtable的大小,当memtable达到指定大小,会自动转换成immutable memtable并且新创建一个memtable

max_bytes_for_level_base:L1的总大小,L1的大小建议设置成和L0大小一致,提升L0->L1的compaction效率

min_write_buffer_number_to_merge:immutable memtable在flush之前先进行合并,比如参数设置为2,当一个memtable转换成immutable memtable后,RocksDB不会进行flush操作,等到至少有2个后才进行flush操作。这个参数调大能够减少磁盘写的次数,因为多个memtable中可能有重复的key,在flush之前先merge后就避免了旧数据刷盘;但是带来的问题是每次数据查找,当memtable中没有对应数据,RocksDB可能需要遍历所有的immutable memtable,会影响读取性能。

level0_file_num_compaction_trigger:L0达到指定个数的sstable后,触发compaction L0->L1。所以L0稳定状态下大小为write_buffer_size min_write_buffer_number_to_merge level0_file_num_compaction_trigger

statistics:统计系统性能和吞吐信息,开启statistics会增加5%到10%的额外开销

stats_dump_period_sec:统计信息导出日志时间间隔

compression_type: 压缩类型

bloom_filter_bits:使用bloom过滤器来避免不必要的磁盘访问

lru_cache_size:cache大小

max_open_files:最大打开文件句柄

skip_stats_update_on_db_open: 打开db时,是否跳过stats。建议设为false

二、wirte sall 常见情况及解决方法

(1)RocksDB在flush或compaction速度来不及处理新的写入,会启动自我保护机制,延迟写或者禁写。主要有几种情况:

写限速:如果max_write_buffer_number大于3,将要flush的memtables大于等于max_write_buffer_number-1,write会被限速。

禁写:memtable个数大于等于max_write_buffer_number,触发禁写,等到flush完成后允许写入。

写限速:L0文件数量达到level0_slowdown_writes_trigger,触发写限速。

禁写:L0文件数量达到level0_stop_writes_trigger,禁写。

写限速:等待compaction的数据量达到soft_pending_compaction_bytes,触发写限速。

禁写:等待compaction的数据量达到hard_pending_compaction_bytes,触发禁写。

(2)当出现write stall时,可以按具体的系统的状态调整如下参数:

调大max_background_flushes

调大max_write_buffer_number

调大max_background_compactions

调大write_buffer_size

调大min_write_buffer_number_to_merge

三、推荐配置示例

存储介质flash

options.options.compaction_style = kCompactionStyleLevel;

options.write_buffer_size = 67108864; // 64MB

options.max_write_buffer_number = 3;

options.target_file_size_base = 67108864; // 64MB

options.max_background_compactions = 4;

options.level0_file_num_compaction_trigger = 8;

options.level0_slowdown_writes_trigger = 17;

options.level0_stop_writes_trigger = 24;

options.num_levels = 4;

options.max_bytes_for_level_base = 536870912; // 512MB

options.max_bytes_for_level_multiplier = 8;

全内存

options.allow_mmap_reads = true;

BlockBasedTableOptions table_options;

table_options.filter_policy.reset(NewBloomFilterPolicy(10, true));

table_options.no_block_cache = true;

table_options.block_restart_interval = 4;

options.table_factory.reset(NewBlockBasedTableFactory(table_options));

options.level0_file_num_compaction_trigger = 1;

options.max_background_flushes = 8;

options.max_background_compactions = 8;

options.max_subcompactions = 4;

options.max_open_files = -1;

ReadOptions.verify_checksums = false