rocksdb性能调优
一、关键参数
create_if_missing:创建缺失表
num_levels:层次数量,默认是7。如果L0大小有512MB,6层能容纳512M+512M+5G+50G+500G+5T,如果配置是7,在数据量少于前面计算的5T+的数据之前,最后一层是不会被使用的。如果num_levels配置为6,那么最下面一层数据量会大于5T
max_background_flushes:memtable dump成sstable的并发线程数。默认是1,线程数小,当写入量大时,会导致无法写入。
max_background_compactions:底层sst向高层sst compact的并发线程数。并发compaction会加快compaction的速度,如果compaction过慢,达到soft_pending_compaction_bytes_limit会发生阻塞,达到hard_pending_compaction_bytes会停写。
max_write_buffer_number:指定memtable和immutable memtable总数。当写入速度过快,或者flush线程速度较慢,出现memtable数量超过了指定大小,请求会无法写入
write_buffer_size:单个memtable的大小,当memtable达到指定大小,会自动转换成immutable memtable并且新创建一个memtable
max_bytes_for_level_base:L1的总大小,L1的大小建议设置成和L0大小一致,提升L0->L1的compaction效率
min_write_buffer_number_to_merge:immutable memtable在flush之前先进行合并,比如参数设置为2,当一个memtable转换成immutable memtable后,RocksDB不会进行flush操作,等到至少有2个后才进行flush操作。这个参数调大能够减少磁盘写的次数,因为多个memtable中可能有重复的key,在flush之前先merge后就避免了旧数据刷盘;但是带来的问题是每次数据查找,当memtable中没有对应数据,RocksDB可能需要遍历所有的immutable memtable,会影响读取性能。
level0_file_num_compaction_trigger:L0达到指定个数的sstable后,触发compaction L0->L1。所以L0稳定状态下大小为write_buffer_size min_write_buffer_number_to_merge level0_file_num_compaction_trigger
statistics:统计系统性能和吞吐信息,开启statistics会增加5%到10%的额外开销
stats_dump_period_sec:统计信息导出日志时间间隔
compression_type: 压缩类型
bloom_filter_bits:使用bloom过滤器来避免不必要的磁盘访问
lru_cache_size:cache大小
max_open_files:最大打开文件句柄
skip_stats_update_on_db_open: 打开db时,是否跳过stats。建议设为false
二、wirte sall 常见情况及解决方法
(1)RocksDB在flush或compaction速度来不及处理新的写入,会启动自我保护机制,延迟写或者禁写。主要有几种情况:
写限速:如果max_write_buffer_number大于3,将要flush的memtables大于等于max_write_buffer_number-1,write会被限速。
禁写:memtable个数大于等于max_write_buffer_number,触发禁写,等到flush完成后允许写入。
写限速:L0文件数量达到level0_slowdown_writes_trigger,触发写限速。
禁写:L0文件数量达到level0_stop_writes_trigger,禁写。
写限速:等待compaction的数据量达到soft_pending_compaction_bytes,触发写限速。
禁写:等待compaction的数据量达到hard_pending_compaction_bytes,触发禁写。
(2)当出现write stall时,可以按具体的系统的状态调整如下参数:
调大max_background_flushes
调大max_write_buffer_number
调大max_background_compactions
调大write_buffer_size
调大min_write_buffer_number_to_merge
三、推荐配置示例
存储介质flash
options.options.compaction_style = kCompactionStyleLevel;
options.write_buffer_size = 67108864; // 64MB
options.max_write_buffer_number = 3;
options.target_file_size_base = 67108864; // 64MB
options.max_background_compactions = 4;
options.level0_file_num_compaction_trigger = 8;
options.level0_slowdown_writes_trigger = 17;
options.level0_stop_writes_trigger = 24;
options.num_levels = 4;
options.max_bytes_for_level_base = 536870912; // 512MB
options.max_bytes_for_level_multiplier = 8;
全内存
options.allow_mmap_reads = true;
BlockBasedTableOptions table_options;
table_options.filter_policy.reset(NewBloomFilterPolicy(10, true));
table_options.no_block_cache = true;
table_options.block_restart_interval = 4;
options.table_factory.reset(NewBlockBasedTableFactory(table_options));
options.level0_file_num_compaction_trigger = 1;
options.max_background_flushes = 8;
options.max_background_compactions = 8;
options.max_subcompactions = 4;
options.max_open_files = -1;
ReadOptions.verify_checksums = false