全书内容整理如下:
- 存储系统分类
- 文件:文件抽象,面向 block
- KV:hashtable 抽象,面向 key-value
- Table:列存、一般由列族概念
- DB:分布式数据库,提供事务(ACID)的保证
- 分布式系统关注问题
- 数据分布 & 路由
- hash
- region
- 数据同步
- 主备(Primary-Based)
- 多写(NWR)
- 负载均衡
- 感知负载 & 数据迁移
- 表格合并和分裂
- 自动扩容、缩容
- 容错:大多依赖分布式锁服务,如 chubby、zookeeper
- lease or paxos 保证主可用 (leader election)
- p2p
- 多副本
- 数据分布 & 路由