okx

Vite存储层设计之blockDB文件系统设计

时间:2023-08-26|浏览:147

blockDB用来存储交易(Transaction/AccountBlock)和快照(SnapshotBlock)数据。在生成快照后,这些数据类型都是最终确认的状态,并且无需修改。因此,使用快速追加写入的方式进行高效的存储非常适合。blockDB的存储设计采用了追加写入优化策略,通过ringBuffer将需要顺序写入的数据依次写入一个队列,然后异步地批量写入到文件中。

1. 写入数据的提交 一个快照块(SnapshotBlock)和关联的账户块(AccountBlock)列表对相关的数据结构进行序列化,并写入存储。

2. ringBuffer 序列化后的数据不会直接写入文件,而是先写入一个名为ringBuffer的内存缓冲区。这个缓冲区由一系列连续的10M子数据段(Segment)构成,每个数据段都有一个递增的序列号fileId。对于每个块(Block),首先会写入该块序列化后的字节长度,然后再是实际的数据内容。因为块和段不是一一对应的,所以会存在一个块的数据需要跨越多个段的情况。为了能够定位和存储一个块的数据段,可以通过[fileId, offset]二元组来确定块的起始位置,其中offset表示该块在段中的偏移量。

为了提高效率并减少开辟和回收缓存区的开销,这里将这些连续段拼接成一个虚拟环,称为ringBuffer。新数据追加到环的末尾(Tail),旧数据从队头(Head)弹出。追加和弹出操作通过移动段下标的方式完成。队头和队尾之间是待写入文件的已使用段,其他部分是可以被覆盖的空闲段。

已使用段的数据既可以被用作写缓存,又可以做读缓存。空闲段的数据如果之前写入过有效数据,也可以被当做读缓存。因此,整个ringBuffer都可以作为读缓存。整个ringBuffer就相当于一个最近写入数据的读写缓冲区。

当短期写入ringBuffer的数据超过flush速度时,会导致数据超过ringBuffer现有容量。此时,ringBuffer会自动扩容。待数据逐步写入文件列表后,ringBuffer会自动收缩到初始容量。

3. 文件列表、随机读取和账本同步 blockDB使用固定大小的小文件列表来存储块数据。每个文件对应ringBuffer中的一个段,文件名即为ringBuffer中的fileId。通过定期的flush操作,ringBuffer中的已使用段会依次写入文件系统,已flush的段会变为空闲段。

进行随机读取操作时,首先通过blockDB索引获取[fileId, offset]二元组,然后根据fileId在ringBuffer中定位段。如果定位失败,则通过fileId打开对应的小文件,并进行seek到offset位置。从该位置的开头读取数据大小后,就可以连续读取该块对应的数据块。可能需要跨越多个文件读取fileId+1的下一个小文件。由于采用小文件存储,相较于大文件,seek操作速度更快,也对系统的页缓存更友好。

小文件列表在顺序写入和批量顺序读取上具有良好的性能,这个特性在"账本同步"场景中非常有用。

4. 数据回滚 blockDB仅支持从最新状态回滚数据到某个历史状态,不允许删除中间的历史数据,即数据是连续的片段,不允许存在数据空洞。

数据回滚分为预删除和删除两个阶段。在预删除阶段,先在ringBuffer中删除相应的数据,然后标记要回滚到的目标位置。标记完毕后,这段数据变得不可读,但并未真正删除。下次进行"异步批量Flush"操作时,会进入删除阶段,此时会真正删除文件列表中的数据。

5. 数据压缩 目前使用snappy算法对每个块进行数据压缩。

« 上一条| 下一条 »
区块链交流群
数藏交流群

合作伙伴

二手域名 今日黄金 去玩呗SPA 玩合约 兼职信息网 元宇宙Web 免费电影 非小号行情 皮卡丘资讯 美白没斑啦 数字财经 借春秋财经 秒懂域名 代特币圈 谈股票 百悦米 佩佩蛙官网 周公解梦 币圈论坛 趣开心资讯 數字黃金 装修装饰网 宝宝起名 币圈ICO官网 黄金行情 爱网站 妈妈知道 金色币圈 币爸爸 旅游资讯网 培训资讯网 币圈官网 借春秋 玩票票财经 趣玩币 宠物丫 减肥瘦身吧 乐评网 茶百科 起名取名网 天天财富 百科书库 聚币网
在区块链世界中,智能合约不仅是代码的信任,更是商业的革命。通过了解其在供应链、版权保护等领域的应用,您将真正体验到智能合约的无限可能性
区块链世界GxPiKaQiu.com ©2020-2024版权所有 桂ICP备16002597号-2