blake3をベースにしたメルクル木
blake3は merkle木をベースにしていますが、公開されているインターフェースはmerkle木をエクスポートしません。
bao は blake3 ストリーミング検証を実装していますが、基礎となる チャンクの サイズを変更することはできません( 空間のオーバーヘッドを減らすためにより大きな "chunk group" をサポートする を参照してください)。
これは、baoがmerkle木を記録するために6%の余分なストレージスペースを消費することを意味し、分散コンテンツインデックスにとっては大きなオーバーヘッドとなる。
そこで、 blake3_merkleを 実装し、コンテンツ1MBあたり32バイトのハッシュを導き出し、さらにストレージのオーバーヘッドを0.3‱としました。
メルクル木はblake3と整合性のあるハッシュを生成する。
コンテンツが1MB以下の場合、メルクルツリーは1つのノードしか持たず、このノードのハッシュはblake3のハッシュと等しくなる。
./examples/main.rs
以下の通りです。
use blake3_merkle::Merkle;
use std::{env, error::Error, fs::File, io::copy};
fn main() -> Result<(), Box<dyn Error>> {
let fpath = env::current_dir()?.join("test.pdf");
let mut blake3 = blake3::Hasher::new();
copy(&mut File::open(&fpath)?, &mut blake3)?;
let mut merkle = Merkle::new();
copy(&mut File::open(&fpath)?, &mut merkle)?;
merkle.finalize();
dbg!(&merkle.li);
dbg!(merkle.blake3());
dbg!(blake3.finalize());
Ok(())
}
./example.main.sh
を実行すると、次のような出力が得られます。
[examples/main.rs:14] &merkle.li = [
HashDepth {
hash: Hash(
"eb896f431b7ff8acb4749b54981d461359a01ded0261fa0da856dd28bf29d3b3",
),
depth: 10,
},
HashDepth {
hash: Hash(
"4a84cc85f03f47a7c32755f8d9d81c5d3f3e04548ee8129fd480cb71c7dbc5b4",
),
depth: 10,
},
HashDepth {
hash: Hash(
"fbfe78e550b355cb6775e324c4fed7eb987084b115dca599aaf40056bfb031c3",
),
depth: 10,
},
HashDepth {
hash: Hash(
"392878c3bdc9c315d6cc8a1721d8cd0a39e49ac8716f4cb8cdf6cf83fbb666f5",
),
depth: 6,
},
]
[examples/main.rs:15] merkle.blake3() = Hash(
"74a79d0bc37dcac64c493e872252f19e8bdb32dee306481a6827fa037b378c76",
)
[examples/main.rs:16] blake3.finalize() = Hash(
"74a79d0bc37dcac64c493e872252f19e8bdb32dee306481a6827fa037b378c76",
)