blake3をベースにしたメルクル木

blake3は新しいウィンドウで開く merkle木をベースにしていますが、公開されているインターフェースはmerkle木をエクスポートしません。

bao新しいウィンドウで開く は blake3 ストリーミング検証を実装していますが、基礎となる チャンクの新しいウィンドウで開く サイズを変更することはできません( 空間のオーバーヘッドを減らすためにより大きな "chunk group" をサポートする新しいウィンドウで開く を参照してください)。

これは、baoがmerkle木を記録するために6%の余分なストレージスペースを消費することを意味し、分散コンテンツインデックスにとっては大きなオーバーヘッドとなる。

そこで、 blake3_merkleを新しいウィンドウで開く 実装し、コンテンツ1MBあたり32バイトのハッシュを導き出し、さらにストレージのオーバーヘッドを0.3‱としました。

メルクル木はblake3と整合性のあるハッシュを生成する。

コンテンツが1MB以下の場合、メルクルツリーは1つのノードしか持たず、このノードのハッシュはblake3のハッシュと等しくなる。

./examples/main.rs 以下の通りです。

use blake3_merkle::Merkle;

use std::{env, error::Error, fs::File, io::copy};

fn main() -> Result<(), Box<dyn Error>> {
  let fpath = env::current_dir()?.join("test.pdf");

  let mut blake3 = blake3::Hasher::new();
  copy(&mut File::open(&fpath)?, &mut blake3)?;

  let mut merkle = Merkle::new();
  copy(&mut File::open(&fpath)?, &mut merkle)?;
  merkle.finalize();
  dbg!(&merkle.li);
  dbg!(merkle.blake3());
  dbg!(blake3.finalize());
  Ok(())
}

./example.main.shを実行すると、次のような出力が得られます。

[examples/main.rs:14] &merkle.li = [
    HashDepth {
        hash: Hash(
            "eb896f431b7ff8acb4749b54981d461359a01ded0261fa0da856dd28bf29d3b3",
        ),
        depth: 10,
    },
    HashDepth {
        hash: Hash(
            "4a84cc85f03f47a7c32755f8d9d81c5d3f3e04548ee8129fd480cb71c7dbc5b4",
        ),
        depth: 10,
    },
    HashDepth {
        hash: Hash(
            "fbfe78e550b355cb6775e324c4fed7eb987084b115dca599aaf40056bfb031c3",
        ),
        depth: 10,
    },
    HashDepth {
        hash: Hash(
            "392878c3bdc9c315d6cc8a1721d8cd0a39e49ac8716f4cb8cdf6cf83fbb666f5",
        ),
        depth: 6,
    },
]
[examples/main.rs:15] merkle.blake3() = Hash(
    "74a79d0bc37dcac64c493e872252f19e8bdb32dee306481a6827fa037b378c76",
)
[examples/main.rs:16] blake3.finalize() = Hash(
    "74a79d0bc37dcac64c493e872252f19e8bdb32dee306481a6827fa037b378c76",
)
アップデート:
より: gcxfd