分散ハッシュテーブルで使われる検索技術

P2P情報検索における単語の頻度情報に基づくデータ配置手法
http://www.adl.nii.ac.jp/paper/kurasawa_tod40.pdf

分散ハッシュテーブル(DHT)上に、いかにして検索システムを組むかというテーマの論文。面白そう。日本語。でもまだ読んでない。

DHTは本質的にハッシュテーブルであって、完全一致検索は得意でも部分一致その他は苦手である。かといって、素直に転置インデックスを分散させるだけでは、ノード間の通信量が膨大なものになってしまう。

現実的なシステムを目指すにはメタデータの配置を工夫してやらねばならない。DHT上に提案手法のようなレイヤを被せることで、P2P上でももうちょっとマシな検索が実現可能だろう、という話らしい。