春山 征吾のくけー : 電話番号とかMACアドレスとか携帯の契約者idの単なるハッシュにとどめを刺したい - livedoor Blog(ブログ) では ソートしたんですが, 1億件の電話番号に対して ハッシュの頭文字で 16分割したファイル(各625万行ほど)を作ると, ソートしないで grep でもすぐ結果が返ってきました. これらのファイルを作るのに直列にやって 8分台でした.
単にあるハッシュ値と一致する電話番号探すだけなら, ファイルIOがない分速いです. 1億件は 2,3分で終わります. もちろん並列にやったり GPU 使えばもっと速いです.
電話番号みたいな狭い空間の単なるハッシュ値は, 少しの手間で復元できます. セキュリティに関する目的に利用してはいけません.