春山 征吾のくけー : 電話番号とかMACアドレスとか携帯の契約者idの単なるハッシュにとどめを刺したい - livedoor Blog(ブログ) では ソートしたんですが, 1億件の電話番号に対して ハッシュの頭文字で 16分割したファイル(各625万行ほど)を作ると, ソートしないで grep でもすぐ結果が返ってきました. これらのファイルを作るのに直列にやって 8分台でした.

単にあるハッシュ値と一致する電話番号探すだけなら, ファイルIOがない分速いです. 1億件は 2,3分で終わります. もちろん並列にやったり GPU 使えばもっと速いです.

電話番号みたいな狭い空間の単なるハッシュ値は, 少しの手間で復元できます. セキュリティに関する目的に利用してはいけません.

080[0-9]{8} な 電話番号のハッシュ値と番号を記述したファイル群

https://app.sugarsync.com/wf/D1955203_142_7316730

ファイル作成に利用したスクリプト

haruyama/tel_hash ・ GitHub