« 学資保険の失敗談(その2) | トップページ | 子供を産むと得? 教育費の公費負担1600万円。 »

2007/06/10

混雑状況サービス、止まってます(年金)

社会保険事務所・年金相談センターの混雑状況案内、停止しているようです。日本全国どこの相談所も過去1週間の混雑状況が分かっていたのですが、更新が遅いのかな?
ま、見なくても状況は想像できますけど。

   http://www.sia.go.jp/sodan/madoguchi/nenkin/konzatu.htm

Komiguai490
(だったら、止める前に真っ赤っかにしておいてほしいよね)


========================

今日は、ソフトウェアエンジニアとしての考察です。

データ容量の計算と検索要求についてです。
5000万件のデータ量、膨大です。


 『5000万件の年金記録、突き合わせ処理、
    あなたなら、どんなソフトを組む? 』


 窓口に来た人が出す情報は、「名前、性別、生年月日」
 
   名前 + 性 + 年 + 月 + 日
   20byte 1byte 1byte 1byte 1byte  =24バイト

データベースの方にはこれに年金番号が26bit(log5000万/log2)=3バイトが必要なわけで、27バイト。だから最低でも32byteをひと塊で検索するわけですね。
性、年月日を圧縮すれば、4→2byteになるけどメリットはあまりない。

1データが32byteとしても、5000万件掛ければ 1525Gbyte。

どんなキーで並べておくのが検索しやすいのかなぁ。
名前の登録ミス、数字の登録ミス、年号のミスこれらの助長性を持たせながら曖昧検索するとなると結構な処理時間になります。

データベースの方に曖昧さを持たせたキーを置いておくか、キーそれぞれでデータベースを作っておくか。それとも、検索要求する方に曖昧さを持たせて、端末側1検索の要求で同時に複数の要求を出すか。

前者ならデータ量が数倍とか十数倍になるし、後者だと処理能力の方に負荷ががかかります。

====================

15年前のソフト屋さんだったら、ファジーが流行っていたので、メンバシップ関数作って、一致度を点数化して、いくら以上なら候補として出力させる、みたいなものを作っちゃいそうですね。
これ総当たりになるから凄い処理時間が掛かる。

でも、「記録有りません」っていうためには、最後はこういうのをしないとダメなんじゃないでしょうか。
とすると、最終的には総当たり。

まず、5000万件の行方不明データそのものを50万件くらいにする。

 1)加入者や企業/市町村記録から単純突き合わせ。
 2)死亡者の確認。

そんでもって総当たり大作戦開始。

うーん、それでも、来年5月までに終わらせるのは難しいように思うなぁ。

不明者5000万件が20万件になりました、くらいが良い所じゃないかな。

あなたなら残り何件なら許してあげる?


おいらは(5月の時点で)1万件以下なら「よく頑張ったね」って言ってあげるよ。
銀行が1万件の口座無くしたっていうと凄いことなんですけどね。


こういう作業って、最後残ったのをつぶしていくのが大変なんだよね。
ソフトのバグ取りでも、製造不良品の解析でも。残りの1割に半分以上の時間なんてよくある。

|

« 学資保険の失敗談(その2) | トップページ | 子供を産むと得? 教育費の公費負担1600万円。 »

FP-年金・老後」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/61456/15372384

この記事へのトラックバック一覧です: 混雑状況サービス、止まってます(年金):

« 学資保険の失敗談(その2) | トップページ | 子供を産むと得? 教育費の公費負担1600万円。 »