仕事で日本の鉄道路線一覧と駅一覧が欲しくなったので、データがどっかに転がっていないか探す。
国土地理院のサイトへ行ったらGIS(地理情報システム)データが置いてあったので、そこから施設情報として鉄道関連を抜き出してデータベースに突っ込んで、重複をまとめたら出来るかなと考えた。
早速ブロードバンドを活かしてサイトごと4GBぐらいのデータ(だって市区郡別にファイル分かれてて一個ずつダウンロードしてられなかったし)を一気にダウンロード!!
データはよく分からないテキスト形式だったが、XML形式に変換するプログラムも一緒に公開されていたのでそれで一旦XMLにすることにする。
日本全国、市区郡のファイルから、どのデータ(道路・河川・鉄道・施設等々)を変換するか選ばされるんだけど、変換プログラムのインターフェースがいけてなさ過ぎ。
市区郡一個ずつ、変換対象を選ばないといけない…。
どないしたものかと変換プログラムを見ていたら、iniファイルで認識するデータの種類が定義されていたので鉄道関連のデータしか見ないようにiniファイルを書き換える。
そして一気に変換!!
とか思ったら所々データの不備があるようで、変換プログラムがエラーを出す。
エラーの時に「全てスキップ」「スキップ」「終了」というダイアログが出るんだけど、全てスキップを選ぶとまたエラーが出て変換自体が終了してしまう。
結局毎回スキップを選ぶことになるのだが、変換に凄い時間がかかって、日付変わる頃からやっててそろそろ寝たいんだけどなぁ。半分は過ぎたけど。
でもこのデータ、2004年の1月のデータなんだよなぁ。
客の案件で欲しいなぁと思ったんだけど、誰がメンテナンスするんだよ、と。
で、ほかに探してみたら
http://www17.pos.to/~navit/navit_hp/navitou/train_db.html
とかみつかった。初回180まんえんで、メンテが90まんえん…。なんちゅう恐ろしい値段なんだ。
とてもそんな予算降りないのは分かってるし、この仕様自体が却下だな。
根本的な問題点、国土地理院のGISデータは駅名がひらがなしか入ってなかった。
返信削除