GIS奮闘記

現役GISエンジニアの技術紹介ブログ。主にPythonを使用。

スポンサーリンク

GISでよく使われるデータ形式

本日はGISでよく使われるデータ形式について書いてみようと思います。実はGISの世界では様々はデータ形式がありますが、その中でもよく使う形式は数個くらいかと思います。

すべての形式を説明することはちょっと難しいので、今回は私が主に使用するデータ形式を紹介します。参考までにですが、以下にArcGISでサポートされているデータ形式の一覧が記載されていますので、興味のある方はぜひ読んでみてください。
desktop.arcgis.com

そもそもArcGISって何?という方は以下のエントリーを読んでみてください。
www.gis-py.com


また、データ形式以外にもGISについて色々勉強したいと思っている方は以下のエントリーを参考にしてみてください。きっとお探しの情報を見つけることができると思います。
www.gis-py.com

Shape(*.shp)

GISで一番よく使われるデータ形式かと思います。建物や道路やなどの位置や形状、属性情報を持つベクターデータ(ポイント、ライン、ポリゴン)を格納することができます。 ESRI製で仕様も公開されています。

f:id:sanvarie:20181024134017p:plain

ファイル構成

Shapeファイルは複数のファイルから構成されていて。必須ファイルのうち 1 つでも欠けるとShapeファイルと認識することができません。

①必須ファイル:
.shp —Shape規格;地形情報の本体。
.shx —Shapeインデックス規格;地形データの前方検索、後方検索を高速にするための位置インデックス
.dbf —属性規格;各Shapeに対する縦表形式の属性情報。dBASE IV形式準拠。

②オプションのファイル:
.prj —投影規格;座標系および投影情報。投影法をWell-known text形式で記述したプレーンテキストファイル。
.sbn及び.sbx —空間インデックス;
.fbn及び.fbx —読み取り専用空間インデックス;
.ain及び.aih —テーブル内アクティブフィールドの属性インデックス
.ixs —読み書き用ファイルのジオコーディングインデックス
.mxs —読み書き用ファイルのジオコーディングインデックス(ODB規格)
.atx —DBFファイルの属性インデックス(ArcGIS Ver8以降)
.shp.xml —ISO 19115や他のXMLスキーマ言語などのXML形式地理空間メタデータ、
.cpg —使用した文字コードの識別コードページ(DBF専用)指定

DXF/DWG(*.DXF/*.DWG)

DXF/DWGはCADの世界で使われる形式ですが、GISの世界でもよく使われます。

DXFのDWG違いとは?
  • 「DXF」ファイルは、基本保存形式の違うCAD間でデータを受け渡しするための中間ファイル形式で、多くのCADが「DXF」形式の読み書きをサポートしています。
  • 「DWG」ファイルは、AutoCADの ファイル形式です。

CADなので、施設の設計などに使われることが多いです。

f:id:sanvarie:20181024135342j:plain

ラスター

ラスター データは、行と列の格子状(グリッド状)に並んだセル(ピクセル)で構成されるデータです。要するに画像ファイルです。ただ、ラスターはファイル形式ではなく、以下のようなデータの総称ですね。

f:id:sanvarie:20181024135720j:plain

ラスタデータの主なファイル形式について
形式 特徴
BMP Windowsで標準的に使われている形式
JPEG デジカメ画像やWebでの写真画像によく利用されている形式
TIFF 画像を劣化させずに圧縮が可能な形式
GIF 最大256色で構成される 。2次元の画像に適した形式
PNG Webように作られた形式。フルカラー1670万色を表現できる
GEOTIFFとは

TIFFの中でも座標を持ったTIFFはGEOTIFFと呼ばれます。GEOTIFFに関しては以下のエントリーで紹介していますので、興味のある方はぜひ読んでみてください。

www.gis-py.com

航空写真なんかは大体GEOTIFFで扱われているかと思います。航空写真に関しては以下のエントリーで紹介していますので、興味のある方はぜひ読んでみてください。
www.gis-py.com

GeoJson(*.geojson)

GeoJsonは割と最近のデータ形式で、Jsonを用いて空間データをエンコードし非空間属性を関連付けるデータ形式です。要するにテキストを使ってGISデータを扱おうということですね。

f:id:sanvarie:20181024140926p:plain

GML(*.gml)

GMLはOpen Geospatial Consortium (OGC)によって開発された地理的特徴を表現する XMLベースのマークアップ言語です。自分はあまり使うことはありませんが、かなり有名なフォーマットだと思います。

国土数値情報ダウンロードサービスなんかはGML形式でダウンロードできますね。

国土数値情報って何?という方は以下エントリーを読んでみてください。
www.gis-py.com

KML(*.kml)

KMLは、XML ベースの形式で、地理データと関連コンテンツを格納するためのデータ形式です。有名なところだとGoogle EarthはKMLのインポートとエクスポートができます。また、多くのGISエンジンがKMLに対応しているので、こちらも非常に使いやすい形式ですね。

f:id:sanvarie:20181024142017j:plain

ファイル ジオデータベース(*.gdb)

ArcGIS用のデータ形式です。ファイルジオデータベースはディスク上の 1 つのフォルダーに格納されたファイルの集合であり、空間データと非空間データの両方を格納、検索、管理できます。フォルダ(*.gdb)の中に以下のようなファイルが格納されています。

f:id:sanvarie:20181024142554p:plain

CSV(*.csv)

意外かと思いますが、CSVもよく使われる形式の一つです。
位置参照情報ダウンロードサービスではCSVデータのダウンロードが可能です。

位置参照情報って何?という方は以下エントリーを読んでみてください。
www.gis-py.com

DM(ディジタルマッピング)(*.dm)

DM は国土交通省公共測量作業規程に基づいて作成されたデータ形式です。地形データですね。ただ、このファイルをそのまま読み込むことができるGISエンジンというのはほとんどなく、実際に利用する際はShapeなどに変換する必要があります。

OSM(* .osm)

OSMはOpenStreetMap専用のファイル形式です。OpenStreetMap以外ではこの形式を利用していません。

OpenStreetMapって何?という方は以下のエントリーを読んでみてください。
www.gis-py.com

色々紹介しましたが、正直、Shape、DXF/DWG、ラスターだけでほとんど事足りるかもしれません。後は皆さんがどのようにGISを利用されているかによると思います。ただ、データ形式が色々あるといっても基本的な考え方は同じなので、使ったことないデータ形式のファイルに出会ったとしても恐れることは無いかと思います。

これからGISを使い始めるという方はまずはShapeファイルから使ってみるといいかと思います。以下のエントリーでGISデータのダウンロードができるサイトを紹介していますので、ぜひ色々なデータ形式を使ってみてください。

www.gis-py.com