第7回:Qlikデータモデル入門① ~Qlikで学ぶデータ分析~
更新日:2023年4月22日
分析用データを準備する!
Qlik Senseでデータモデルを考えてみよう
突然ですが、データ分析するにあたって地味ながらとても大切なことがあります。
それは、分析するデータを準備することです。「分析に必要なデータ」を「分析に適した形に整える」ことで、適切なデータモデルを作れるようになりましょう。
ーー
※
ここではQlik Senseのデータモデルをご説明します。一般的なデータベースのデータモデルとは異なるのでご了承ください。
また、細かな技術知識というよりは、Qlik Senseデータモデルの基本的な考え方を理解することを目標にして説明していきます。
ーー
■データモデルとは
データモデルとは、分析で利用するデータ構造の事です。下図のように、単一のテーブルだけで完結されるものもあれば、複数テーブルで構成されるものもあり、さらには各テーブル同士の紐付け有無の考慮も必要になります。
※Qlik Senseのデータモデルは、「データモデルビューア」にて下図のようなイメージを確認することができます。
■関連用語の理解
データモデルの検討を行う上で、用語の理解は重要です。 以下に代表的なものを挙げていますが、これらの用語が理解出来ていないと、Qlik Sense上でのイメージが沸きづらくなります。下図を確認しながら、データモデルの検討前に覚えるようにして下さい。
■よくあるデータのパターン5種類
社内データは様々な形式で保管されておりますが、代表的なデータのパターンを5種類をご紹介します。
① 単一のテーブルデータ
最もシンプルなパターンです。必要なデータが全て一つのテーブルに含まれています。
② レイアウトが同じでファイルが複数に分かれたデータ
単一のテーブルデータが複数のファイルに分かれて存在しているパターンです。日ごと
に同じレイアウトのCSVファイルが生成されるなど、ファイルデータによくあるパター
ンです。
③ 「マスタ」「明細」に分かれたデータ
データベースによくあるパターンです。
正規化されており、キーによって関連づけを行うことで、統合的なデータモデルを実現
します。
④ ピボット形式のデータ(値が横に展開されている)
業務利用しているExcelデータによくあるパターンです。
データ値がカラムとして展開されているため、一般的なデータ分析には向いておらず、
テーブル形式に加工して取り扱う必要があります。
サンプル図のように、年月が横に展開されているケースがよくあります。
⑤ 複数の明細に分かれているデータ
「予算」と「実績」など、複数の明細データがそれぞれに存在しているパターンです。
データの内容によって、データモデルに工夫が必要となります。
Comments