データサイエンティスト

【初心者向け】共分散構造分析とは?パス図と共にわかりやすく解説

こんにちは、まさかめです。
この記事では共分散構造分析とパス図について解説していきます。

共分散構造分析は一見難しそうに感じますが、この記事ではなるべく複雑な用語を使わずわかりやすく伝えていきますのでご安心ください。

まさかめ
まさかめ
データサイエンスには必要な知識だからしっかり学んでおこう!

共分散構造分析とは?

共分散構造分析(SEM:Structural Equation Modeling)とは、多変量解析の手法の一つで、事象に対する因果関係がどうなっているかを分析するためのものです。

まさかめ
まさかめ
これだけだとなんのこっちゃって話だと思うから噛み砕いてくよ

まず、多変量解析は「いろいろな種類のデータを使って分析すること」です。
重回帰分析やクラスター分析など、非常に多くの分析手法があります。

また、因果関係とは「2つの要素のうち、どちらかが原因でどちらかが結果」という関係のことです。

つまり、共分散構造分析は様々な種類のデータに対して、データ間の因果関係を明らかにするための分析手法の一つということになります。

まさかめ
まさかめ
要するに共分散構造分析はいろいろな種類のデータに対して、データ間の因果関係を調査するための分析手法ってこと!

パス図とは何か?

パス図はデータごとの相関係数・因果関係の方向(何のデータがどのデータに対して影響を及ぼしているか、もしくは及ぼし合っているか)をビジュアライズするためのものです。

共分散構造分析やパス解析などといったデータ間の関係性を明らかにする際に用いられることが多く、記載には一定のルールがあります。

まさかめ
まさかめ
データ間にどういった関係性があるかを図示するためのものだね!

 

具体的なパス図記載のルールは下記の通りです。

このときの矢印をパスというためパス図を言われています。
また、実際の作成する際はパスのそばに係数を記載します。

まとめ

今回は共分散構造分析とパス図について解説しました。

共分散構造分析は様々な種類のデータに対して、データ間の因果関係を明らかにするための分析手法であり、パス図はデータごとの相関係数・因果関係の方向をビジュアライズするためのものです。

相関関係と因果関係を正しく理解することはデータを正しく扱う一歩となりますので、
何らかのデータ間の関係を分析する際は上記について注意しながら分析を行いましょう。