10.2. 主成分分析

主成分分析,Principle components analysis (PCA),はデータの組を抽象的に分解する手法です.

注釈

この章は未完成です.

ここでは,塩化金が金属状態の金に還元されていく時系列変化の試料について正しく処理されたデータを含むプロジェクトファイルを読み込みます.このプロジェクトファイルには8つの異なる時間についてのデータと9つの標準スペクトルを含んでいます.主成分分析 (PCA) を実行する前にデータの整列および規格化について正しく行うことは強調してもしすぎることはありません.データが正しく処理されていなければ,主成分分析を行ったとしても何の役にも立たない結果が出てくることに注意してください.(訳注: データ処理に関する定型句とも言える This is truly a case of garbage-in/garbage-out. の訳)

それでは,メインメニューから PCA ツールを選択してください.

../_images/pca.png

図 10.5 PCA ツール

PCA ツールの操作コンセプトは標準の ATHENA グループ選択ツールを利用するというものです.マークのついたグループのまとまりが PCA が実行されるデータとして利用されます.選択されたグループ(すなわちグループリストで強調されているもの)は再構成することも,ターゲット変換することもできます.関連する制御項目は選択されたグループがマークされているか(つまり,PCA で使われるデータの1つかどうか)あるいはそうでないか(つまり,ターゲット変換の対象であるか)によって,実行可能になったり不可能になったりします.

Perform PCA ボタンをクリックすると,必要に応じてデータの規格化が行われ,成分分析が実行されます.終わると,結果の一部がテキストボックスに表示され,いくつかのボタンが有効化されます.

PCA が完了すると,抽出された成分がプロットされます.このプロットは,Plots とあるところの下の Components ボタンをクリックすることで再び表示することができます.近くのスピンボックスでいくつの成分を表示するか変更することができます.1つめの成分は,多くの場合,他のものよりも遥かに大きいので,1つめの(最も大きな)成分を表示から除外するために数字を2に設定するとよい場合が多いでしょう.

他のプロットオプションには,分析範囲でのデータの積み上げ,scree プロット(すなわち,PCA の固有値)あるいはその対数プロット,そして累積寄与率(すなわち,固有値の和を固有ベクトル空間の大きさで割り算したもの)があります.クラスター分析のプロットについてはまだ実装されていません.

PCA が実行されると,データを1つあるいはそれ以上の主成分を使って再構成することができます.ここでは,例えば,最初の3つの成分を使って,中間のスペクトルの再構成を行います.

../_images/pca_components.png

図 10.6 このデータ集合の主成分

../_images/pca_recon.png

図 10.7 PCA 再構成

グループリストの標準のうちの1つを選択すると,Target transform ボタンが有効化されます.これをクリックすると,変換の結果が表示され,小さなテキストボックスに変換の係数が表示されます.

../_images/pca_tt.png

図 10.8 標準データに対するターゲット変換

../_images/pca_tt_good.png

図 10.9 金箔に対するターゲット変換がうまくいった例.実際のところ,金箔は PCA に使われたデータ集合の一部です.

../_images/pca_tt_bad.png

図 10.10 金シアニドに対するターゲット変換がうまくいかない例.確かに,金シアニドは PCA に使われたデータ集合の構成要素ではありません.

PCA ツールで実装されていない事柄については,私の Github サイト にあります.




DEMETER is copyright © 2009-2016 Bruce Ravel – This document is copyright © 2016 Bruce Ravel

This document is licensed under The Creative Commons Attribution-ShareAlike License.

If DEMETER and this document are useful to you, please consider supporting The Creative Commons.