結果:クラスタリング
ここはAuto Modelの最終ステップで、生成されたモデルを他の結果と一緒に確認できます。出力はデータと選択内容によって異なります。例えば、相関関係の計算やk-Meansを無効にした場合、それらの結果は表示されません。
結果はバックグラウンドで計算されることに注意してください。ただし、結果が完成したらすぐに確認を開始できます。画面下部の Stop ボタンを押すと、バックグラウンド実行を停止できます。実行が停止したときに完了していない計算は利用できません。実行が完了した後、または停止した後でも、戻って変更を加えることができます。
私たちAltair RapidMinerはブラックボックスを信用しません。そのため、モデルと関連するすべての結果を作成したプロセスをいつでも開くことができます。結果をクリックし、画面上部のプロセスを開くをクリックするだけです。これにより、必要なデータ前処理とモデル最適化を実行するプロセスが表示されます。このプロセスをモデルのデプロイに、またはさらなる最適化の出発点として使用できます。
以下に、可能な結果について詳しく説明します。
クラスター結果
結果メニューの他のすべてのセクションはクラスターモデル専用です。各クラスターモデルには独自のセクションがあり、一般的に以下の項目が提供されます。
- Summary: 見つかったすべてのクラスターのサイズと、クラスターおよびその品質に関する情報を示します。
- Heat Map: 各クラスターの最も重要な属性を特定します。
- Cluster Tree: クラスター間の主な違いを説明する決定木を表示します。
- Centroid Chart: クラスターセントロイドの値を平行座標チャートで表示します。
- Centroid Table: クラスターセントロイドの値をテーブルで表示します。
- Scatter Plot: クラスターを選択すると、2つの最も重要な属性に関して散布図が表示されます。
- Clustered Data: 各データポイントのクラスターラベルを含むすべてのデータをテーブルで表示します。
- Feature Sets : 特徴量選択が有効になっている場合にのみ表示されます。特徴量セットの複雑さとクラスタリング品質の間のすべての最適なトレードオフを示します。トレードオフプロット内の任意の点を選択すると、下部に特定の特徴量セットが表示されます。
一般
このセクションでは、モデルに依存しない一般的な情報が表示されます。
- Data: モデリングのために変換された後のデータセット。
- Text: テキストデータからの特徴量抽出が有効になっている場合にのみ表示されます。 分析に使用されるテキスト列の単語がテーブルとして、またワードクラウドとして表示されます。さらに、これらの単語が強調表示されたすべてのトレーニングおよびスコアリングドキュメントを確認できます。最後に、感情または言語の計算を有効にした場合は、すべてのテキスト列のこれらの値の分布も確認できます。
- Correlations: 属性間の相関を示す行列。