The Data View

メインデータビューは、データの標準ビューです。ここから、すべてのデータ変換を開始し、現在作業中のデータセットを管理できます。データセットに変更を加えている間、バックグラウンドでそれらを記録し、それらのアクションに基づいてプロセスを作成できます。そのため、この新しいインターフェースでの作業は簡単ですが、Altair AI Studioプロセスデザインビューの利点を維持できます。プロセスにより、内部を詳しく見てデータ準備プロセスについて学ぶことができます(ブラックボックスではありません!)。しかし、プロセスに変更を加えたり、ループやブランチのような複雑な概念をプロセスに追加したり、新しいデータセットにプロセスを適用したりすることもできます。しかも定期的に。

Introduction Video

Turbo Prepがどのように機能するかを理解するために、以下の短い紹介ビデオをご覧ください。

Turbo Prep - Introduction

Data Management

このセクションでは、データの管理方法について説明します。

The Data Set List

画面左側には、このセッションでTurbo Prepに読み込んだデータセットのリストが表示されます。上部にあるLoad Dataボタンをクリックして、追加のデータセットを追加できます。リストからエントリを削除することもできます。まず選択し、その後削除します。画面右上のドットメニューで、Removeアクション、またはリストのエントリを右クリックしたときに表示されるコンテキストメニューを見つけることができます。

一般的に、作業したいデータセットはクリックして選択します。

The Data Table

選択したデータは画面中央に表示されます。このデータビューはTurbo Prepの心臓部であり、変更をコミットまたはキャンセルした後、常にこのビューに戻ります。

データテーブルは複数の部分で構成されており、以下で上から下へ説明します。

Sorting

データを昇順または降順にソートできます。列を右クリックし、コンテキストメニューから順序を選択するだけです。同様の方法でソートを変更またはキャンセルすることもできます。これはデータの現在のビューをソートするだけであり、データ自体をソートするものではないことに注意してください。データを永続的にソートしたい場合は、TransformグループのSort変換で行うことができます。

Selecting Columns

列をクリックして選択できます。追加の列をクリックしながらCtrlキーを押すと、複数の列を同時に選択できます。列の選択を解除したい場合は、Ctrlキーを押します。最後に選択した列から始まる列の範囲を選択したい場合は、目的の範囲の最後の列をクリックしながらShiftキーを押します。同じタイプのすべての列を選択したい場合は、列をクリックしながらAltキーを押すだけです。列自体と、同じタイプの他のすべての列が選択されます。最後に、すべての列を選択するには、CtrlAキーを押すだけです。

Transformations and Cleansing in Context Menu

特定の列に対して変換またはクリーニングオペレーションを実行したい場合は、現在選択されている列のいずれかを右クリックし、コンテキストメニューからTransformまたはCleanseオペレーションのいずれかを選択できます。変換と列がすでに事前選択されているTransformまたはCleanse画面に移動します。その後、結果を確定してコミットするために、変換を適用する必要があります。

Remove変換(1つまたは複数の列を削除する)を開始するもう1つの便利な方法は、いくつかの列を選択した後でDeleteキーを押すことです。これによりTransform画面に移動し、左側のApplyをクリックするか、Enterを押すことで削除変換を適用できます。結果をコミットすることを忘れないでください。その後、このメインビューに戻ります。

Column Details

いずれかの列に関する詳細を見たい場合は、選択した列を右クリックし、コンテキストメニューからShow Details...を選択します。より大きな分布チャート、品質測定に関する詳細情報(以下参照)、および列に関する統計が表示されるダイアログが表示されます。上部の矢印ボタンを使用するか、LeftおよびRightキーを押して列を閲覧することもできます。

Quality Measures

AI Studioは、一般的なデータ品質の問題を一目で確認できるユニークな方法を提供します。それらは以下で指定された色でエンコードされており、例えば欠損値や無限値は赤で表示されます。これらの品質測定がどのように計算され、何を意味するかの詳細は以下の通りです。

Actions

以下のアクションでデータを変更および操作できます。

Main Manipulation Groups

Turbo Prepにおけるすべてのデータ操作は5つのグループに分類されます。

  1. Transform:: 列の名前変更、フィルタリング、型変換などの単純なデータ変換。
  2. Cleanse:: より良い機械学習モデルを得ることに焦点を当てた(自動)データ準備。
  3. Generate:: 強力な数式エディターで新しい列を生成します。
  4. Pivot:: データセットをグループ化したり、値を集計したり、テーブルを異なる形式に回転させたりします。
  5. Merge:: データセットの結合や追加など、典型的なブレンドオペレーション。

Other Actions

これらすべてのアクションは、画面上部のアクションバーの右側、または右側のドットメニューで利用できます。画面左側のデータセットを右クリックし、表示されるコンテキストメニューから選択することもできます。

Model:ここから直接Auto Modelを開始できます。そのためには、Modelボタンをクリックするだけです。初めてこれを行う場合は、Turbo Prepが現在の結果を保存し、Auto Modelがそこからそれらを取得するための一時的なリポジトリを指定する必要があります。この場合、ダイアログの手順に従ってください。2回目以降は、再度尋ねられることなく、すぐにモデリングを開始できます。

Charts:散布図や棒グラフなどの一般的なチャートでデータを視覚化できます。

Process:基になるプロセスを開き、高度な変更を行ったり、新しいデータセットに適用したりできます。Processをクリックするだけで、デザインビューに切り替わり、完全なデータ変換プロセスが表示されます。プロセスを検査することで、内部を詳しく見てデータ準備オペレーションの詳細について学ぶことができます(ブラックボックスではありません!)。しかし、プロセスに変更を加えたり、ループやブランチのような複雑な概念をプロセスに追加したり、またはAltair AI Hubでスケジュールすることで、新しいデータセットに定期的にプロセスを適用したりすることもできます。

History and Roll-back:間違いを犯した場合でも、いつでも以前の結果に戻ることができます。Historyボタンを押して、これまでに加えたすべての変更を確認します。以前の状態に戻したり、以前の状態からコピーを作成してそこから再度開始したりすることができ、現在のデータとその変換を保持します。

Export:結果が気に入ったら、再度リポジトリに保存できます。Exportボタンを押して、データを保存する場所を選択するだけです。データをExcelまたはCSVファイルに保存したり、データ視覚化プラットフォーム用にエクスポートしたりすることもできます。

Rename:左側のデータセットリストでこのデータセットの名前を変更したい場合は、このボタンをクリックすると、新しい名前を問い合わせるダイアログが表示されます。データセット名はTurbo Prepセッション内で一意である必要があることに注意してください。

Copy:これまでに実行されたすべてのデータ操作を含むデータのコピーを作成します。

Remove:現在作業中のデータセットのリストからデータセットを削除します。これは、リストからデータを削除するだけで、リポジトリからは削除しません。結果を保存しなかった場合、データに行ったすべての操作が失われることに注意してください。

Remove All:現在作業中のデータセットのリストからすべてのデータセットを削除します。これは、リストからデータセットを削除するだけで、リポジトリからは削除しません。結果を保存しなかった場合、データに行ったすべての操作が失われることに注意してください。