Welcome to Turbo Prep!

Turbo Prepは、データセットの管理、操作、準備のための新しいデータ中心のビューを提供します。データを変更すると、それらはバックグラウンドで記録され、それらのアクションに基づいてプロセスを作成できます。この新しいインターフェースは操作が簡単ですが、AI Studioプロセスデザインビューの利点を維持できます。プロセスを使用すると、内部を調べてデータ準備プロセスについて学ぶことができます(ブラックボックスではありません!)。また、プロセスに変更を加えたり、ループやブランチのような複雑な概念をプロセスに追加したり、単に新しいデータセットに、または定期的にプロセスを適用したりすることもできます。

Turbo Prepがどのように機能するかを理解するために、以下の短い紹介ビデオをご覧ください。

Turbo Prep - はじめに

Turbo Prepにおけるすべてのデータ操作は、5つのグループに分類されています。

  1. Transform: 列の名前変更、フィルタリング、型変換などの単純なデータ変換。
  2. Cleanse: より良い機械学習モデルを得ることに焦点を当てた(自動)データ準備。
  3. Generate:強力な数式エディタで新しい列を生成。
  4. Pivot: データセットをグループ化したり、値を集計したり、テーブルを異なる形式に回転させたりします。
  5. Merge: データセットの結合や追加などの一般的なブレンド操作。

データをロードした後、これら5つのグループのアクションをデータに適用することから始められます。ご安心ください。間違いを犯した場合でも、いつでも以前の結果に戻ることができます。結果が気に入ったら、それを再びリポジトリに保存できます。あるいは、基になるプロセスを開いて高度な変更を加えたり、新しいデータセットに適用したりすることもできます。最後に、ここからAuto Modelを直接開始することもできます。

以上が基本です。さあ、始めてデータをロードしましょう。AI Studioに組み込まれているデータセットの1つを最初に使用したい場合でも問題ありません。この場合、サンプルリポジトリにあるTitanicデータセットを使用することをお勧めします。Turbo Prepを使って、タイタニック号で生き残った最も高齢の女性が何歳だったかを見つけることができますか?