메인 데이터 뷰는 데이터의 표준 뷰입니다. 여기에서 모든 데이터 변환을 시작하고 현재 작업 중인 데이터 세트를 관리할 수 있습니다. 데이터 세트를 변경하는 동안, 시스템은 배경에서 이러한 작업을 기록하고 이를 기반으로 프로세스를 생성할 수 있습니다. 따라서 이 새로운 인터페이스로 작업하기는 쉽지만, Altair AI Studio 프로세스 디자인 뷰의 장점을 유지할 수 있습니다. 이 프로세스를 통해 데이터 준비 과정을 살펴보고 배울 수 있으며(블랙박스가 아닙니다!), 프로세스를 변경하거나, 루프 및 분기와 같은 복잡한 개념을 추가하거나, 새로운 데이터 세트에 또는 정기적으로 프로세스를 적용할 수 있습니다.
Turbo Prep의 작동 방식에 대한 아이디어를 얻으려면 아래의 짧은 소개 비디오를 시청하세요:
이 섹션에서는 데이터를 관리하는 방법을 설명합니다.
화면 왼쪽에는 이 세션에서 Turbo Prep에 로드한 데이터 세트 목록이 표시됩니다. 상단의 데이터 로드 버튼을 클릭하여 추가 데이터 세트를 추가할 수 있습니다. 또한 항목을 먼저 선택한 다음 제거하여 이 목록에서 항목을 제거할 수 있습니다. 목록 항목에서 오른쪽 클릭을 수행할 때 표시되는 컨텍스트 메뉴에서 제거 작업을 찾을 수 있습니다. 또는 화면 오른쪽 상단의 점 메뉴에서 찾을 수 있습니다.
일반적으로 작업하려는 데이터 세트를 클릭하여 선택합니다.
선택한 데이터는 화면 중앙에 표시됩니다. 이 데이터 뷰는 Turbo Prep의 핵심이며, 변경 사항을 확정하거나 취소한 후에는 항상 이 뷰로 돌아옵니다.
데이터 테이블은 여러 부분으로 구성되어 있으며, 아래에서 위에서 아래로 설명합니다:
데이터를 오름차순 또는 내림차순으로 정렬할 수 있습니다. 열을 마우스 오른쪽 버튼으로 클릭하고 컨텍스트 메뉴에서 순서를 선택하면 됩니다. 같은 방식으로 정렬을 변경하거나 취소할 수도 있습니다. 이는 데이터 자체가 아닌 현재 데이터 뷰만 정렬한다는 점에 유의하세요. 데이터를 영구적으로 정렬하려면 변환 그룹의 정렬 변환을 사용하면 됩니다.
열을 클릭하여 선택할 수 있습니다. Ctrl 키를 누른 상태에서 추가 열을 클릭하여 여러 열을 동시에 선택할 수 있습니다. 열을 선택 해제하려면 Ctrl 키를 누른 상태에서 클릭합니다. 마지막으로 선택한 열부터 시작하는 열 범위를 선택하려면, Shift 키를 누른 상태에서 원하는 범위의 마지막 열을 클릭합니다. 동일한 유형의 모든 열을 선택하려면 Alt 키를 누른 상태에서 열을 클릭하면 됩니다. 해당 열과 동일한 유형의 다른 모든 열이 선택됩니다. 마지막으로, Ctrl과 A 키를 눌러 모든 열을 선택할 수 있습니다.
특정 열에 대해 변환 또는 정제 작업을 수행하려면, 현재 선택된 열 중 하나를 마우스 오른쪽 버튼으로 클릭하고 컨텍스트 메뉴에서 변환 또는 정제 작업 중 하나를 선택하면 됩니다. 변환 또는 정제 화면으로 이동하며, 이미 변환과 열이 미리 선택되어 있습니다. 여전히 변환을 적용하여 결과를 확인하고 확정해야 합니다.
열을 제거하는 변환(하나 또는 여러 열을 삭제하기 위한)을 시작하는 또 다른 유용한 방법은 일부 열을 선택한 후 Delete 키를 누르는 것입니다. 이렇게 하면 변환 화면으로 이동하며, 왼쪽의 적용을 클릭하거나 Enter를 눌러 제거 변환을 적용할 수 있습니다. 결과를 확정하는 것을 잊지 마세요. 그 후에 이 메인 뷰로 돌아오게 됩니다.
열에 대한 더 자세한 정보를 보려면, 선택한 열을 마우스 오른쪽 버튼으로 클릭하고 컨텍스트 메뉴에서 세부 정보 표시...를 선택하세요. 더 큰 분포 차트, 품질 측정에 대한 자세한 정보(아래 참조), 그리고 열에 대한 일부 통계를 보여주는 대화 상자가 표시됩니다. 상단의 화살표 버튼을 사용하거나 왼쪽 및 오른쪽 키를 눌러 열을 탐색할 수도 있습니다.
AI Studio는 일반적인 데이터 품질 문제를 한눈에 볼 수 있는 독특한 방법을 제공합니다. 이러한 문제는 아래에 지정된 색상으로 인코딩됩니다(예: 누락되거나 무한한 값은 빨간색). 다음은 이러한 품질 측정이 계산되는 방법과 그 의미에 대한 세부 정보입니다:
아래 작업으로 데이터를 변경하고 조작할 수 있습니다.
Turbo Prep의 모든 데이터 조작은 다섯 개의 그룹으로 구성되어 있습니다:
이러한 모든 작업은 화면 상단의 작업 표시줄 오른쪽 부분이나 오른쪽의 점 메뉴에서 사용할 수 있습니다. 화면 왼쪽의 데이터 세트를 마우스 오른쪽 버튼으로 클릭하고 표시된 컨텍스트 메뉴에서 선택하여 액세스할 수도 있습니다.
모델: 여기에서 바로 Auto Model을 시작할 수 있습니다. 모델 버튼을 클릭하면 됩니다. 처음 사용하는 경우, Turbo Prep이 현재 결과를 저장하고 Auto Model이 가져올 수 있는 임시 저장소를 지정해야 합니다. 이 경우 대화 상자의 단계를 따르세요. 두 번째부터는 다시 묻지 않고 바로 모델링을 시작할 수 있습니다.
차트: 산점도나 막대 차트와 같은 일반적인 차트로 데이터를 시각화할 수 있습니다.
프로세스: 기본 프로세스를 열고 고급 변경을 하거나 새 데이터 세트에 적용할 수 있습니다. 프로세스를 클릭하여 디자인 뷰로 전환하고 전체 데이터 변환 프로세스를 표시합니다. 프로세스를 검사하면 내부를 살펴보고 데이터 준비 작업의 세부 사항을 배울 수 있습니다(블랙박스가 아닙니다!). 또한 프로세스를 변경하고, 루프 및 분기와 같은 복잡한 개념을 프로세스에 추가하거나, 단순히 새 데이터 세트에 프로세스를 적용하거나 Altair AI Hub에서 예약하여 정기적으로 적용할 수 있습니다.
히스토리 및 롤백: 실수를 했다면 언제든지 이전 결과로 돌아갈 수 있습니다. 히스토리 버튼을 누르면 지금까지 수행한 모든 변경 사항을 볼 수 있습니다. 이전 상태로 롤백하거나 이전 상태의 복사본을 만들어 현재 데이터와 해당 변환을 유지하면서 다시 시작할 수 있습니다.
내보내기: 결과가 마음에 들면 다시 저장소에 저장할 수 있습니다. 내보내기 버튼을 누르고 데이터를 저장할 위치를 선택하세요. 또한 데이터를 Excel이나 CSV 파일로 저장하거나 데이터 시각화 플랫폼으로 내보낼 수도 있습니다.
이름 바꾸기: 왼쪽의 데이터 세트 목록에서 이 데이터 세트의 이름을 바꾸려면 이 버튼을 클릭하면 새 이름을 묻는 대화 상자가 표시됩니다. 데이터 세트 이름은 Turbo Prep 세션 내에서 고유해야 합니다.
복사: 지금까지 수행한 모든 데이터 조작을 포함하여 데이터의 복사본을 만듭니다.
제거: 현재 작업 중인 데이터 세트 목록에서 데이터 세트를 제거합니다. 이는 이 목록에서만 데이터를 제거하며, 저장소에서는 제거하지 않습니다. 결과를 미리 저장하지 않았다면 데이터에 수행한 모든 조작이 손실된다는 점에 유의하세요.
모두 제거: 현재 작업 중인 데이터 세트 목록에서 모든 데이터 세트를 제거합니다. 이는 이 목록에서만 데이터 세트를 제거하며, 저장소에서는 제거하지 않습니다. 결과를 미리 저장하지 않았다면 데이터에 수행한 모든 조작이 손실된다는 점에 유의하세요.