결과: 회귀
이것은 Auto Model의 마지막 단계로, 생성된 모델과 다른 결과들을 함께 검사할 수 있습니다.
출력은 데이터와 사용자가 선택한 옵션에 따라 달라집니다. 예를 들어, 상관관계 계산이나 의사결정 트리 계산을 비활성화한 경우, 해당 결과는 표시되지 않습니다.
결과는 백그라운드에서 계산됩니다. 하지만 계산이 완료된 결과부터 즉시 확인할 수 있습니다.
하단의 Stop 버튼을 눌러 백그라운드 실행을 중단할 수 있습니다.
실행을 중단할 때까지 완료되지 않은 계산은 결과로 제공되지 않습니다.
실행이 완료되거나 중단된 후에는 다시 돌아가 변경할 수 있습니다.
Altair RapidMiner는 블랙박스 접근을 지양합니다.
따라서 언제든지 모델과 관련된 결과를 생성한 프로세스를 열어볼 수 있습니다.
결과를 클릭한 다음 화면 상단의 Open Process를 클릭하면,
모든 필요한 데이터 전처리 및 모델 최적화를 수행한 프로세스를 볼 수 있습니다.
이 프로세스를 사용하여 모델을 배포하거나 추가 최적화의 출발점으로 삼을 수 있습니다.
이제 아래에서 가능한 결과들을 자세히 살펴보겠습니다.
비교
두 개 이상의 모델을 선택한 경우, 이 섹션에서는 빠른 비교를 제공합니다.
- 개요: 모델들의 정확도와 실행 시간을 보여줍니다.
모델
결과 메뉴의 다른 모든 섹션은 모델에 관한 내용입니다.
각 모델은 고유의 섹션을 가지며 일반적으로 아래 항목들을 제공합니다.
- 모델: 가능한 경우 모델의 시각화를 보여줍니다.
- 가중치: 특정 모델의 예측에 가장 큰 영향을 미치는 열을 보여줍니다.
가중치는 이전 화면에서 '예측 설명' 옵션을 선택한 경우에만 표시됩니다.
- 시뮬레이터: 모델에 대한 입력값을 실시간으로 쉽게 변경하고 출력을 확인할 수 있는 인터페이스를 제공합니다.
입력에 대한 예측과 설명을 보여줍니다.
- 성능: 모델의 예측 정확도와 다른 성능 기준을 나열합니다.
성능은 모델 최적화에 사용되지 않은 40% 홀드 아웃 세트를 기반으로 계산됩니다.
이 홀드 아웃 세트는 7개의 분리된 부분에 대해 성능을 계산하는 다중 홀드 아웃 세트 검증에 사용됩니다.
가장 크고 가장 높은 성능을 제외하고, 나머지 5개의 성능 평균이 여기에 보고됩니다.
이 검증은 전체 교차 검증만큼 철저하지 않지만, 실행 시간과 모델 검증 품질 간의 균형을 잘 맞춘 접근법입니다.
- 최적 파라미터: 모델의 성능을 다양한 파라미터 설정에 대해 보여줍니다. 자동 최적화된 모델에 대해서만 생성됩니다.
- 특성 집합: 특성 엔지니어링이 활성화된 경우에만 표시됩니다. 특성 집합 복잡성과 모델 정확도 간의 최적 트레이드오프를 모두 보여줍니다.
트레이드오프 플롯에서 점을 선택하면 하단에서 해당 특성 집합을 볼 수 있습니다.
- 예측: 타겟 열의 값이 누락된 각 행과 40% 홀드 아웃 세트에 대해 예측과 그 예측에 대한 설명을 제공합니다.
설명은 이전 화면에서 '예측 설명' 옵션을 선택한 경우에만 표시됩니다.
- 예측 차트: 40% 검증 케이스에 대해 예측 값과 실제 값을 비교하여 보여줍니다.
플롯에서 각 점은 특정 예측과 그 실제 값을 나타냅니다. 점들이 오렌지색 선에 가까울수록 모델이 더 좋습니다.
일반
이 섹션은 모델과 무관한 일반적인 정보를 보여줍니다.
- 데이터: 모델링을 위해 변환된 데이터 세트입니다. 이는 모든 모델링 방법과 자동 특성 엔지니어링의 입력 데이터입니다.
모델은 이 데이터의 일부만 사용하거나 추가 열을 생성할 수 있습니다.
- 텍스트: 텍스트 데이터에서 특성 추출이 활성화된 경우에만 표시됩니다. 분석에 사용된 텍스트 열의 단어를 테이블과 워드 클라우드로 보여줍니다.
또한, 해당 단어들이 강조된 훈련 및 평가 문서를 검사할 수 있습니다. 감정 분석이나 언어 계산을 활성화한 경우,
모든 텍스트 열에 대해 이러한 값들의 분포를 검사할 수 있습니다.
- 상관 관계: 열 간의 상관 관계를 보여주는 행렬입니다.