결과: 클러스터링
이것은 Auto Model의 마지막 단계로, 생성된 모델과 기타 결과들을 함께 확인할 수 있는 단계입니다.
출력 결과는 데이터와 사용자가 선택한 옵션에 따라 달라집니다. 예를 들어, 상관관계나 k-평균 계산을 비활성화한 경우,
해당 결과는 표시되지 않습니다.
결과는 백그라운드에서 계산됩니다. 하지만 계산이 완료된 결과부터 즉시 확인할 수 있습니다.
하단의 Stop 버튼을 눌러 백그라운드 실행을 중단할 수 있습니다.
실행을 중단할 때까지 완료되지 않은 계산은 결과로 제공되지 않습니다.
실행이 완료되거나 중단된 후에는 다시 돌아가 변경할 수 있습니다.
Altair RapidMiner는 블랙박스 접근을 지양합니다.
따라서 언제든지 모델과 관련된 결과를 생성한 프로세스를 열어볼 수 있습니다.
결과를 클릭한 다음 화면 상단의 Open Process를 클릭하면,
모든 필요한 데이터 전처리 및 모델 최적화를 수행한 프로세스를 볼 수 있습니다.
이 프로세스를 사용하여 모델을 배포하거나 추가 최적화의 출발점으로 삼을 수 있습니다.
이제 아래에서 가능한 결과들을 자세히 살펴보겠습니다.
클러스터 결과
결과 메뉴의 다른 모든 섹션은 클러스터 모델에 예약되어 있습니다.
각 클러스터 모델은 독립된 섹션을 가지며 일반적으로 아래 항목들을 포함합니다.
- 요약: 발견된 모든 클러스터의 크기와 클러스터에 대한 정보, 품질 정보를 보여줍니다.
- 히트맵: 각 클러스터에 대해 가장 중요한 속성을 식별합니다.
- 클러스터 트리: 클러스터 간 주요 차이를 설명하는 결정 트리를 보여줍니다.
- 중심 차트: 클러스터 중심점의 값을 평행 좌표 차트로 표시합니다.
- 중심 테이블: 클러스터 중심점의 값을 표로 보여줍니다.
- 산점도: 선택된 클러스터를 기준으로 가장 중요한 두 속성에 대한 산점도를 보여줍니다.
- 클러스터링된 데이터: 각 데이터 포인트에 대한 클러스터 레이블을 포함한 전체 데이터를 테이블로 보여줍니다.
- 특성 집합: 특성 선택이 활성화된 경우에만 표시됩니다.
특성 집합의 복잡성과 클러스터링 품질 간의 최적 절충점을 모두 보여줍니다.
절충 플롯의 임의의 점을 선택하면 하단에 해당 특성 집합을 확인할 수 있습니다.
일반
이 섹션은 모델과 무관한 일반 정보를 보여줍니다.
- 데이터: 모델링을 위해 변환된 데이터 세트입니다.
- 텍스트: 텍스트 데이터에서 특성 추출이 활성화된 경우에만 표시됩니다.
분석에 사용된 텍스트 열의 단어들을 표와 워드 클라우드로 보여줍니다.
강조된 단어가 포함된 학습 및 예측 문서를 확인할 수 있습니다.
감정 분석 또는 언어 분석 기능이 활성화된 경우, 해당 텍스트 열에 대한 값 분포도 확인할 수 있습니다.
- 상관관계: 속성 간의 상관관계를 보여주는 행렬입니다.