본문 바로가기
Data Analysis/Spotfire

[TIBCO Spotfire] Scatter Plot

by 불탄오징어 2019. 6. 18.
반응형

2-7. Scatter Plot


 

Scatter Plot은 데이터를 점의 형태로 출력하여 데이터의 전반적인 형태를 보거나 x, y 축에 따른 데이터 분포를 통해 상관관계를 유추하는데 사용합니다. 산점도라고 부르는 이 Chart는 실제 두 연속형 변수를 각 축으로 놓아 관계를 보고자 하는 용도이지만 Spotfire에서의 Scatter Plot은 연속형외에도 명목형을 출력하거나 점이 아니 Pie Chart로 표현하는 등 다양한 형태로 변형이 가능합니다.

 

데이터는 설명을 위해 Iris 데이터를 사용했습니다. Iris는 워낙 유명한 데이터 인데 Iris(붓꽃)의 3종을 구분하기 위해 꽃받침(Sepal), 꽃잎(Petal)의 각각 길이와 폭을 측정한 데이터 입니다. 통계학에서는 군집 분석이나 분류모형에 주로 많이 사용되는 예제입니다.

 

 

데이터가 있는 상태에서 상단의 Scatter Plot을 실행하면 아래와 같이 임의의 Scatter Plot이 생성됩니다.

 

 

원하는 형태로 변경을 위해 기준을 수정하겠습니다. Scatter Plot에서는 주로 다음과 같은 부분을 수정합니다.

  • X축, Y축
  • Color By : 점의 색상을 결정, 변수를 지정하여 가변적으로 변경되도록 설정 가능
  • Shape By : 점의 모양을 결정, 변수를 지정하여 가변적으로 변경되도록 설정 가능
  • Size By : 점의 크기를 결정, 변수를 지정하여 가변적으로 변경되도록 설정 가능

다른 것들은 그대로 두고 X축만 바꿔보겠습니다. X 축을 "Petal.Width" 변경하면 아래와 같이 Scatter Plot이 변경됩니다.

 

 

첫 Chart 보다 Iris의 종이 잘 구분되어보입니다. Scater Plot은 두개의 축 외에도 Shape와 Size를 이용하여 데이터를 더 다양하게 표현이 가능합니다. Size에 다른 변수를 주어 표현해보겠습니다. 

Size by에 "Petal.Length" 를 부여합니다.

 

 

Petal.Length 값에 따라서 점의 크기가 달라지는 것을 확인할 수 있습니다. "Setosa" 종은 Petal.Length, Petal.Width가 모두 다른 종에 비해서 많이 작은 것을 알 수 있습니다. 점의 크기가 작으니 좀 더 키워보겠습니다. Scatter Plot의 Properties에 Size탭으로 가면 Marker size라는 옵션을 확인 할 수 있습니다.

 

 

이 옵션의 막대를 오른쪽으로 이동하면 점이 점점 더 커집니다. 점의 변화가 도드라져 보이지만 너무 겹쳐져 보입니다. 투명도를 조절하여 겹쳐 있어도 일정 부분 데이터를 확인 할 수 있도록 변경하겠습니다. 이번에는 Properties의 Appearance 탭으로 가면 Trasperency 라는 옵션을 확인 할 수 있습니다.

 

 

이 옵션의 막대를 우측으로 이동하면 점의 투명도가 높아집니다.

Scatter Plot은 앞서 말한바와 같이 단순히 점이 아닌 다른 형태로도 표현이 가능합니다. 이번에는 점 대신 PieChart를 표현한 Scatter Plot을 만들어보겠습니다. 데이터는 다음과 같은 임의로 생성한 데이터를 사용합니다.

 

 

이 데이터를 활용하여 Scatter Plot을 그려봅니다. Scatter Plot을 실행하면 다음과 같은 Chart를 출력합니다. 일단 여기 Color by에 있는 성별을 제거합니다.

 

그다음 "sum(구매고객수)"로 변경하고 Marker by에서 (Row Number)를 제거합니다. 참고로 (Row Number)로 되어있으면 행하나하나를 점으로 출력하게끔 설정하는 조건입니다. 

 

 

아래와 같은 연령대별 구매고객수의 산점도를 얻었습니다. 

 

 

이번에는 이점들을 성별 구매고객수 PieChart로 변경해보겠습니다. Chart 의 Properties로 들어가서 Shape탭으로 이동합니다.

 

 

위와 같이 Shape를 Pies로 설정하고 Sector size by를 "Sum(구매고객수)"로 변경합니다. 다음으로 Colors로 이동합니다.

 

 

Colors의 Columns에 성별을 부여합니다. 다음은 Size 탭으로 이동합니다.

 

 

Marker size의 옵션 바를 우측으로 조금 이동합니다. Properties 를 닫고 보면 아래와 같은 Chart를 얻을 수 있습니다.

 

 

이상으로 간단하게 Scatter Plot의 사용법에 대해서 알아봤습니다.

 

'Data Analysis > Spotfire' 카테고리의 다른 글

[TIBCO Spotfire] Map Chart  (7) 2019.06.25
[TIBCO Spotfire] Tree Map  (0) 2019.06.20
[TIBCO Spotfire] Pie Chart  (1) 2019.06.13
[TIBCO Spotfire] Combination Chart  (0) 2019.06.09
[TIBCO Spotfire] 가이드 목차  (0) 2019.06.04

댓글