본문 바로가기

Spotfire 초보9

[TIBCO Spotfire] Spotfire & R 6. Spotfire & R 앞서 설명한 기능들은 Spotfire 내에서 제공하는 통계 분석 기능으로 통계를 잘 모르는 사용자 부터 중급 사용자까지 대상으로 기능을 제공하고 있습니다. 하지만 정해진 기능이고 통계분석 툴만큼 자세한 기능을 제공하지 않는데 이런 경우를 위해 Spotfire는 몇가지 통계 분석 언어와 연동이 가능합니다. SAS Matlab S+ R(TERR) SAS, Matlab의 경우 유명한 언어이나 상용이며 S+는 R의 상용버전입니다만 최근에는 더이상 업데이트를 하지 않는 것 같습니다. 가장 쉽게 접근 가능한 언어이자 인기 언어인 R과 연동이 가능하므로 R과의 연동을 통해 해당 기능에 대해서 설명을 하려 합니다. 다만 이런 통계 언어 연동을 위해서는 추가적인 프로그램이 필요합니다. 서버급.. 2019. 11. 26.
[TIBCO Spotfire] Classification Modeling 5-6. Classification Modeling Spotfire의 Classification Modeling은 보통 통계학에서 이야기하는 분류 모형이 아니라 Logisitic Regression을 말합니다. 물론 분류 모형이라는 큰 의미에서는 Logistic Regression도 하나의 모형이긴 합니다만 Spotfire에서는 그것도 Binomial Logistic Regression만 지원합니다. 이게 무엇을 뜻하는 말이냐면 참과 거짓, 증가와 감소 같이 두 개의 값에 대해서만 적용이 가능합니다. 즉 주어진 데이터를 바탕으로 둘 중 하나를 결정하는 모형이라고 이해하면 될 것 같습니다. 만약 사용자가 3개이상의 값을 가지는 Column을 종속변수로 지정할 경우 분류 중 어떤 것을 참으로 놓고 나머지를 .. 2019. 11. 16.
[TIBCO Spotfire]Hierarchical Clustering 5-4. Hierarchical Clustering Hierarchical Clustering은 K-means Clustering과 마찬가지로 군집분석으로 매우 유명한 통계분석 방법입니다. K-means Clustering의 경우와 비슷하게 데이터 간의 유사성 거리 지수를 활용합니다. K-means Clustering은 각 집단의 평균값을 활용하여 거리를 측정하는데 반해 Hierarchical Clustering는 개별 데이터간 거리를 이용하여 하나씩 짝을 이뤄가며 계층 구조를 만들어 줍니다. 자세한 이론은 넘어가고 Spotfire에서 예제를 진행해보겟습니다. 이번에는 Baseball 데이터를 활용하겠습니다. 해당 데이터를 Spotfire로 가져옵니다. 다음 상단 메뉴에서 Tool - Hierarchic.. 2019. 10. 30.
[TIBCO Spotfire] Data Relationship - Chi-square 5-1-3. Chi-Square Chi-Square(교차분석)은 Cetegorical 변수간의 연관성을 분석하기 위한 통계분석 방법입니다. 해당 예제를 위해서 전통적인 예제 데이터를 가져왔습니다. 해당 데이터를 Spotfire로 가져옵니다. 데이터를 가져오면 좌측처럼 되어있습니다. 성별과 지지정당에 대한 값이 들어있는데 해당 예제는 R에서 chi.test()에 포함된 첫번째 예제 데이터입니다. 참고로 R에 포함된 예제 데이터의 경우 우측의 Cross Table와 같이 이미 성별과 지지정당에 대해 집계가 되어있는 상태로 되어있습니다. Spotfire에서는 이런 형태가 아니라 개별 데이터 형태로 되어있어야합니다. 그럼 Data Relationship을 실행하고 Comparision method에서 Chi-s.. 2019. 9. 25.
[TIBCO Spotfire] Tree Map 2-8. Tree Map Tree Map은 데이터가 계층적 구조를 갖고 있다면 이를 타일 형태로 표현한 것을 말합니다. 두가지 정도의 수치적 지표를 넓이 또는 색상(농도)로 표현할 수 있습니다. 데이터를 시각화하는데 굉장히 잘표현할 수 있는 차트이며 다양하게 활용할 수 있는 차트입니다. 데이터는 설명을 위해 아래와 같이 임의로 생성했습니다. 데이터가 있는 상태에서 상단의 Tree Map을 클릭하여 실행하면 아래와 같이 임의의 Tree Map이 생성됩니다. Tree Map에서 차트의 형태를 변화시키는 주로 사용되는 속성은 아래의 3가지입니다. Color by : Tree Map의 각 타일 색상을 결정하는 속성 Size by : Tree Map의 각 타일의 넓이를 결정하는 속성 Hierarchy : 계층 구.. 2019. 6. 20.
[TIBCO Spotfire] Scatter Plot 2-7. Scatter Plot Scatter Plot은 데이터를 점의 형태로 출력하여 데이터의 전반적인 형태를 보거나 x, y 축에 따른 데이터 분포를 통해 상관관계를 유추하는데 사용합니다. 산점도라고 부르는 이 Chart는 실제 두 연속형 변수를 각 축으로 놓아 관계를 보고자 하는 용도이지만 Spotfire에서의 Scatter Plot은 연속형외에도 명목형을 출력하거나 점이 아니 Pie Chart로 표현하는 등 다양한 형태로 변형이 가능합니다. 데이터는 설명을 위해 Iris 데이터를 사용했습니다. Iris는 워낙 유명한 데이터 인데 Iris(붓꽃)의 3종을 구분하기 위해 꽃받침(Sepal), 꽃잎(Petal)의 각각 길이와 폭을 측정한 데이터 입니다. 통계학에서는 군집 분석이나 분류모형에 주로 많이 .. 2019. 6. 18.
[TIBCO Spotfire] Combination Chart 2-5 : Combination Chart Combination Chart는 Bar Chart와 Line Chart를 혼합한 Chart로 두가지 Chart의 특성을 모두 가지고 있으며 옵션 또한 모두 가지고 있습니다. 보통 두가지 이상의 지표를 비교하여 보여 줄 수 있도록 구성합니다. 예를 들면 월별 매출(원)과 달성률(%)과 같이 두가지 지표이면서 단위가 다른 경우에 매우 유용하게 보여 줄 수 있습니다. 데이터는 설명을 위해서 아래와 같이 임의로 생성했습니다. 월별로 매출과 이익 데이터입니다. 데이터가 있는 상태에서 상단의 Combination Chart를 실행하면 임의의 Chart가 생성됩니다. 차트는 제목처럼 Combination Chart이지만 형태는 Barchart처럼 보입니다. 붉은 사각형으로.. 2019. 6. 9.
[TIBCO Spotfire] Data Table TIBCO Spotfire 2-2. Data Table Data Table은 차트라고 하기엔 좀 애매하지만 어쨌든 차트범주에 있으니 차트로 설명을 합니다. 데이터를 Spotfire로 가져왔을 때 데이터의 전체적인 구성을 확인하기 유용한 차트이며 장표를 구성할 경우 Drill-Down 기능을 이용하여 특정 차트에서 마킹한 부분에 대한 실데이터를 확인 하는 용도로 구성할 수 있습니다. 차트를 하나하나 다 설명하고 기능을 다 보여주기에는 너무 내용이 방대하므로 주요한 부분만 집어서 설명하겠습니다. 이는 다른 차트 또한 동일한데 Data Table은 응용의 범위가 적기 때문에 내용이 많지 않지만 다른 차트의 경우 응용 위주 사례로 진행하겠습니다. 칼럼위 위치를 보는 것처럼 마우스로 Drag&Drop하여 변경이 .. 2019. 4. 17.
[TIBCO Spotfire] 가이드 시작 TIBCO Spotfire TIBCO Spotfire는 시각화 분석 솔루션 중 하나로 과거 2014년 전까지만 해도 아주 강력한 분석도구로 활약했습니다. 이후 신규 시각화 분석 솔루션이 등장하고 단순히 분석 기능 뿐만 아니라 시각적 표현의 다양성이 요구 되면서 현재는 성장세가 주춤하는 편인데 아무래도 시각적으로 좀 더 이쁜 Tableau나 획기적으로 변화한 Qlik Sense 에 비하면 사용성 측면 및 차트에 대한 변화가 없는 편입니다. 아주 오랫동안 지속적으로 고객측에서 기능 추가 요청이 있는데도 최근에 들어서야 KPI Chart나 WaterFall Chart가 추가됐습니다. 물론 대표적으로 비교되는 Tableau, Qlik Sense에 비해서 TIBCO Spotfire가 색감이나 차트의 다양성이 떨어.. 2018. 2. 13.