본문 바로가기

통계분석3

[TIBCO Spotfire] Classification Modeling 5-6. Classification Modeling Spotfire의 Classification Modeling은 보통 통계학에서 이야기하는 분류 모형이 아니라 Logisitic Regression을 말합니다. 물론 분류 모형이라는 큰 의미에서는 Logistic Regression도 하나의 모형이긴 합니다만 Spotfire에서는 그것도 Binomial Logistic Regression만 지원합니다. 이게 무엇을 뜻하는 말이냐면 참과 거짓, 증가와 감소 같이 두 개의 값에 대해서만 적용이 가능합니다. 즉 주어진 데이터를 바탕으로 둘 중 하나를 결정하는 모형이라고 이해하면 될 것 같습니다. 만약 사용자가 3개이상의 값을 가지는 Column을 종속변수로 지정할 경우 분류 중 어떤 것을 참으로 놓고 나머지를 .. 2019. 11. 16.
[TIBCO Spotfire] Data Relationship - Chi-square 5-1-3. Chi-Square Chi-Square(교차분석)은 Cetegorical 변수간의 연관성을 분석하기 위한 통계분석 방법입니다. 해당 예제를 위해서 전통적인 예제 데이터를 가져왔습니다. 해당 데이터를 Spotfire로 가져옵니다. 데이터를 가져오면 좌측처럼 되어있습니다. 성별과 지지정당에 대한 값이 들어있는데 해당 예제는 R에서 chi.test()에 포함된 첫번째 예제 데이터입니다. 참고로 R에 포함된 예제 데이터의 경우 우측의 Cross Table와 같이 이미 성별과 지지정당에 대해 집계가 되어있는 상태로 되어있습니다. Spotfire에서는 이런 형태가 아니라 개별 데이터 형태로 되어있어야합니다. 그럼 Data Relationship을 실행하고 Comparision method에서 Chi-s.. 2019. 9. 25.
[TIBCO Spotifre] Statistic Analytics 5. Statistic Analytics Spotfire 기본적으로 데이터 시각화 분석 툴이지만 조금 더 고급적인 분석 에 대한 사용자들의 요구사항을 충족하기 위해 통계분석 기능들을 내장하고 있습니다. 전문화된 통계분석 툴, SAS, SPSS를 다루기 위해서는 전문적인 지식이 필요할 수가 있는데 Spotfire에서 제공하는 기능들을 전문지식이 없이도 쉽게 결과를 도출할 수 있는 기능 부터 전문 통계 분석가들을 위한 기능까지 제공 하고 있습니다. 대표적인 통계분석으로 Data Relationships이 있는데 이기능은 데이터의 Column들 간의 1:1 연관성을 분석하기 위한 기능입니다. 단순하게 분석 대상들만 정해서 실행하면 결과를 보기 쉽게 출력을 해줍니다. 그 외에도 Clustering을 위한 K-m.. 2019. 8. 30.