본문 바로가기

Spotfire 사용법14

[TIBCO Spotfire] Regression Modeling 5-5. Regression Modeling Spotfire에서 기능 상 Regression 관련 기능이 두 개가 있는데 앞서 설명한 Data Relationship에 있는 Linear Regression과 이번에 소개할 Regression Modeling이 있습니다. 두 기능을 비교해서 말하자면 전자는 단순회귀분석이고 후자는 다중회귀분석입니다. 단순회귀분석은 하나의 종속변수와 하나의 독립변수만을 사용하므로 두 변수간의 선형적인 관계를 분석할 수 있습니다. Regression Modeling은 이와 달리 하나의 종속변수와 다수의 독립변수간의 선형적인 관계를 확인하고 모형을 만들어 예측까지 할 수 있는 기능입니다. Data Relationship의 Linear Regression 보다는 좀더 고급 통계 기.. 2019. 11. 8.
[TIBCO Spotfire]Hierarchical Clustering 5-4. Hierarchical Clustering Hierarchical Clustering은 K-means Clustering과 마찬가지로 군집분석으로 매우 유명한 통계분석 방법입니다. K-means Clustering의 경우와 비슷하게 데이터 간의 유사성 거리 지수를 활용합니다. K-means Clustering은 각 집단의 평균값을 활용하여 거리를 측정하는데 반해 Hierarchical Clustering는 개별 데이터간 거리를 이용하여 하나씩 짝을 이뤄가며 계층 구조를 만들어 줍니다. 자세한 이론은 넘어가고 Spotfire에서 예제를 진행해보겟습니다. 이번에는 Baseball 데이터를 활용하겠습니다. 해당 데이터를 Spotfire로 가져옵니다. 다음 상단 메뉴에서 Tool - Hierarchic.. 2019. 10. 30.
[TIBCO Spotfire] Data Relationship - Chi-square 5-1-3. Chi-Square Chi-Square(교차분석)은 Cetegorical 변수간의 연관성을 분석하기 위한 통계분석 방법입니다. 해당 예제를 위해서 전통적인 예제 데이터를 가져왔습니다. 해당 데이터를 Spotfire로 가져옵니다. 데이터를 가져오면 좌측처럼 되어있습니다. 성별과 지지정당에 대한 값이 들어있는데 해당 예제는 R에서 chi.test()에 포함된 첫번째 예제 데이터입니다. 참고로 R에 포함된 예제 데이터의 경우 우측의 Cross Table와 같이 이미 성별과 지지정당에 대해 집계가 되어있는 상태로 되어있습니다. Spotfire에서는 이런 형태가 아니라 개별 데이터 형태로 되어있어야합니다. 그럼 Data Relationship을 실행하고 Comparision method에서 Chi-s.. 2019. 9. 25.
[TIBCO Spotifre] Statistic Analytics 5. Statistic Analytics Spotfire 기본적으로 데이터 시각화 분석 툴이지만 조금 더 고급적인 분석 에 대한 사용자들의 요구사항을 충족하기 위해 통계분석 기능들을 내장하고 있습니다. 전문화된 통계분석 툴, SAS, SPSS를 다루기 위해서는 전문적인 지식이 필요할 수가 있는데 Spotfire에서 제공하는 기능들을 전문지식이 없이도 쉽게 결과를 도출할 수 있는 기능 부터 전문 통계 분석가들을 위한 기능까지 제공 하고 있습니다. 대표적인 통계분석으로 Data Relationships이 있는데 이기능은 데이터의 Column들 간의 1:1 연관성을 분석하기 위한 기능입니다. 단순하게 분석 대상들만 정해서 실행하면 결과를 보기 쉽게 출력을 해줍니다. 그 외에도 Clustering을 위한 K-m.. 2019. 8. 30.
[TIBCO Spotfire] Information Link 활용법 4-2-4. Information Link 활용법 Spotfire는 데이터 시각화 분석에 최적화된 도구입니다만 활용하기에 따라서는 BI장표로서 활용도 가능합니다. 이것을 가능하게 해주는것이 Information Link가 가지는 기능입니다. 간단하게 예를 들자면 몇가지 옵션을 부여하여 이를 기준으로 데이터를 조회하는 화면을 개발할 수 있습니다. 오늘은 이런 활용법에 대해서 이야기를 해보겠습니다. 먼저 Information Link에서 조건을 받아올 수 있도록 설정을 해보겠습니다. Information Designer를 실행하여 Information Link를 열어줍니다. 그후 하단의 SQL을 클릭하여 SQL 쿼리문을 열어 주고 WHERE 부분에서 아래와 같이 입력을 합니다. "?ITEM"으로 입력을 했는.. 2019. 8. 22.
[TIBCO Spotfire] Add Data Table - Databases 4-1 Add Data Tables - Databases Add Data Tables에서 Databases를 연결하기 위해서는 ODBC 설정이 필요합니다. 먼저 제어판 - 관리도구에서 데이터 원본(ODBC)를 실행합니다. ODBC 데이터 원본 관리자가 실행 되면 추가 버튼을 누릅니다. 데이터 원본과 연결할 드라이버를 선택합니다. 저는 SQL Server Native Client 11.0 를 선택했습니다. 접속을 위한 정보를 구성할 건데 먼저 데이터 원본을 명칭을 입력하고 연결할 서버를 선택합니다. 저는 제 PC 내에 이미 MSSQL 서버를 설치했기 때문에 그냥 "localhost"라고 입력했습니다. 그 외에는 서버의 ip를 입력하면 됩니다. 기본 포트가 아닌 경우는 포트 번호까지 입력해주셔야 합니다. 아.. 2019. 8. 15.
[TIBCO Spotfire] Data Connection 4. Data Connection Spotfire는 데이터 시각화 분석 툴이기 때문에 다양한 Data Source와 연결을 지원합니다. 전통적인 Database인 Oracle, MSSQL 외에도 jdbc 드라이버나 odbc 드라이버를 지원한다면 모두 연결이 가능합니다. 그리고 ADS(Advanced Data Source)라는 프로그램을 통해서 빅데이터 와도 연결이 가능합니다. 데이터 연결을 위한 방법은 크게 두가지인데 Information designer의 Information Link를 이용한 방법과 Add Data Table의 Database를 이용하는 방법이 있습니다. Information designer는 Data source와 information link를 구성하고 관리하기 위한 툴로서 Col.. 2019. 8. 13.
[TIBCO Spotfire] Transformation 3-4. Transformation Tranformation은 원 Data Table에 구조나 Column형식에 직접적으로 수정을 가하는 기능입니다. Column형식을 바꾸는 Change Data types, 구조를 변경시키는 Unpivot, Pivot, Column 명은 변경하거나 Normalization까지 제공하고 있습니다. 해당 기능은 상단 메뉴에서 Insert - Transformation으로 실행할 수 있습니다. 이와 비슷한 화면(기능)을 다른 곳에서도 볼 수 있는데 File - Add data tables의 하단에 이 옵션이 있습니다. 하지만 Transformation과 차이점은 Add Data Table은 데이터 테이블을 추가하면서 Transformation을 적용하는 것이고, Transf.. 2019. 8. 9.
[TIBCO Spotfire] Insert Columns and Rows 3-3. Insert Columns and Rows Insert Columns와 Rows는 말그대로 칼럼을 기존 테이블에 추가하거나 행을 추가하는 기능입니다. Column은 SQL에서 사용하는 JOIN과 동일하게 Key가 되는 칼럼을 기준으로 칼럼을 붙일 수 있으며 Rows는 Union과 동일하게 데이터를 행으로추가할 수 있습니다. 해당 기능은 상단 메뉴 Insert-Columns, Insert-Rows로 실행할 수 있습니다. 3-3-1. Insert Columns 예제를 위해 데이터를 다운로드 받아 Spotfire에 삽입합니다. 엑셀파일은 두개로 각각 Column과 Rows에 대한 예제파일입니다. 첫번째 sample data_column.xlsx Excel 파일에는 고객정보 Sheet와 주문정보 She.. 2019. 8. 2.
[TIBCO Spotfire] Data Handling 3. Data Handling Spotfire를 잘 활용하기 위해서는 데이터 원천이 필요한데 가능하며 분석하고자 하는 방향과 목적에 맞춰서 데이터를 수집하고 잘 가공하는 것이 좋습니다. 사실 처음부터 이런 것을 다 설계해서 데이터를 만들 수는 없으니 원데이터(Raw Data)를 불러올 수 있는 적당량을 가져오고 1차 분석을 진행한 후 2차, 3차 가공을 거치면서 점점 데이터를 풍성하게 하는 과정을 거칩니다. 이러한 과정에서 또는 여러가지 목적에 따라서 데이터를 Spotfire 내로 가져온 이후에 데이터를 가공해야할 필요성이 생깁니다. 새로운 칼럼을 만들거나 데이터의 축을 바꾸거나 칼럼의 형식을 전환하고 새로운 데이터를 덧붙이는 과정이 필연적으로 생깁니다. Spotfire에서는 다음과 같은 데이터 가공(D.. 2019. 7. 16.