본문 바로가기

Spotfire44

[TIBCO Spotfire] Python 활용 예제 - 특정 입력값이 일치하는 행의 다른 칼럼값 가져오기 8. Spotfire & Python 연동 활용 예제 8-1. 특정입력값이 일치하는 행의 다른 칼럼 값 가져오기 Spotfire에서는 특정 값을 참조하여 다른 값일 가져올 수 있도록 Join을 활용하거나 Relation을 활용하여 Drill-down을 하는 등 다양한 방법을 제공하고 있습니다. 그리고 Spotfire를 활용하여 데이터 분석하는 경우에는 데이터를 보고 특정값을 조건으로 다른 데이터를 보고자 할 경우 Filter를 활용할 수도 있습니다. 하지만 BI 성 장표를 Spotfire로 만들 경우 이런 기능들을 활용할 수가 없는데 예를 들면 코드와 코드값을 가진 테이블을 만들어 두고 특정 코드를 조회하거나 특정 코드명을 포함하는 데이터를 찾은 후 해당하는 행의 다른 값을 가져와서 조건으로 활용할 경우.. 2020. 9. 17.
[Spotfire] 증권DATA 수집/분석 - 4 그동안 분석을 하겠다고 꾸준히 R 소스를 돌려서 데이터를 수집하고 있는데 종목을 정해서 해야할 것 같습니다. 전 종목을 기준으로 수집하다보니 시간도 오래 걸리고 중간중간 끊기는 경우도 많구요. 데이터 모으기가 쉽지는 않네요. 이번 포스팅은 Spotfire로 대략적인 데이터를 확인해보고 모델링에 대한 계획을 세워서 정리해보려 합니다. 1) 데이터 load 먼저 Spotfire를 실행하고 Add Data Table을 열어 줍니다. 우측 상단에 Add - Others - databases를 선택합니다. Odbc Data Provider를 클릭하여 Database 연결 셋팅을 합니다. (https://bongury.tistory.com/302) 참조 위와 같이 Specify Tables and Columns 창.. 2020. 6. 24.
[TIBCO Spotfire] Data Function을 활용한 Regression 분석화면 만들기 6-3. Data Function을 활용한 Multiple Regression 만들기 Spotfire를 활용하여 고급 통계분석을 수행할 수 있는 화면을 만들 수 있습니다. 기본적인 골자는 Text Area를 활용하여 입력 또는 설정을 위한 화면을 구성하고 이를 Data Function과 연결하여 분석화면을 만드는 것입니다. 활용하기에 따라서는 통계분석을 잘 모르는 사용자도 쉽게 모델링을 수행할 수 있으며 많은 Column 들 속에서 변수간 연관관계를 빠르게 파악할 수 있습니다. 본 예제는 임의로 생성한 데이터로 진행하겠습니다. 해당 데이터를 가져오면 아래와 같습니다. x1과 x2가 독립변수가 되고 y는 종속 변수가 됩니다. 이 데이터를 가지고 먼저 입력/설정을 할 수 있는 화면을 구성하겠습니다. Text.. 2019. 12. 9.
[TIBCO Spotfire] Spotfire & R 6. Spotfire & R 앞서 설명한 기능들은 Spotfire 내에서 제공하는 통계 분석 기능으로 통계를 잘 모르는 사용자 부터 중급 사용자까지 대상으로 기능을 제공하고 있습니다. 하지만 정해진 기능이고 통계분석 툴만큼 자세한 기능을 제공하지 않는데 이런 경우를 위해 Spotfire는 몇가지 통계 분석 언어와 연동이 가능합니다. SAS Matlab S+ R(TERR) SAS, Matlab의 경우 유명한 언어이나 상용이며 S+는 R의 상용버전입니다만 최근에는 더이상 업데이트를 하지 않는 것 같습니다. 가장 쉽게 접근 가능한 언어이자 인기 언어인 R과 연동이 가능하므로 R과의 연동을 통해 해당 기능에 대해서 설명을 하려 합니다. 다만 이런 통계 언어 연동을 위해서는 추가적인 프로그램이 필요합니다. 서버급.. 2019. 11. 26.
Line Similarity 5-3. Line Similarity Line Similarity는 말 그대로 Line 패턴 유사성을 찾는 방법으로 K-means Clustering과 동일하게 Line Chart가 필요하며 데이터 형식에 대한 제약도 존재합니다. 첨부된 샘플 파일 처럼 패턴을 찾고자 할 경우 데이터의 구분은 별도 칼럼으로 구분되어야 하며 값들은 모두 하나의 칼럼으로 존재해야합니다. 데이터를 불러오면 다음과 같습니다. 위의 데이터를 가지고 아래와 같이 Line Chart를 만듭니다. 해당 예제는 데이터가 총 7개 뿐이지만 실제로 몇십개가 되는 지수들을 나열하고 거기서 특정 패턴의 라인을 찾고자 한다면 분명 쉽지 않을 것 입니다. Spotfire 에서는 Line Similarity를 통해 상승, 하강, 유지 등의 기본 패턴.. 2019. 10. 16.
[TIBCO Spotfire] Data Relationship - Chi-square 5-1-3. Chi-Square Chi-Square(교차분석)은 Cetegorical 변수간의 연관성을 분석하기 위한 통계분석 방법입니다. 해당 예제를 위해서 전통적인 예제 데이터를 가져왔습니다. 해당 데이터를 Spotfire로 가져옵니다. 데이터를 가져오면 좌측처럼 되어있습니다. 성별과 지지정당에 대한 값이 들어있는데 해당 예제는 R에서 chi.test()에 포함된 첫번째 예제 데이터입니다. 참고로 R에 포함된 예제 데이터의 경우 우측의 Cross Table와 같이 이미 성별과 지지정당에 대해 집계가 되어있는 상태로 되어있습니다. Spotfire에서는 이런 형태가 아니라 개별 데이터 형태로 되어있어야합니다. 그럼 Data Relationship을 실행하고 Comparision method에서 Chi-s.. 2019. 9. 25.
[TIBCO Spotifre] Statistic Analytics 5. Statistic Analytics Spotfire 기본적으로 데이터 시각화 분석 툴이지만 조금 더 고급적인 분석 에 대한 사용자들의 요구사항을 충족하기 위해 통계분석 기능들을 내장하고 있습니다. 전문화된 통계분석 툴, SAS, SPSS를 다루기 위해서는 전문적인 지식이 필요할 수가 있는데 Spotfire에서 제공하는 기능들을 전문지식이 없이도 쉽게 결과를 도출할 수 있는 기능 부터 전문 통계 분석가들을 위한 기능까지 제공 하고 있습니다. 대표적인 통계분석으로 Data Relationships이 있는데 이기능은 데이터의 Column들 간의 1:1 연관성을 분석하기 위한 기능입니다. 단순하게 분석 대상들만 정해서 실행하면 결과를 보기 쉽게 출력을 해줍니다. 그 외에도 Clustering을 위한 K-m.. 2019. 8. 30.
[TIBCO Spotfire] Add Data Table - Databases 4-1 Add Data Tables - Databases Add Data Tables에서 Databases를 연결하기 위해서는 ODBC 설정이 필요합니다. 먼저 제어판 - 관리도구에서 데이터 원본(ODBC)를 실행합니다. ODBC 데이터 원본 관리자가 실행 되면 추가 버튼을 누릅니다. 데이터 원본과 연결할 드라이버를 선택합니다. 저는 SQL Server Native Client 11.0 를 선택했습니다. 접속을 위한 정보를 구성할 건데 먼저 데이터 원본을 명칭을 입력하고 연결할 서버를 선택합니다. 저는 제 PC 내에 이미 MSSQL 서버를 설치했기 때문에 그냥 "localhost"라고 입력했습니다. 그 외에는 서버의 ip를 입력하면 됩니다. 기본 포트가 아닌 경우는 포트 번호까지 입력해주셔야 합니다. 아.. 2019. 8. 15.
[TIBCO Spotfire] Tree Map 2-8. Tree Map Tree Map은 데이터가 계층적 구조를 갖고 있다면 이를 타일 형태로 표현한 것을 말합니다. 두가지 정도의 수치적 지표를 넓이 또는 색상(농도)로 표현할 수 있습니다. 데이터를 시각화하는데 굉장히 잘표현할 수 있는 차트이며 다양하게 활용할 수 있는 차트입니다. 데이터는 설명을 위해 아래와 같이 임의로 생성했습니다. 데이터가 있는 상태에서 상단의 Tree Map을 클릭하여 실행하면 아래와 같이 임의의 Tree Map이 생성됩니다. Tree Map에서 차트의 형태를 변화시키는 주로 사용되는 속성은 아래의 3가지입니다. Color by : Tree Map의 각 타일 색상을 결정하는 속성 Size by : Tree Map의 각 타일의 넓이를 결정하는 속성 Hierarchy : 계층 구.. 2019. 6. 20.
[TIBCO Spotfire] Scatter Plot 2-7. Scatter Plot Scatter Plot은 데이터를 점의 형태로 출력하여 데이터의 전반적인 형태를 보거나 x, y 축에 따른 데이터 분포를 통해 상관관계를 유추하는데 사용합니다. 산점도라고 부르는 이 Chart는 실제 두 연속형 변수를 각 축으로 놓아 관계를 보고자 하는 용도이지만 Spotfire에서의 Scatter Plot은 연속형외에도 명목형을 출력하거나 점이 아니 Pie Chart로 표현하는 등 다양한 형태로 변형이 가능합니다. 데이터는 설명을 위해 Iris 데이터를 사용했습니다. Iris는 워낙 유명한 데이터 인데 Iris(붓꽃)의 3종을 구분하기 위해 꽃받침(Sepal), 꽃잎(Petal)의 각각 길이와 폭을 측정한 데이터 입니다. 통계학에서는 군집 분석이나 분류모형에 주로 많이 .. 2019. 6. 18.