본문 바로가기

Data Analysis/Spotfire61

[TIBCO Spotfire] Python 활용 예제 - 특정 입력값이 일치하는 행의 다른 칼럼값 가져오기 8. Spotfire & Python 연동 활용 예제 8-1. 특정입력값이 일치하는 행의 다른 칼럼 값 가져오기 Spotfire에서는 특정 값을 참조하여 다른 값일 가져올 수 있도록 Join을 활용하거나 Relation을 활용하여 Drill-down을 하는 등 다양한 방법을 제공하고 있습니다. 그리고 Spotfire를 활용하여 데이터 분석하는 경우에는 데이터를 보고 특정값을 조건으로 다른 데이터를 보고자 할 경우 Filter를 활용할 수도 있습니다. 하지만 BI 성 장표를 Spotfire로 만들 경우 이런 기능들을 활용할 수가 없는데 예를 들면 코드와 코드값을 가진 테이블을 만들어 두고 특정 코드를 조회하거나 특정 코드명을 포함하는 데이터를 찾은 후 해당하는 행의 다른 값을 가져와서 조건으로 활용할 경우.. 2020. 9. 17.
[Spotfire] 증권DATA 수집/분석 - 4 그동안 분석을 하겠다고 꾸준히 R 소스를 돌려서 데이터를 수집하고 있는데 종목을 정해서 해야할 것 같습니다. 전 종목을 기준으로 수집하다보니 시간도 오래 걸리고 중간중간 끊기는 경우도 많구요. 데이터 모으기가 쉽지는 않네요. 이번 포스팅은 Spotfire로 대략적인 데이터를 확인해보고 모델링에 대한 계획을 세워서 정리해보려 합니다. 1) 데이터 load 먼저 Spotfire를 실행하고 Add Data Table을 열어 줍니다. 우측 상단에 Add - Others - databases를 선택합니다. Odbc Data Provider를 클릭하여 Database 연결 셋팅을 합니다. (https://bongury.tistory.com/302) 참조 위와 같이 Specify Tables and Columns 창.. 2020. 6. 24.
[TIBCO Spotfire] R chart 연동하기 - Wordcloud 7-1. 외부시각화 차트 연동 7-1-1. R Chart 연동 한창 Spotfire로 프로젝트를 할 때 Wordcloud가 유행했던적이 있습니다. Text Analysis를 할 때 시각적으로 사용되는 단어들을 보여주기위해 가장 유용한 차트이지요. Spotfire에서는 Wordcloud 차트를 제공하지 않지만 R과 연동하여 Wordcloud 차트를 Spotfire 내에 그릴 수 있습니다. 먼저 샘플 데이터는 다음과 같습니다. 임의의 단어를 나열하고 빈도를 임의로 부여했습니다. wordcloud를 사용하여 출현빈도가 많은 단어는 크게 그렇지 않은 단어는 작게 표현하겠습니다. 먼저 Data Function을 만들겠습니다. Tool-Register Data Functions를 실행한 후 아래와 같이 입력합니다... 2020. 1. 8.
[TIBCO Spotfire] Spotfire 고급 활용법 7. Spotfire 고급 활용법 Spotfire는 나름 Enterprize급(?) 제품인지라 다양한 3rd Party 제품군들과의 연동이 가능하며 시각화 툴인 것치고는 자체적으로 연동할 수 있는 다양한 방법들을 제공하고 있습니다. 실제 업무에서 활용하면서 유용했던 것들은 몇가지 소개해보려고 합니다. 외부 시각화 차트 연동 R Chart 연동 3rd Party : JSVIZ 활용 Javascript Chart 연동 Python 활용 Javascript Chart 연동 Data Loading 없는 시각화 장표 운영 (with Scheduled Update) 시각화 장표 자동화 메일 IronPython을 활용한 능동적 시각화 구성 외부시각화 차트 연동 Spotfire는 다양한 Chart들을 제공하고는 있지만.. 2019. 12. 27.
[TIBCO Spotfire] Data Function을 활용한 시계열 분석 화면 만들기 6-4. Data Function을 활용한 시계열 분석 화면 만들기 이번에는 간단한 시계열 예측 화면을 만들어보겠습니다. Spotfire에서 line 기능을 통해 Forecast Line을 추가하여 간단하게 시계열 예측을 할 수 있습니다. 하지만 이 경우 예측값을 받아올 수 없기 때문에 추가적인 작업이 불가능합니다. 그래서 동일한 예측 모형을 Data Function을 통해 구현하여 보겠습니다. Data 는 AirPassengers 라는 아래의 데이터를 사용했습니다. 먼저 Data Function을 작성합니다. Register Data Function을 실행한 후 상단에 HoltWinters라고 Data Function 함수명을 지정합니다. HoltWinters() 함수는 R에서 기본적으로 제공하는 시계.. 2019. 12. 24.
[TIBCO Spotfire] Data Function을 활용한 Regression 분석화면 만들기 6-3. Data Function을 활용한 Multiple Regression 만들기 Spotfire를 활용하여 고급 통계분석을 수행할 수 있는 화면을 만들 수 있습니다. 기본적인 골자는 Text Area를 활용하여 입력 또는 설정을 위한 화면을 구성하고 이를 Data Function과 연결하여 분석화면을 만드는 것입니다. 활용하기에 따라서는 통계분석을 잘 모르는 사용자도 쉽게 모델링을 수행할 수 있으며 많은 Column 들 속에서 변수간 연관관계를 빠르게 파악할 수 있습니다. 본 예제는 임의로 생성한 데이터로 진행하겠습니다. 해당 데이터를 가져오면 아래와 같습니다. x1과 x2가 독립변수가 되고 y는 종속 변수가 됩니다. 이 데이터를 가지고 먼저 입력/설정을 할 수 있는 화면을 구성하겠습니다. Text.. 2019. 12. 9.
[TIBCO Spotfire] Simple Example : Spotfire & R 6-2. Simple Example 1 아래의 예제는 아주 간단히 Spotfire와 R이 연동 되었는지 체크할 때 주로 사용했던 것입니다. n : uniform(0,1) 분포로 몇개를 샘플링할지 지정 x : 샘플링된 결과를 저장할 Column 명 x 2019. 12. 1.
[TIBCO Spotfire] Spotfire & R 6. Spotfire & R 앞서 설명한 기능들은 Spotfire 내에서 제공하는 통계 분석 기능으로 통계를 잘 모르는 사용자 부터 중급 사용자까지 대상으로 기능을 제공하고 있습니다. 하지만 정해진 기능이고 통계분석 툴만큼 자세한 기능을 제공하지 않는데 이런 경우를 위해 Spotfire는 몇가지 통계 분석 언어와 연동이 가능합니다. SAS Matlab S+ R(TERR) SAS, Matlab의 경우 유명한 언어이나 상용이며 S+는 R의 상용버전입니다만 최근에는 더이상 업데이트를 하지 않는 것 같습니다. 가장 쉽게 접근 가능한 언어이자 인기 언어인 R과 연동이 가능하므로 R과의 연동을 통해 해당 기능에 대해서 설명을 하려 합니다. 다만 이런 통계 언어 연동을 위해서는 추가적인 프로그램이 필요합니다. 서버급.. 2019. 11. 26.
[TIBCO Spotfire] Classification Modeling 5-6. Classification Modeling Spotfire의 Classification Modeling은 보통 통계학에서 이야기하는 분류 모형이 아니라 Logisitic Regression을 말합니다. 물론 분류 모형이라는 큰 의미에서는 Logistic Regression도 하나의 모형이긴 합니다만 Spotfire에서는 그것도 Binomial Logistic Regression만 지원합니다. 이게 무엇을 뜻하는 말이냐면 참과 거짓, 증가와 감소 같이 두 개의 값에 대해서만 적용이 가능합니다. 즉 주어진 데이터를 바탕으로 둘 중 하나를 결정하는 모형이라고 이해하면 될 것 같습니다. 만약 사용자가 3개이상의 값을 가지는 Column을 종속변수로 지정할 경우 분류 중 어떤 것을 참으로 놓고 나머지를 .. 2019. 11. 16.
[TIBCO Spotfire] Regression Modeling 5-5. Regression Modeling Spotfire에서 기능 상 Regression 관련 기능이 두 개가 있는데 앞서 설명한 Data Relationship에 있는 Linear Regression과 이번에 소개할 Regression Modeling이 있습니다. 두 기능을 비교해서 말하자면 전자는 단순회귀분석이고 후자는 다중회귀분석입니다. 단순회귀분석은 하나의 종속변수와 하나의 독립변수만을 사용하므로 두 변수간의 선형적인 관계를 분석할 수 있습니다. Regression Modeling은 이와 달리 하나의 종속변수와 다수의 독립변수간의 선형적인 관계를 확인하고 모형을 만들어 예측까지 할 수 있는 기능입니다. Data Relationship의 Linear Regression 보다는 좀더 고급 통계 기.. 2019. 11. 8.