본문 바로가기
Data Analysis/Spotfire

[TIBCO Spotfire] Data Handling

by 불탄오징어 2019. 7. 16.
반응형

3. Data Handling


Spotfire를 잘 활용하기 위해서는 데이터 원천이 필요한데 가능하며 분석하고자 하는 방향과 목적에 맞춰서 데이터를 수집하고 잘 가공하는 것이 좋습니다. 사실 처음부터 이런 것을 다 설계해서 데이터를 만들 수는 없으니 원데이터(Raw Data)를 불러올 수 있는 적당량을 가져오고 1차 분석을 진행한 후 2차, 3차 가공을 거치면서 점점 데이터를 풍성하게 하는 과정을 거칩니다. 이러한 과정에서 또는 여러가지 목적에 따라서 데이터를 Spotfire 내로 가져온 이후에 데이터를 가공해야할 필요성이 생깁니다.  새로운 칼럼을 만들거나 데이터의 축을 바꾸거나 칼럼의 형식을 전환하고 새로운 데이터를 덧붙이는 과정이 필연적으로 생깁니다.

Spotfire에서는 다음과 같은 데이터 가공(Data Handling) 기능을 제공하고 있습니다.

 

  • Calculated Column : 계산된 칼럼, 기존의 칼럼을 조합하거나 조건식, 함수등을 적용하여 새로운 칼럼을 생성
  • Binned Column : 칼럼의 값을 특정한 기준으로 나누어 새로운 등급, 구간 칼럼을 생성
  • Predicted Columns : 예측값을 생성하는 기능으로 Prediction Model이 있어야 적용가능
  • Hierarchy : 칼럼간 계층 관계를 맺어주는 기능
  • Columns : 다른 데이터로 부터 칼럼을 가져오는 기능으로 SQL에서 JOIN과 동일한 기능
  • Rows : 데이터의 행 기준으로 새로운 데이터를 덧붙이는 기능
  • Data Function : R, SAS, SPSS 등 연동을 통해 데이터를 처리할 수 있는 기능
  • Transformations : 데이터 구조를 변경(Unpivot, pivot) 하거나 데이터 형식을 변환할 수 있는 기능

 

다양한 기능등을 제공하고 있으며 특히 Calculated Column은 조건문 외에도 여러가지 함수들을 제공하고 있으며 활용할 수 있는 정도에 따라 기본에서 고급 사용자로 나눌 수 있습니다. 이후 데이터 가공(Data Handling)에서는 아래의 4개 기능에 대해서 내용을 다룰려고 합니다.

 

  • Insert Calculated Column
  • Custom Expression
  • Insert Columns and Rows
  • Transformation

 

 

댓글