본문 바로가기
Data Analysis/Spotfire

시각화 분석을 업무에 활용하면서 느끼는 몇가지...

by 불탄오징어 2019. 4. 14.
반응형

안녕하세요 불탄오징어입니다.

 

오늘은 그동안 시각화 분석을 통해 업무을 진행하면서 느꼈던 점들을 정리해볼까 합니다.

 

데이터 분석을 하면서 빠르게 현황을 파악하고 의미를 전달하기 위해서는 데이터의 시각화가 매우 중요합니다.

같은 데이터를 같은 차트를 쓰더라도 어떻게 구성하고 설명하느냐에 따라 전달력이 달라질 수 있기 때문이죠. 하지만 그게 본래의 목적과 멀어지거나 과한 요구사항이 될 경우는 문제가 됩니다.

 

 

전달력 높은 시각화에 대해서는 아직도 고민해야할 부분이 저도 많고 앞으로도 쌓아야 할 경험이 많습니다. 

 

시각화 또는 시각화 분석을 하기 위해서 저는 TIBCO Spotfire를 활용하고 있습니다. 

시각화/시각화 분석을 위한 여러 툴은 많지만 엑셀 이나 R 처럼 데이터를 시각화 하기위해 다음과 같은 단계를 거쳐야합니다.

 

  • 1. 데이터의 형태를 파악한다.(차원과 지표)
  • 2. 어떤 지표에 대해 어떤 차원으로 어떤 차트를 그릴지 결정한다.
  • 3. 결정된 기준으로 차트를 그린다.
  • 4. 현황을 보고 의미가 있으면 유지하고 없으면 2번부터 반복한다.
  • 5. 의미있는 시각화(Insight가 있는)를 도출하면 해당 시각화를 보존한다.

Spotfire, Tableau와 같은 툴은 위의 단계를 획기적으로 줄여줍니다. 특히나 "2번 어떤 지표에 대해 어떤차원으로 어떤차트를 그릴지.."

 

예전에 신입이나 신규 인력에 대해 교육을 할때 항상 이야기하는 부분인데 "크게 고민하지 말고 그냥 그려보라" 라는 것입니다. 짧은 시간안에 다양한 형태로 시각화 차트를 만들어 볼 수 있고 각 차트별 관계에 대해 쉽게 연결이 가능하기 때문에 이런 "그냥 그려보는 행위" 자체가 분석이 됩니다.

 

Spotfire는 Tableau에 비해 아름다운(이쁜) 점은 다소 약하지만 데이터 핸들링이나 차트간 관계, 차트 구성이 마우스 중심으로 이루어질 수 있어서 분석에 대한 시간을 단축 시키는데 많은 도움이 되었습니다.

 

약간 Spotfire의 자랑 글이 됐는데 여기서 말하고 싶은 점은 시각화 분석 툴의 활용 용도가 무엇이 중점인지를 말하고 싶습니다. 사실 아름다운 차트, 능동적인 애니메이션을 보이는 차트는 차트프로그램을 활용한 개발한 정형장표를 따라갈 수는 없습니다. 시각화 분석 툴은 분석 기능 외에도 이를 정형장표화하여 웹으로 배포, 여러 사람이 웹으로 접근할 수 있도록 기능을 제공하고 있습니다.

 

이 기능의 목적은 분석가가 분석을 통해 Insight를 얻은 또는 얻을 수 있는 분석 장표를 만들고 이를 공유하여 다른 사람들도 쉽게 Insight를 얻을 수 있도록 하기 위함입니다. 물론 기능상 일반적인 데이터 조회 정형장표를 만들 수도 있고 매일매일 열람 가능한 Dashboard도 구성할 수 있습니다. 후자의 역활을 가지는 장표를 만들게 될 때 겪는 문제나 질문이 "화면이 안이뻐요", "이런 차트는 왜 안되나요?" 등입니다.

 

 

시각화 분석 및 시각화 분석 장표를 개발/배포하고 있는 업무를 진행하면서 마주치게되는 지시/요구 사항이 얼마나 이쁘게 만들 수 있는지가 중점이 되는 경우가 워낙 많았습니다. 사용자/의뢰자가 원하는 데이터를 보여주거나 Insight를 얼마나 쉽게 전달할 수 있을지 보다 말이죠. 물론 이쁘고 새로운 차트들을 쓸 수 있으면 당연히 좋습니다. 

 

Spotfire의 경우 Python, javascript, R을 연동하여 기존에 제공하지 않는 차트나 기능들을 일부 개발하여 표현할 수 있습니다. 그래서 실제로 과한 요구사항이지만 상급자의 Needs를 맞추기위해 다소 과한 개발(?)을 진행한 적도 있습니다. 이 경우 따라오는 문제가 몇가지가 있는데....

 

  • 유지보수의 어려움(난이도, 소요기간)
  • 인수인계의 어려움(Spotfire, Python, javascript, R 중 일부 또는 전부를 모두 이해해야함)

실제 위에 언급한 Spotfire, Python, Javascript, R을 모두 활용하여 구성한 시각화 장표의 경우 Spotfire의 Automation Service를 통해서 자동 메일까지 발송하고 있습니다. 위에 4가지 툴/언어에 대한 이해를 이야기 했지만 자동 배치 수행을 위해 dos 명령어, job scheduler 사용법, 데이터 에러에 대한 방어 코딩을 모두 이해/숙지해야 유지보수 가능한 구조입니다.

 

어떻게 보면 요구사항을 맞추기 위해 무식하게 작업한 저로 인해 태어난 이른바 혼종인거죠. 제 불찰입니다.

 

 

글이 좀 두서 없는데 정리하자면....

 

목적과 방향을 명확히 하고 그에 맞춰서 업무를 진행해야 낭비되는 리소스를 줄이고 이른바 헛짓거리를 안하게 됩니다.

시각화 분석, 시각화 분석 툴의 본래 목적과 업무에 도입/활용하기 위한 방향에 맞춰서 진행해야 합니다. 

아름다운 차트도 좋지만 그를 위해 들여야할 공수나 향후에 대한 우려가 존재한다면 과감하게 포기해야할 건 포기해야합니다. 그런 외향적인 것 보다는 내적인 것, Insight를 어떻게 하면 효율적으로 전달할지를 좀더 고민하는 것이 더 좋겠죠 :)

 

'Data Analysis > Spotfire' 카테고리의 다른 글

[TIBCO Spotfire] Barchart  (14) 2019.04.19
[TIBCO Spotfire] Data Table  (0) 2019.04.17
[TIBCO Spotfire] Visualization Chart  (2) 2018.03.12
[TIBCO Spotfire] Marking  (1) 2018.02.13
[TIBCO Spotfire] 가이드 시작  (7) 2018.02.13

댓글