본문 바로가기

Data Analysis120

[TIBCO Spotfire] Tree Map 2-8. Tree Map Tree Map은 데이터가 계층적 구조를 갖고 있다면 이를 타일 형태로 표현한 것을 말합니다. 두가지 정도의 수치적 지표를 넓이 또는 색상(농도)로 표현할 수 있습니다. 데이터를 시각화하는데 굉장히 잘표현할 수 있는 차트이며 다양하게 활용할 수 있는 차트입니다. 데이터는 설명을 위해 아래와 같이 임의로 생성했습니다. 데이터가 있는 상태에서 상단의 Tree Map을 클릭하여 실행하면 아래와 같이 임의의 Tree Map이 생성됩니다. Tree Map에서 차트의 형태를 변화시키는 주로 사용되는 속성은 아래의 3가지입니다. Color by : Tree Map의 각 타일 색상을 결정하는 속성 Size by : Tree Map의 각 타일의 넓이를 결정하는 속성 Hierarchy : 계층 구.. 2019. 6. 20.
[TIBCO Spotfire] Scatter Plot 2-7. Scatter Plot Scatter Plot은 데이터를 점의 형태로 출력하여 데이터의 전반적인 형태를 보거나 x, y 축에 따른 데이터 분포를 통해 상관관계를 유추하는데 사용합니다. 산점도라고 부르는 이 Chart는 실제 두 연속형 변수를 각 축으로 놓아 관계를 보고자 하는 용도이지만 Spotfire에서의 Scatter Plot은 연속형외에도 명목형을 출력하거나 점이 아니 Pie Chart로 표현하는 등 다양한 형태로 변형이 가능합니다. 데이터는 설명을 위해 Iris 데이터를 사용했습니다. Iris는 워낙 유명한 데이터 인데 Iris(붓꽃)의 3종을 구분하기 위해 꽃받침(Sepal), 꽃잎(Petal)의 각각 길이와 폭을 측정한 데이터 입니다. 통계학에서는 군집 분석이나 분류모형에 주로 많이 .. 2019. 6. 18.
[TIBCO Spotfire] Pie Chart 2-6 : Pie Chart Pie Chart는 전체에 대한 각 part의 비율을 분할하여 부채꼴로 나타낸 그래프입니다. 전체에서 차지하는 비율을 한눈에 쉽게 볼 수 있기 때문에 잘 사용되는 Chart 중 하나입니다. 단순히 Pie Chart만 사용해도 되지만 Trellis나 PieChat의 Size 기능을 활용하여 좀더 시각적인 차트를 만들 수 있습니다. 데이터는 설명을 위해서 아래와 같이 임의로 생성했습니다. 데이터가 있는 상태에서 상단의 Pie Chart를 실행하명 아래와 같이 임의의 PieChart가 생성됩니다. 임의의 PieChart이기 때문에 원하는 형태로 옵션을 주어 PieChart를 변경하겠습니다. PieChart에서 형태를 결정하는 부분은 Color by와 Sector size by입니다.. 2019. 6. 13.
[TIBCO Spotfire] Combination Chart 2-5 : Combination Chart Combination Chart는 Bar Chart와 Line Chart를 혼합한 Chart로 두가지 Chart의 특성을 모두 가지고 있으며 옵션 또한 모두 가지고 있습니다. 보통 두가지 이상의 지표를 비교하여 보여 줄 수 있도록 구성합니다. 예를 들면 월별 매출(원)과 달성률(%)과 같이 두가지 지표이면서 단위가 다른 경우에 매우 유용하게 보여 줄 수 있습니다. 데이터는 설명을 위해서 아래와 같이 임의로 생성했습니다. 월별로 매출과 이익 데이터입니다. 데이터가 있는 상태에서 상단의 Combination Chart를 실행하면 임의의 Chart가 생성됩니다. 차트는 제목처럼 Combination Chart이지만 형태는 Barchart처럼 보입니다. 붉은 사각형으로.. 2019. 6. 9.
[TIBCO Spotfire] 가이드 목차 1. 목차작성 : 2019-06-03 2. 최종수정 : 2021-08-02, 연결안된 링크 추가 시작 Marking Visualization Chart Data Table Bar Chart Line Chart Combination Chart Pie Chart Scatter Plot TreeMap Map Chart(1/2) Data Handling Calculated Column Custom Expression Insert Columns and Rows Transformation Data Connection Add Data Tables Information Designer Information Link 활용법 Information Link 활용법 - Fake element Statistic Analysis.. 2019. 6. 4.
[Python] 다중 회귀 분석(Multiple Linear Regression) 안녕하세요 불탄오징어입니다. Python 공부도 할 겸 틈틈히 통계 분석 모형들을 하나씩 수행해보려고 합니다. Python이 대세라서 한다기보다는 순수한 재미로 해볼려고 합니다. 현재는 업무에 Python을 활용하는 경우가 거의 없기도 하구요. 새로운 언어를 배우는 건 매우 재미있는 일이기도 해서요. 처음으로 다중 회귀분석을 정리해보려는데 사실 이미 Python으로 다중 회귀 분석을 수행하는 예제는 올린 적이 있습니다만 너무 정리 되지 않은 형태여서.... 고치자니 귀찮고 새로 만들어진 마크다운 형식으로 써보고 싶어서 새로 정리해 봅니다. 여기서 굳이 통계적 이론부분은 다루지 않으려고 합니다. 워낙 오래됐지만 유명한 통계모형이고 쉽게 수행할 수 있는 모형이다 보디 웹상에 이미 많은 정보들이 공유되고 있어.. 2019. 5. 19.
[TIBCO Spotfire] Line Chart 2-4 : Line Chart Line Chart는 꺽은선으로 수치를 나타냄과 동시에 일자와 같은 Date 타입형의 기준을 활용하여 추세를 표현하는 차트입니다. TIBCO Spotfire에서도 동일한 방식으로 주로 사용하며 BarChart 만큼 자주 사용됩니다. 데이터는 2-3. Bar Chart에서 사용한 데이터를 이용해서 설명하겠습니다. 데이터가 있는 상태에서 상단 Line Chart 아이콘을 클릭하여 실행하면 임의의 Line Chart가 생성됩니다. 각 부분에 따라 여러 기능이 있지만 위의 이미지에서 표시된 X축, Y축, 색상, 데이터 테이블에 대해서 설명하겠습니다. Y축 : 정량지표를 설정하며 다수의 정량 지표를 부여할 수 있음, 다수 정량 지표 부여서 Color by 또는 line by에 (Co.. 2019. 5. 7.
데이터 분석... 데이터만 보는데도 시간이 부족하다. 예전에도 그랬고 지금도 그렇고 앞으로도 그렇지만 항상 마법의 단어는 필요한것 같습니다. 약 10년 이전에만해도 CRM이 5~6년 전에는 빅데이터가 지금은 딥러닝과 AI라는 마법의 단어가 있죠. 왜 마법의 단어라고 하냐면 통과 안될 보고서나 기획서도 이 단어가 들어가면 통과가 되거든요. 교육도 비슷한거 같아요 실제와 관계없는 단어를 붙이는 걸보면요. 실제 데이터를 보고 만져보고 꼬아보고 들여다보고 멀리서보고 하는 것들이 필요하고 이런 경험들이 쌓이면 데이터에 의해 발생할 수 있는 오류나 실수를 최소화 할 수 있게 됩니다. 수많은 강의들이 있고 유투브에도 강의들이 떠다닙니다. 대학교에서도 취업을 위해 강의들을 개설하고 있습니다. 대부분의 강사, 교수님들은 본인들의 분석 경험과 지식을 바탕으로 교육을 하시겠지.. 2019. 4. 23.
[TIBCO Spotfire] Barchart 응용 2-3. Bar Chart 고급응용 저번 글에서 Barchart의 일반적인 기능을 활용하여 구성해보는 예제를 진행했습니다. 이번 글에서는 저번 글의 데이터를 활용해서 Animaiton처럼 자동으로 년도를 변경하는 예제를 만들어보려고 합니다. 본 예제를 진행하게 된 이유는 아래의 글을 봤기 때문인데요. [데이터의 아름다움: 역사상 최고로 꼽히는 10가지 데이터 시각화의 예] : https://www.tableau.com/ko-kr/learn/articles/best-beautiful-data-visualization-examples Next America라는 이름으로 소개된 차트인데 향후 미국의 인구 분포 및 베이비붐 세대의 변화가 어떻게 되는지를 보여주고 있습니다. 저번에 만든 Barchart와 동일하며.. 2019. 4. 22.
[TIBCO Spotfire] Barchart 2-3. Bar Chart Bar Chart는 가장 많이 사용하는 차트로 세로 막대 그래프를 기준으로 하단(X축)은 카테고리형(명목형) 기준을 잡고 좌측(Y축)은 지표를 넣어 막대모양의 길이로 표현하는 차트를 말합니다. 크고 작음을 쉽게 비교하여 볼 수 있기 때문에 가장 기본이 되는 차트이며 당연히 TIBCO Spotife에서도 제공하는 많이 사용차트입니다. 설명은 각설하고 실제 데이터를 가지고 차트를 만들어보려 합니다. 데이터는 국가통계포털에서 성 및 연령별 추계인구(1세별, 5세별) / 전국 를 활용하겠습니다. 해당 데이터에 대해서는 아래와 같이 설명되어있습니다. 인구주택총조사 결과를 기초로 인구변동요인(출생,사망,국제이동 등)을 반영하여 매년 7월 1일 현재로 코호트요인법을 이용하여 추계한 인구 엑.. 2019. 4. 19.