데이터를 분석하는 과정에서 필수적으로 고민해야하는 부분 중 하나는 데이터를 시각화 하는 것입니다. 아무리 좋은 데이터 분석이라도 누군가에게 데이터 분석의 과정과 의미가 전달되지 않으면 그 분석은 의미가 없어지게 되기 때문입니다.
분석의 결과를 시각적으로 만들어서 전달할 때 적절한 차트 유형을 선택한다면 같은 내용도 전혀 다르게 전달 할 수 있습니다.
이번 시간에는 대시보드와 차트 구성시 고려하면 좋을 10가지 사례를 가져왔습니다.
ㅤ
1. 하나의 대시보드에 너무 많은 정보를 담지 말자
대시보드를 만들 때 실수하기 쉬운 가장 쉬운 부분입니다. 저도 대시보드나 발표자료를 만들게 되면 항상 많은 정보를 담는것과 적절한 정보를 담는 것 사이에서 많이 고민을 하곤 합니다.
하나의 대시보드에 많은 내용을 담는 이유는 전달하고 싶은 내용이 그만큼 많다는 것을 의미합니다. 물론 대시보드를 보는 사람은 해당 정보를 궁금해할 수 있지만 대부분의 경우에는 많은 정보가 오히려 혼란과 오해를 일으킬 뿐입니다.
핵심을 말하는게 글을 쓸때에서도 중요한 부분이듯 시각화에서도 이부분이 가장 중요한 부분입니다.
단순함이 핵심입니다.
ㅤ
2. 사용자가 읽지 않고 볼 수 있게 해주자
테이블 차트는 상대적으로 시각적 차트 보다 정보를 분류하고 얻기 위해서 차트를 보는 사용자가 많은 고민을 해야합니다. 사람은 한번에 인식하고 처리할 수 있는 정보의 양이 정해져 있으며 이를 시각적으로 빠르게 분류 할 수 있게 도와주는게 바로 시각화의 핵심입니다.
물론 회계자료와 같은 중요 연속적 숫자의 연계성이 중요 한경우에는 필수적으로 테이블의 형태를 선택해야하는 경우도 있습니다. 하지만 대부분은 시각적 차트 표현을 선택한다면 더 좋은 시각화를 만드실 수 있습니다.
ㅤ
3. 지도 차트는 정보를 얻기 어렵다
국가별 매출을 분석한다고 가정 했을 때 이를 지도로 표현하면 시각적인 표현의 우수성(예쁜 시각화)은 훌륭한 편입니다. 다만, 보통 지도는 데이터 스케일을 색상으로 구분하여 표현하는 경우가 많습니다. 문제는 국가와 지역은 명확하게 이 스케일이 상호 비교되어 보기 어려운 단점을 가지고 있다는 것입니다. 예를 들어 한국과 미국의 수치 중 한국의 수치가 미국보다 조금 더 높다고 하더라도 한눈에 한국의 수치가 더 크다고 지도 차트에서 인식 하기는 어렵기 때문입니다.
따라서 특별한 경우가 아니라면 지도 차트로 표현하기보다 바 차트나 도넛 차트와 같이 실질적인 차이를 표현할 수 있는 차트를 사용하는 것이 좋습니다.
ㅤ
4. 축의 범위를 조절하세요
왼쪽의 차트는 수치 차이가 없지만 오른쪽 차트는 수치적으로 많은 변화가 있는 것을 알 수 있습니다. 둘다 동일한 데이터를 가지고 차트를 만들었으며 차이는 Y축의 범위를 조절한 것입니다.
해당 데이터는 역대 100m 달리기 세계 신기록을 순위별로 나타낸 것입니다. 세계 1위는 우사인볼트로 9.58초에 100m 주파하였습니다. 반면에 세계 기록 16위는 9.95초로 우사인볼트와 차이가 0.37초 나고 있습니다. 100m 기록은 0.01초 차이로 승부가 날 정도로 순위간 데이터 차이가 적게 발생합니다. 이러한 데이터 특성을 고려하지 않고 Y축의 시작을 0에서 부터 보게 되면 사실 세계 기록간 차이가 보이지 않게 됩니다. 반면에 데이터 특성을 알고 오른쪽 표와 같이 데이터 범위에 맞춰서 축 구간을 조절하게 되면 우리는 세계신기록을 달성한 우사인볼트가 얼마나 다른 선수들과 압도적 차이를 만들고 있는지를 알수 있게 됩니다.
물론 축 구간을 조절해서 보여주는것은 데이터의 특성을 고려해야합니다. 사실 큰 차이가 나지 않아도 문제없는 데이터 에서는 굳이 데이터 축 구간을 확대해서 추세를 보여주는 것은 오히려 혼란을 주는 데이터 표현 방식입니다.
ㅤ
5. 차트를 정리하기
동일한 차트에서 다른 기준으로 데이터를 분석하는 경우에 서로다른 차트간 상대 비교가 되기 때문에 자주 사용하는 차트 표현 방식이됩니다. 다만, 하나의 차트에 여러 선들이 겹치기 때문에 역시나 한번에 많은 정보를 처리해야하는 어려움이 있습니다. 이러한 차트 형태를 스파게티 차트라고 부릅니다. 너무 많은 선이 겹치면 추세선을 식별하기 어려워지기 때문입니다.
따라서 개별 속성의 추세를 비교하고자 한다면 오른쪽과 같이 개별적인 차트의 표현이 더 효과적일 수 있습니다.
ㅤ
6. 차트를 회전해보자
바 차트를 그리다보면 범례이름이 긴 경우 범례 이름의 표현이 잘 되지 않고 축약되어 표현되어서 불편한 경우들이 많이 있을 것입니다. 특히나 광고나 프로모션과 같이 범례를 표현하는 이름이 긴 경우에는 더더욱 이를 보고 판단하는 것은 어렵습니다. 이처럼 범례가 긴경우에는 오른쪽과같이 세로형 바차트를 활용하면 훨씬 쉽게 표현할 수 있습니다.
ㅤ
7. 원형 차트(파이차트)를 그룹화하기
파이 차트나 도넛차트는 차트의 면적이나 원의 길이로 구성요소의 구성비율을 시각적으로 쉽게 표현하는 차트 형태입니다. 다만, 구성요소가 많은 경우에는 차트가 지나치게 많이 쪼개져서 오히려 시각적으로 혼란도가 큰 차트 형태입니다. 따라서 파이차트를 사용하는 경우에는 상위 5개 또는 10개 정도만 표현하고 하위의 차트는 기타로 뭉쳐서 표현한다면 실제로 우리가 집중해야할 높은 비율을 차지하고 있는 요소들을 더 쉽게 표현할 수 있습니다.
ㅤ
8.데이터의 집계 기준을 잘 조절하자
일년간 발생한 매출의 변화를 추세로 시각화 하면 아래와 같이 표현할 수 있습니다. 하나는 일단위로 구분한것이고 하나는 주 단위로 표현하였습니다. 365개의 라인 vs 52개로 표현된 라인 중 여러분은 어떤게 더 시각적으로 쉽게 인식 되시나요? 같은 데이터 임에도 불구하고 일단위에서는 추세를 인지하는게 생각보다 쉽지 않습니다. 오히려 데이터수가 적어진 주 단위 표현에서 더 명확한 데이터의 흐름이 보이는 것을 알 수 있습니다.
시계열 차트와 같이 기간에 대한 데이터 변화를 표현하는 경우 집계 기간의 범위를 고려해서 일/주/월/분기/년 단위표현을 적절하게 고민해보시면 좋습니다.
ㅤ
9. 색상 표현을 통한 비교 활용하기
대시보드를 만들거나 차트를 만드는 경우 색상을 사용하는 것을 어려워하거나 부차적인 것으로 생각하는 경우가 종종 있습니다. 물론 차트를 시각화 하는 것에서 차트의 형태적 표현이 더 중요한 것은 맞습니다. 다만 색상의 효과또한 사용자가 시각화된 차트를 쉽게 인식하게하는 중요한 역할 중 하나 입니다. 따라서 시각적 표현을 할때 색상 표현을 적용해보면 더 효과적인 차트를 만들 수 있습니다. 특히 데이터의 크기를 히트맵으로 표현하면 단순히 숫자를 나열하는 것보다 훨씬 쉽게 현상의 차이를 전달 할 수 있습니다.
ㅤ
10. 하나의 차트에는 하나의 차이 표현만
시각화를 하는 경우 색상의 차이는 데이터의 크기를 표현할때 사용할 수 있다는 것을 앞에서 설명하였습니다. 동일하게 바 차트도 바의 길이를 통해 데이터의 크기를 시각적으로 표현하는 차트 형태입니다.
하나는 시각적 효과로, 또 하나는 길이를 통해 동일한 데이터를 다르게 표현할 수 있는 것입니다.
다만 비교 표현 방식을 섞어서 쓰게 되면 오히려 비교를 명확하게 하는데 방해를 불러일으킬 수 있습니다. 따라서 하나의 차트에서는 하나의 비교표현만 사용하는 것이 좀 더 효과적인 차트 구성 방식이 됩니다.
ㅤ
ㅤ
ㅤ
마무리
이번 시간에는 시각화를 하는데 도움이 되는 10가지 사례를 가지고 설명해보았습니다. 다만 시각화는 디자인적인 요소를 많이 가지고 있는 영역입니다. 따라서 동일한 표현도 누군가에게는 좋고 또 다른 누군가에게는 오히려 불편할 수 있습니다. 세상에 모두를 만족시키는 것은 없습니다. 시각화도 마찬가지입니다.
모두를 만족시키는 대시보드는 오히려 아무도 사용하지 않는 대시보드가 될 수 있습니다. 이번에 알려드린 내용을 바탕으로 여러분의 위치에서 여러분에게 맞는 방식을 발견 하시는데 활용 하시면 좋겠습니다.
ㅤ
참조
https://www.datavizclarity.com/The-Fundamentals-of-Data-Visualization
https://www.datacamp.com/cheat-sheet/data-viz-cheat-sheet