웅진 STARTERS 부트캠프

4주 4일차 TIL 정리

WoodenStella 2023. 3. 5. 19:17

4주 4일차에는 2일차에 이어 Tableau 온라인 강의를 수강했다. 


그룹


- 그루핑: 기존의 데이터 항목들은 존재하지 않은 채, 그룹화된 하나의 새로운 데이터로 노출시킨다.

데이터를 선택 후 멤버 그룹화를 선택해 그룹을 생성할 수 있다.

 

- 그루핑 알아둘 사항

그루핑 때 한 쪽을 그루핑하면 다른 영역도 기타로 묶이는 경우가 있다.

이때 그룹 편집에 들어가서 다른 그룹을 해제하여 해결할 수 있다.

 


집합


1. 집합: 기존의 데이터를 그대로 다룰 수 있다. 말 그대로 데이터들의 집합.

데이터를 선택 후 집합 만들기를 선택해 집합을 생성할 수 있다.

그룹이 특정 영역의 데이터를 하나로 뭉쳐서 표현하는 방식인 반면,

집합은 해당 영역의 데이터를 하이라이팅하는 역할을 한다고 생각할 수 있다.

2. 동적 집합

일반 집합(정적 집합)의 경우 데이터가 변경되거나 분석의 변화에 대한 따른 상태를 반영하지 못한다.

따라서, 유동성을 확보하기 위해 동적 집합을 사용한다.

 

데이터셋에서 직접 '만들기 - 집합' 으로 들어가 생성해두면, '집합 편집' 에서 상위조건 인원조정, 하위조건으로 변경 등을 자유롭게 할 수 있게 된다.

모든 목록에서 적용할 수 있도록 일반에서 모두 사용을 설정해준 후,

Top 10 등 조건들을 이를 통해 조정하며 사용할 수 있다.

 

2. 동적 집합과 매개변수의 동시 사용

다음과 같이 매개변수를 생성 후

매개변수 이름을 다음과 같이 동적집합의 조건에 넣어 준다.

필터를 노출시켜 다음과 같이 데이터를 조정해가며 볼 수 있다.

 

3. 집합 간의 결합

결합된 집합 만들기 기능을 통해 만들어진 집합을 결합할 수 있다.

생성 시 다음과 같이 두 집합의 합집합, 교집합, 차집합된 데이터를 뽑을 수 있다.

 

2와 3을 결합하여 활용하면 다음과 같이 두 개의 매개변수를 동시에 다룰 수 있다.


기타 기능


- 폴더

폴더를 생성해 데이터셋을 효율적으로 정리할 수 있다. (폴더 생성으로 인한 별도의 물리적 제약은 없다.)

- 툴팁으로 그래프 노출

1. 도구 설명 더블클릭하면 툴팁 편집할 수 있다.

2. 여기서 삽입 - 시트로 들어가면 자신이 만든 시트를 툴팁으로 표시할 수 있다.

 

대시보드에서 참조선 추가

축을 우클릭해 참조선 추가를 선택할 수 있다.

값에 매개변수를 넣고, 레이블로 값을 지정하면 다음과 같이 현재 선택한 매개변수값을 참조선으로 보여줄 수 있다.

 

 

- 축 연장선 추가

그래프의 내부를 우클릭해 축 연장선을 표시하면 선택한 데이터의 위치를 연장선으로 표시해준다.

 

- 테이블 계산의 결과물 저장

테이블 계산의 결과물을 데이터셋으로 옮겨 수정할 수 있으나, 이를 수정한다고 그래프에 자동으로 업데이트되진 않는다.

(업데이트를 위해서는 다시 시트에 옮겨줘야 한다.)

 

- 많은 데이터 join 시 고려할 것

데이터에서 Head가 될 데이터를 하나 선정한 후 join을 하는 경우, head데이터에 join의 기준이 되는 값이 null값인 것이 존재한다면 멀쩡한 데이터도 없어질 수 있다.

따라서, 엑셀에서 head데이터가 될 만한 파일을 하나 만들어서 붙이는 것 또한 방법이 될 수 있다.

 

예시) datetime을 기준으로 join하려 하는데, 결측치가 의심될 경우

해당 데이터 형식에서 다음과 같이 Datetime만 존재하는 데이터를 임의로 만들고, 빈틈없이 값을 채워넣어 head테이블로 설정해둔다.

그리고 이를 기반으로 다음과 같이 join 할 수 있다.

* 이때 Timline에는 모든 데이터가 있으므로 left outer join을 하는 것이 바람직하다.

 

- window average 함수

window_average(식, 시작, 끝): 창 내 식의 평균 반환.


  eg1) window_average(sum([Tones]),-2,0)
      → sum([Tones])식의 특정 열에서 -2, -1, 0 세 개 행의 평균을 보여준다. ( 현재 행:(0번째 행) 아래 노출 )


  eg2) window_average(sum([Tones]),-3,1)
      → sum([Tones])식의 특정 열에서 -3, -2, -1, 0, 1 5개 행의 평균을 보여준다. ( 현재 행:(0번째 행) 아래 노출 )


리뷰


제작한 시각화데이터가 많아질수록 태블로를 통한 데이터 분석이 효율적임이 느껴진다. Tableau가 비단 시각화 툴로써의 기능 뿐만 아니라 전체적인 데이터 분석의 툴이라는 생각을 하게 되었고, 앞으로도 더욱 열심히 배워두고 싶다.