ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 4주 2일차 TIL 정리
    웅진 STARTERS 부트캠프 2023. 2. 28. 17:37

    4주 2일차에는 Tableau 온라인 강의를 처음으로 수강했다. 대략적인 기능은 알고 있던 만큼, 데이터와 통계적 지식을 갖춘 상태로 복습하는 형태로 수강을 진행했다.


    데이터 묶기


    - join: 테이블 하나를 더블클릭해 물리 차원으로 만들고, join할 테이블을 끌어온 다음 물리 차원을 닫는다.

    join된 테이블

    - blend: 따로따로 불러온 후 시트 생성 시 같이 넣어주면 자동으로 블랜드가 된다.
        * 블랜드 인식이 잘못되거나 누락돼 편집할 때엔 데이터 - 혼합 관계 편집 - 사용자 지정에서 섞어줄 데이터셋 선택
      사용하는 경우
        - join으로 묶을 때 특정 데이터들이 소거되는 경우
        - 데이터 소스가 달라서 결합이 안 될 때(csv + xlsx 등)

      효율적인 left outer join 형태와 비슷함.

     

      but 따로 불러와야 한다는 특징 때문에 많은 테이블이 필요할 경우 오히려 비효율적일 수 있음.

     

    - 관계 형성: 공유데이터가 있는 테이블끼리 논리구조를 형성. (끌어다가 옆에 붙임)

      별도 지정하지 않더라도 무리 없이 연결되므로 효율적.

     


    테이블의 데이터 타입


    차원(Dimension, 파란색): 독립적 변수

    측정값(Measure, 초록색): 종속적 변수

        eg) 얼마나 많은 unit들이 지역별로 얼마나 팔렸는가? // 지역에 종속적인 측정값 unit

    일반적 표현으로, 측정값(measure)은 합산값으로 표시되며, 차원(demension)은 정보 세분화의 정도를 결정한다.

     


    그 외 기능


    - 필터: 보고 싶은 것만 보이게 할 수 있다.
      * 필터 우클릭 후 필터 표시 누르면 범례처럼 생긴다
      * 우클릭 후 워크시트에 적용 - 이 데이터를 활용하는 모든 워크시트에 적용 선택하면 이후 생성하는 그래프 모두에 같은 필터 적용

     

    범례 클릭해도 하이라이트 안되면 '선택한 항목 하이라이트' 클릭.

     

    - 지도 작업
      * 계층(Hierachy) 만들기: 요소를 끌어 다른 요소로 가져가면 묶이면서 계층 생성

    다음과 같이 날짜를 hierarchy로 묶었을 때 하위의 항목을 간편히 추가 및 삭제할 수 있다.

     

    - 동작(action): 대시보드에서 그래프와 상호작용할 수 있게 함.
      * 삽입한 시트를 클릭해서 필터모양 클릭(필터로 사용) 하면 해당 시트에서 클릭할 시 다른 시트의 정보들도 연동된다.
      * highlight가 안 먹힌다면, 해당 분류에 따른 detail값이 설정돼있지 않은 것.(지도가 필터보드로 설정돼있으면 state, country 등이 scatterplot에 들어가있어야 highlight가 먹힌다.)

     

    - 측정값 끄기: (분석 측정값 집계) 체크해제 시 합산데이터가 아닌 전부 detail데이터가 나온다.

    기본값: 집합 적용되어 합산값이 나온다.

    집합 끄면 모든 데이터가 다 나온다(분석 – 측정값 집계)
     
     
    이 중에서 일부만 detail값이 나오도록 세부화하고 싶다면, 해당 카테고리를 '세부 정보'에 넣으면 된다.

    해당 데이터에서 '세부 정보'에 age데이터를 넣으면

    다음과 같이 연령에 따른 데이터가 집계값이 아닌 실제 데이터양으로 나온다.
     

    ※ 리뷰 ※


     

    확실히 데이터 처리 및 다용도를 겸하고 있는 python이나 R을 경험하고 Tableau로 넘어오니 시각화의 난이도가 급감하는 것을 느꼈다. 이전에 공부했던 Tableau 강의는 통계학지식과 데이터분야 지식이 전무했다 보니 따라가는 것마저도 힘들었는데, 그 경험을 되짚으며 해당 지식을 갖추고 공부하니 python, R 등 다른 분야들에 비해 훨씬 쉽게 학습했던 것 같다. 

    댓글

Designed by Tistory.