-
6주 1일차 TIL 정리웅진 STARTERS 부트캠프 2023. 3. 13. 18:55
6주 1일차에는 Tableau 프로젝트 기반 강의의 첫 번째 시간이었다.
첫 시작인 만큼, 가벼운 ice breaking과 태블로 기본기를 이용한 그룹별 과제가 주어졌다.
※ OT 내용 정리 ※
- 데이터 분석가가 실무에서 하는 업무
1. 데이터 추출
2. 데이터 분석
- 가설 설정 후 툴을 곁가지로 이용해서 검증한다. 툴 활용 능력은 베이스로 갖춰야 하는 소양이 된다.
3. 대시보드 시각화
- 발표대상에 따라 시각화의 방향성이 달라진다.
임원진: 간단하며, 몇 초동안 보더라도 파악이 가능해야 한다.
실무진: 빨라야 한다. (중요도가 낮은 프로젝트의 경우 publishing까지 2주 안에 끝나야 하는데, 이때 순수 작업시간은 3일 정도.)
(빠른 일처리를 위해 자신만의 format을 하나씩 구축해야 한다.)
(+ DB는 일일 업데이트되기 때문에 자동화는 필수! / 인수인계가 가능한 dashboard)
4. 기획 / 제안
- DA를 가르는 한 끝 차이. Tool은 기본이고, 기획자의 역량이 중요하다.
(1분 안에 모든 설명을 끝낼 수 있어야 한다.)
(전문용어 x, 넣어야 한다면 시트 하나에 넣을 수 있어야 함.)
(스크린샷 찍은 dashboard 1sheet + 전문용어 1sheet)
* how to make profit?- 회사가 원하는 데이터분석가?
- DA는 어느 필드에 가는가에 따라 천차만별.
- DA field 를 3년 안에 정하는 게 좋다. (그 이후 쌓아가는 domain 지식이 향후 결정)- 개인질문
게임업계의 데이터분석 직무특성
- SQL 별로 필요없다. Python 잘해야함. 기술적인 부분이 아니라 기획, 제안을 잘 하고 ptyhon이 붙어여 한다. user data 를 준 후 어떻게 해야 daily user를 늘릴 수 있는지 20장 가량의 pt를 시킨다.
데이터분석가로서 추후 활동에 대한 조언
- 앞에서 나서는 일: generalist (엄청 많이 짤림)
- 뒤에서 하는 DA: specialist(잘 안 짤림, 입지가 굳건함.): generalist를 휘어잡을 수 있어야 한다. 체력이 좋아야 한다.
- category를 여성남성이 아니라 숫자를 기준으로 나눌 줄 알아야 한다. 0~10, 10~20 등.- field 옮길 때: 그 field의 문화를 알고 가는 게 중요하다.
eg1) 금융권같은 군대형식 조직: 잘하고 노력도 하지만 사수의 능력을 침범하지 않는 사람 / 기획 및 제안력 어필, 협업 중요
eg2) 컨설팅: 사람이 매서워보여야한다?? 2명 파견되는 데에 주당 1억 줌.(10주동안 10억보다 더 줘야 한다.)
남들이 봤을 떄 전부 잘해보여야 한다.(전부 deep하게 해야한단 뜻 아님)
eg3) commerce: 말을 많이 해야 한다. 남한테 보여줄 게 아니라도 내 성과를 미리 보여주기 위해 dashboard를 하나씩 만들어둬야 한다.- dashboard를 만들 때 고려할 것.
- 매개변수, filter 활용해 한 샷에 최소한에 정보를 담는다.
- 매출을 올리려고 하는 것이니, 돈을 잘 버는 사람이 만들라고 하는 대로.
- DA가 협업해야 하는 이유: 기호실수, 숫자 실수, 필드 생성 시의 등이 데이터를 완전히 엇나가게 한다. 서로 더블체크가 필수.- 공백 크게, 숫자 크게, 그래프 적게.
- YoY, MoM 등 비교하는 것을 꼭 넣어야 한다. (변동성 고려해야 한다)
- layout 측면에서 피드백을 꼭 구할 것.- Dashboard 종류:
1. 만들어놓은 것을 보여줌
2. 너도 한 번 만져봐라: target:building manager // 필터 최소한, 간단하게. 피드백을 꼭 구해야 한다. 보기 편한지?
- filter, 매개변수- 정리) 어떤 dashboard를 만들어야 할까?
- 숫자가 눈에 잘 띄는 단순한 대시보드- filter, 매개변수로 조정이 잘 되며 렉 안 걸리는 대시보드
내가 필요한 데이터가 무엇인지 제대로 알아야 한다.(이부분은 SQL이나 filter 활용능력이 중요함)- 타겟을 정확히 이해하고 자동화된 대시보드(인수인계 포함)
타겟 이해가 1순위!!! → 어떤 것을 원하고, 어떤 걸 보고 싶은지 육하원칙으로 물어볼 것!!!(중요)
target, 어떤 걸 보여줄것, layout틀 등 답 받은 후 확인까지 하고 작업하기.- 자동화 제대로 이뤄지지 않으면 대참사..
limit을 안 걸면 DB다운된다!!- 데이터분석가의 이직을 쉽게 만드는 것
- 경력 : 경력증명서!
- TOOL 활용 능력
- 학벌과 전공 : IT경영전공을 미리 써도 된다.- Tableau Desktop Specialist 자격증 꼭 따자
(면접에서 대부분 물어본다)
※ 수업 내용 정리 ※
연결에서 자주 쓰이는 순서
서버에 연결 - 태블로 서버 - 파일에 연결파일 형식에 따른 분류
데이터는 얼마 없지만 분류가 많음 : excel
raw data가 mass로 있음 : csv
데이터 원본
1. 시트 확인(데이터의 오류 여부 확인, pivot이 돼있는 시트인지 확인.)
2. 데이터타입 확인!
ID가 숫자로 되어있는지 확인 - (#값으로 돼있는지 확인) (이러면 집계되거나 한다...)
지도를 안 만들 거라면 지리적 역할을 없음으로 변경해줘야 함
차원과 측정값을 간단히 나누기:
- 더할수있음: 측정값
- 더할수없음: 차원값
라이브와 추출
- 라이브: 추출하지 않고 그냥 넘어감
- 추출: 데이터셋을 다 빼서 컴퓨터에 저장
→ 많은 DB를 연결해 사용한다면 무조건 추출 사용!
추출을 누른 후 시트로 가면 미리 저장하며 로딩해둔다.
시트
1. 필드 확인
ID가 측정값으로 들어가있지 않은지 여부 확인
(차원값에 있어야 할 게 있는지 여부 확인)
2. 계층 생성
3. 대시보드부터 들어가서 레이아웃 잡기
대시보드
1. 제목, 빈 페이지 등을 활용해 미리 레이아웃 잡아두기.
텍스트로 '히트맵 - 매개변수사용 - sum,avg' 등으로 넣을 정보 적어두기
2. 서식 - 통합 문서 들어가서 서식 지정해주기. 글꼴이나 제목 등 미리 설정해두기.
3. 크기 선택
- 보는 사람의 기기
- 메뉴얼하게 보기 쉬운 크기 지정
- 최대한 스크롤 안 할 수 있게 설정
4. 기기 미리보기에서 크기 기준으로 설정
다시 시트
1. LoD 개념: Level of Detail - 차원이 조각나있을수록
vLoD: 눈에 보이는 차원의 Detail
- 차원만 변경 가능. 측정값은 불가능하다.
마크를 변경할 수 있는 것은 차원이다.
※ 실습 과제 ※
과제내용: 레이아웃 짜기
1. 블루프린트같은 대시보드 하나
2. 완성했을 때 어떤 모습일지?
- 못 만들면 text라도 써서 넣기!
- 필터는 부동으로 그냥 필터1 필터2 써서 넣기
region manager(데이터를 잘 볼 줄 모름, 지역별 담당)들이 타겟,
내가 얼마나 profit을 냈는지 체크하고 싶다. 승진에 도움을 받고 싶다.- 보기 쉬운 dashboard
- 필터, 매개변수 사용
결과물(개인과제):
지역별 filter를 걸어 각 지역별로 정보를 확인할 수 있게 하며, 분기별 성장추이를 꺾은선 그래프를 통해 파악할 수 있게 하였다. 이에 더해, 분기별 성장률 측면에서 전 분기와의 차이를 비율로 한 눈에 표시하였다.
분기별 성장에 이어 집중한 것은 물품 카테고리별 분류이다. 물품 카테고리별 분류에선 해당 지역에서 카테고리별 최대매출을 달성한 제품을 보여주며, 이 또한 이전 분기 대비 성장률의 옆에 비치해두어 핵심정보를 함께 표시했다. 하단의 수량별 이익 그래프는, 카테고리별 상품이 개당 얼마나 이익을 가져왔는지 설명해주며 다음 분기의 수익 극대화를 위해서는 어떤 제품을 축소하고 어떤 제품의 판매를 늘려야 할지 파악할 수 있도록 하였다.
'웅진 STARTERS 부트캠프' 카테고리의 다른 글
6주 3일차 TIL 정리 (0) 2023.03.15 6주 2일차 TIL 정리 (2) 2023.03.14 유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 5주차 학습 일지 (0) 2023.03.12 5주 5일차 TIL 정리 (0) 2023.03.10 5주 4일차 TIL 정리 (0) 2023.03.09