분류 전체보기
-
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 11주차 학습 일지웅진 STARTERS 부트캠프 2023. 4. 23. 23:53
웅진 Udemy STARTERS 취업 부트캠프 11주차 학습일지 유데미 STARTERS 취업 부트캠프의 열한 번째 주이다. 이번 주는 SQL 오프라인 교육의 마지막 주로, SQL의 응용학습을 진행했다. ※ 학습내용 및 후기 ※ 이번 주에는 SQL의 기능들을 조금 학습하고, 미니프로젝트를 진행해 차주의 해커톤을 연습했다. SQL의 기능을 응용하여 분석하는 기법으로 decil 분석, ABC 분석, RFM 분석을 배웠다. 프로젝트 진행 중 많은 조에서 RFM 분석을 사용했는데, 굉장히 유용한 분석기법인 동시에 헛점이 존재한다는 것을 알 수 있었다. , cte_odcnt AS ( SELECT customer_unique_id, count(order_id) cnt FROM cte_joined GROUP BY 1 ..
-
11주 5일차 TIL 정리웅진 STARTERS 부트캠프 2023. 4. 23. 22:30
11주 5일차엔 SQL 미니프로젝트의 피드백을 받고, SQL과 Tableau의 최종평가를 진행했다. ※ 발표 피드백 ※ * 앞부분 굉장히 좋다! - 주제와 목표가 구체적이다. * (하단 ppt에서)그래프가 두개있으면 뭘 뜻하는건지 적어두기 * 주별 배송 소요기간 차이 같은 부분은 주제를 선정하기 위한 근거이기 때문에, 데이터를 직접 보여주면서 더 강조했으면 좋겠다. * 고려했던 브라질의 지리적 특성이라던지 그런 것들도 들어가면 좋겠다. (운임비가 높은 지역의 특징으로, 아마존지역과 산맥을 넘어야 배송이 가능한 지역 두 가지가 있었음.) * 분석목표가 구체적이고, 목표에 따라 우리가 뭘 할지를 잘 선정했다. *분석 흐름이라던가, 결론까지 이어지는 흐름이 좋았다. - 다른 조 피드백 (4조) RFM 지표에 ..
-
11주 4일차 TIL 정리웅진 STARTERS 부트캠프 2023. 4. 23. 20:32
11주 4일차엔 SQL 미니프로젝트를 이어서 진행했다. ※ 분석목표 설정 및 과정 ※ 1. 물류창고 선정 1) 물류창고를 선정할 지역군 탐색 2) 지역군 중 중앙에 위치한 주를 물류창고 개설 주로 결정 2. 입점 상품 선정 1) 해당 주를 기준으로 반경거리를 계산, 커버할 주의 주 상품 판매품목 알아보기(Category) 2) ABC분석을 통해 가장 많이 판매된 상품 카테고리를 배치하도록 판단. ※ 활용 그래프 선택 ※ 1. 주별 운임비 / 주별 배송 소요일수 그래프 2. 주 그룹(구역)별 배송기간 및 매출 그래프 3. 타겟 주(BA) 기준 이격거리 그래프 4. ABC분석 시각화 그래프 ※ 결론 ※
-
11주 3일차 TIL 정리웅진 STARTERS 부트캠프 2023. 4. 23. 20:14
11주 3일차엔 해커톤 전 마지막으로 SQL 미니프로젝트를 진행했다. ※ 데이터 파악 ※ 1. 데이터 종류: 브라질 OLIST사의 전자상거래 데이터 2. ERD 3. 특이사항 정리 - customer_id는 고객마다의 값이 아니다. count(customer_id) = count(order_id) → customer_unique_id를 식별자로 사용할 것. ※ 주제 선정 및 필요 컬럼 추출 ※ 1. 주제: 배송기간 단축, 운임비 절감을 위한 물류창고 신설 및 배치물품 선정 2. 필요컬럼 선정 및 cte절 생성 WITH cte_joined AS ( SELECT p.product_id, p.product_category_name, o.order_id, o.order_purchase_timestamp 구매일시..
-
11주 2일차 TIL 정리웅진 STARTERS 부트캠프 2023. 4. 18. 17:41
11주 2일차에는 SQL을 활용한 RFM 분석과 재구매율 분석, 이탈율 분석을 진행했다. ※ RFM 분석 ※ 1. RFM분석 - RFM분석은 11주 1일차에 진행했던 것과 동일한 내용으로, 최근 며칠 안에 재구매를 했으며, 총 몇 번 구매했고, 구매액수는 얼마나 되는지의 3개 지표를 활용하여 분석하는 것이다. R-F, R-M, F-M으로도 분석 가능하며, R, F, M을 점수화해 세 지표를 모두 활용할 수도 있다. /* RFM 분석 */ WITH cte_customers as( SELECT o.order_id , o.order_date , od.unit_price, od.quantity , od.discount , od.unit_price * od.quantity * (1-od.discount) AS s..
-
11주 1일차 TIL 정리웅진 STARTERS 부트캠프 2023. 4. 17. 17:40
11주 1일차에는 SQL의 윈도우 함수 entile과 decil분석, RFM분석을 배움과 동시에 기능을 연습하는 시간을 가졌다. ※ 고객 분석 ※ -- 국가 별 고객 수, 고객수누계 SELECT country , count(country) ,sum(count(country)) OVER (ORDER BY count(country) DESC, country) FROM customers GROUP BY 1; SELECT country, 고객수, 구성비 , sum(구성비) OVER (ORDER BY 구성비 desc, country) * 100 누적비 FROM ( -- 구성비 SELECT *, 고객수/sum(고객수) over() AS 구성비 FROM ( -- 고객수 SELECT country , count(cou..
-
유데미 스타터스 취업 부트캠프 4기 - 데이터분석/시각화(태블로) 10주차 학습 일지웅진 STARTERS 부트캠프 2023. 4. 16. 23:33
웅진 Udemy STARTERS 취업 부트캠프 10주차 학습일지 유데미 STARTERS 취업 부트캠프의 열 번째 주이다. 이번 주는 SQL 오프라인 교육의 시작 주로, SQL의 응용학습을 진행했다. ※ 학습내용 및 후기 ※ 이번 주에는 두 번의 팀과제와 세 번의 개인과제를 진행했다. SQL을 학습한 것은 작년 2학기 학교 수업 외엔 크게 없어서, 심화학습에 대해 조금 걱정을 하고 있었지만 따라가는 것에 큰 문제는 없어 다행이라고 생각했다. 이번 주의 학습 내용은 다음과 같다. 1일차: DB 분석 및 ERD 해석 (+ PostgreSQL과 DBeaver 설치 및 작업환경 설정) 2일차: 분석목표 설정 및 함수(coalesce, 날짜함수 등)에 대한 학습 3일차: 복잡한 데이터셋 다루기 (주로 CTE에 대한..
-
10주 3일차 TIL 정리웅진 STARTERS 부트캠프 2023. 4. 16. 22:17
10주 3일차에는 SQL의 CTE절, 윈도우 함수 구문에 대해 학습했다. ※ 복잡한 데이터셋을 다루는 방법 ※ 1. ETL 스냅샷테이블: 쿼리 결과를 테이블에 저장 (테이블 컨트롤 권한 필요) 2. VIEW: 쿼리 결과를 가상테이블(VIEW)로 저장하여 사용 (테이블 컨트롤 권한 필요) 3. TEMPORARY TABLE: 현재 세션동안 유지되는 임시테이블에 저장 (테이블 컨트롤 권한 필요) 4. 공통 테이블 표현식(CTE): 쿼리 결과에 이름을 붙여 테이블처럼 사용 (테이블 컨트롤 권한 불필요) ※ TEMPORARY TABLE 생성 ※ create temporary table temp_order_details as select o.order_id, o.customer_id, o.order_date , t..