'분류 전체보기' 카테고리의 글 목록

분류 전체보기

[ 태블로 신병훈련소 17기 ] DAY 4 과제 2023.02.11
[ 태블로 신병훈련소 17기 ] DAY 3 과제 2023.02.08
[ 태블로 신병훈련소 17기 ] DAY 2 과제 2023.02.06
[ 태블로 신병훈련소 17기 ] DAY 1 과제 2023.02.05
[ 책 리뷰 ] 그로스해킹 2023.01.30
데이터리안 1월 세미나 후기 : 데이터 분석가 되면 어떤 일을 하나요? 2023.01.15
[ 책 리뷰 ] 데이터 문해력 2023.01.13 1
[MYSQL] 조건에 조건 더하기 2023.01.09

[ 태블로 신병훈련소 17기 ] DAY 4 과제

2023. 2. 11. 15:23

1. 라인 차트

2010년부터 2020년까지 월 별 미세먼지 평균 지수를 살펴보고 싶다

열에 넣은 기준연월(년/분기/월/일 등)을 선택해서 그래프차트를 자유롭게 표현할 수 있다

2. 하이라이트 테이블

시도별 월 별 미세먼지 패턴을 살펴보고 싶다

=> 시기적으로 6 ~ 8월의 미세먼지 농도가 양호하고, 1 ~ 5월의 미세먼지 농도가 심하다

경기, 충북 지역의 미세먼지가 상대적으로 심하다

1번에서는 아랫칸의 월을 선택했고 2번에서는 윗칸의 월을 선택했다

아랫칸 월(2015년 5월) - 2010년 1월, 2010년 2월, ... , 2020년 11월, 2020년 12월의 값

윗칸 월(5월) - 2010~2020년 1월 평균, 2010~2020년 2월 평균, ... , 2010~2020년 12월 평균

마크 색상, 레이블 -> 평균(PM10)

3. 테이블 계산식을 이용한 시간 분석

Q. 어느 나라 빅맥 가격 변동 비율이 가장 큰가요?

A. 브라질

2000년과 2020년의 가격 상승 비율(단순 가격 차이 X)을 보기 위해서,

1) 기준년월에서 2000년, 2020년만 선택

2) [퀵 테이블 계산] - [비율 차이]

마크 색상 -> Dollar Price (평균 달러 가격)

레이블 -> Name (국가명)

* [테이블 계산 편집] - 기준을 첫 번째로 선택하기!! (2020년이 데이터의 가장 첫 번째 값이기 때문에)

4. 덤벨차트

덤벨차트 만드는 방법 참고 : https://www.youtube.com/watch?v=rnI97LXpiuY

연도별로 최소 빅맥 가격과 최대 빅맥 가격의 차이 변화를 살펴보고 싶다

Q. 최대 빅맥 가격이 가장 높았던 시기는 언제인가요?

A. 2011년 7월

*윗칸 기준연월 선택칸에서 [자세히] - [사용자 지정] - [연도/월] 선택하면

'20nn년 n월' 방식으로 표현할 수 있다

'What I study > Tableau' 카테고리의 다른 글

[ 태블로 신병훈련소 17기 ] DAY 3 과제 (0)	2023.02.08
[ 태블로 신병훈련소 17기 ] DAY 2 과제 (0)	2023.02.06
[ 태블로 신병훈련소 17기 ] DAY 1 과제 (0)	2023.02.05

[ 태블로 신병훈련소 17기 ] DAY 3 과제

2023. 2. 8. 19:16

매개변수 : 계산, 필터 및 참조선에서 상수 값을 동적으로 바꿀 수 있는 변수

Top N 필터, KPI 조정하기 등 동적으로 데이터를 분석하기 위해 사용한다

정적인 값인 상수로 변수를 설정하는 것이 아니라

필터를 적용하여 변수 값을 쉽게 변경할 수 있다

대시보드 동작 : 대시보드에서 다양한 동작이 가능하다

예) 맵에서 한 영역을 선택하면 해당 영역과 관련된 데이터만 표시하도록 다른 뷰의 데이터가 필터링할 수 있다

1. 매개 변수를 사용하여 측정값 변경하기 1 & 마크 색상 표현하기

Q. (칼로리/카페인/당류) (1 ~ 200) 함유량이 넘는 카테고리는?

Q. 카페인 60Mg 함유량이 넘는 카테고리는?

A. 브루드커피, 콜드브루커피, 에스프레소

*매개 변수를 사용하여 측정값을 변경하려면 두 단계가 필요하다

1️⃣ 매개 변수 만들기

2️⃣ 매개 변수를 활용한 계산된 필드 만들기

1️⃣ 매개 변수 -> 측정값 선택

2️⃣ 계산된 필드 -> 선택한 측정값

이렇게 페어링되게 이름 지어주기🙂

CASE [측정값 선택]
WHEN '칼로리' THEN [칼로리(Kcal)]
WHEN '카페인' THEN [카페인(Mg)]
WHEN '당류' THEN [당류(G)]
END

1️⃣ 매개 변수 -> 카페인 함유량 선택

2️⃣ 계산된 필드 -> 카페인 > 선택한 카페인

IF AVG([카페인(Mg)]) > [카페인 함유량 선택]
THEN '선택한 카페인보다 많이 들음'
ELSE '선택한 카페인보다 적게 들음'
END

행 -> 카테고리

열 -> 선택한 측정값

마크 색상 -> 카페인 > 선택한 카페인

화면 오른쪽에서 매개 변수를 이용해서 필터링하려면

해당 매개 변수에서 [매개 변수 표시] 누르기

2. 매개 변수를 사용하여 측정값 변경하기 2

Q. 카페인과 나트륨의 상관관계는 어떠한가?

A. 뚜렷한 상관관계를 가지고 있지 않다

X축, Y축을 매개변수 & 계산된 필드 만들기

마크 세부정보 -> 카테고리, 메뉴명

마크 모양 -> 원

마크 색상, 크기 -> 카페인 합계

3. 대시보드 동작 적용하기

[대시보드] -> [동작]

원본 시트(카테고리 별 카페인)에서 동작하면 대상 시트(카페인과 나트륨의 상관관계)에서 하이라이트 나타낼 수 있다

=> 에스프레소 카페고리에 마우스 커서를 올리면(=마우스 오버)

에스프레소 카테고리에 해당하는 메뉴들의 카페인과 나트륨의 상관관계를 확인할 수 있다

'What I study > Tableau' 카테고리의 다른 글

[ 태블로 신병훈련소 17기 ] DAY 4 과제 (0)	2023.02.11
[ 태블로 신병훈련소 17기 ] DAY 2 과제 (0)	2023.02.06
[ 태블로 신병훈련소 17기 ] DAY 1 과제 (0)	2023.02.05

[ 태블로 신병훈련소 17기 ] DAY 2 과제

2023. 2. 6. 13:45

오늘은 워드클라우드와 박스플롯 만드는 방법,

계산식이나 함수를 이용해서 새로운 필드를 만드는 방법을 배웠다!

파이썬 코드로 열심히 만들던 워드클라우드와 박스플롯이

드래그 몇번으로 완성되다니..🤯

학습 강의는 첫 날에만 길었던 모양이다

10분 내외 강의 + 참고 자료를 보고 익히는데에 30분정도 걸린 것 같다

(+ 과제 실습시간 별도)

1. 워드클라우드

Q. 가장 칼로리가 높은 메뉴는 무엇일까요?

A. 제주 까망 크림 프라푸치노!

다이어터는 제주 까망 크림 프라푸치노를 조심하자 ⚠️

일단 색상과 크기를 칼로리로 표현하는 것부터 잡고 시작했다

마크 유형 -> 텍스트 로 선택하고

(자동으로 선택하니까 트리맵이 만들어져버려서 놀랐음👀)

마크 색상, 크기 -> 칼로리

2. 박스플롯

Q. 칼로리가 낮고 카페인이 높지 않은 메뉴를 마시고 싶다면?

A. 티바나 카테고리에 있는 메뉴를 고르면 좋을 듯!

테이블명에는 메뉴명, 카테고리가 있다

카테고리 내에 메뉴명 여러개가 포함되어있다

열 -> 카테고리

행 -> 칼로리

마크 세부정보 -> 메뉴명

=> 기본 차트인 막대차트에서 카테고리 내 메뉴명이 나뉜다

마크 형태 -> 원

박스플롯에 겹쳐보이는 원들이 만들어진다

마지막으로 [분석] - [박스 플롯] 선택하면 완성!

*[분석 탭]에서 박스플롯을 선택해야 올바른 결과가 나온다

오른편에 있는 [표현 방식]에서 박스플롯을 선택하면 아래와 같이 나온다🙅‍♀️

3. 계산된 필드 만들기

Q. 평균 카페인 용량이 80mg 넘는 카테고리는?

A. 에스프레소, 콜드브루커피, 브루드커피

역시 커피메뉴들이 카페인 용량이 높다!

평균 카페인 용량이 80mg보다 높은 카테고리와 아닌 카테고리를

쉽게 구분하기 위해 계산된 필드를 만들었다

IF AVG([카페인(Mg)]) > 80
THEN "카페인 > 80mg"
ELSE "카페인 <= 80mg"
END

만들어진 필드를 마크 색상에 적용하면 완성!

[추가 도전 과제]

Q. 시도별 매장운영시간은 어떤가요?

A. 강원도에서는 동해DT, 강릉중앙로 지점의 매장운영시간이 15시간으로 가장 길다

DATEDIFF('hour', [영업시작시간], [영업종료시간])

'What I study > Tableau' 카테고리의 다른 글

[ 태블로 신병훈련소 17기 ] DAY 4 과제 (0)	2023.02.11
[ 태블로 신병훈련소 17기 ] DAY 3 과제 (0)	2023.02.08
[ 태블로 신병훈련소 17기 ] DAY 1 과제 (0)	2023.02.05

[ 태블로 신병훈련소 17기 ] DAY 1 과제

2023. 2. 5. 21:04

태블로를 공부하기 위해 태블로 신병훈련소를 신청했다👊

한 번도 다루어보지 않은 프로그램이라서

기초부터 알려주는 친절한 강의 + 다른 사람들이랑 공부하면서 동기부여 되는 그런게 필요했는데

신병훈련소가 딱(!)인 것 같다고 생각했다!

[SQL로 분석하고 Tableau로 시각화하자]라는 책까지 빌려서 참고하면서 진행해보려고 한다

신청할 때 회사 기입란..이 있어서 취준생은 못듣나했는데

신청했더니 슬랙에 입장할 수 있었다🙂

기초 실습 교육이 2시간이나 되어서 놀랐는데

태블로의 기본적인 UI 설명부터 부가적인 기능까지 차근차근해주셔서 오히려 좋았다

(영상으로 배우다가 책으로 보면 답답할 지경)

인터페이스가 낯설어서 그렇지 태블로가 정말 유용하다는 것을 하루만에 체감할 수 있었다!!

시각화에 아주 최적화되어있는,,👍

열심히 배워서 내 것으로 만들어야지

1. 카테고리별 평균 칼로리 & 평균 카페인

태블로에서는 행렬을 잘 구분해야한다

열을 x축, 열을 y축으로 보면 이해하기 쉬움!

열에 평균 칼로리, 평균 카페인을 넣고

행에 메뉴명을 넣게 되면 완성

2. 메뉴별 칼로리 & 카페인

전체 대비 부분의 비율이 얼마나 되는지 한눈에 확인할 수 있는 트리맵

마크의 유형 = 사각형으로 설정하고

칼로리 -> 크기, 카페인 -> 색상으로 하면 완성

3. 카테고리와 메뉴명을 한 번에 살펴보기

1) [카테고리별 평균 칼로리 & 카페인] 시트로 이동

2) 도구 설명 - 삽입 - 시트 - [메뉴별 칼로리 & 카페인]

시트 2개를 한 번에 살펴볼 수 있다!

4. 당분 함유량과 칼로리 상관관계

열 = 당류, 행 = 칼로리

메뉴명을 세부 정보에 넣고, 마크의 형태를 원으로 변경하면 scatter plot 완성!

추세선과 평균까지 추가하면 전체적인 분포를 파악하기 쉽다

5. 시군구 별 매장 분표 현황

테이블명 앞에 있는 아이콘을 눌러

테이블명의 형식을 변경할 수 있다

[지리적 역할] - [시/도] or [시군구(카운티)]로 바꿔서 더블클릭하면 지역별 분포를 쉽게 나타낼 수 있다

*[시(도시)] 누르지 않도록 주의!

매장 수는 매장코드를 카운트하기

6. 대시보드 만들기

워크시트에서 만든 것들을

대시보드에 한번에 모아볼 수 있다

shift를 누르고 범례를 자유자재로 옮길 수 있다

'What I study > Tableau' 카테고리의 다른 글

[ 태블로 신병훈련소 17기 ] DAY 4 과제 (0)	2023.02.11
[ 태블로 신병훈련소 17기 ] DAY 3 과제 (0)	2023.02.08
[ 태블로 신병훈련소 17기 ] DAY 2 과제 (0)	2023.02.06

[ 책 리뷰 ] 그로스해킹

2023. 1. 30. 19:55

스타트업이 성공하기 위해 실패를 최소화하고 성공으로 가는 지름길을

친절하게 설명해주는 듯한 책이었다

그로스해킹(Growth Hacking) :

성장(Growth)과 해킹(Hacking)의 합성어로서

한정된 예산 하에 빠른 성장을 해야하는 스타트업들에게 효과적인 마케팅 기법 (출처 : 시사경제용어사전)

과거와 다르게

새로 생긴 회사가 빠르게 성장하기 위해 '데이터'를 활용할 수 있다

내나름대로 그로스해킹의 의미를 요약해보자면

<자원이 한정된 스타트업에서 고객지향 + 데이터 분석 + 상호작용 하는 마케팅 형태>

이정도? 느낌이다

✍️이 책에서 내가 저장하는 내용들

그로스 해커가 하는 일은 '누구'와 '어디'보다는 과학적으로 더 다양하고 측정 가능한 방법에 집중하는 것이다. 마케팅이 브랜드 기반이었다면 그로스 해킹은 지표와 ROI 기반으로 돌아간다. 순식간에 고객을 찾고 제품에 대한 관심을 얻는 일은 더 이상 막연한 추측에 기반한 일이 아니다. 하지만 이것은 단순히 더 나은 지표를 사용하는 마케팅이나 다이렉트 마케팅의 새로운 이름이 아니다.

과거에는 감이나 직관에 의존해서 마케팅을 개선해나갔지만, 이제는 의미 있고 측정 가능한 지표를 기반으로 개선점을 찾으면 된다!

최고의 마케팅 의사결정은 실존하는 잘 정의된 이용자 집단이 갖고 있는 현실적이고 강력한 욕구를 충족시키는 제품이나 비즈니스를 갖는 것이다.

제품 시장 궁합(PMF : Product Market Fit)은 저자가 강조하는 포인트 중에 하나이다

회사가 이용자(=고객)의 니즈를 충족시키려고 노력해야 한다는 점은 아무리 강조해도 모자라지 않은 듯하다

사람들이 당신의 제품을 어떻게 알고 어떻게 찾았는지는 중요하지 않다. 얼마나 많은 사람이 가입했는지가 중요하다. 만약 전단지를 길에 뿌린 것에 성공했다면 그것이 바로 그로스 해킹이다.
소비자의 '인식'에 신경 쓰는 전통적인 방식에서 벗어나 소비자를 확보하는 것에 집중하라.

제품과 시장의 궁합을 맞추어 소비자를 빠르게 확보하자!

그들에게 필요한 것은 이미 몰입되고 있는 장래가 유망한 이용자들을 만드는 일이었다.
유지(retention)와 최적화(optimization) : 별 관심 없는 사람을 온라인 배너 광고에 노출시켜서 전환을 시도하는 것보다, 훨씬 더 전환하기 쉬운 사람을 대상으로 마케팅하는 것이다.
그로스 해킹은 투자 대비 수익률(ROI)을 극대화하는 것이다. 우리의 에너지와 노력을 가장 효과적으로 쓸 수 있는 곳에 퍼붓는 것이다. 잠재 고객을 더 찾겠다고 하다가 회사에서 짤리는 것보다 현재의 잠재 고객을 활성화 고객으로 만드는 것이 낫다.

투자 대비 수익률을 극대화한다는 것은 선택과 집중이다

수익을 낼 수 있는 방향에 집중해야겠다

데이터 기반 접근법은 효과가 있는 것과 없는 것을 실제로 구분해서 보게 해주었다. 우리는 허영 지표를 쫓아다니지 않았다.
효과적이고, 확장 가능하며, 데이터에 기반을 둔 방법으로 사람들에게 다가가는 것이다.
사실 그로스 해킹은 도구가 아니라 사고방식이다.

실무에서 허영 지표에 속지 않도록 주의해야하겠다

사용자, 매출에 직접적으로 연관이 있는 지표를 찾아내자

그로스 해킹(growth hacking) : 그로스 해킹은 전통적인 마케팅 교본을 집어 던지고, 그 자리를 검증 가능하고, 추적 가능하며, 확장 가능한 고객 확보 기법들로 대체하는 사업 전략이다. 전통적인 마케팅 도구가 광고, 홍보, 돈이었다면 그로스 해킹 도구는 이메일, 클릭당 지불 광고, 블로그, 플랫폼 AI이다. 전통적인 마케팅에서는 '브랜딩'과 '마인드 공유' 같은 모호한 개념들을 추구하는 데에 반해 그로스 해커들은 끊임없이 이용자와 성장을 추구한다. 그리고 그로스 해킹이 제대로 먹혔을 때 이 이용자들은 더 많은 이용자들을 만들며, 늘어난 이용자들은 더욱더 많은 이용자들을 끌어들인다. 그로스 해킹 기법은 스타트업을 아무 것도 아닌 것에서 위대한 것으로 변화시키는 성장 머신으로써 스스로 존속하고 자가 증식하는 창조적 존재이자 운영자이며 시스템이다.

그로스 해커의 사고방식은 어떤 종류의 사업에도 적용 가능하다. 서비스에 정말 필요한 가치를 불어넣고, 탈출구 내지는 더 개발하고 이용할 여지가 있는 틈새 시장을 찾고, 구전 효과를 활성화시켜서 결국에는 데이터와 피드백을 기반으로 엄청나게 최적화하는 모든 것에 적용할 수 있다.

이용자의 입장이 되는 것이 그로스 해킹의 정답이다

데이터 분석은 자칫 잘못하면 데이터 분석 그 자체를 위한 분석이 되어 버릴 위험이 있다. 너무 빠지면 대체 자신이 왜 이런 데이터를 보고 잇고, 왜 분석을 하고 있는지 진짜 의미를 잊을 수 있는 것이다. ~ 사실 데이터 분석을 통해 나온 결론보다는 해당 분야에 대해 많은 경험을 통해 직감적으로 답을 알고 있는 사람이 해결책을 제시하는 것이 보다 실용적인 경우가 많다. 결국 이용자와 몸으로 많이 부대껴 본 사람이 진짜 답에 접근하기 더 쉽다는 이야기이다.
조직 내에 경험을 통한 감이 확실한 사람이 있다면 그 사람이 내놓은 가설을 실제 데이터로 검증하는 것부터 시작하는 것이 좋다. 즉, 명확한 목표와 범위를 설정하는 것이다. 그렇게 검증하는 과정에서 감은 감으로 끝나는 것이 아니라 재사용 및 변형 적용이 가능한 강력한 메커니즘으로 변신한다. 이 과정에서 얻는 또 하나의 장점은 분석 과정을 통해 감으로 얻었던 것 외의 다른 값진 통찰을 얻을 확률이 상당히 높다는 것이다.

분석 자체를 위한 분석이 되지 않도록 조심하자

(직감적으로 답을 내릴 수 있을 만큼) 이용자와 상호작용하는 경험 + 데이터 분석 => 결과 확인 -> 새로운 통찰을 얻을 수 있다는 결론!!

'Reference > Books' 카테고리의 다른 글

[ 책 리뷰 ] 데이터 문해력 (1)	2023.01.13
[ 책 리뷰 ] 감으로만 일하던 김 팀장은 어떻게 데이터 좀 아는 팀장이 되었나 (1)	2022.12.31

데이터리안 1월 세미나 후기 : 데이터 분석가 되면 어떤 일을 하나요?

2023. 1. 15. 19:07

데이터 분석가로서 회사에서 어떤 역할을 하는지 현직자의 이야기를 들어보고 싶어서

세미나에 참여하게 되었다

솔직히 말하면 1부 이야기는 100프로 이해하지는 못했다🥲

아직 낯선 용어들이 많이 등장해서 흐름 따라가기에도 벅찼다

(VOD 제공받으면 다시 들어보면서 포스팅 내용 보충해야지)

하지만 내용은 너무너무 알차고 유익했다!!❤️

글램 프로덕트 총괄이자 데이터 분석가인 카야님이 몇년간 겪은 소중한 경험을 차근차근 알려주셨고

개인적인 노하우와 생각들도 공유해주셨다

데이터 분석가가 하는 일은 데이터를 기반으로 조직의 비즈니스 의사결정을 돕는 일이다

회사의 조직의 데이터 리터러시 발전 과정은 크게

친해지기 -> 스며들기 -> 앞서가기

~~조직의 데이터 리터러시에 따라 데이터 분석가의 역할은 조금씩 달라질 수 있는데~~

~~이에 관한 자세한 내용은 추후에 정리할 예정~~

카야님의 회사가 데이터와 친해지기 단계일 때는 구글 스프레드시트에 직접 데이터 리포트를 만들어서

데이터 분석을 진행했다고 하셨다(😇)

내가 잠깐 회사에서 일했을 때 저런식으로 만들어진 데이터 자료를 활용해

업무에 적용했던 기억이 났다

덕분에 데이터를 효과적으로 관리하는 걸 배우기 위해 데이터 분석을 배우기 시작했지(tmi)

데이터 기반 의사결정을 전사적으로 확대해나가기 위한 여정이 아주 흥미로웠다

Q. 분석결과를 설득력있게 공유하는 노하우?

A. 1) 지금까지 회사가 어떻게 의사결정을 해왔는지 참고하고 기존 제도와 얼라인하게 진행한다

2) 현재 회사가 당면한 문제와 연관성을 고려한다

3) 회사 내 주로 쓰는 용어, 지표 확인한다

Q. AB테스트 임팩트 판단하는 기준

A. 가설에 따라 달라진다

1) 1차적인 성공 지표 (가설 검증ㅇ)

2) 모니터링 지표 : 가설과 별개 but 서비스의 핵심 (예 : 리텐션)

3) 이 실험으로 인해 부정적 영향(side effect)을 주지 않게

p-value는 참고 할때도 있고 아닐때도 있고..

Q. 데이터 분석이 막히거나 어려울때 어떻게 하시나요?

A. 다른 데이터를 의미없이 더 구하면 시간 소모만 될뿐,,

처음으로 돌아가자! 분석의 기획, 방향성을 확인하자

'분석을 통해 어떤걸 원했지? 지금까지 어떤걸 얻었지? 현시점에서 분석의 결론은 무엇인지?'

데이터 분석 자체에 매몰되지 말자!

Q. 데이터 분석가가 가지면 좋은 태도가 있을까요?

A. 1) 본인은 문제해결사인가? (기술보다 의미있는 액션~)

2) 분석가로서의 주관 발휘

3) 열린 자세

실무를 경험하지 못한 나에게 너무나도 유익했던 Q&A 시간이 지나

중고거래 플랫폼 데이터 분석가 배예슬님과 NICE지니데이타 데이터 분석가 정보경님의

'데이터 분석가의 하루'를 들을 수 있었다

데이터라는 것이 분야에 따라, 조직의 데이터 리터러시에 따라천차만별이기 때문에 두 분의 분석 업무 일과도 많이 달랐다!오히려 달라서 더 재밌게 들을 수 있었던 것 같다

여러 가지 이야기를 들었지만 그 중 기억에 남는 것은

1. 데이터 분석가로서 분석 자체보다 다른 일을 더 많이 할 수 있다

2. 워라밸은 그렇게 좋지 않다(^_T)

다들 너무 멋있고 배우고 싶은 선배님들이었다!!

다음 세미나도 참석해야징

[ 책 리뷰 ] 데이터 문해력

2023. 1. 13. 18:47

데이터 분석을 배우는 모든 사람들에게 도움이 될 것이라고 확신하는 책!

1회독 슈슉 읽고 2회독은 내용을 정리해가며 읽었다

눈앞에 놓인 데이터 읽기에 급급하거나 분석 기법에 매몰되지 않고

목적 지향적인 데이터 분석은 이렇게 하는 것이다! 라고 차근차근 설명해준다

분석가로서는 기계가 할 수 없는, 사람이 할 수 있는 가치 창출에 집중하자는 그런 이야기가 인상 깊었다

데이터와 분석은 내가 원하는 가치를 창출하기 위한 수단임을 명심하자!

✍️이 책에서 내가 저장하는 내용들

1장. 앞으로 필요한 건 데이터 문해력 : 분석보다 활용

인간보다 기계가 잘하는 일은 기계한테 맡기고 기계가 할 수 없는 것, 사람이 해야 하는 것을 갈고 닦아 자신에게 필요한 형태로 효과적으로 활용해서 최대한의 결과물을 창출하는 것을 목표로 삼자

그림1-1에서 (2)보다 (1)과 (3)에서 사람이 가치를 창출할 수 있다.

👎자주 겪는 문제점

1. 데이터를 적절하게 분석하면 문제와 목적, 결론이 나올 것이라고 생각한다 (이것은 본래 분석자 스스로가 생각해야 하는 것)

2. 눈앞의 데이터를 적절히 가공하면 뭔가 유용한 정보를 얻을 수 있을 것으로 생각한다. 아무것도 안나오게 되면, 분석 방법에 문제가 있다고 생각한다.

2장. 올바른 데이터로 올바른 문제를 풀고 있는가?

<데이터 활용에 실패하는 두 가지 주요 원인>

주요 원인 1 : 풀고자 하는 문제가 명확하지 않다

Are you solving the right problem?

주요 원인 2 : 정의한 문제와 사용하는 데이터가 일치하지 않는다

Are you using the right data?

주요 원인 1 : 풀고자 하는 문제가 명확하지 않다

예를 들어, ‘인구 문제를 데이터로 분석해보자’고 하면 구체적인 목적에는 인구 감소 문제 해결, 저출산 고령화 문제 해결, 인구 유출을 막고 유입 촉진 등이 있다.

절대적인 정답이 존재하지 않을 때, 여러분은 자신의 생각을 무엇으로 논리적이고 객관적으로 상대방에게 전달하고 이해시킬 수 있을까요? 자신의 결론으로 이끌어 내는 이야기를 만드는 능력이 앞으로 더욱 중요해진다는 것은 더 말할 필요도 없습니다.

가장 먼저, ‘목적과 문제에 대한 정의’를 해야한다

1) 나는 무엇을 알고 싶은가
2) 나는 무엇을 해결하고자 하는가

💡 자신이 알고 있거나 보고 들은 적이 있고 경험한 적 있는 직접적인 대상은 어디까지나 겉으로 드러난 현상과 사실이기 때문에, ‘문제와 목적’이라고 하기에는 충분하지 않다

<목적과 문제를 정의할 때 확인해야 할 포인트 두 가지>

포인트 1 : 사용된 언어가 구체적이고 명확한가?

포인트 2 : 문제, 원인, 해결 방안을 구분하고 있는가?

문제 ⇒ 원인 ⇒ 해결 방안

주요 원인 2 : 정의한 문제와 사용하는 데이터가 일치하지 않는다

나는 올바른 데이터(지표)를 활용하고 있는가?

예를 들어, 오늘 처음 만난 외부인이나 제3자에게 데이터를 보여주면서, ‘제 고민은 이것입니다’, ‘이것이 문제입니다’, ‘이것을 이해해주시면 좋겠습니다’라고 말할 때, 어떤 데이터를 활용하겠습니까?

목적이나 배경을 공유하지 않은 사람이나 한 번에 전부 복잡하게 이것저것 설명해서 이해하기 힘들어하는 사람에게 어떻게 자신의 ‘목적’과 ‘문제’를 전달할 수 있을까요? 상대방의 입장에서 생각해봐야 자신의 개선점이 보일 것입니다.

3장. ‘이것이 문제다’ 데이터로 말하는 방법

실무에서 ‘가치 있는’ 정보란, 다음 중 한 가지와 연결되어야 한다.

1) 구체적인 행동을 특정할 수 있다.(누가 언제 무엇을 했는지)

2) 구체적인 판단을 내릴 재료가 된다.

‘평가’를 하기 위해 필요한 것은 ‘비교’

데이터란 숫자의 크고 작음을 나타내는 것이지 그 값에 대한 평가를 단독으로 내릴 수 없습니다.

비교 대상이 있어야 비로소 값에 대한 평가가 가능해집니다.

당신이 현재 직면하고 있는 문제나 그 배경에 대해 전혀 모르는 제3자가 바로 앞에 있다고 상상하세요. 그 사람에게 당신이 다루는 문제를 데이터로 설명하려면 무슨 데이터를 어떻게 보여주면 좋을까요? 상대방이 그 데이터를 보고 나서, ‘그렇군요! 확실히히 문제가 있네요!’라고 말한다면 성공한 것입니다.

4장. 결과가 나왔다고 끝난 것은 아니다

조직에서 데이터를 잘 활용하고 있다는 것은, 그 정보를 통해 문제 해결 방안을 수립하거나 구체적인 행동 계획을 세우거나 관계자들이 납득할만한 합의 또는 판단을 내릴 수 있다는 이야기입니다

5장. 기법에 집착하지 마라

데이터를 활용하려면 본질적으로 논리적인 사고가 반드시 기반이 되어야 한다

문제 해결 프로세스에서 누구나 하는 실수

= 곧바로 ‘해결 방안’에 무턱대로 달려드는 것

‘해결 방안’은 ‘문제’에 직접적으로 적용하는 것이 아니라, ‘문제’를 일으키고 있는 ‘원인’에 적용하는 것

‘해결 방안’이 좀처럼 성과를 내지 못한다고 느껴질 때는, 그 방안에 이르기까지의 과정에서 ‘원인’을 간과한 결과가 아닌지 의심해봐야 합니다. 해결방안은 이 질문에 답을 할 수 있어야 합니다.

어째서 (다른 수단이 아니라) 그것이 필요한지?
그로 인해 어떤 것을 실현 또는 해결 가능한가? 그리고 효과적인 결과가 나올 것이라는 근거는 어디에 있는가?

6장. ‘결론은 이것이다’ 정보를 요약하라

결과와 결론은 다르다

결론이란 결과에 기반해 도출해야 한다

결과로부터 결론을 도출할 때는 자신의 정보 집약 능력에 더해 어느 정도 상상력도 필요합니다. 하지만 여기서 주의해야할 점은, 필요 이상으로 자신의 해석을 덧붙이지 않아야 한다는 것입니다.

'Reference > Books' 카테고리의 다른 글

[ 책 리뷰 ] 그로스해킹 (0)	2023.01.30
[ 책 리뷰 ] 감으로만 일하던 김 팀장은 어떻게 데이터 좀 아는 팀장이 되었나 (1)	2022.12.31

[MYSQL] 조건에 조건 더하기

2023. 1. 9. 18:53

메인 쿼리(OUTER QUERY) + 서브 쿼리(INNER QUERY)

<쿼리의 핵심 키워드 6가지>

SELECT FROM WHERE GROUP BY HAVING ORDER BY

💡 GROUP BY 제외한 나머지 핵심 키워드에 서브 쿼리 적용 가능

서브 쿼리 : 하나의 쿼리 내에 포함된 또 하나의 쿼리
서브 쿼리는 괄호 안에 있어야 함
INSERT, UPDATE, DELETE에도 적용 가능
서브 쿼리에는 ; (세미 콜론)을 붙이지 않아도 됨

SELECT절의 서브 쿼리 (스칼라 서브 쿼리)

반드시 결과값이 하나의 값이어야 함

SELECT [칼럼 이름]

(

SELECT

FROM

WHERE

)

FROM [테이블 이름] WHERE 조건식;

FROM절의 서브 쿼리 (인라인 뷰 서브쿼리)

반드시 결과값이 하나의 테이블이어야 함
반드시 서브쿼리로 만든 테이블은 별명을 가져야 함

SELECT [칼럼 이름]

FROM

(

SELECT

FROM

WHERE

) AS [테이블 별명]

WHERE 조건식;

FROM절의 서브 쿼리 (중첩 서브쿼리)

반드시 결과값이 하나의 칼럼이어야 함 (EXISTS 제외)
- 하나의 칼럼에는 여러 개의 값이 존재할 수 O
연산자와 함께 사용합니다
- WHERE [칼럼 이름] [연산자] [서브 쿼리] 형식

SELECT [칼럼 이름]

FROM [테이블 이름]

WHERE [칼럼 이름] [연산자]

(

SELECT

FROM

WHERE

);

비교 연산자	= != > >= < <=
주요 연산자	IN ALL ANY EXISTS ⇒ TRUE or FALSE 반환 *EXISTS는 연산자 없이 단독으로 사용, 결과값이 여러 칼럼이어도 OK

ALL

< (작다) : 서브 쿼리의 최솟값보다 작은지

> (크다) : 서브 쿼리의 최댓값보다 큰지

ANY

< (작다) : 서브 쿼리의 최댓값보다 작은지

> (크다) : 서브 쿼리의 최솟값보다 큰지

'What I study > mysql' 카테고리의 다른 글

[MYSQL] 여러 테이블을 한번에 다루기 (0)	2023.01.09
[MYSQL] 규칙 만들기 (0)	2023.01.05
[MYSQL] 데이터 그룹화하기 (0)	2023.01.03
[MYSQL] 원하는 데이터 만들기 (0)	2023.01.02
[MYSQL] 조건에 맞는 데이터 가져오기 (WHERE) (0)	2023.01.02

PREV 이전 1 2 3 4 NEXT 다음