기초 통계 개념_2
비율과 확률
비율 : 비교하는 양 / 기준량
확률 : 해당 사건이 일어날 경우의 수 / 일어날 수 있는 모든 경우의 수
구매 비율은 연령 별로 다를 수 있어도, 구매 확률은 모두 동일하다.
* 구매확률은 구매한다와 안한다로 나뉘기 때문
확률의 덧셈, 곱셈 법칙
확률의 덧셈 법칙
- 서로 동시에 일어나지 않는 사건(배반 사건)의 경우 두 사건의 확률을 더하여 확률을 구한다는 개념
예시. 동전의 앞면 또는 뒷면이 나오는 사건
확률의 곱셈 법칙
- 서로 동시에 일어나는 사건(독립사건 또는 종속사건)의 경우에는 두 사건의 확률을 곱하여 확률을 구한다는 개념
예시. 독립 사건(서로 영향이 없는 사건)
주사위 2개를 던졌을 때 1과 2가 나올 확률
1 / 6 X 1 / 6 = 1 / 18
종속사건(사건이 먼저 일어나면 그 다음 사건에 영향을 미치는 사건)
주머니 속 빨간 공 3개, 파란 공 2개가 있을 때, 빨간 공 1개를 꺼낸 뒤 넣지 않고 파란 공 1개를 더 꺼낼 확률
3 / 5 X 2 / 4 = 30%
비가 오는 날 우비가 완판될 확률이 50%, 강수확률은 40%, 우비가 완판 될 확률은?
- 해당 사건은 종속사건임
40 / 100 X 50 / 100 = 20%
평균, 분산, 표준편차
데이터가 정규분포를 이루고 있을 때 의미있는 지표
하나의 봉우리를 기준으로 좌우대칭되는 그래프가 되는 상태를 의미
평균 : 전체 데이터 합계 / 전체 데이터 개수
분산 : 데이터의 흩어진 정도를 나타내는 값, 그래프에서는 기울기(경사)로 표현
(평균과의 차이)제곱의 합계 / 전체 데이터의 개수
표준편차 : 분산에 루트
예시. A/ 평균 거래액 20,000원인 고객 그룹의 평균 거래액을 26,000원으로 올리는 것과
B/ 평균 거래액이 50,000원인 고객 그룹의 평균 거래액을 60,000원으로 올리는 것 중 더 어려운 것은?
A의 표준편차는 2,000원 / B의 표준편차는 5,000원
B가 A 대비 1표준편차만큼 더 쉽다.
상관 분석
- 두 변수가 선형적인 관계를 가지는지 분석하는 기법으로 상관계수를 가지고 측정함
- 서로 다른 데이터의 관계를 수치화한 것을 의미
- 상관 분석은 상관 관계에 대한 것을 나타낼 뿐 인과 관계를 나타내지 않음
- 상관계수는 단위가 없기 때문에 단위가 다른 변수들 간의 분석도 가능
상관 계수
- 상관계수는 -1 ~ 1사이의 값을 가짐
- 상관계수가 음의 값을 가질 것을 음의 상관관계이므로 한 변수의 값을 작으면 다른 변수의 값도 커짐
- 반대로 상관계수가 양의 값을 가질 경우 한 변수의 값이 커지면 다른 변수의 값도 커짐
상관계수는 +-0.4 이상일 경우 상관계수가 있으며, 1과 가까울 수록 상관관계가 높음
엑셀에서 CORREL 함수를 사용해서 계산할 수 있음
= CORREL(A변수의 범위, B변수의 범위)
예시. CORRL(매출의 범위, 노출의 범위) 와 같이 활용하여 매출이 올랐을 때
노출, 도달, 클릭, 앱설치, 광고비용 중 어떤 수치가 가장 매출액과 관계가 높을까?
A/B 테스트의 가설 설정부터 결과 분석
순서도
가설 설정 -> 변수정의 -> 독립변수별 성과 확인 -> 기존 성과 비교 검증
가설설정 원칙
- 가설은 검증 가능하게 설정 : A를 실행하면 B가 10% 증가할 것이다.
- 가설은 데이터 기반으로 설정 : 논리적 유추를 통해 설정해야 하므로 근거(데이터)가 필요,
- 가설 설정을 위한 데이터가 없을 경우, 가설 설정을 위한 데이터 수집 목적의 단기적인 테스트 진행 가능
- 가설 설정을 위한 데이터가 없을 경우, 다른 레퍼런스와 아이디어를 참고해서 가설 설정 가능
예시. 구매전환율 개선 실험 가설
가정. 제품의 정가 대신 최대 할인율을 적용한 가격을 보여주면 구매전환율이 증가할 것
1단계. 제품의 정가 대신 최대 할인율을 적용한 가격을 보여주기 위한 비용 산출
2단계. 구매전환율이 얼마나 개선되어야 1단계에서 산출한 비용이 상쇄되는지 계산
가설. 구매전환율이 10% 개선되어야 상쇄된다면 아래와 같이 가설 설정
- 제품의 정가 대신 최대 할인율을 적용한 가격을 보여주면 구매전환율이 10% 증가할 것이다.
변수 정의
독립 변수 : 원인에 해당하는 변수
독립 변수와 종속 변수는 인과 관계가 이루어지도록 설정
빠르고 정확한 테스트 결과 분석을 위하여 한 번에 한가지 영역만 설정
종속 변수 : 결과에 해당하는 변수
종속 변수의 경우 주요 KPI 또는 개선햐애 할 지표를 선택하는 것이 좋음
독립 변수 지정할 만한 예시
랜딩 url 또는 링크, CTA 버튼 내 문구, 타이틀 또는 소구 포인트, 이미지 또는 디자인, 타겟 연령 또는 성별 또는 관심사, 캠페인 목표, 비딩
종속 변수로 지정할 만한 요소 예시
링크 클릭 수 또는 클릭률, 앱 오픈 수 또는 오픈율, 회원가입 수 또는 가입률, 예약 수 또는 예약률, 구매 수 또는 구매율, 그 외 중요한 KPI나 GOAL
결과 분석
독립 변수별 성과 비교
- 독립 변수인 A와 B 중 무엇이 더 종속 변수를 많이 개선 또는 변화시켰는지 확인하는 과정을 의미
'마케팅 > 데이터' 카테고리의 다른 글
마케터가 알아야 할 데이터 분석 PART. 1_관점과 흐름 (0) | 2023.03.12 |
---|---|
마케터에게 필요한 데이터 리터러시(히스토그램, 확률분포, 그래프 등) (0) | 2023.02.26 |
기초 수학 개념_1(사칙연산, 마진율, 가중치 등) (0) | 2023.02.26 |