๋‚ด์ผ๋ฐฐ์›€์บ ํ”„/๐Ÿ‘ฉ๐Ÿป‍๐Ÿ’ปTIL:Today I Learn

[ํ†ต๊ณ„ํ•™ ๊ธฐ์ดˆ]_3์ฃผ์ฐจ

๊ธฐํš ์—ด์ •์˜ ํ•ญํ•ด! 2025. 1. 20. 15:24

์ถœ์ฒ˜ : [์ŠคํŒŒ๋ฅดํƒ€์ฝ”๋”ฉํด๋Ÿฝ] ์œ ์˜์„ฑ๊ฒ€์ •

[์ŠคํŒŒ๋ฅดํƒ€์ฝ”๋”ฉํด๋Ÿฝ] ์œ ์˜์„ฑ๊ฒ€์ •

[์ˆ˜์—… ๋ชฉํ‘œ]

๊ฐ๊ฐ์˜ ์œ ์˜์„ฑ ๊ฒ€์ • ๋ฐฉ๋ฒ•๋“ค์— ์ดํ•ดํ•˜๊ณ  ํŠน์ง•์„ ํŒŒ์•…ํ•œ๋‹ค.
์‹ ๋ขฐ๊ตฌ๊ฐ„๊ณผ ๊ฐ€์„ค๊ฒ€์ •์˜ ๊ด€๊ณ„์— ๋Œ€ํ•ด ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋‹ค.
์ œ 1์ข… ์˜ค๋ฅ˜์™€ 2์ข… ์˜ค๋ฅ˜์— ๋Œ€ํ•ด ์ดํ•ดํ•˜๊ณ  ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ๋‹ค.

 


3.1 A/B ๊ฒ€์ •

โœ”๏ธ ๋‘ ๊ทธ๋ฃน (A, B)๊ณผ ๋น„๊ตํ•˜๋Š”๊ฒŒ ํฌ์ธํŠธ!

 

1) A/B ๊ฒ€์ •์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

 

โ˜‘๏ธ ๊ทธ๋ฆผ์œผ๋กœ ํ™•์ธํ•˜๊ธฐ!

โ˜‘๏ธ A/B ๊ฒ€์ • 

  • A/B ๊ฒ€์ •์€ ๋‘ ๋ฒ„์ „(A์™€ B) ์ค‘ ์–ด๋А ๊ฒƒ์ด ๋” ํšจ๊ณผ์ ์ธ์ง€ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ๊ฒ€์ • ๋ฐฉ๋ฒ•.
  • ๋งˆ์ผ€ํŒ…, ์›น์‚ฌ์ดํŠธ ๋””์ž์ธ ๋“ฑ์—์„œ ๋งŽ์ด ์‚ฌ์šฉ๋จ.
  • ์‚ฌ์šฉ์ž๋“ค์„ ๋‘ ๊ทธ๋ฃน์œผ๋กœ ๋‚˜๋ˆ„๊ณ , ๊ฐ ๊ทธ๋ฃน์— ๋‹ค๋ฅธ ๋ฒ„์ „์„ ์ œ๊ณตํ•œ ํ›„, ๋ฐ˜์‘์„ ๋น„๊ต.
  • ์ผ๋ฐ˜์ ์œผ๋กœ ์ „ํ™˜์œจ, ํด๋ฆญ๋ฅ , ๊ตฌ๋งค์ˆ˜, ๋ฐฉ๋ฌธ ๊ธฐ๊ฐ„, ๋ฐฉ๋ฌธํ•œ ํŽ˜์ด์ง€ ์ˆ˜, ํŠน์ • ํŽ˜์ด์ง€ ๋ฐฉ๋ฌธ ์—ฌ๋ถ€, ๋งค์ถœ ๋“ฑ์˜ ์ง€ํ‘œ๋ฅผ ๋น„๊ต.

โ˜‘๏ธ ๋ชฉ์ 

  • ๋‘ ๊ทธ๋ฃน ๊ฐ„์˜ ๋ณ€ํ™”๊ฐ€ ์šฐ์—ฐ์ด ์•„๋‹ˆ๋ผ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•œ์ง€๋ฅผ ํ™•์ธ.

2) A/B ๊ฒ€์ •์ด ์‹ค์ œ๋กœ ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜์–ด์งˆ๊นŒ?

โ˜‘๏ธ ๋‘ ๊ฐœ๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ตฌ๋งค ์ „ํ™˜์œจ์ด ํฐ ๊ฒƒ์„ ์„ ํƒ

  • ์˜จ๋ผ์ธ ์‡ผํ•‘๋ชฐ์—์„œ ๋‘ ๊ฐ€์ง€ ๋””์ž์ธ(A์™€ B)์— ๋Œ€ํ•œ ๋žœ๋”ฉ ํŽ˜์ด์ง€๋ฅผ ํ…Œ์ŠคํŠธํ•˜์—ฌ ์–ด๋–ค ๋””์ž์ธ์ด ๋” ๋†’์€ ๊ตฌ๋งค ์ „ํ™˜์œจ์„ ๊ฐ€์ ธ์˜ค๋Š”์ง€ ํ‰๊ฐ€.

โ˜‘๏ธ ํŒŒ์ด์ฌ ์‹ค์Šต

import numpy as np
import scipy.stats as stats

# ๊ฐ€์ •๋œ ์ „ํ™˜์œจ ๋ฐ์ดํ„ฐ
group_a = np.random.binomial(1, 0.30, 100)  # 30% ์ „ํ™˜์œจ
group_b = np.random.binomial(1, 0.45, 100)  # 45% ์ „ํ™˜์œจ

# t-test๋ฅผ ์ด์šฉํ•œ ๋น„๊ต
t_stat, p_val = stats.ttest_ind(group_a, group_b)
print(f"T-Statistic: {t_stat}, P-value: {p_val}")

 

โ“ stats.ttest_ind๊ฐ€ ๋ญ”๊ฐ€์š”?

  • scipy.stats.ttest_ind ํ•จ์ˆ˜๋Š” ๋…๋ฆฝํ‘œ๋ณธ t-๊ฒ€์ •(Independent Samples t-test)์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ๋‘ ๊ฐœ์˜ ๋…๋ฆฝ๋œ ์ง‘๋‹จ ๊ฐ„ ํ‰๊ท ์˜ ์ฐจ์ด๊ฐ€ ์œ ์˜๋ฏธํ•œ์ง€ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  • ์ด ํ•จ์ˆ˜๋Š” ๋‘ ์ง‘๋‹จ์˜ ๋ฐ์ดํ„ฐ ๋ฐฐ์—ด์„ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„์„œ t-ํ†ต๊ณ„๋Ÿ‰๊ณผ p-๊ฐ’์„ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
    • t-ํ†ต๊ณ„๋Ÿ‰ (statistic)
      • t-๊ฒ€์ • ํ†ต๊ณ„๋Ÿ‰์ž…๋‹ˆ๋‹ค. ๋‘ ์ง‘๋‹จ ๊ฐ„ ํ‰๊ท  ์ฐจ์ด์˜ ํฌ๊ธฐ์™€ ๋ฐฉํ–ฅ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
    • p-๊ฐ’ (pvalue)
      • p-๊ฐ’์€ ๊ท€๋ฌด ๊ฐ€์„ค์ด ์ฐธ์ผ ๋•Œ, ํ˜„์žฌ ๋ฐ์ดํ„ฐ๋ณด๋‹ค ๊ทน๋‹จ์ ์ธ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ ์ž…๋‹ˆ๋‹ค.
      • ์ด ๊ฐ’์ด ์œ ์˜์ˆ˜์ค€(α) ๋ณด๋‹ค ์ž‘์œผ๋ฉด ๊ท€๋ฌด ๊ฐ€์„ค์„ ๊ธฐ๊ฐํ•˜๊ณ  ์ด ๊ฐ’์ด ์œ ์˜์ˆ˜์ค€(α) ๋ณด๋‹ค ํฌ๋ฉด ๊ท€๋ฌด ๊ฐ€์„ค์„ ๊ธฐ๊ฐํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

โ˜‘๏ธ ์‹ค์ „ ์˜ˆ์‹œ !!!(๊ด€์‹ฌ์žˆ์œผ๋ฉด ๊ผญ ์ฝ์–ด๋ณด๊ธฐ)

 

๊ฑฐ๋ž˜ ํ›„๊ธฐ ์‹คํ—˜์„ ํ†ตํ•ด ๋”ฐ๋œปํ•œ ๊ฑฐ๋ž˜ ๊ฒฝํ—˜ ๋งŒ๋“ค๊ธฐ

๊ฑฐ๋ž˜ ํ›„๊ธฐ ์‹คํ—˜์„ ํ†ตํ•ด ๋‹น๊ทผ๋งˆ์ผ“์ด ์–ด๋–ป๊ฒŒ ๋”ฐ๋œปํ•œ ์„œ๋น„์Šค๋ฅผ ๋งŒ๋“ค๊ณ  ์„ฑ์žฅ์‹œ์ผœ ๋‚˜๊ฐ€๋Š”์ง€ ์†Œ๊ฐœํ•ด ๋“œ๋ฆด๊ฒŒ์š”!

medium.com

 


โญ3.2 ๊ฐ€์„ค๊ฒ€์ •

โœ”๏ธ ๋ฐ์ดํ„ฐ๊ฐ€ ํŠน์ • ๊ฐ€์„ค์„ ์ง€์ง€ํ•˜๋Š”์ง€ ๊ฒ€์ •ํ•˜๋Š”๊ฒŒ ํฌ์ธํŠธ!

 

โ˜‘๏ธ ๊ทธ๋ฆผ์œผ๋กœ ํ™•์ธํ•˜๊ธฐ!

โ˜‘๏ธ ๊ฐ€์„ค๊ฒ€์ •

  • ํ‘œ๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ๋ชจ์ง‘๋‹จ์˜ ๊ฐ€์„ค์„ ๊ฒ€์ฆํ•˜๋Š” ๊ณผ์ •
  • ์ฆ‰, ๋ฐ์ดํ„ฐ๊ฐ€ ํŠน์ • ๊ฐ€์„ค์„ ์ง€์ง€ํ•˜๋Š”์ง€ ํ‰๊ฐ€ํ•˜๋Š” ๊ณผ์ •
  • ๊ท€๋ฌด๊ฐ€์„ค(H0)๊ณผ ๋Œ€๋ฆฝ๊ฐ€์„ค(H1)์„ ์„ค์ •ํ•˜๊ณ , ๊ท€๋ฌด๊ฐ€์„ค์„ ๊ธฐ๊ฐํ• ์ง€๋ฅผ ๊ฒฐ์ •
  • ๋ฐ์ดํ„ฐ ๋ถ„์„์‹œ ๋‘๊ฐ€์ง€ ์ „๋žต์„ ์ทจํ•  ์ˆ˜ ์žˆ์Œ
    • ํ™•์ฆ์  ์ž๋ฃŒ๋ถ„์„
      • ๋ฏธ๋ฆฌ ๊ฐ€์„ค๋“ค์„ ๋จผ์ € ์„ธ์šด ๋‹ค์Œ ๊ฐ€์„ค์„ ๊ฒ€์ฆํ•ด ๋‚˜๊ฐ€๋Š” ๋ถ„์„
    • โญํƒ์ƒ‰์  ์ž๋ฃŒ๋ถ„์„(EDA)
      • ๊ฐ€์„ค์„ ๋จผ์ € ์ •ํ•˜์ง€ ์•Š๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ํƒ์ƒ‰ํ•ด๋ณด๋ฉด์„œ ๊ฐ€์„ค ํ›„๋ณด๋“ค์„ ์ฐพ๊ณ  ๋ฐ์ดํ„ฐ์˜ ํŠน์ง•์„ ์ฐพ๋Š” ๊ฒƒ

โ˜‘๏ธ ๋‹จ๊ณ„

  1. ๊ท€๋ฌด๊ฐ€์„ค(H0)๊ณผ ๋Œ€๋ฆฝ๊ฐ€์„ค(H1) ์„ค์ • (ex. ์‹ ์•ฝ๊ฐœ๋ฐœ์ด๋ผ๊ณ  ํ–ˆ์„ ๋•Œ, ๊ท€๋ฌด๊ฐ€์„ค์€ ํšจ๊ณผ๊ฐ€ ์—†๋‹ค, ๋Œ€๋ฆฝ๊ฐ€์„ค์€ ํšจ๊ณผ๊ฐ€ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ํšŒ์‚ฌ ์ž…์žฅ์—์„  ๋Œ€๋ฆฝ๊ฐ€์„ค์ด ๋งž๊ธธ ๋ฐ”๋ผ๊ฒ ์ง€)
  2. ์œ ์˜์ˆ˜์ค€(α) ๊ฒฐ์ • (p๊ฐ’์ด 0.05๋ณด๋‹ค ์ž‘์•„์•ผ ๋Œ€๋ฆฝ๊ฐ€์„ค์„ ์ฑ„ํƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.)
  3. ๊ฒ€์ •ํ†ต๊ณ„๋Ÿ‰ ๊ณ„์‚ฐ
  4. p-๊ฐ’๊ณผ ์œ ์˜์ˆ˜์ค€ ๋น„๊ต
  5. ๊ฒฐ๋ก  ๋„์ถœ

2) ํ†ต๊ณ„์  ์œ ์˜์„ฑ๊ณผ p๊ฐ’

โ˜‘๏ธ ํ†ต๊ณ„์  ์œ ์˜์„ฑ

  • ํ†ต๊ณ„์  ์œ ์˜์„ฑ์€ ๊ฒฐ๊ณผ๊ฐ€ ์šฐ์—ฐํžˆ ๋ฐœ์ƒํ•œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์–ด๋–ค ํšจ๊ณผ๊ฐ€ ์‹ค์ œ๋กœ ์กด์žฌํ•จ์„ ๋‚˜ํƒ€๋‚ด๋Š” ์ง€ํ‘œ
  • p๊ฐ’์€ ๊ท€๋ฌด ๊ฐ€์„ค์ด ์ฐธ์ผ ๊ฒฝ์šฐ ๊ด€์ฐฐ๋œ ํ†ต๊ณ„์น˜๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ ์„ ์˜๋ฏธ
  • ์ผ๋ฐ˜์ ์œผ๋กœ p๊ฐ’์ด 0.05 ๋ฏธ๋งŒ์ด๋ฉด ๊ฒฐ๊ณผ๋ฅผ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜ํ•˜๋‹ค๊ณ  ํŒ๋‹จ

โ˜‘๏ธ p-๊ฐ’

  • ๊ท€๋ฌด๊ฐ€์„ค์ด ์ฐธ์ผ ๋•Œ, ๊ด€์ฐฐ๋œ ๊ฒฐ๊ณผ ์ด์ƒ์œผ๋กœ ๊ทน๋‹จ์ ์ธ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ํ™•๋ฅ 
  • ์ผ๋ฐ˜์ ์œผ๋กœ p-๊ฐ’์ด ์œ ์˜์ˆ˜์ค€(α)๋ณด๋‹ค ์ž‘์œผ๋ฉด ๊ท€๋ฌด๊ฐ€์„ค์„ ๊ธฐ๊ฐ
  • ์œ ์˜์ˆ˜์ค€์œผ๋กœ ๋งŽ์ด ์‚ฌ์šฉํ•˜๋Š” ๊ฐ’์ด 0.05

โ˜‘๏ธ p-๊ฐ’์„ ํ†ตํ•œ ์œ ์˜์„ฑ ํ™•์ธ

  • p-๊ฐ’์ด 0.03์ด๋ผ๋ฉด, 3%์˜ ํ™•๋ฅ ๋กœ ์šฐ์—ฐํžˆ ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ์Œ
  • ์ผ๋ฐ˜์ ์œผ๋กœ 0.05 ์ดํ•˜๋ผ๋ฉด ์œ ์˜์„ฑ์ด ์žˆ๋‹ค๊ณ  ๋ด„

3) ์‹ ๋ขฐ๊ตฌ๊ฐ„๊ณผ ๊ฐ€์„ค๊ฒ€์ •์˜ ๊ด€๊ณ„

โ˜‘๏ธ ์‹ ๋ขฐ๊ตฌ๊ฐ„๊ณผ ๊ฐ€์„ค๊ฒ€์ •

  • ์‹ ๋ขฐ๊ตฌ๊ฐ„๊ณผ ๊ฐ€์„ค๊ฒ€์ •์€ ๋ฐ€์ ‘ํ•˜๊ฒŒ ๊ด€๋ จ๋œ ๊ฐœ๋…
  • ๋‘˜ ๋‹ค ๋ฐ์ดํ„ฐ์˜ ๋ชจ์ˆ˜(ex. ํ‰๊ท )์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๊ตฌํ•˜๊ณ ์ž ํ•˜๋Š” ๊ฒƒ์ด์ง€๋งŒ ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋‹ค๋ฆ„
  • ์‹ ๋ขฐ๊ตฌ๊ฐ„
    • ํŠน์ • ๋ชจ์ˆ˜๊ฐ€ ํฌํ•จ๋  ๋ฒ”์œ„๋ฅผ ์ œ๊ณต

โ“์—ฌ๊ธฐ์„œ ์ž ๊น! ์‹ ๋ขฐ๊ตฌ๊ฐ„์ด ๋ฌด์—‡์ผ๊นŒ์š”~?

์‹ ๋ขฐ๊ตฌ๊ฐ„ (Confidence Interval)

  • ์‹ ๋ขฐ๊ตฌ๊ฐ„์€ ๋ชจ์ง‘๋‹จ์˜ ํ‰๊ท ์ด ํŠน์ • ๋ฒ”์œ„ ๋‚ด์— ์žˆ์„ ๊ฒƒ์ด๋ผ๋Š” ํ™•๋ฅ ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  • ์ผ๋ฐ˜์ ์œผ๋กœ 95% ์‹ ๋ขฐ๊ตฌ๊ฐ„์ด ์‚ฌ์šฉ๋˜๋ฉฐ, ์ด๋Š” ๋ชจ์ง‘๋‹จ ํ‰๊ท ์ด 95% ํ™•๋ฅ ๋กœ ์ด ๊ตฌ๊ฐ„ ๋‚ด์— ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  • ๋งŒ์•ฝ ์–ด๋–ค ์„ค๋ฌธ์กฐ์‚ฌ์—์„œ ํ‰๊ท  ๋งŒ์กฑ๋„๊ฐ€ 75์ ์ด๊ณ , ์‹ ๋ขฐ๊ตฌ๊ฐ„์ด 70์ ์—์„œ 80์ ์ด๋ผ๋ฉด, ์šฐ๋ฆฌ๋Š” 95% ํ™•๋ฅ ๋กœ ์‹ค์ œ ํ‰๊ท  ๋งŒ์กฑ๋„๊ฐ€ ์ด ๋ฒ”์œ„ ๋‚ด์— ์žˆ๋‹ค๊ณ  ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  •  
  • ๊ฐ€์„ค๊ฒ€์ •
    • ๋ชจ์ˆ˜๊ฐ€ ํŠน์ • ๊ฐ’๊ณผ ๊ฐ™์€์ง€ ๋‹ค๋ฅธ์ง€ ํ…Œ์ŠคํŠธ
  • โ˜‘๏ธ ์‹ ๋ขฐ๊ตฌ๊ฐ„๊ณผ ๊ฐ€์„ค๊ฒ€์ •

4) ๊ฐ€์„ค๊ฒ€์ •์ด ์‹ค์ œ๋กœ ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜์–ด์งˆ๊นŒ?

โ˜‘๏ธ ๊ฐ€์„ค์„ ์„ค์ •ํ•˜์—ฌ ๊ฒ€์ฆ

  • ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ์ด ๊ธฐ์กด ์•ฝ๋ฌผ๋ณด๋‹ค ํšจ๊ณผ๊ฐ€ ์žˆ๋Š”์ง€ ๊ฒ€์ •
  • ์ด ๋•Œ ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ์€ ๊ธฐ์กด ์•ฝ๋ฌผ๊ณผ ํฐ ์ฐจ์ด๊ฐ€ ์—†๋‹ค๋Š” ๊ฒƒ์ด ๊ท€๋ฌด๊ฐ€์„ค!
  • ๋Œ€๋ฆฝ๊ฐ€์„ค์€ ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ์ด ๊ธฐ์กด ์•ฝ๋ฌผ๊ณผ ๋Œ€๋น„ํ•ด ํšจ๊ณผ๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒƒ!

โ˜‘๏ธโญ ํŒŒ์ด์ฌ ์‹ค์Šตโญ

# ๊ธฐ์กด ์•ฝ๋ฌผ(A)์™€ ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ(B) ํšจ๊ณผ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ
A = np.random.normal(50, 10, 100)
B = np.random.normal(55, 10, 100)

# ํ‰๊ท  ํšจ๊ณผ ๊ณ„์‚ฐ
mean_A = np.mean(A)
mean_B = np.mean(B)

# t-๊ฒ€์ • ์ˆ˜ํ–‰
t_stat, p_value = stats.ttest_ind(A, B)

print(f"A ํ‰๊ท  ํšจ๊ณผ: {mean_A}")
print(f"B ํ‰๊ท  ํšจ๊ณผ: {mean_B}")
print(f"t-๊ฒ€์ • ํ†ต๊ณ„๋Ÿ‰: {t_stat}")
print(f"p-๊ฐ’: {p_value}")

# t-๊ฒ€์ •์˜ p-๊ฐ’ ํ™•์ธ (์œ„ ์˜ˆ์‹œ์—์„œ ๊ณ„์‚ฐ๋œ p-๊ฐ’ ์‚ฌ์šฉ)
print(f"p-๊ฐ’: {p_value}")
if p_value < 0.05:
    print("๊ท€๋ฌด๊ฐ€์„ค์„ ๊ธฐ๊ฐํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•œ ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.")
else:
    print("๊ท€๋ฌด๊ฐ€์„ค์„ ๊ธฐ๊ฐํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•œ ์ฐจ์ด๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค.")

 

p-value๋Š” t-๊ฒ€์ •(t-test)์„ ํ†ตํ•ด ๊ณ„์‚ฐ๋˜๋ฉฐ, ๋‘ ์ง‘๋‹จ ๊ฐ„์˜ ํ‰๊ท  ์ฐจ์ด๊ฐ€ ์šฐ์—ฐํžˆ ๋ฐœ์ƒํ–ˆ์„ ๊ฐ€๋Šฅ์„ฑ์„ ํ™•๋ฅ ๋กœ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

์ด๋ฅผ ํ†ตํ•ด ๊ท€๋ฌด๊ฐ€์„ค์„ ๊ธฐ๊ฐํ•˜๊ฑฐ๋‚˜ ๊ธฐ๊ฐํ•˜์ง€ ์•Š๋Š” ๊ฒฐ๋ก ์„ ๋‚ด๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

1. p-value ๊ณ„์‚ฐ ๊ณผ์ • ์š”์•ฝ

 

t-๊ฒ€์ •์€ ๋‹ค์Œ ๋‹จ๊ณ„๋กœ ์ง„ํ–‰๋ฉ๋‹ˆ๋‹ค:

  1. ๊ท€๋ฌด๊ฐ€์„ค (Null Hypothesis, ) : 
    ๊ธฐ์กด ์•ฝ๋ฌผ(A)์™€ ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ(B)์˜ ํšจ๊ณผ ์ฐจ์ด๊ฐ€ ์—†๋‹ค. (μA)
  2. ๋Œ€๋ฆฝ๊ฐ€์„ค (Alternative Hypothesis, H1H):
    ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ(B)์˜ ํšจ๊ณผ๊ฐ€ ๊ธฐ์กด ์•ฝ๋ฌผ(A)์™€ ๋‹ค๋ฅด๋‹ค. (μA≠)
    (์–‘์ธก ๊ฒ€์ •์ด๋ผ๋ฉด ํšจ๊ณผ๊ฐ€ ๋‹ค๋ฆ„, ๋‹จ์ธก ๊ฒ€์ •์ด๋ผ๋ฉด ํšจ๊ณผ๊ฐ€ ๋” ํผ)
  3. t-๊ฐ’ ๊ณ„์‚ฐ (t-statistic):
    t-๊ฐ’์€ ๋‘ ์ง‘๋‹จ์˜ ํ‰๊ท  ์ฐจ์ด๋ฅผ ํ‘œ์ค€ ์˜ค์ฐจ๋กœ ๋‚˜๋ˆˆ ๊ฐ’์œผ๋กœ ๊ณ„์‚ฐ๋ฉ๋‹ˆ๋‹ค.
  4. p-value ๊ณ„์‚ฐ:
    t-๊ฐ’๊ณผ ์ž์œ ๋„()๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ t-๋ถ„ํฌ์˜ ๋ˆ„์  ํ™•๋ฅ  ๋ถ„ํฌ์—์„œ -๊ฐ’์„ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. -๊ฐ’์€ ๋‘ ํ‰๊ท  ์ฐจ์ด๊ฐ€ ์šฐ์—ฐํžˆ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

3.3 t๊ฒ€์ •

โœ”๏ธ ๊ฐ€์„ค๊ฒ€์ •์˜ ๋Œ€ํ‘œ์ ์ธ ๊ฒ€์ •

 

1) t๊ฒ€์ •์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

โ˜‘๏ธ t๊ฒ€์ •

  • t๊ฒ€์ •์€ ๋‘ ์ง‘๋‹จ ๊ฐ„์˜ ํ‰๊ท  ์ฐจ์ด๊ฐ€ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•œ์ง€ ํ™•์ธํ•˜๋Š” ๊ฒ€์ • ๋ฐฉ๋ฒ•
  • ๋…๋ฆฝํ‘œ๋ณธ t๊ฒ€์ •๊ณผ ๋Œ€์‘ํ‘œ๋ณธ t๊ฒ€์ •์œผ๋กœ ๋‚˜๋‰จ

โ˜‘๏ธ ๋…๋ฆฝํ‘œ๋ณธ t๊ฒ€์ •

  • ๋‘ ๋…๋ฆฝ๋œ ๊ทธ๋ฃน์˜ ํ‰๊ท ์„ ๋น„๊ต

โ˜‘๏ธ ๋Œ€์‘ํ‘œ๋ณธ t๊ฒ€์ •

  • ๋™์ผํ•œ ๊ทธ๋ฃน์˜ ์‚ฌ์ „/์‚ฌํ›„ ํ‰๊ท ์„ ๋น„๊ต

 

2) ๊ฐ€์„ค๊ฒ€์ •์ด ์‹ค์ œ๋กœ ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜์–ด์งˆ๊นŒ?

โ˜‘๏ธ p-๊ฐ’์„ ํ†ตํ•œ ์œ ์˜์„ฑ ํ™•์ธ

  • ๋‘ ํด๋ž˜์Šค์˜ ์‹œํ—˜ ์„ฑ์  ๋น„๊ต(๋…๋ฆฝํ‘œ๋ณธ t๊ฒ€์ •)
  • ๋‹ค์ด์–ดํŠธ ์ „ํ›„ ์ฒด์ค‘ ๋น„๊ต(๋Œ€์‘ํ‘œ๋ณธ t๊ฒ€์ •)

โ˜‘๏ธ ํŒŒ์ด์ฌ ์‹ค์Šต

# ํ•™์ƒ ์ ์ˆ˜ ๋ฐ์ดํ„ฐ
scores_method1 = np.random.normal(70, 10, 30)
scores_method2 = np.random.normal(75, 10, 30)

# ๋…๋ฆฝํ‘œ๋ณธ t๊ฒ€์ •
t_stat, p_val = stats.ttest_ind(scores_method1, scores_method2)
print(f"T-Statistic: {t_stat}, P-value: {p_val}")

 


3.4 ๋‹ค์ค‘๊ฒ€์ •

โœ”๏ธ ์—ฌ๋Ÿฌ ๊ฐ€์„ค์„ ๋™์‹œ์— ๊ฒ€์ •! ํ•˜์ง€๋งŒ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ!

 

1) ๋‹ค์ค‘๊ฒ€์ •์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

โ˜‘๏ธ ๋‹ค์ค‘๊ฒ€์ •

  • ์—ฌ๋Ÿฌ ๊ฐ€์„ค์„ ๋™์‹œ์— ๊ฒ€์ •ํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ
  • ๊ฐ ๊ฒ€์ •๋งˆ๋‹ค ์œ ์˜์ˆ˜์ค€์„ ์กฐ์ •ํ•˜์ง€ ์•Š์œผ๋ฉด 1์ข… ์˜ค๋ฅ˜(๊ท€๋ฌด๊ฐ€์„ค์ด ์ฐธ์ธ๋ฐ ๊ธฐ๊ฐํ•˜๋Š” ์˜ค๋ฅ˜) ๋ฐœ์ƒ ํ™•๋ฅ ์ด ์ฆ๊ฐ€
  • 1์ข… ์˜ค๋ฅ˜๊ฐ€ ๋ฌด์—‡์ธ์ง€๋ž‘ ์™œ ๋‹ค์ค‘๊ฒ€์ •์‹œ ๋ฐœ์ƒํ™•๋ฅ ์ด ์ฆ๊ฐ€ํ•˜๋Š”์ง€๋Š” ๋ฐ‘์—์„œ ๋‹ค์‹œ ์„ค๋ช…! ์ง€๊ธˆ์€, ์–ด๋–ค ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ •๋„๋กœ ์ดํ•ด!

โ˜‘๏ธ ๋ณด์ • ๋ฐฉ๋ฒ•

  • ๋ณธํŽ˜๋กœ๋‹ˆ ๋ณด์ •, ํŠœํ‚ค ๋ณด์ •, ๋˜๋„ท ๋ณด์ •, ์œŒ๋ฆฌ์—„์Šค ๋ณด์ • ๋“ฑ์ด ์žˆ์Œ
  • ๊ฐ€์žฅ ๋Œ€ํ‘œ์ ์ด๊ณ  ๊ธฐ๋ณธ์ ์ธ๊ฒŒ ๋ณธํŽ˜๋กœ๋‹ˆ ๋ณด์ •

2) ๋‹ค์ค‘๊ฒ€์ •๊ณผ ๋ณด์ •์„ ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜์–ด์งˆ๊นŒ?

โ˜‘๏ธ ์—ฌ๋Ÿฌ ์•ฝ๋ฌผ์˜ ํšจ๊ณผ๋ฅผ ๋™์‹œ์— ๊ฒ€์ •

  • ์ด ๋•Œ ๋ณธํŽ˜๋กœ๋‹ˆ ๋ณด์ •์„ ์‚ฌ์šฉํ•ด๋ณผ ์ˆ˜ ์žˆ์Œ

โ˜‘๏ธ ํŒŒ์ด์ฌ ์‹ค์Šต

import numpy as np
import scipy.stats as stats

# ์„ธ ๊ทธ๋ฃน์˜ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ
np.random.seed(42)
group_A = np.random.normal(10, 2, 30)
group_B = np.random.normal(12, 2, 30)
group_C = np.random.normal(11, 2, 30)

# ์„ธ ๊ทธ๋ฃน ๊ฐ„ ํ‰๊ท  ์ฐจ์ด์— ๋Œ€ํ•œ t๊ฒ€์ • ์ˆ˜ํ–‰
p_values = []
p_values.append(stats.ttest_ind(group_A, group_B).pvalue)
p_values.append(stats.ttest_ind(group_A, group_C).pvalue)
p_values.append(stats.ttest_ind(group_B, group_C).pvalue)

# ๋ณธํŽ˜๋กœ๋‹ˆ ๋ณด์ • ์ ์šฉ
alpha = 0.05
adjusted_alpha = alpha / len(p_values)

# ๊ฒฐ๊ณผ ์ถœ๋ ฅ
print(f"๋ณธํŽ˜๋กœ๋‹ˆ ๋ณด์ •๋œ ์œ ์˜ ์ˆ˜์ค€: {adjusted_alpha:.4f}")
for i, p in enumerate(p_values):
    if p < adjusted_alpha:
        print(f"๊ฒ€์ • {i+1}: ์œ ์˜๋ฏธํ•œ ์ฐจ์ด ๋ฐœ๊ฒฌ (p = {p:.4f})")
    else:
        print(f"๊ฒ€์ • {i+1}: ์œ ์˜๋ฏธํ•œ ์ฐจ์ด ์—†์Œ (p = {p:.4f})")

 

3.5 ์นด์ด์ œ๊ณฑ๊ฒ€์ •

โœ”๏ธ ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ์˜ ๋ถ„์„์— ์‚ฌ์šฉํ•œ๋‹ค๋Š” ๊ฒƒ์ด ํฌ์ธํŠธ!

 

1) ์นด์ด์ œ๊ณฑ๊ฒ€์ •์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

โ˜‘๏ธ ์นด์ด์ œ๊ณฑ๊ฒ€์ •

  • ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ์˜ ํ‘œ๋ณธ ๋ถ„ํฌ๊ฐ€ ๋ชจ์ง‘๋‹จ ๋ถ„ํฌ์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ๊ฒ€์ •(์ ํ•ฉ๋„ ๊ฒ€์ •)ํ•˜๊ฑฐ๋‚˜
  • ๋‘ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜ ๊ฐ„์˜ ๋…๋ฆฝ์„ฑ์„ ๊ฒ€์ •(๋…๋ฆฝ์„ฑ ๊ฒ€์ •)

โ˜‘๏ธ ์ ํ•ฉ๋„ ๊ฒ€์ •

  • ๊ด€์ฐฐ๋œ ๋ถ„ํฌ์™€ ๊ธฐ๋Œ€๋œ ๋ถ„ํฌ๊ฐ€ ์ผ์น˜ํ•˜๋Š”์ง€ ๊ฒ€์ •
  • p๊ฐ’์ด ๋†’์œผ๋ฉด ๋ฐ์ดํ„ฐ๊ฐ€ ๊ท€๋ฌด ๊ฐ€์„ค์— ์ž˜ ๋งž์Œ. ์ฆ‰, ๊ด€์ฐฐ๋œ ๋ฐ์ดํ„ฐ์™€ ๊ท€๋ฌด ๊ฐ€์„ค์ด ์ ํ•ฉ
  • p๊ฐ’์ด ๋‚ฎ์œผ๋ฉด ๋ฐ์ดํ„ฐ๊ฐ€ ๊ท€๋ฌด ๊ฐ€์„ค์— ์ž˜ ๋งž์ง€ ์•Š์Œ. ์ฆ‰, ๊ด€์ฐฐ๋œ ๋ฐ์ดํ„ฐ์™€ ๊ท€๋ฌด ๊ฐ€์„ค์ด ๋ถ€์ ํ•ฉ

โ˜‘๏ธ ๋…๋ฆฝ์„ฑ ๊ฒ€์ •

  • ๋‘ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜ ๊ฐ„์˜ ๋…๋ฆฝ์„ฑ์„ ๊ฒ€์ •
  • p๊ฐ’์ด ๋†’์œผ๋ฉด ๋‘ ๋ณ€์ˆ˜ ๊ฐ„์˜ ๊ด€๊ณ„๊ฐ€ ์—ฐ๊ด€์„ฑ์ด ์—†์Œ → ๋…๋ฆฝ์„ฑ์ด ์žˆ์Œ
  • p๊ฐ’์ด ๋‚ฎ์œผ๋ฉด ๋‘ ๋ณ€์ˆ˜ ๊ฐ„์˜ ๊ด€๊ณ„๊ฐ€ ์—ฐ๊ด€์„ฑ์ด ์žˆ์Œ → ๋…๋ฆฝ์„ฑ์ด ์—†์Œ

2) ์นด์ด์ œ๊ณฑ๊ฒ€์ •์€ ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜์–ด์งˆ๊นŒ?

โ˜‘๏ธ ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ํ™•์ธ ๋ฐ ๋…๋ฆฝ์„ฑ ํ™•์ธ์„ ์œ„ํ•ด ์‚ฌ์šฉ

  • ์ฃผ์‚ฌ์œ„์˜ ๊ฐ ๋ฉด์ด ๋™์ผํ•œ ํ™•๋ฅ ๋กœ ๋‚˜์˜ค๋Š”์ง€ ๊ฒ€์ •(์ ํ•ฉ๋„ ๊ฒ€์ •)
  • ์„ฑ๋ณ„๊ณผ ์ง์—… ๋งŒ์กฑ๋„ ๊ฐ„์˜ ๋…๋ฆฝ์„ฑ ๊ฒ€์ •(๋…๋ฆฝ์„ฑ ๊ฒ€์ •)

โ˜‘๏ธ ํŒŒ์ด์ฌ ์‹ค์Šต

# ์ ํ•ฉ๋„ ๊ฒ€์ •
observed = [20, 30, 25, 25]
expected = [25, 25, 25, 25]
chi2_stat, p_value = stats.chisquare(observed, f_exp=expected)
print(f"์ ํ•ฉ๋„ ๊ฒ€์ • ์นด์ด์ œ๊ณฑ ํ†ต๊ณ„๋Ÿ‰: {chi2_stat}, p-๊ฐ’: {p_value}")

# ๋…๋ฆฝ์„ฑ ๊ฒ€์ •
observed = np.array([[10, 10, 20], [20, 20, 40]])
chi2_stat, p_value, dof, expected = stats.chi2_contingency(observed)
print(f"๋…๋ฆฝ์„ฑ ๊ฒ€์ • ์นด์ด์ œ๊ณฑ ํ†ต๊ณ„๋Ÿ‰: {chi2_stat}, p-๊ฐ’: {p_value}")

# ์„ฑ๋ณ„๊ณผ ํก์—ฐ ์—ฌ๋ถ€ ๋…๋ฆฝ์„ฑ ๊ฒ€์ •
observed = np.array([[30, 10], [20, 40]])
chi2_stat, p_value, dof, expected = stats.chi2_contingency(observed)
print(f"๋…๋ฆฝ์„ฑ ๊ฒ€์ • ์นด์ด์ œ๊ณฑ ํ†ต๊ณ„๋Ÿ‰: {chi2_stat}, p-๊ฐ’: {p_value}")

 

โ“ stats.chisquare ํ•จ์ˆ˜๊ฐ€ ๋ญ”๊ฐ€์š”?

  • scipy.stats.chisquare ํ•จ์ˆ˜๋Š” ์นด์ด์ œ๊ณฑ ์ ํ•ฉ๋„ ๊ฒ€์ •์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ๊ด€์ฐฐ๋œ ๋นˆ๋„ ๋ถ„ํฌ๊ฐ€ ๊ธฐ๋Œ€๋œ ๋นˆ๋„ ๋ถ„ํฌ์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ฒ€์ •์€ ์ฃผ๋กœ ๋‹จ์ผ ํ‘œ๋ณธ์— ๋Œ€ํ•ด ๊ด€์ฐฐ๋œ ๋นˆ๋„๊ฐ€ ํŠน์ • ์ด๋ก ์  ๋ถ„ํฌ(์˜ˆ: ๊ท ๋“ฑ ๋ถ„ํฌ)์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ํ™•์ธํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
  •  
  • ๋ฐ˜ํ™˜ ๊ฐ’
    • chi2: ์นด์ด์ œ๊ณฑ ํ†ต๊ณ„๋Ÿ‰์ž…๋‹ˆ๋‹ค.
    • p: p-๊ฐ’์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๊ด€์ฐฐ๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ท€๋ฌด ๊ฐ€์„ค ํ•˜์—์„œ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ž…๋‹ˆ๋‹ค.

โ“ stats.chi2_contingency ํ•จ์ˆ˜๊ฐ€ ๋ญ”๊ฐ€์š”?

  • scipy.stats.chi2_contingency ํ•จ์ˆ˜๋Š” ์นด์ด์ œ๊ณฑ ๊ฒ€์ •์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ๋‘ ๊ฐœ ์ด์ƒ์˜ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜ ๊ฐ„์˜ ๋…๋ฆฝ์„ฑ์„ ๊ฒ€์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด ํ•จ์ˆ˜๋Š” ๊ด€์ธก ๋นˆ๋„๋ฅผ ๋‹ด๊ณ  ์žˆ๋Š” ๊ต์ฐจํ‘œ(contingency table)๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ์นด์ด์ œ๊ณฑ ํ†ต๊ณ„๋Ÿ‰, p-๊ฐ’, ์ž์œ ๋„, ๊ทธ๋ฆฌ๊ณ  ๊ธฐ๋Œ€ ๋นˆ๋„(expected frequencies)๋ฅผ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฐ˜ํ™˜ ๊ฐ’
    • chi2 : ์นด์ด์ œ๊ณฑ ํ†ต๊ณ„๋Ÿ‰์ž…๋‹ˆ๋‹ค.
    • p : p-๊ฐ’์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๊ด€์ธก๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ท€๋ฌด ๊ฐ€์„ค ํ•˜์—์„œ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ž…๋‹ˆ๋‹ค.
    • dof : ์ž์œ ๋„์ž…๋‹ˆ๋‹ค. ์ด๋Š” (ํ–‰์˜ ์ˆ˜ - 1) * (์—ด์˜ ์ˆ˜ - 1)๋กœ ๊ณ„์‚ฐ๋ฉ๋‹ˆ๋‹ค.
    • expected : ๊ธฐ๋Œ€ ๋นˆ๋„์ž…๋‹ˆ๋‹ค. ์ด๋Š” ํ–‰ ํ•ฉ๊ณ„์™€ ์—ด ํ•ฉ๊ณ„๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ณ„์‚ฐ๋œ ์ด๋ก ์  ๋นˆ๋„์ž…๋‹ˆ๋‹ค.

3.6 ์ œ 1์ข… ์˜ค๋ฅ˜์™€ ์ œ 2์ข… ์˜ค๋ฅ˜

โœ”๏ธ ๋‘๊ฐ€์ง€์˜ ์˜ค๋ฅ˜๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ฒƒ์ด ํฌ์ธํŠธ!

 

1) ์ œ 1์ข… ์˜ค๋ฅ˜์™€ ์ œ 2์ข… ์˜ค๋ฅ˜๋Š” ๋ฌด์—‡์ผ๊นŒ?

โ˜‘๏ธ ๊ทธ๋ฆผ์œผ๋กœ ํ™•์ธํ•˜๊ธฐ!

โ˜‘๏ธ ์ œ 1์ข… ์˜ค๋ฅ˜

  • ๊ท€๋ฌด๊ฐ€์„ค์ด ์ฐธ์ธ๋ฐ ๊ธฐ๊ฐํ•˜๋Š” ์˜ค๋ฅ˜
  • ์ž˜๋ชป๋œ ๊ธ์ •์„ ์˜๋ฏธ (์•„๋ฌด๋Ÿฐ ์˜ํ–ฅ์ด ์—†๋Š”๋ฐ ์˜ํ–ฅ์ด ์žˆ๋‹ค๊ณ  ํ•˜๋Š” ๊ฒƒ)
  • ํ•œ ๋‹จ์–ด๋กœ ์œ„์–‘์„ฑ!
  • α๋ฅผ ๊ฒฝ๊ณ„๋กœ ๊ท€๋ฌด๊ฐ€์„ค์„ ๊ธฐ๊ฐํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ œ1์ข… ์˜ค๋ฅ˜๊ฐ€ α๋งŒํผ ๋ฐœ์ƒ
  • ๋”ฐ๋ผ์„œ ์œ ์˜์ˆ˜์ค€(α)์„ ์ •ํ•จ์œผ๋กœ์จ ์ œ 1์ข… ์˜ค๋ฅ˜ ์ œ์–ด ๊ฐ€๋Šฅ
  • ๋งŒ์•ฝ, ์œ ์˜์ˆ˜์ค€์ด 0.05๋ผ๋ฉด 100๋ฒˆ ์ค‘ 5๋ฒˆ ์ •๋„ ์ผ์–ด๋‚  ์ˆ˜ ์žˆ๋Š” ์ œ 1์ข… ์˜ค๋ฅ˜๋Š” ๊ฐ์ˆ˜ํ•˜๊ฒ ๋‹ค๋Š” ๊ฒƒ

โ“๋‹ค์ค‘ ๊ฒ€์ •์‹œ ์ œ 1์ข… ์˜ค๋ฅ˜๊ฐ€ ์ฆ๊ฐ€ํ•˜๋Š” ์ด์œ ?

โ˜‘๏ธ ์ œ 2์ข… ์˜ค๋ฅ˜

  • ๊ท€๋ฌด๊ฐ€์„ค์ด ๊ฑฐ์ง“์ธ๋ฐ ๊ธฐ๊ฐํ•˜์ง€ ์•Š๋Š” ์˜ค๋ฅ˜.
  • ์ž˜๋ชป๋œ ๋ถ€์ •์„ ์˜๋ฏธ (์˜ํ–ฅ์ด ์žˆ๋Š”๋ฐ ์˜ํ–ฅ์ด ์—†๋‹ค๊ณ  ํ•˜๋Š” ๊ฒƒ)
  • ํ•œ ๋‹จ์–ด๋กœ ์œ„์Œ์„ฑ!
  • ์ œ 2์ข… ์˜ค๋ฅ˜๊ฐ€ ์ผ์–ด๋‚  ํ™•๋ฅ ์€ β๋กœ ์ •์˜.
  • ์ œ 2์ข… ์˜ค๋ฅ˜๊ฐ€ ์ผ์–ด๋‚˜์ง€ ์•Š์„ ํ™•๋ฅ ์€ ๊ฒ€์ •๋ ฅ(1-β)์œผ๋กœ ์ •์˜.
  • ํ•˜์ง€๋งŒ ์ด๋ฅผ ์ง์ ‘ ํ†ต์ œํ•  ์ˆ˜๋Š” ์—†์Œ.
  • ๊ทธ๋‚˜๋งˆ ํ†ต์ œ๋ฅผ ํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ๋Š”…
    • ํ‘œ๋ณธํฌ๊ธฐ n์ด ์ปค์งˆ ์ˆ˜๋ก β๊ฐ€ ์ž‘์•„์ง.
    • α์™€ β๋Š” ์ƒ์ถฉ๊ด€๊ณ„์— ์žˆ์–ด์„œ ๋„ˆ๋ฌด ๋‚ฎ์€ α๋ฅผ ๊ฐ€์ง€๊ฒŒ ๋˜๋ฉด β๋Š” ๋”์šฑ ๋†’์•„์ง

โ˜‘๏ธ ์˜ˆ์‹œ

  • ์ƒˆ๋กœ์šด ์•ฝ๋ฌผ์ด ํšจ๊ณผ๊ฐ€ ์—†๋Š”๋ฐ ์žˆ๋‹ค๊ณ  ๊ฒฐ๋ก  ๋‚ด๋ฆฌ๋Š” ๊ฒƒ(์ œ 1์ข… ์˜ค๋ฅ˜).
  • ํšจ๊ณผ๊ฐ€ ์žˆ๋Š”๋ฐ ์—†๋‹ค๊ณ  ๊ฒฐ๋ก  ๋‚ด๋ฆฌ๋Š” ๊ฒƒ(์ œ 2์ข… ์˜ค๋ฅ˜).