내일배움캠프/πŸ‘©πŸ»‍πŸ’»TIL:Today I Learn

[데이터 λ¦¬ν„°μ‹œ] 03. λ°μ΄ν„°μ˜ μœ ν˜•

기획 μ—΄μ •μ˜ ν•­ν•΄! 2025. 1. 13. 17:26

03. λ°μ΄ν„°μ˜ μœ ν˜•

[μˆ˜μ—… λͺ©ν‘œ]
μ§€ν‘œ μ •μ˜λ₯Ό μœ„ν•œ λ°μ΄ν„°μ˜ μ’…λ₯˜μ™€ ν™œμš©λ²•μ— λŒ€ν•΄μ„œ μ•Œμ•„λ΄μš”. 😊

 

[λͺ©μ°¨]

01. λ°μ΄ν„°μ˜ μœ ν˜•

1) 정성적 데이터 vs μ •λŸ‰μ  데이터

2) ✍ λ°μ΄ν„°μ˜ μœ ν˜• 예제

3) μ •λŸ‰μ  λ°μ΄ν„°μ˜ 사둀

4) μ •λŸ‰μ  λ°μ΄ν„°μ˜ ν™œμš©

 

4) μ •λŸ‰μ  λ°μ΄ν„°μ˜ ν™œμš© | Notion

β˜‘οΈ μ •λŸ‰μ  λ°μ΄ν„°μ˜ ν™œμš©

teamsparta.notion.site


01. λ°μ΄ν„°μ˜ μœ ν˜•

λ°μ΄ν„°μ˜ μœ ν˜•κ³Ό μ •λŸ‰μ  λ°μ΄ν„°μ˜ ν™œμš©μ— λŒ€ν•΄μ„œ μ•Œμ•„λ³΄λŠ” μ‹œκ°„μ„ κ°€μ Έμš”. πŸ˜„

 

 

1) 정성적 데이터 vs μ •λŸ‰μ  데이터

β˜‘οΈ μ •성적 데이터 (Qualitative Data)

  • λΉ„μˆ˜μΉ˜μ μΈ μ •λ³΄λ‘œ μ‚¬λžŒμ˜ κ²½ν—˜, 관점, νƒœλ„μ™€ 같은 주관적인 μš”μ†Œλ₯Ό ν¬ν•¨ν•΄μš”
  • λŒ€λΆ€λΆ„ ν…μŠ€νŠΈ, λΉ„λ””μ˜€, μ˜€λ””μ˜€ ν˜•νƒœλ‘œ μ‘΄μž¬ν•΄μš”
  • μ •ν˜•λ˜μ§€ μ•Šκ³  ꡬ쑰화 λ˜μ–΄μžˆμ§€ μ•Šμ•„μš”
  • 데이터λ₯Ό κ΅¬μ‘°ν™”ν•˜κΈ° μ–΄λ €μ›Œμš”
  • μƒˆλ‘œμš΄ ν˜„μƒμ΄λ‚˜ κ°œλ…μ— λŒ€ν•œ 이해λ₯Ό μ‹¬ν™”ν•˜λŠ”λ° μ‚¬μš©ν•΄μš”

β˜‘οΈ μ •λŸ‰μ  데이터 (Quantitative Data)

  • 수치적으둜 ν‘œν˜„λ˜λŠ” μ •λ³΄λ‘œ 양적인 μΈ‘μ •κ³Ό 뢄석을 톡해 얻을 수 μžˆμ–΄μš”
  • 데이터가 숫자 ν˜•νƒœλ‘œ μ‘΄μž¬ν•˜κΈ° λ•Œλ¬Έμ— ν†΅κ³„μ μœΌλ‘œ λΆ„μ„ν•˜κΈ° μ‰¬μ›Œμš”
  • 개인의 ν•΄μ„μ΄λ‚˜ 주관이 적게 μž‘μš©ν•˜λŠ” 객관성을 κ°€μ§€κ³  μžˆμ–΄μš”
  • μ§€ν‘œλ‘œ λ§Œλ“€κΈ°μ— μš©μ΄ν•΄μš”
  • 섀문쑰사, μ‹€ν—˜, 인ꡬ 톡계, μ§€ν‘œ 뢄석 등에 ν™œμš©ν•΄μš”

β˜‘οΈ λ°μ΄ν„° μœ ν˜•λ³„ 비ꡐ

  • λΉ„μ¦ˆλ‹ˆμŠ€ λͺ©ν‘œλ₯Ό μœ„ν•΄μ„œ 두 κ°€μ§€ 데이터λ₯Ό μ μ ˆν•˜κ²Œ ν™œμš©ν•˜λŠ” 것이 ν•„μš”
  • μ§€ν‘œμ„€μ •κ³Ό 뢄석에 ν™œμš©ν•˜κΈ° μœ„ν•œ μ •λŸ‰μ  데이터λ₯Ό μ€‘μ μ μœΌλ‘œ μ‚΄νŽ΄λ³Ό μ˜ˆμ •

2) ✍ λ°μ΄ν„°μ˜ μœ ν˜• 예제

πŸ’‍♀️  μ£Όμ–΄μ§„ 예제λ₯Ό 보고, μ •λŸ‰μ  데이터인지 정성적 데이터인지 κ³ λ―Όν•΄λ΄…μ‹œλ‹€. 아직 ν—·κ°ˆλ¦΄ 수 μžˆλŠ” μ •μ„±κ³Ό μ •λŸ‰μ— λŒ€ν•œ 이해λ₯Ό μ™„λ²½νžˆ λλ‚΄λ΄…μ‹œλ‹€!

 

 

1) 힌트 μ‚΄νŽ΄λ³΄κΈ°

  • λ‹¨μˆœνžˆ μ •λŸ‰μ , μ •μ„±μ μœΌλ‘œ λ‚˜λˆ„μ–΄μ§€μ§€ μ•Šμ„ 수 μžˆμ–΄μš”. μ΄λŸ΄λ•ŒλŠ” μ–΄λ–»κ²Œ μ§€ν‘œλ‘œ ν™œμš©ν•  수 μžˆλŠ”κ°€? μ•ˆλœλ‹€λ©΄ μ–΄λ–»κ²Œ ν•  수 μžˆμ„κΉŒ? κ³ λ―Όν•΄λ΄μš”.

문제

  • Q1. ν•œ λ ˆμŠ€ν† λž‘μ—μ„œ ν•˜λ£¨μ— νŒλ§€λ˜λŠ” 햄버거 μ„ΈνŠΈμ˜ μˆ˜λŠ” 150개 μž…λ‹ˆλ‹€. (μ •λŸ‰μ )
  • Q2. ν•œ 고객이 카페 이용 리뷰에 "컀피 맛이 λ„ˆλ¬΄ μ’‹μ•˜κ³ , λΆ„μœ„κΈ°κ°€ μ•„λŠ‘ν–ˆλ‹€"κ³  λ§ν–ˆμŠ΅λ‹ˆλ‹€. (정성적)
  •  Q3. ν•œ 온라인 μ‡Όν•‘λͺ°μ˜ μ§€λ‚œ λ‹¬μ˜ 평균 ꡬ맀 κΈˆμ•‘μ€ 10λ§Œμ›μž…λ‹ˆλ‹€. (μ •λŸ‰μ )
  • Q4. μ–΄λ–€ μ„œλΉ„μŠ€λ₯Ό μ΄μš©ν•œ μœ μ €κ°€ "μ‚¬μš©ν•˜κΈ° 쉽고, μΈν„°νŽ˜μ΄μŠ€κ°€ 직관적이닀"λΌλŠ” 평가λ₯Ό λ‚¨κ²ΌμŠ΅λ‹ˆλ‹€. (정성적)
  • Q5. 고객 μ„€λ¬Έ μ‘°μ‚¬μ—μ„œ, 고객듀이 μ„œλΉ„μŠ€μ— λŒ€ν•΄ "λ§Œμ‘±ν•œλ‹€", "맀우 λ§Œμ‘±ν•œλ‹€", "λ§Œμ‘±ν•˜μ§€ μ•ŠλŠ”λ‹€"와 같이 μ‘λ‹΅ν–ˆμŠ΅λ‹ˆλ‹€. (정석적 > μ •λŸ‰μ μœΌλ‘œ λ³€ν™˜ κ°€λŠ₯)
  • Q6. μ–΄λ–€ μ—°κ΅¬μžκ°€ 인터뷰λ₯Ό 톡해 μˆ˜μ§‘ν•œ λ°μ΄ν„°μ—λŠ” μ°Έκ°€μžλ“€μ˜ λ‚˜μ΄, 성별, 직업과 λ”λΆˆμ–΄ κ·Έλ“€μ˜ 생각과 λŠλ‚Œμ΄ ν¬ν•¨λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. (λ‚˜μ΄,성별,직업 -> μ •λŸ‰μ , κ·Έλ“€μ˜ 생각과 λŠλ‚Œ->정성적)

1) μ •λ‹΅ ν™•μΈν•˜κΈ°

    • Q1, Q3. μ •λŸ‰μ  데이터
      • ꡬ체적인 숫자둜 ν‘œν˜„λ˜μ—ˆμŠ΅λ‹ˆλ‹€.
    • Q2, Q4. 정성적 데이터
      • 고객의 주관적인 κ²½ν—˜κ³Ό μ˜κ²¬μ„ λ°˜μ˜ν•˜κ³  있으며, 수치적으둜 μΈ‘μ •ν•  수 μ—†μŠ΅λ‹ˆλ‹€.
    • Q5. 정성적 데이터
      • 이λ₯Ό ν†΅κ³„μ μœΌλ‘œ λΆ„μ„ν•˜κΈ° μœ„ν•΄ μˆ˜μΉ˜ν™”ν•  수 μžˆμŠ΅λ‹ˆλ‹€. (ex. 맀우 만쑱 = 3, 만쑱 = 2,λ§Œμ‘±ν•˜μ§€ μ•ŠμŒ = 1)
      • λ”°λΌμ„œ 이 λ°μ΄ν„°λŠ” 정성적인 μ˜κ²¬μ„ 기반으둜 ν•˜μ§€λ§Œ, μ •λŸ‰μ μœΌλ‘œ λ³€ν™˜λ  수 μžˆμŠ΅λ‹ˆλ‹€.
    • Q6. 정성적, μ •λŸ‰μ  데이터 λͺ¨λ‘.
      • 이 λ°μ΄ν„°λŠ” μ •λŸ‰μ  정보(λ‚˜μ΄, 성별, 직업)와 정성적 정보(생각과 λŠλ‚Œ)λ₯Ό λͺ¨λ‘ ν¬ν•¨ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€

3) μ •λŸ‰μ  λ°μ΄ν„°μ˜ 사둀

  • 인ꡬ 톡계 데이터

  • μˆ˜μΉ˜ν˜• 섀문쑰사 데이터
  • λΉ„μ¦ˆλ‹ˆμŠ€ μ„±κ³Ό 데이터

  • 행동 둜그 데이터

  • λ§ˆμΌ€νŒ… 데이터

 

4) μ •λŸ‰μ  λ°μ΄ν„°μ˜ ν™œμš©

β˜‘οΈ μ •λŸ‰μ  λ°μ΄ν„°μ˜ ν™œμš©

  • μ •λŸ‰μ  λ°μ΄ν„°λŠ” 객관적이고 μΈ‘μ •κ°€λŠ₯ν•œ μ§€ν‘œλ₯Ό λ§Œλ“€κΈ°μ— μ ν•©ν•©λ‹ˆλ‹€.
  • 일일 ν™œμ„± μ‚¬μš©μžμˆ˜(DAU, Daily Active User), 재방문 λΉ„μœ¨(Retention) λ“± μ„œλΉ„μŠ€μ˜ 건강 μƒνƒœλ₯Ό λ‚˜νƒ€λ‚΄λŠ” μ€‘μš”ν•œ μ§€ν‘œλ“€μ„ 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.
    • μˆ˜μΉ˜ν˜• 섀문쑰사 데이터λ₯Ό μ •λŸ‰μ μΈ κΈ°μ€€μœΌλ‘œ λ‚˜λˆˆ 사둀, μΆ”μ²œ μ§€μˆ˜(NPS)λ₯Ό λ§Œλ“€ 수 있음

β˜‘οΈ ν†΅κ³„적 뢄석 적용

  • 뢄포, 평균, 쀑앙값 등을 κ³„μ‚°ν•΄μ„œ λ°μ΄ν„°μ˜ κ²½ν–₯μ„±κ³Ό νŒ¨ν„΄μ„ νŒŒμ•…ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
  • ν•΄λ‹Ή λ‚΄μš©μ„ 근거둜 μ˜μ‚¬κ²°μ • κ³Όμ •μ—μ„œ μ€‘μš”ν•œ νŒλ‹¨μ„ λ‚΄λ¦½λ‹ˆλ‹€.
    • μ—¬ν–‰ ν‚€μ›Œλ“œ 검색 및 μ˜ˆμ•½ μ‹œκ³„μ—΄ κ·Έλž˜ν”„

  • μš”μΌλ³„, 성별 λ ˆμŠ€ν† λž‘ 팁 뢄포 κ·Έλž˜ν”„

β˜‘οΈ λ‹€μ–‘ν•œ 데이터 뢄석 방법 적용

  • λΉ„μ¦ˆλ‹ˆμŠ€ 뢄석, 예츑 λͺ¨λΈλ§, μΆ”μ„Έ 뢄석을 ν¬ν•¨ν•œ λ¨Έμ‹ λŸ¬λ‹κ³Ό 같은 ν˜„λŒ€μ  데이터 뢄석 기법에 ν™œμš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
  • 이λ₯Ό 톡해 미래 예츑, 효율적 μžμ› λ°°λΆ„, μ‹œμž₯ 변화에 λŒ€ν•œ 적응이 κ°€λŠ₯ν•΄μ§‘λ‹ˆλ‹€.

 

μœ„ νŠΉμ„±μ„ λ°”νƒ•μœΌλ‘œ μš°λ¦¬λŠ” λ‹€μŒκ³Ό 같은 μ§ˆλ¬Έμ— λŒ€λ‹΅μ„ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  • ν•œ 달 λ™μ•ˆ 우리 νšŒμ‚¬κ°€ λ²Œμ–΄λ“€μ΄λŠ” λ§€μΆœμ€ μ–Όλ§ˆμΈκ°€?
  • ν•˜λ£¨ 평균 우리 ν”Œλž«νΌμ— μ ‘μ†ν•˜λŠ” 고객 μˆ˜λŠ”?
  • μ§€λ‚œλ‹¬μ— λ°©λ¬Έν•œ μœ μ € 쀑 μ–Όλ§ŒνΌμ΄ λ‹€μ‹œ 우리 μ„œλΉ„μŠ€λ₯Ό μ΄μš©ν–ˆλŠ”κ°€?
  • 결과적으둜 이것을 톡해 μ„œλΉ„μŠ€μ˜ μˆ˜μ€€μ„ μ§„λ‹¨ν•˜κ³ , μš°λ¦¬λŠ” μ§€κΈˆ μ–΄λ–€ action을 ν•΄μ•Όλ˜μ§€?