3. visual studio code ์ค์น ๋ฐ ์ค์
โ๏ธ ๋จธ์ ๋ฌ๋์ ๋ฐฐ์ฐ๊ธฐ ์ํ ํ๋ก๊ทธ๋จ์ ์ค์นํด๋ณด๊ณ , ๋จธ์ ๋ฌ๋์ ์ํ ํ๊ฒฝ์ธ Jupyter Notebook์ ์์๋ด ์๋ค.
3.1 ๋จธ์ ๋ฌ๋ ์ค์ต ์ํํธ์จ์ด
โ๏ธ ๋จธ์ ๋ฌ๋์ ํ์ฉํ๊ธฐ ์ํ ๋ํ ์ํํธ์จ์ด
- Visual Studio Code(a.k.a vscode) - ๋ณธ ๊ฐ์ ์ฉ
- Microsoft๊ฐ ์ ๊ณตํ๋ ์์ค ์ฝ๋ ์๋ํฐ. Python ์ธ์๋ R, C, Java๋ฑ ํ์กดํ๋ ๋๋ถ๋ถ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ฅผ ์ ๊ณตํ๋ฉฐ, Copilot ๋ฑ ๋ค์ํ extension์ด ์๋ ๊ฒ์ด ์ฅ์ ์ ๋๋ค. ๋ก์ปฌ ์ปดํจํฐ ์์์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์ฌ์ฉํ๋ ์ปดํจํฐ ํ๊ฒฝ์ ๋ฐ๋ผ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ์ฌ์ฉ์ด ๋๋ฆด ์ ์์ต๋๋ค.
- Google Colab
- Google์ด ๋ง๋ Jupyter Notebookํ๊ฒฝ์ผ๋ก, ๋ฌด๋ฃ๋ก GPU ๋ฑ ๊ณ ์ฌ์์ ํ๊ฒฝ์ ์ด์ฉํ ์ ์์ต๋๋ค. ๋ค๋ง, ์ฌ์ฉํ ์ ์๋ ๋ฆฌ์์ค๊ฐ ์์๋ก ์ค์ ๋์ด, ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๋ฑ ๋ฆฌ์์ค๋ฅผ ๋ง์ด ์ฌ์ฉํ๋ ค๋ฉด ๊ณผ๊ธ์ด ํ์๋ก ์๊ตฌ ๋ฉ๋๋ค.
- Anaconda
- ๋ฐ์ดํฐ ๊ณผํ ๋ฐ ๋จธ์ ๋ฌ๋ ๋ถ์ผ์ ์ ํฉํ Python๊ณผ R์ ํจํค์ง/์์กด์ฑ ๋ฐ ๋ฐฐํฌ๋ฅผ ํธ๋ฆฌํ๊ฒ ํด์ฃผ๋ ์คํ ์์ค ํจํค์ง์ ๋๋ค. ๋ฐ์ดํฐ ๊ณผํ์ ์ด์ ์ด ๋ง์ถฐ์ ธ ์์ผ๋ฉฐ, ์ญ์ ๋ก์ปฌ ์ปดํจํฐ ์์์ ์ฌ์ฉํฉ๋๋ค.
โ๏ธ Jupyter Notebook ์ด๋?
- Data Science๋ฅผ ์ํ ํ๊ฒฝ์ผ๋ก ์คํ์ํํธ์จ์ด ์น ์ดํ๋ฆฌ์ผ์ด์
- ์ฝ๋์์ฑ, ์๊ฐํ, Markdown์ ์ด์ฉํ ๋ฌธ์ ์์ฑ์ด ๊ฐ๋ฅ
- Jupyter Notebook์ ๊ตฌ์ฑ์์: Code Cell, Markdown Cell
์์ฐ๊ณผํ, ๊ณต๊ณผ ๋ํ ๋ฑ ์คํ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ์ฐ๊ตฌ๋ ์ฐ๊ตฌ๋ ธํธ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๊ธฐ์กด script ์ฝ๋ ํ์ผ์ ์คํ๊ณผ ์ฐ๊ตฌ์ ๋ํ ๊ฒฐ๊ณผ๋ฅผ ๋จ๊ธฐ๊ธฐ์ ๋ฉ๋ชจ์ ์๊ฐํ ๊ธฐ๋ฅ์ด ์ฝํ์ฌ cell ๊ธฐ๋ฐ์ผ๋ก ์ฐ๊ตฌ ๋ ธํธ๋ถ์ ํํ์ธ Jupyter Notebook์ด ๊ฐ๋ฐ๋์์ต๋๋ค. Jupyter Notebook์ vscode, Colab(์ฃผํผํฐ๋ ธํธ๋ถ ๊ทธ ์์ฒด์!), Anaconda ๋ชจ๋ ํ์ฌํ์ฌ์ ์ฌ์ฉํ ์ ์์ง๋ง ์ฐ๋ฆฌ ๊ฐ์์์๋ vscode๋ฅผ ๊ธฐ์ค์ผ๋ก ์ค์ตํ๊ฒ ์ต๋๋ค.
1. ํ์ต ๋ชฉํ
โ๏ธ ๋จธ์ ๋ฌ๋์ ๊ธฐ๋ณธ! ํ๊ท๋ถ์์ด ๋ฌด์์ธ์ง, ํ๊ฐ์ฒ๋๋ ๋ฌด์์ธ์ง ์์๋ด ์๋ค.
2. ์ ํํ๊ท์ ์ฌ๋ก
โ๏ธ ์ฌ๋ฌ๋ถ์ด 1์ฐจ ๋ฐฉ์ ์์ ๊ฐ ๋ฐฐ์ด ํ์์ด๋ผ๊ณ ๊ฐ์ ํ๊ณ ์ ํํ๊ท๋ฅผ ์ ์ฉํด๋ณด๋ ์ฌ๋ก๋ฅผ ์ดํดํด๋ด ์๋ค.
2.1 ๋ชธ๋ฌด๊ฒ์ ํค ์๊ด๊ด๊ณ๋ฅผ ์ฐพ์๋ด๊ธฐ
๐ ๋ฐฉ์ ์์ ๋ฐฐ์ด ๋จธ์ ์ด๋ ๋ชธ๋ฌด๊ฒ์ ํค์ ๋ฐ์ดํฐ๋ฅผ ํ๋ํ๋ค. ์ผ์ ํ๊ฒ ์ฆ๊ฐํ๋ ํจํด์ด ์์ด์ ๋ฏธ๋ฆฌ ๋ชธ๋ฌด๊ฒ๋ฅผ ์๋ฉด ํค๋ฅผ ์ ์ ์์ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ๋ค.
- ํค์ ๋ชธ๋ฌด๊ฒ ๊ฐ์ ๋ฐ์ดํฐ
weights = [87,81,82,92,90,61,86,66,69,69]
heights = [187,174,179,192,188,160,179,168,168,174]
- ํค์ ๋ชธ๋ฌด๊ฒ ๊ฐ์ ์ฐ์ ๋
๐ ์คํ๊ต 1ํ๋ ๋ 1์ฐจ ๋ฐฉ์ ์์ ๋ฐฐ์ด ๋จธ์ ์ด๋ ํค์ ๋ชธ๋ฌด๊ฒ์ ๋ํ ๋ฐ์ดํฐ๊ฐ ๋๋ฌด ๋ง์์ ๋ฌด์จ ๋ ์ ์ ์ด์ด ์ง์ ์ ๋ง๋ค์ง ๊ณ ๋ฏผ ๋์์ง๋ง, ์ ๋ง์ ์ ๋ค์ ๊ดํตํ๋ ์ฌ๋ฌ ๊ฐ์ ์ง์ ์ ๋ง์ด ๊ทธ๋ ค๋ณด๊ธฐ๋ก ํ๋ค.
- ์ด๋ค ์ง์ ์ด ํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ “์ค๋ช ”ํ๋ค๊ณ ํ ์ ์์๊น?
๐ ๋จธ์ ์ด๋ 3๊ฐ์ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ ค๋ณด๋, ์๋ฌด๋๋ ์ด๋ก์, ํ๋์ ์ง์ ๋ณด๋ค๋ ๋นจ๊ฐ์ ๊ทธ๋ํ๊ฐ ์ ์ ํ ๊ฒ ๊ฐ๋ค. ํ์ง๋ง ์ด๋ ๊ฒ ๋๊ฐ ์ง์ ์ ๊ทธ๋ฆฌ๋ค ๋ณด๋ฉด ์ ์ ํ ๊ทธ๋ํ๋ฅผ ์ฐพ๊ธฐ ์ด๋ ค์ธ ๊ฒ ๊ฐ์ ๊ณ ๋ฏผ์ด ๋น ์ก๋ค.
2.2 Data Scientific ํ ๋ฐ์
- ๋ฐฉ๋ฒ1) ์ค์ ๋ฐ์ดํฐ ๊ฐ - ์ง์ ์ ์์ธก ๊ฐ = Error
- โ ๋ฒ ์ค์ ๋ฐ์ดํฐ:187, ์์ธก ๋ฐ์ดํฐ: 187 Error: 0
- โก๋ฒ ์ค์ ๋ฐ์ดํฐ: 174, ์์ธก ๋ฐ์ดํฐ: 181 Error: -7
- โข๋ฒ ์ค์ ๋ฐ์ดํฐ: 174, ์์ธก ๋ฐ์ดํฐ : 169 Error: +5
๐ ํ์ง๋ง ๋ฌธ์ ๊ฐ ๋ ์์๋ค. ์ ๋ถ์ ๊ธฐ์ค์ผ๋ก ์์ ์๋ ๋ฐ์ดํฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ๋ฉด ์์๊ฐ ๋๊ณ , ๋ฐ๋๋ก ์๋์ ์๋ ๊ฒ์ ์์๊ฐ ๋๋ค. ์ด ๊ฒฝ์ฐ ๋ชจ๋ ์๋ฌ๋ฅผ ํฉ์น๋ฉด ์๋ก ์์๋๋ ๋ฌธ์ ๊ฐ ์์๋ค. ๋ฐ๋ผ์, ์์๋ฅผ ์์๋ก ๋ง๋ค๊ธฐ ์ํด ์ ๊ณฑ์ ํ๋ ๋ฐฉ๋ฒ์ด ์๋ค๋ ๊ฑธ ์๊ฐํด ๋๋ค.
- ๋ฐฉ๋ฒ2) ๊ฐ๊ฐ Error๋ฅผ ์ ๊ณฑํ์ฌ ๋ชจ๋ ๋ํ๊ธฐ
- โ , โก,โข์ ์ ๊ณฑ ํฉ: 49 +25 = 71
๐ ๋ฌธ์ ๋ ํ๋ ๋ ์์๋ค. ๋์ค์๋ ๋ฐ์ดํฐ๋ฅผ ๋ ์์งํ ์์ ์ธ๋ฐ, ๋ฐ์ดํฐ๊ฐ ๋ ๋์ด๋ ์๋ก(โฃ,โค) ์๋ฌ๋ ์์ฐ์ค๋ฝ๊ฒ ๊ฐ์ด ์ปค์ง ์ ๋ฐ์ ์๋ ๊ฒ์ด๋ค! ๊ทธ๋์ ๋ฐ์ดํฐ์ ๊ฐฏ์๋ก ๋๋๊ธฐ๋ก ํ๋ค. ๋ํ ๋ฐ์ดํฐ๊ฐ ์ ๊ณฑ ๋์ด ์๋ ๊ฒ์ ์ค์ด๊ธฐ ์ํด root๋ฅผ ์์ฐ๊ธฐ๋ก ํ๋ค.
- ๋ฐฉ๋ฒ3) ์ ์ฒด ์๋ฌ ํฉ์ ๋ฐ์ดํฐ์ ๊ฐฏ์๋ก ๋๋๊ธฐ
- โ , โก,โข๋ง ๊ณ ๋ คํ๋ค๋ฉด 71/3 → 23.7
3. ์ ํํ๊ท ์ด๋ก
โ๏ธ ๋จธ์ ์ด๊ฐ ํ๋ ค๋ ๋ฐฉ๋ฒ์ด ์ดํด๊ฐ ์ ๋์๋์? ์ด๋ฒ์๋ ์ค์ ์ผ์ฐจ ๋ฐฉ์ ์์ ํตํด ์์ํ ํด๋ณผ๊ฒ์.
โ๏ธ ์ ํํ๊ท ์ฉ์ด ์ ๋ฆฌ
๐ ๋จธ์ ์ด๋ ๋ชธ๋ฌด๊ฒ๋ฅผ ์๋ฉด ํค๋ฅผ ์ ์ ์์ ๊ฒ์ด๋ผ ์๊ฐํ์ด์. ์ด๋ฅผ ์ด์ฉํด์ ๋ฐฉ์ ์์ ์ธ์ฐ๊ณ ์ฉ์ด๋ฅผ ์ ๋ฆฌํด๋ณผ๊ฒ์. ํต๊ณํ๊ณผ ์ปดํจํฐ ๊ณตํ ๋ ํ๋ฌธ์ ๋ฐํ์ผ๋ก ๋ฐ์ ํด์์ ๊ฐ์ ์๋ฆฌ์ง๋ง ๋ถ๋ฅด๋ ๋ช ์นญ์ด ์ด์ง ๋ฌ๋ผ์! ์ฉ์ด๋ฅผ ์ ๋ฆฌํด๋ณผ๊ฒ์
- ๊ณตํต
- Y๋ ์ข ์ ๋ณ์, ๊ฒฐ๊ณผ ๋ณ์ (์๊ณ ์ถ์ ๊ฐ)
- X๋ ๋ ๋ฆฝ ๋ณ์, ์์ธ ๋ณ์, ์ค๋ช ๋ณ์
- ํต๊ณํ์์ ์ฌ์ฉํ๋ ์ ํํ๊ท ์
- ๋จธ์ ๋ฌ๋/๋ฅ๋ฌ๋์์ ์ฌ์ฉํ๋ ์ ํํ๊ท ์
๐ ๊ฒฐ๊ตญ ๋ ์์์ด ์ ๋ฌํ๋ ค๊ณ ํ๋ ์๋ฏธ๋ ๊ฐ์์. ํ๊ท ๊ณ์ ํน์ ๊ฐ์ค์น๋ฅผ ๊ฐ์ ์๋ฉด X๊ฐ ์ฃผ์ด์ก์ ๋ Y๋ฅผ ์ ์ ์๋ค๋ ๊ฒ์ด์ฃ ! ์ฐ๋ฆฌ๋ ํธ์๋ฅผ ์ํด X์ ๊ณ์๋ ๊ฐ์ค์น๋ผ๊ณ ์ง์นญํ ๊ฒ์!
๐ (์คํฌ) ๋ชธ๋ฌด๊ฒ์ ํค ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด์ ์ ํํ๊ท ์์ ๋ง๋ค๋ฉด, y = 0.86x + 109.37 ์ด ๋์์. ์ด ๋ป์, 1kg ์ฆ๊ฐํ ๋๋ง๋ค ํค๊ฐ 0.86 cm ์ฆ๊ฐํ๋ค๋ ๊ฒ์ผ๋ก ํด์ ํ ์ ์์ด์.
โ๏ธ ์ง๋ฌธ
- Q1) β0โ ๋ 1์ฐจ ๋ฐฉ์ ์์ Y์ ํธ์ ํด๋นํ๋ ๊ฑธ ์๊ฒ ์ด์. ๊ทธ๋ฐ๋ฐ ε ์ ์ ๋ฐ๋ก ์๋๊ฑด๊ฐ์?
- ์ฐ๋ฆฌ๊ฐ ๋ชธ๋ฌด๊ฒ์ ํค์ ๋ํ ์ ํํ๊ท์์ ๋ง๋ค์์ง๋ง, ํด๋น ์์ด ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์๋ฒฝํ๊ฒ ์ค๋ช ํ ์ ์์ด์. ์ด๋ ์๋ฒฝํ ์ค๋ช ์ด๋ ์ค์ ๋ฐ์ดํฐ๊ฐ = ์์ธก ๋ฐ์ดํฐ ์ด๋ผ๊ณ ํ ์ ์์ด์. ๋ค์ ๋งํด ์๋ฌ(โก,โข)์ ๊ฐ์ ํํํ๊ธฐ ์ํด์ ์๋ ๊ฒ ์ ๋๋ค.
- Q2) ๊ฐ์ค์น(W)๋ฅผ ์๊ฒ ๋๋ฉด X๊ฐ์ ๋ํ์ฌ Y๊ฐ์ ์์ธกํ ์ ์๋ค๋ ๊ฒ์ ์ดํด๊ฐ ๋๋๋ฐ, ๊ทธ๋ผ ๊ฐ์ค์น๋ ์ด๋ป๊ฒ ๊ตฌํ์ฃ ?
- ์ด๋ฐ ๋ฌผ์์ด ๋ค์๋ค๋ฉด ๋จธ์ ๋ฌ๋์ ๊ดํตํ๋ ์ง๋ฌธ์ ๋๋ค. ๋ฐ์ดํฐ๊ฐ ์ถฉ๋ถํ ์๋ค๋ฉด ๊ฐ์ค์น๋ฅผ “์ถ์ ”ํ ์ ์์ต๋๋ค. ์ด๋ ์ฌํ ๋ด์ฉ์์ ๋ค๋ฃจ๋๋ก ํ ๊ฒ์! ์ด ๋ถ๋ถ์ ํ์ฌ๋ ๊ทธ๋ํ๋ฅผ ์๋ ์์ด ๊ทธ๋ ค์ ์๋ฌ๋ฅผ “์ต์ํ”ํ๋ ์ง์ ์ ๊ตฌํ๋ค๊ณ ์๊ฐํ์๋ฉด ๋ฉ๋๋ค.
4. ํ๊ท๋ถ์ ํ๊ฐ ์งํ
โ๏ธ ์ ํ(์ง์ )ํ๊ท(๋์๊ฐ๋ ค๊ณ ํ๋๊ฑฐ)๋ฅผ ์๋ฆฝํ๋ ๋ฐฉ๋ฒ์ ๋ฐฐ์ ์ผ๋ ํด๋น ๋ชจ๋ธ์ด ์ข์์ง ํ๊ฐํ๋ ๋ฐฉ๋ฒ๋ ์์๋ด ์๋ค.
โ๏ธ ํ๊ท ํ๊ฐ์งํ - MSE
๐ ๋จธ์ ์ด๊ฐ ๋๋ํ๊ฒ ์๋ฌ๋ฅผ ์ ์ํ ๊ฒ์ ๋ฐํ์ผ๋ก ํ๊ท์์ ํ๊ฐ์งํ๋ฅผ ๋ง๋ค์ด๋ณด๊ฒ ์ต๋๋ค. ๋จธ์ ์ด๊ฐ ์ ๋ฆฌํ ๋ด์ฉ์ ๋ค์ ์จ๋ณผ๊น์?
- ์๋ฌ ์ ์๋ฐฉ๋ฒ
- ๋ฐฉ๋ฒ1) ์๋ฌ = ์ค์ ๋ฐ์ดํฐ - ์์ธก ๋ฐ์ดํฐ ๋ก ์ ์ํ๊ธฐ
- ๋ฐฉ๋ฒ2) ์๋ฌ๋ฅผ ์ ๊ณฑํ์ฌ ๋ชจ๋ ์์๋ก ๋ง๋ค๊ธฐ, ๋ค ํฉ์น๊ธฐ
- ๋ฐฉ๋ฒ3) ๋ฐ์ดํฐ๋งํผ ๋๋๊ธฐ
๐ y๊ฐ์ ๋จธ๋ฆฌ์ ์๋ ^ ํ๊ธฐ๋ฅผ hat์ด๋ผ๊ณ ํ๋ฉฐ, ์์ธก(ํน์ ์ถ์ )ํ ์์น์ ํ๊ธฐํด์! ์์ ์ ์ฒด๋ฅผ ๋ณด๋ฉด ์ดํดํ๊ธฐ ํ๋ค ์ ์์ง๋ง, ๋จ๊ณ๋ณ๋ก ํ์ธํด๋ณด๋ฉด ์ด๋ ต์ง ์์์! ์ฐฌ์ฐฌํ ๋ค์ ๊ณฑ์น๋ด ์๋ค.
- Mean Squared Erorr(MSE)๋ผ๊ณ ์ ์ <Erorr์ธ๋ฐ ์ ๊ณฑ์ ํ๊ณ ํ๊ท ์ ๋์ด>
๐ ์์ผ๋ก ๋ง๋๋ ์ซ์ ์์ธก ๋ฌธ์ ๋ ๋ชจ๋ธ์ ๋จธ์ ๋ฌ๋์ด๋ ๋ฅ๋ฌ๋์ด๋ ์ด๋ค ๋ชจ๋ธ์ ๋ง๋ค์ด๋ ์ MSE ์งํ๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ์งํํ๊ณ ํ๊ฐํ๊ฒ ๋ ๊ฑฐ์์!
- ๊ธฐํ ํ๊ฐ ์งํ
4.2 ์ ํํ๊ท๋ง์ ํ๊ฐ ์งํ - R Square
๐ ์ซ์๋ฅผ ์์ธกํ๋ ํ๊ท๋ถ์์์, ์ ํํ๊ท์์๋ง ํ๊ฐ๋๋ ์งํ๊ฐ 1๊ฐ ๋ ์์ด์. ๊ทธ๊ฑด ๋ฐ๋ก R Square ์งํ์ ๋๋ค. R Square(R^2)๋ ์ ์ฒด ๋ชจํ์์ ํ๊ท์ ์ผ๋ก ์ค๋ช ํ ์ ์๋ ์ ๋๋ฅผ ๋ปํฉ๋๋ค.
์ด๋ค ๊ฐ์ “์์ธก”ํ๋ค๋๊ฑด ์ด๋ฆผ์ง์์ผ๋ก ํ๊ท ๊ฐ๋ณด๋จ ์์ธก์ ์ํด์ผํ๋ค๋ ๊ฒ์ ์๋ฏธํด์. ์์ปจ๋, ํค์ ํ๊ท ๊ฐ์ด 176.9์ธ๋ฐ ์ด ๊ฐ์ผ๋ก ๋ชจ๋ ์์ธกํ ๊ฒ๋ณด๋ค๋ ์ํด์ผ๊ฒ ์ฃ ?
# ํ๊ท: ์ซ์(Y)๋ฅผ ๋ง์ถ๋ ๊ฒ <->๋ถ๋ฅ : ๋ฒ์ฃผ(Y=0์ธ๊ฐ? Y=1์ธ๊ฐ)๋ฅผ ๋ง์ถ๋ ๊ฒ
- 3๋ฒ์ ๋ฐ์ดํฐ ๊ฐ์ SST = 174^2, SSR = 169^2
- ํด๋น ๊ฐ์ ๋ํ ์ค๋ช ๋ ฅ = 94% ( 169^2/174^2)
- ๋จ, ๋ชจ๋ ๋ฐ์ดํฐ์ ๋ํด์ ์ ๊ณ์ฐ์ ์ํ
5.1 ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค์นํ๊ธฐ
๐ ๋จธ์ ๋ฌ๋์ ์ํํ๊ธฐ ์ํ ๋ํ์ ์ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ scikit- learn ์ ๋๋ค. ๊ทธ ์ธ์๋ ์์ฃผ ์ฐ์ด๋ ๋ํ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ค์นํด๋ด ์๋ค.
๐จ์ฃผ์ : Python์์ ํจํค์ง ์ด๋ฆ์ ํ์ดํ(-)์ด ํฌํจ๋ ์ ์๊ธฐ ๋๋ฌธ์ scikit-learn์ importํ ๋๋ ํจํค์ง ์ด๋ฆ์ sklearn์ผ๋ก ์ฌ์ฉํด์ผ ํฉ๋๋ค.
๋ํ, VS Code์์ ํ์ด์ฌ์ ์ฌ์ฉํ ๋๋ ํ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ง์ ์ค์น( ex. !pip install numpy )ํด์ค์ผ ํฉ๋๋ค. VS Code๋ Colab์ฒ๋ผ ๊ธฐ๋ณธ์ ์ผ๋ก ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํฌํจํ์ง ์๊ธฐ ๋๋ฌธ์ ๋๋ค.
โ๏ธ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
- scikit-learn: Python ๋จธ์ ๋ฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
import sklearn as sk (ํ์ด์ฌ์์๋!)
- numpy: Python ๊ณ ์ฑ๋ฅ ์์น ๊ณ์ฐ์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
- pandas: ํ ์ด๋ธ ํ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃฐ ์ ์๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
- matplotlib: ๋ํ์ ์ธ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ, ๊ทธ๋ํ๊ฐ ๋จ์ํ๊ณ ์ค์ ์์ ๋ง์
- seaborn: matplot: ๊ธฐ๋ฐ์ ๊ณ ๊ธ ์๊ฐํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ, ์์ ์์ค์ ์ธํฐํ์ด์ค๋ฅผ ์ ๊ณต
โ๏ธ ์์ฃผ ์ฐ๋ ํจ์
- sklearn.linear_model.LinearRegression : ์ ํํ๊ท ๋ชจ๋ธ ํด๋์ค
- coef_: ํ๊ท ๊ณ์
- intercept: ํธํฅ(bias)
- fit: ๋ฐ์ดํฐ ํ์ต
- predict: ๋ฐ์ดํฐ ์์ธก
5.2 (์ค์ต) ์ ํํ๊ท ์ค์ต
โ ํ๊ท๋ถ์ ์ค์ต์ ํด๋ด ์๋ค.
โ๏ธ ํค-๋ชธ๋ฌด๊ฒ ๋ฐ์ดํฐ ์ค์ต
- ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ค์น
- ์ ํํ๊ท ๋ชจ๋ธ ๋ถ๋ฌ์ค๊ณ ํ๋ จํ๊ธฐ
- ์ฐ์ ๋ ๊ทธ๋ฆฌ๊ธฐ
- ํ๊ฐ
โ๏ธ tips๋ก ์ค์ต
โ๏ธ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋ด์ฅ๋์ด ์๋ tip์ ๋ํ ๋ฐ์ดํฐ๋ก ์ค์ ํ๊ท๋ถ์์ ์งํํด๋ด ์๋ค.
๐ ์๋น์์ ํํธํ์์ผ๋ก ์ผํ๊ณ ์๋ ๋จธ์ ์ด๋ ์ด๋ฒ์๋ tip ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ์ ์ฉํด๋ณด๊ธฐ๋ก ํ์ต๋๋ค. ๋์ ๋ง์ด ๋ฒ๊ณ ์ถ์๋ ๋จธ์ ์ด๋ ์ ์ฒด ๊ธ์ก(X)๋ฅผ ์๋ฉด ๋ฐ์ ์ ์๋ ํ(Y)์ ๋ํ ํ๊ท๋ถ์์ ์งํํด๋ณผ ์์ ์ ๋๋ค.
- ๋ฐ์ดํฐ ํ๋
- tips_df.head()
- ์ปฌ๋ผ ์ค๋ช
- total_bill: ์ ์ฒด ์ง๋ถ๊ธ์ก
- tip: ํ ๊ธ๋งฅ
- sex: ์ฑ๋ณ
- smoker: ํก์ฐ ์ ๋ฌด
- day: ์์ผ
- time: ์์ฌ ์๊ฐ(์ ์ฌ, ์ ๋ )
- size: ์์ฌ ์ธ์
2. ์ ํํ๊ท ํ๋ จํ๊ธฐ
3. ํ๊ฐ
'๋ด์ผ๋ฐฐ์์บ ํ > ๐ฉ๐ปโ๐ปTIL:Today I Learn' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[์ฑ๋ฆฐ์ง]๋จธ์ ๋ฌ๋ ์คํฌ์ - ์์์ฌ ํํฐ (1) | 2025.02.03 |
---|---|
๋ฐ์ดํฐ ๋ถ์ ์ ๋ฌธ : 1. ๊ธฐ์ด ํ๋ก์ ํธ (๐จ๏ธ์ฒซ ํํ๋ก์ ํธ)_ํ๊ณ ๋ฐ ์ ๋ฆฌ (0) | 2025.01.22 |
๋จธ์ ๋ฌ๋์ ์ดํด์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์ฉ ๊ธฐ์ด_1.๋จธ์ ๋ฌ๋์ ๊ธฐ์ด (0) | 2025.01.21 |
[ํต๊ณํ ๊ธฐ์ด]_6์ฃผ์ฐจ (0) | 2025.01.20 |
[ํต๊ณํ ๊ธฐ์ด]_5์ฃผ์ฐจ (0) | 2025.01.20 |