1. 머신러닝이란 무엇인가

1-1

전통적인 프로그래밍 vs 머신러닝

보통 프로그램은 사람이 규칙을 직접 적어요. "이메일에 '무료'와 '당첨'이 같이 들어있으면 스팸" 같은 식이죠. 그런데 스팸을 거르는 규칙을 사람이 다 적으려면 끝이 없어요. 단어를 바꾸고, 띄어쓰기를 비틀고, 새로운 수법이 계속 나오니까요.

머신러닝은 발상을 뒤집어요. 규칙을 직접 적는 대신, 스팸인 메일과 아닌 메일을 잔뜩 보여주고 규칙을 스스로 찾게 합니다.

전통 프로그래밍: 규칙 + 데이터 → 답
머신러닝: 데이터 + 답 → 규칙(모델)

핵심은 이거예요. 머신러닝은 "예시(데이터와 정답)로부터 규칙을 뽑아내는 기술"이에요. 그렇게 뽑아낸 규칙 덩어리를 모델(model)이라고 부릅니다.

1-2

널리 쓰이는 정의가 하나 있어요. "어떤 작업(Task)을 경험(Experience)을 통해 더 잘하게 되고, 그 잘함을 성능 지표(Performance)로 잴 수 있으면, 그 프로그램은 학습한다." (Tom Mitchell)

스팸 필터로 풀어보면 이래요.

경험(데이터)이 쌓일수록 성능이 오르면, 그게 바로 "배운다"는 거예요. 이 세 가지를 항상 분명히 정하는 습관이 중요해요. 무엇을(T), 무엇으로(E), 어떻게 잘하는지 잴까(P).

1-3

"정답을 주느냐, 안 주느냐"에 따라 크게 셋으로 나뉘어요.

지도학습은 다시 둘로 나뉘어요. 정답이 숫자면 회귀(regression)(예: 집값 몇 원), 정답이 종류면 분류(classification)(예: 스팸/정상)예요. 이 교재의 대부분과 YOLO는 지도학습이에요.

강화학습은 결이 좀 달라요. 정답을 직접 알려주지 않고, 잘하면 점수를 주는 방식이라 "시험 답안" 대신 "게임 점수"로 배운다고 생각하면 돼요. 이 교재에선 지도·비지도를 중심으로 다룹니다.

1-4

한 문장으로 묶으면, "모델은 파라미터를 가진 함수이고, 학습은 그 파라미터를 데이터에 맞게 조절하는 일"이에요. 다음 데모가 이걸 손으로 보여줘요.

1-5 · 직접 해보기

아래 점들은 두 종류(빨강/파랑)예요. 우리가 만들 모델은 아주 단순해요. 직선 하나를 긋고, 한쪽은 빨강 다른 쪽은 파랑이라고 예측하는 거예요. 직선의 기울기와 위치가 이 모델의 파라미터죠. 슬라이더로 직접 조절하면서 정확도를 최대로 올려보세요.

기울기(각도) 위치(높이)

직접 맞추기도 은근 귀찮죠? 머신러닝의 진짜 매력은 이 조절을 사람 대신 컴퓨터가 자동으로 한다는 거예요. 어떻게 자동으로 최적의 직선을 찾는지가 바로 2장(경사하강법)의 주제예요.

1-6

머신러닝의 진짜 목표는 "본 데이터를 잘 맞히는 것"이 아니라 "처음 보는 데이터를 잘 맞히는 것"이에요. 시험 공부에 비유하면, 기출문제 답만 외운 학생이 아니라 원리를 이해해 새 문제도 푸는 학생이 되는 거죠.

그래서 데이터를 처음부터 나눠 써요.

시험 세트를 학습에 쓰면, 시험지를 미리 본 거랑 같아요. 점수는 높게 나오지만 실제 성능은 거품이에요. 이걸 "데이터 누수(leakage)"라고 해요.

1-7

어떤 문제든 대략 이 순서를 밟아요.

문제 정의 → 데이터 수집 → 전처리·특징 → 학습 → 평가 → (반복 개선) → 배포

"데이터가 모델보다 중요할 때가 많다"는 말이 있어요. 화려한 모델보다 깨끗하고 충분한 데이터가 성능을 더 끌어올리는 경우가 흔해요.