Kong Eunho

머신러닝

2025년 10월 17일 12시
카테고리 - LECTURE, 인공지능개론


인공지능개론(정명희) 6주차 강의내용

머신러닝 개요

머신러닝의 정의
‘기계학습’으로도 불리는 인공지능의 한 분야.
인간의 학습 능력을 컴퓨터로 실현하려는 기법.

머신러닝의 역사적 배경
• Arthur Samuel(IBM 연구원)의 체커 프로그램 (1952)
– 세계 최초의 머신러닝 프로그램 중 하나
– 단순한 규칙 기반이 아니라, 경험을 통해 점점 더 나아지는 프로그램
– 휴리스틱 평가 함수(Heuristic Evaluation Function) 사용:
현재 체스판 상태를 숫자로 평가하여 경험을 통해 학습하는 방법 사용

머신러닝의 연도별 주요 개발 모델과 특징
연도 개발자 모델 특징 또는 종류
1952년 Arthur Samuel Checker Program 최초의 머신러닝
1957년 Frank Rosenblatt Perceptron 최초의 신경망 모델
1986년 Rumelhart 등 Multilayer Perceptron Back-propagation 알고리즘
1986년 Quinlan Decision Tree ID3
1995년 Vapnik, Cortes Support Vector Machine 이진 분류기

머신러닝
머신러닝은 데이터에서 지식을 추출하는 작업.
─ 데이터로부터 유용한 규칙 등을 추출하는 기능.
─ 경험을 통해 데이터 기반으로 학습하고 예측.
프로그래밍하기 어려운 작업의 해결에 주로 활용됨.

머신러닝 학습 개념 예제
1 - 입력과 출력이 여러 개의 데이터 쌍으로 주어짐.
(1, 2), (2, 4), (4, 8), (7, 14), (5, 10), …
2 - 학습 후, 출력이 입력의 2배임을 유추
3 - (3, ?), (8, ?) 등의 질문에 6, 16 등으로 답변

전통적인 프로그래밍과 머신러닝의 차이점
프로그래밍 : 데이터 + 규칙 = 출력
→ 모든 규칙을 작성하며, 규칙이 추가될 경우 유지 관리가 어려움.
머신러닝 : 데이터 + 출력 = 규칙
→ 입출력의 관계를 학습하여 규칙 생성. 시간에 따라 효율 향상.

인공지능 > 머신러닝 > 딥러닝

머신러닝의 활용 분야

활용 분야 응용
컴퓨터 비전 이미지 분류, 객체 탐지, 얼굴 인식, 문자인식, 물체인식
자연어 처리 기계 번역, 챗봇, 감정 분석, 대화 분석
음성 인식 음성 비서(Bixby, Siri, Alexa), 자동 자막
추천 시스템 유튜브, 넷플릭스, 쇼핑몰 추천, 개인 맞춤식 추천 시스템
정보 검색 스팸 메일 필터링
로보틱스 & 제어 자율주행, 로봇 경로 계획
의료 AI 질병 진단, 신약 개발, 환자 모니터링
금융 AI 신용평가, 이상거래 탐지, 자동투자


머신러닝 알고리즘

머신러닝의 학습 형태에 따른 분류
지도 학습, 비지도 학습, 강화 학습 등으로 분류.

• 지도학습 (Supervised Learning)
입력과 정답(label) 데이터로 학습 → 분류(Classification), 회귀(Regression)
• 비지도학습 (Unsupervised Learning)
정답 없는 데이터에서 패턴 탐색 → 군집화(Clustering), 차원축소(DimensionalityReduction)
• 강화학습 (Reinforcement Learning)
보상을 기반으로 의사결정 전략(policy) 학습 → 게임, 로봇 제어
• 준지도학습 (Semi-Supervised Learning)
라벨링 일부만 활용 → 라벨링 비용 절감
• 자기지도학습 (Self-Supervised Learning)
데이터 자체에서 가상의 라벨을 만들어 학습 → LLM, 멀티모달 AI

기술적 기반
머신러닝을 구현하는 다양한 기법들

• 전통적 ML 알고리즘
선형회귀, 로지스틱 회귀, k-NN, 결정트리, SVM, 나이브 베이즈
• 앙상블 기법 (Ensemble Methods)
랜덤포레스트(Random Forest), 그래디언트 부스팅(GBM, XGBoost, LightGBM)
• 신경망 및 딥러닝 (Neural Networks & Deep Learning)
MLP, CNN, RNN, Transformer
• 특징학습 & 차원축소
PCA, Autoencoder, t-SNE
• 최적화 & 일반화
경사하강법(GD), 정규화(L1/L2), 드롭아웃(Dropout)

머신러닝의 학습 방법

1. 지도 학습

2. 비지도 학습

3. 강화학습

4. 준지도학습

5. 자기지도학습

구분 입력데이터 학습 방식 주요 알고리즘 대표 응용
지도학습 입력+정답 예측 정확도 향상 회귀, 분류 스팸 필터, 의료 진단
비지도학습 입력만 있음 패턴/구조 발견 군집화, 차원축소 고객 세분화, 이상 탐지
강화학습 상태, 보상 보상 최대화 Q-learning, DQN 게임, 로봇 제어
준지도학습 일부 라벨 라벨+비라벨 혼합 전이학습, 그래프 기반 의료 데이터
자기지도학습 비라벨 데이터 자체 라벨링 BERT, GPT류 자연어처리, 멀티모달



지도학습

1. 개념

① 장점

② 단점

2. 주요 방법

분류
유사한 특성을 가진 데이터들끼리 묶어서 나누는 것.
2개로 분류하는 이항 분류, 그 이상의 다항 분류.

회귀
변수들 사이의 관계를 결정하는 통계적 측정.
하나의 독립 변수를 사용하는 직선 형태의 ‘선형 회귀’.
실제 값과 예측값의 차이의 제곱 합을 최소화하는 회귀 직선을 구하는 방법.

회귀 분석
변수 사이의 회귀에 대해 검정이나 추정을 하는 것.
학습 데이터를 사용하여 출력값을 예측.



회귀 분석

하나 이상의 독립 변수(원인)가 종속 변수(결과)에 미치는 영향을 파악하여 종속 변수의 미래 값을 예측하거나 변수들 간의 관계를 설명하고자 하는 통계분석 기법.

회귀 분석의 주요 목적
① 예측 (Prediction/Forecasting): 독립 변수들의 값을 이용하여 종속 변수의 미래 값을 예측.
② 관계 파악 (Relationship Analysis): 독립 변수와 종속 변수 사이에 어떤 종류의 관계(선형, 비선형 등)가 존재하는지, 각 독립 변수가 종속 변수에 미치는 영향의 방향(양의 상관관계, 음의 상관관계)과 크기 파악.
③ 영향력 파악 (Impact Assessment): 특정 독립 변수가 종속 변수에 통계적으로 유의미한 영향을 미치는지 여부 판단.

회귀분석 기본 개념
∙ 독립변수(independent variable) 또는 설명변수(explanatory variable)
다른 변수에 영향을 주는 원인에 해당하는 변수
∙ 종속변수(dependent variable) 또는 반응변수(response variable)
영향을 받는 결과에 해당하는 변수
∙ 단순회귀분석(simple regression analysis)
독립변수와 종속변수가 각각 하나일 때의 분석
∙ 중회귀분석(multiple regression analysis)
종속변수는 1개이면서 독립변수가 2개 이상일 때의 분석
∙ 단순선형회귀분석(simple linear regression analysis)
독립변수가 1개이고, 독립변수와 종속변수의 관계가 1차 직선인 경우
∙ 다중선형회귀
독립변수가 여러 개이고, 독립과 종속 변수의 관계가 직선인 경우

◀ 이전 글 LECTURE, 서버프로그래밍
권한
2025-10-16
목록으로 다음 글 ▶ LECTURE, 인공지능개론
인공지능개론 중간고사
2025-10-19