본문 영역으로 바로가기
예측 및 분류를 위한 데이터 애널리틱스 기법  동영상

예측 및 분류를 위한 데이터 애널리틱스 기법




강좌 소개

수업내용/목표

예측 및 분류의 목적으로 데이터를 분석하는 통계기반의 기법들을 이해하고, 데이터 애널리틱스 기법을 활용하여 데이터 분석
및 응용능력을 배양한다.

홍보/예시 영상

강좌 운영 계획

 

주차별 학습 내용

주차별 학습 내용

주차

주차명

차시

차시명

학습요소

1

강좌개요 및 단순회귀모형

1-1

회귀분석, 단순회귀모형, 모형의 추정

강의영상, 퀴즈

학습목표

회귀분석의 개념에 대해 이해하고, 최소자승법에 의한 회귀계수 추정 및 오차항 분산 추정에 대해 학습한다.

1-2

회귀계수 추정량의 분포, 모형의 검정

강의영상, 퀴즈

학습목표

회귀계수 추정량의 분포를 이용하여 회귀계수에 대한 t-검정 및 회귀모형의 유의성을 위한 F-검정을 수행한다.

1-3

회귀모형의 진단, 반응치의 예측

강의영상, 퀴즈

학습목표

잔차를 통하여 회귀 모형의 가정이 성립하는지 진단하고, 평균반응치 및 미래 반응치의 예측을 다룬다.

학습

목표

1) 예측 및 분류 문제 정의 및 관련 기법들을 이해하고, 설명할 수 있다.

2) 단순회귀모형 이론에 대해 설명할 수 있다.

3) 가설 검정의 기초개념을 이해하고, 설명할 수 있다.

4) 실제 데이터에 적용하여 주어진 독립변수가 종속변수를 어떻게 설명하는 지 직접 해석할 수 있다.

2

다중회귀 모형 이론

2-1

다중회귀모형 및 모형의 추정

강의영상, 퀴즈

학습목표

다중회귀모형의 개념에 대해 이해하고, 회귀계수 및 오차항 분산의 추정과정을 설명할 수 있다.

2-2

회귀계수 추정량의 분포 및 모형의 검정

강의영상, 퀴즈

학습목표

회귀계수의 추정 및 t-검정, 그리고 회귀모형의 유의성을 검정할 수 있는 F-검정을 학습한다.

2-3

단계적 회귀분석 및 다중공선성

강의영상, 퀴즈

학습목표

추가 설명력의 개념을 이해하고, 단계적 회귀분석 결과를 해석할 수 있다. 데이터에서 다중공선성 문제를 진단하고 알맞은 방법으로 해결할 수 있다.

2-4

반응치의 예측 및 변수 변환

강의영상, 퀴즈

학습목표

데이터가 주어졌을 때 평균 및 미래 반응치와 그 신뢰 구간을 계산할 수 있다. 범주형 변수에 대하여 지시변수를 활용한 변수 변환을 다루며, 비선형 형태의 모형을 선형형태의 변환하는 방법등을 배운다.

학습

목표

1) 다중회귀모형의 추정 및 검정을 이해하고, 주어진 문제를 해결할 수 있다.

2) 단계적 회귀분석과 다중공선성을 이해하고, 적합한 변수들만을 이용해 회귀모형을 구축할 수 있다.

3) 필요한 경우 적절한 변수 변환을 통해 범주형 독립변수 및 비선형 함수 문제를 선형회귀모형으로 해결할 수 있다.

3

시계열 분석 기법

3-1

평활화 모형 및 예측 성능 척도

강의영상, 퀴즈

학습목표

평활화 모형들의 내용과 그 차이를 이해하고, 예측성능의 척도를 활용하여 분석 결과를 평가한다.

3-2

안정적 ARMA 모형, ARMA 모형의 식별과 추정

강의영상, 퀴즈

학습목표

AR, MA, ARMA 모형의 내용을 이해하고, 새로운 시계열 데이터가 주어졌을 때 어떤 모형을 따르는 지 파악할 수 있다.

3-3

비안정적 시계열 및 시계열 예측

강의영상, 퀴즈

학습목표

비시계열 데이터에 존재하는 추세, 계절성 등을 파악하여 제거할 수 있고, 이를 이용해 미래의 시계열 값을 예측할 수 있다.

학습

목표

1) 다양한 비안정적 시계열 문제들이 증가함에 따라, 본 강좌를 통해 이 문제를 해결할 수 있는 능력을 기른다.

2) 예측기법으로의 시계열분석 기법을 이해하고, 주어진 문제를 해결할 수 있다.

3) 다양한 목적에 따라 시계열 분석 기법을 응용 하여 데이터 분석에 활용할 수 있다.

4) 실제 분석하고자 하는 시계열 데이터를 직접 다루어 원하는 미래 값을 예측할 수 있다.

4

로지스틱 회귀모형 이론

4-1

분류 문제, k-인접객체범, 분류성능

강의영상, 퀴즈

학습목표

분류 문제의 개념과 k-인접객체법을 이해하고 설명할 수 있다. 분류성능 척도를 학습한다.

4-2

이분 로지스틱 회귀분석

강의영상, 퀴즈

학습목표

로지스틱 회귀 모형의 기본 개념을 이해하고 이분형 종속 변수를 예측하는 모형을 학습할 수 있다.

4-3

명목 및 서열 로지스틱 회귀모형

강의영상, 퀴즈

학습목표

종속변수의 형태에 따른 명목형 및 서열형 로지스틱 회귀 모형을 이해한다.

학습

목표

1) k-인접객체법을 학습하고 활용할 수 있다.

2) 분류기법으로서의 로지스틱 회귀모형 이론을 이해하고, 활용할 수 있다.

3) 분류기법의 평가척도를 이해하고, 문제해결을 위해 활용할 수 있다.

4) 종속변수의 형태에 따른 모형 구축 방법을 학습한다.

5

판별분석 이론 및 알고리즘

5-1

피셔 분류방법

강의영상, 퀴즈

학습목표

피셔 방법을 이용해 분류 경계식을 도출하고 이를 이용해 관측치를 분류할 수 있다.

5-2

선형판별분석에 의한 분류규칙

강의영상, 퀴즈

학습목표

데이터의 확률 분포와 사전 확률을 고려하여 범주별 판별함수를 구하고 이를 이용해 새로운 관측치를 분류 (범주를 예측)할 수 있다.

5-3

오분류비용 고려 및 이차판별분석

강의영상, 퀴즈

학습목표

오분류비용을 고려한 선형판별분석과 이차판별분석을 이해하고, 정오분류표를 통해 각 방법의 성능을 판단할 수 있다.

학습

목표

1) 판별분석을 위한 기초이론을 이해하고, 각각의 분석기법을 적용 사례를 토대로 설명할 수 있다.

2) 의사결정론 입각하여 판별분석을 시행할 수 있다.

3) 주어진 문제 상황에 따라 사전확률 또는 오분류비용을 적절히 고려하여 판별분석을 시행할 수 있다.

4) 상황에 가장 적합한 성능 척도를 고려하여 판별분석 결과를 평가할 수 있다.

6

트리기반 분류기법 이론

6-1

트리 기법 개요

강의영상, 퀴즈

학습목표

트리 모형의 전반적인 학습 과정을 익히고, 각 과정에 적용하는 기법들의 내용을 이해한다.

6-2

트리의 형성

강의영상, 퀴즈

학습목표

분지 기준을 이해하고, 분지 기준이 되는 척도를 활용하여 트리를 형성할 수 있다.

6-3

가지치기 및 최적트리

강의영상, 퀴즈

학습목표

CART에서의 비용-복잡도 척도를 통해 가지치기를 하고, 가지치기된 후보 트리들 중에서 최적트리를 결정할 수 있다.

학습

목표

1) 실제 새로운 데이터에 대해 분류를 해야 하는 많은 문제들이 존재함을 깨닫고, 본 강의에서 그 해결책을 찾는다.

2) 트리기반 이론을 이해하고, 문제해결에 활용할 수 있다.

3) CART기법의 핵심 이론을 이해하고, 데이터를 분석할 수 있다.

4) 불순도 함수를 활용하여 데이터 분석을 시행할 수 있다.

5) CART기법을 실제로 프로그래밍 툴을 통해 사용할 수 있다.

6) 새로운 데이터에 대해 분류를 해야하는 문제에 대해 직접 예측트리모형을 만들 수 있고, 중요한 독립변수를 선택할 수 있다.

7

서포트벡터머신 이론 및 알고리즘

7-1

선형 SVM - 분리가능 경우

강의영상, 퀴즈

학습목표

분리 가능한 경우를 통해 선형 SVM의 기본 개념과 KKT 조건을 이해하고, 설명할 수 있다.

7-2

선형 SVM - 분리 불가능 경우

강의영상, 퀴즈

학습목표

분리 불가능한 경우에 대해 앞의 분리 가능한 경우의 선형 SVM 모형을 확장할 수 있다.

7-3

비선형 SVM

강의영상, 퀴즈

학습목표

비선형 모형의 기본 개념과 커널 트릭을 이해하고, 설명할 수 있다.

학습

목표

1) 최적화기반의 분류기법인 서포트벡터머신의 이론을 이해하고, 설명할 수 있다.

2) KKT 조건을 이용하여 최적화할 수 있다.

3) 문제에 따른 모형 구축 방법을 이해한다.

4) 커널 트릭을 통해서 비선형 모형을 학습할 수 있다.

8

기말고사

 

강좌운영팀 소개

교수자

전치혁 교수
전치혁 교수
◯ 성명: 전치혁
◯ 소속: POSTECH 산업경영공학과
◯ E-mail: chjun@postech.ac.kr

학력
○ 1973~1977 서울대학교 자원공학과 학사
○ 1977~1979 한국과학기술원 산업공학 석사
○ 1982~1986 Univ. of California, Berkeley, Department of
Industrial Engineering and Operations Research 박사

경력
○ 1979~1982 - 한국동력자원연구소 연구원
○ 1984~1984 - Lawrence Berkeley Lab 연구원
○ 1990~1990 - University of California at berkeley 방문교수
○ 2007~2007 - University of Washington 방문교수
○ 1987~현재 - 포항공과대학교 산업경영공학과 교수

주요업적 및 수상경력
○ 논문 266, 학회발표 213, 저서 2, 특허 1
○ 백암기술상 (2002)
○ 과학기술우수논문상 (2003)
○ 정헌학술대상 (2011)

연구분야
○ 데이터마이닝, 응용통계 확률모형

강좌지원팀

김경준
김경준
성명: 김경준
소속: POSTECH 산업경영공학과
E-mail: k_kim@postech.ac.kr


정준용
정준용
성명: 정준용
소속: POSTECH 산업경영공학과
E-mail: june0227@postech.ac.kr
이택호
이택호
성명: 이택호
소속: POSTECH 산업경영공학과
E-mail: taekho.lee@postech.ac.kr

강좌 수강 정보

이수/평가정보

과제 반영 비율 
과제명 퀴즈 기말고사
반영비율 40% 60%

※ 총 60% 이상 점수 획득 시, 이수증을 발급받을 수 있습니다.

 

강좌 수준 및 선수요건

강좌수준: 중 (또는 대학교 3학년 수준)
선수요건: 기본적인 확률 및 통계, 선형 대수, 최적화에 대한 지식 필요

교재 및 참고문헌

교재
- 전치혁, 데이터마이닝 기법과 응용

참고문헌
- 전치혁, 정민근, 이혜선, 공학응용통계
- Massimiliano Marcellino, James H. Stock, Mark W. Watson (2006) "A
comparison of direct and iterated multistep AR methods for
forecasting
macroeconomic time series", Journal of Econometrics, (135):1–2,
499-526.
- Tan, Pang-Ning, M. Steinbach and V. Kumar (2006) "Introduction to
data mining", Pearson International Edition, Boston.
- Fisher, Ronald Aylmer (1936) "The use of multiple measurements in
taxonomic problems" Annals of Eugenics, 7, 179-188.
- Burges, Christopher J. C. (1998) "A tutorial on support vector
machines for pattern recognition", Data Mining and Knowledge
Discovery,
2, 121-167.

자주 묻는 질문

데이터 애널리틱스 과목을 수강하기 위해서는 어떤 사전 지식이 필요한가요?

기본적인 통계, 선형 대수, 그리고 최적화에 대한 지식이 필요합니다.

데이터 분석 시 사용하는 프로그래밍 언어는 무엇인가요?

데이터 분석 시 사용할 수 있는 프로그래밍 언어는 Python, Matlab, R, C++ 등 매우 다양하며, 특정 언어에서 제공하는 library 등을 분석에 활용할 수 있습니다.

질문에 대한 답변은 즉시 받을 수 있나요?

질문과 답변: 24시간 이내 답변 가능합니다. (게시판을 이용해 주세요! )

 

 

관련 강좌

현재 강좌와 관련있는 강좌를 찾을 수 없습니다.
  1. 분야

    공학
    (산업)
  2. 강좌 내용의 어려운 수준을 의미합니다. 교양, 전공기초, 전공심화 순으로 난이도가 증가합니다.

    난이도

    전공기초
  3. 강좌를 개발하고 운영하는 기관입니다. 컨소시엄으로 운영 시, 대표기관의 명칭이 나타납니다

    운영기관

    포항공과대학교
  4. 운영 기관의 전화번호 입니다.

    전화번호

    -
  5. 강좌의 구성 주차 수를 의미합니다. (강좌를 충실히 학습하기 위해 필요한 주당 학습시간을 의미합니다.)

    주차
    (주간 학습 권장 시간)

    07주
    (주당 03시간 00분)
  6. 본 강좌 이수자에게 인정되는 학습시간으로 해당 강좌의 동영상, 과제, 시험, 퀴즈, 토론 등의 시간을 포함합니다. (강의 내용과 관련된 동영상 재생 시간의 총 합계입니다.)

    학습인정시간
    (총 동영상시간)

    10시간 00분
    (05시간 45분)
  7. 수강신청이 가능한 기간으로 해당 기간 내에만 수강신청이 가능합니다.

    수강 신청 기간

    2019.01.01 ~ 2019.02.28
  8. 강좌가 운영되고 교수지원이 이루어지는 기간입니다. 이수증은 강좌운영기간이 종료된 이후에 발급받을 수 있습니다.

    강좌 운영 기간

    2019.01.14 ~ 2019.02.28