Skip to main content
빅데이터와 텍스트마이닝 이미지

빅데이터와 텍스트마이닝




◎ 수업 개요

  • 이 수업은 텍스트 데이터를 처리하고 활용하기 위한 R 프로그래밍 언어와 활용 기술을 소개한다. 특히, 기존의 통계 지식이나 프로그래밍 경험이 전무 한 인문계열의 학생들도 쉽고 친숙한 방식으로 텍스트 마이닝에 대해 알아가고 활용해보는 기회를 제공한다.
 

◎ 수업 대상 및 목표

  • 수업대상
    - 디지털 텍스트 분석에 관심은 있지만 코딩 경험이 없는 인문사회계열 학생
  • 수업목표
    - 텍스트 마이닝의 기본 개념과 활용을 소개할 수 있다.

  • - 기초적인 수준에서 텍스트를 분석할 수 있는 방법을 설명할 수 있다.
    - 개별 프로젝트를 수행할 수 있다.
 

◎ 강의일정

◈ 수강신청 : 2018.09.10 ~ 2018. 10.12

◈ 개강 및 종강 : 2018.09.17 ~ 2018. 12.16

◎ 강의계획
주차 강의내용
1 빅데이터와 텍스트마이닝 개념 소개
2 텍스트마이닝의 정의 및 RStudio 사용 방법
3 데이터 구조 I
4 데이터 구조 II
5 어휘 빈도수 분석
6 텍스트 전처리 I
7 텍스트 전처리 II
8 중간고사
9 dplyr 함수와 불용어
10 소셜 웹 마이닝
11 트윗 데이터 처리
12 Tidytext 활용
13 감정분석 I
14 감정분석 II
15 기말고사

 

◎ 이수기준
퀴즈 과제 중간고사 기말고사 합계
20(주차별2~3문제 출제) 40(2회 이상 실시) 20(20문항 객관식 출제) 20(20문항 객관식 출제) 100
총합 60점 이상 이수
 

◎ 본교 학점 인정 기준(세종대학교 수강생 대상)

◈ 오프라인 특강: 학기 중 1회 실시(일정 추후 공지 예정)

◈ 오프라인 시험: 학기 중 1회 이상 실시(일정 추후 공지 예정)

◈ 학점 인정 기준 : 이수증(60), 오프라인 시험(40)

◈ 취득학점 : 1학점

 

◎ 교재 및 참고문헌

  • 교재
    - Julia Silge, David Robinson, “Text Mining with R: A Tidy Approach,“ O’Reilly. 2017
  • 참고문헌
    - 백영민, “R을 이용한 텍스트 마이닝,” 한울아카데미. 2017
    - 김영우, “쉽게 배우는 R 데이터 분석,” 이지스퍼블리싱. 2017
 

◎ 교수 소개

이신행 교수님 사진이신행(세종대학교 _영어영문학과)  
  • 이메일 : shinlee@sejong.ac.kr
  • 학력사항
    - 고려대학교 사회학과 학사
    - 워싱턴 대학교 커뮤니케이션 박사
  • 경력사항
    - 워싱턴대학교 사회과학 통계센터 컨설턴트
    - 홍콩대학교 컴퓨테이셔널 미디어연구 박사 후 연구원
    - 고려대학교 아세아문제연구소 연구교수
  • 주요 연구실적
    - Lee, S. H. (2017). Digital democracy in Asia: The impact of the Asian internet on political participation. Journal of Information Technology & Politics, 14(1), 62-82
    - Lee, S. H. (2018). Revisiting the cultural logic of politics in the digital age: Internet use, personalization of political action, and Asian values. The Journal of Asiatic Studies, 61(1), 217-263.
    - Lee, S. H. (2015). Can regimes really discourage social networking? Urbanization, mobile phone use and the dictator’s plight. First Monday, 20(5).
 

◎ 담당 TA

    민아영  사진
  • TA 민아영(세종대학교 인공지능언어학과 석사과정)
  • 이메일 : cope1105@naver.com
  • 수업 관련 문의(24시간 이내 답변)

관련 강좌

  1. major

    Engineering
    (Computers & Communication)
  2. 강좌를 개발하고 운영하는 기관입니다. 컨소시엄으로 운영 시, 대표기관의 명칭이 나타납니다

    Institution

    Sejong University
  3. 강좌의 구성 주차 수를 의미합니다. (강좌를 충실히 학습하기 위해 필요한 주당 학습시간을 의미합니다.)

    Course Week
    (Estimated Effort)

    15week
    (주당 00시간 50분)
  4. 본 강좌 이수자에게 인정되는 학습시간으로 해당 강좌의 동영상, 과제, 시험, 퀴즈, 토론 등의 시간을 포함합니다. (강의 내용과 관련된 동영상 재생 시간의 총 합계입니다.)

    Accredited learning time
    (Video Duration)

    12시간 30분
    (06시간 15분)
  5. 수강신청이 가능한 기간으로 해당 기간 내에만 수강신청이 가능합니다.

    Course Registration Period

    2018.09.10 ~ 2018.10.12
  6. 강좌가 운영되고 교수지원이 이루어지는 기간입니다. 이수증은 강좌운영기간이 종료된 이후에 발급받을 수 있습니다.

    Classes Period

    2018.09.17 ~ 2018.12.16