Skip to main content
빅데이터와 텍스트마이닝 이미지

빅데이터와 텍스트마이닝




◎ 수업 개요

  • 이 수업은 텍스트 데이터를 처리하고 활용하기 위한 R 프로그래밍 언어와 활용 기술을 소개한다. 특히, 기존의 통계 지식이나 프로그래밍 경험이 전무 한 인문계열의 학생들도 쉽고 친숙한 방식으로 텍스트 마이닝에 대해 알아가고 활용해보는 기회를 제공한다.
 

◎ 수업 대상 및 목표

  • 수업대상
    - 디지털 텍스트 분석에 관심은 있지만 코딩 경험이 없는 인문사회계열 학생
  • 수업목표
    - 텍스트 마이닝의 기본 개념과 활용을 소개할 수 있다.

  • - 기초적인 수준에서 텍스트를 분석할 수 있는 방법을 설명할 수 있다.
    - 개별 프로젝트를 수행할 수 있다.
 

◎ 강의일정

◈ 수강신청 : 2018.09.10 ~ 2018. 10.12

◈ 개강 및 종강 : 2018.09.17 ~ 2018. 12.16

◎ 강의계획
주차 강의내용
1 빅데이터와 텍스트마이닝 개념 소개
2 텍스트마이닝의 정의 및 RStudio 사용 방법
3 데이터 구조 I
4 데이터 구조 II
5 어휘 빈도수 분석
6 텍스트 전처리 I
7 텍스트 전처리 II
8 중간고사
9 dplyr 함수와 불용어
10 소셜 웹 마이닝
11 트윗 데이터 처리
12 Tidytext 활용
13 감정분석 I
14 감정분석 II
15 기말고사

 

◎ 이수기준
퀴즈 과제 중간고사 기말고사 합계
20(주차별2~3문제 출제) 40(2회 이상 실시) 20(20문항 객관식 출제) 20(20문항 객관식 출제) 100
총합 60점 이상 이수
 

◎ 본교 학점 인정 기준(세종대학교 수강생 대상)

◈ 오프라인 특강: 학기 중 1회 실시(일정 추후 공지 예정)

◈ 오프라인 시험: 학기 중 1회 이상 실시(일정 추후 공지 예정)

◈ 학점 인정 기준 : 이수증(60), 오프라인 시험(40)

◈ 취득학점 : 1학점

 

◎ 교재 및 참고문헌

  • 교재
    - Julia Silge, David Robinson, “Text Mining with R: A Tidy Approach,“ O’Reilly. 2017
  • 참고문헌
    - 백영민, “R을 이용한 텍스트 마이닝,” 한울아카데미. 2017
    - 김영우, “쉽게 배우는 R 데이터 분석,” 이지스퍼블리싱. 2017
 

◎ 교수 소개

이신행 교수님 사진이신행(세종대학교 _영어영문학과)  
  • 이메일 : shinlee@sejong.ac.kr
  • 학력사항
    - 고려대학교 사회학과 학사
    - 워싱턴 대학교 커뮤니케이션 박사
  • 경력사항
    - 워싱턴대학교 사회과학 통계센터 컨설턴트
    - 홍콩대학교 컴퓨테이셔널 미디어연구 박사 후 연구원
    - 고려대학교 아세아문제연구소 연구교수
  • 주요 연구실적
    - Lee, S. H. (2017). Digital democracy in Asia: The impact of the Asian internet on political participation. Journal of Information Technology & Politics, 14(1), 62-82
    - Lee, S. H. (2018). Revisiting the cultural logic of politics in the digital age: Internet use, personalization of political action, and Asian values. The Journal of Asiatic Studies, 61(1), 217-263.
    - Lee, S. H. (2015). Can regimes really discourage social networking? Urbanization, mobile phone use and the dictator’s plight. First Monday, 20(5).
 

◎ 담당 TA

    민아영  사진
  • TA 민아영(세종대학교 인공지능언어학과 석사과정)
  • 이메일 : cope1105@naver.com
  • 수업 관련 문의(24시간 이내 답변)

관련 강좌

  1. major

    Engineering
    (Computers & Communication)
  2. 강좌를 개발하고 운영하는 기관입니다. 컨소시엄으로 운영 시, 대표기관의 명칭이 나타납니다

    univ_name

    SejonguniversityK
  3. 강좌의 구성 주차 수를 의미합니다. (강좌를 충실히 학습하기 위해 필요한 주당 학습시간을 의미합니다.)

    Course Week
    (Estimated Effort)

    15week
    (주당 00시간 50분)
  4. 본 강좌 이수자에게 인정되는 학습시간으로 해당 강좌의 동영상, 과제, 시험, 퀴즈, 토론 등의 시간을 포함합니다. (강의 내용과 관련된 동영상 재생 시간의 총 합계입니다.)

    Accredited learning time
    (Video Duration)

    12시간 30분
    (06시간 15분)
  5. 수강신청이 가능한 기간으로 해당 기간 내에만 수강신청이 가능합니다.

    Course Registration Period

    2018.09.10 ~ 2018.10.12
  6. 강좌가 운영되고 교수지원이 이루어지는 기간입니다. 이수증은 강좌운영기간이 종료된 이후에 발급받을 수 있습니다.

    Classes Period

    2018.09.17 ~ 2018.12.16