빅데이터와 텍스트마이닝
SejonguniversityK
◎ 수업 개요
- 이 수업은 텍스트 데이터를 처리하고 활용하기 위한 R 프로그래밍 언어와 활용 기술을 소개한다. 특히, 기존의 통계 지식이나 프로그래밍 경험이 전무 한 인문계열의 학생들도 쉽고 친숙한 방식으로 텍스트 마이닝에 대해 알아가고 활용해보는 기회를 제공한다.
◎ 수업 대상 및 목표
- 수업대상
- 디지털 텍스트 분석에 관심은 있지만 코딩 경험이 없는 인문사회계열 학생 - 수업목표
- 텍스트 마이닝의 기본 개념과 활용을 소개할 수 있다.
- 기초적인 수준에서 텍스트를 분석할 수 있는 방법을 설명할 수 있다.
- 개별 프로젝트를 수행할 수 있다.
◎ 강의일정
◈ 수강신청 : 2018.09.10 ~ 2018. 10.12
◈ 개강 및 종강 : 2018.09.17 ~ 2018. 12.16
주차 | 강의내용 |
---|---|
1 | 빅데이터와 텍스트마이닝 개념 소개 |
2 | 텍스트마이닝의 정의 및 RStudio 사용 방법 |
3 | 데이터 구조 I |
4 | 데이터 구조 II |
5 | 어휘 빈도수 분석 |
6 | 텍스트 전처리 I |
7 | 텍스트 전처리 II |
8 | 중간고사 |
9 | dplyr 함수와 불용어 |
10 | 소셜 웹 마이닝 |
11 | 트윗 데이터 처리 |
12 | Tidytext 활용 |
13 | 감정분석 I |
14 | 감정분석 II |
15 | 기말고사 |
퀴즈 | 과제 | 중간고사 | 기말고사 | 합계 |
---|---|---|---|---|
20(주차별2~3문제 출제) | 40(2회 이상 실시) | 20(20문항 객관식 출제) | 20(20문항 객관식 출제) | 100 |
총합 60점 이상 이수 |
◎ 본교 학점 인정 기준(세종대학교 수강생 대상)
◈ 오프라인 특강: 학기 중 1회 실시(일정 추후 공지 예정)
◈ 오프라인 시험: 학기 중 1회 이상 실시(일정 추후 공지 예정)
◈ 학점 인정 기준 : 이수증(60), 오프라인 시험(40)
◈ 취득학점 : 1학점
◎ 교재 및 참고문헌
- 교재
- Julia Silge, David Robinson, “Text Mining with R: A Tidy Approach,“ O’Reilly. 2017
- 참고문헌
- 백영민, “R을 이용한 텍스트 마이닝,” 한울아카데미. 2017
- 김영우, “쉽게 배우는 R 데이터 분석,” 이지스퍼블리싱. 2017
◎ 교수 소개
이신행(세종대학교 _영어영문학과)- 이메일 : shinlee@sejong.ac.kr
- 학력사항
- 고려대학교 사회학과 학사
- 워싱턴 대학교 커뮤니케이션 박사 - 경력사항
- 워싱턴대학교 사회과학 통계센터 컨설턴트
- 홍콩대학교 컴퓨테이셔널 미디어연구 박사 후 연구원
- 고려대학교 아세아문제연구소 연구교수
- 주요 연구실적
- Lee, S. H. (2017). Digital democracy in Asia: The impact of the Asian internet on political participation. Journal of Information Technology & Politics, 14(1), 62-82
- Lee, S. H. (2018). Revisiting the cultural logic of politics in the digital age: Internet use, personalization of political action, and Asian values. The Journal of Asiatic Studies, 61(1), 217-263.
- Lee, S. H. (2015). Can regimes really discourage social networking? Urbanization, mobile phone use and the dictator’s plight. First Monday, 20(5).
◎ 담당 TA
- TA 민아영(세종대학교 인공지능언어학과 석사과정)
- 이메일 : cope1105@naver.com
- 수업 관련 문의(24시간 이내 답변)
관련 강좌
현재 강좌와 관련있는 강좌를 찾을 수 없습니다.