빅데이터 기초 실습

 ■ 교과목명

  빅데이터 기초 실습

 ■ 교과목코드

 CLTR373-

 ■ 강의개요 및 목적

디지털환경에서 생성되는 빅데이터는 다양한 형태로 구성된 방대한 크기의 데이터로부터 경제적으로 필요한 가치를 추출할 수 있는 데이터를말한다. 21세기 정보화 시대에 기업의 가장 중요한 자산은 데이터이며 이를 수집하고 가공 및 분석하는 데이터 전문가를 필요로 한다.

본 교과목은 데이터 과학을 처음 접하는 이들을 위해 엑셀을 사용하여 데이터를 수집, 처리, 분석하는기본 과정 및 방법을 학습한다. 또한 엑셀의 다양한 분석 도구를 활용하여 데이터를 효과적으로 분석 할 수 있는 방법을 배우고 필요한 데이터를 찾아 의미있는 결과 및 모델을 도출 할수 있도록 한다. 그리고 나아가 R프로그래밍 기반의 패키지를 활용하여 빅데이터 분석 방법을 학습 한다. 이를 통하여 데이터 과학의 기본 개념 이해 및 데이터 분석 능력을 배양하고 빅데이터 전문가가 되기 위한 기본 역량을 함양한다.

 ■ 교재

빅데이터 기초 실습 / 출판사 : 홍릉출판사

[저자] 고석주, 류춘하, 박보석, 송무희, 하숙정

 ■ 과제 및 평가

평가방법 : 중간(35%), 기말(35%), 과제물&쪽지시험(20%), 출석/수업참여도(10%)

수업 시간에 배운 내용을 활용하는 실습 과제가 수업 시 주어진다.

* 본 과목은 실습/실기 강좌로 상대평가 권장 강좌에 해당되어 A등급 40% 이내로 제한됩니다.
* 수업시간의 4분의 3(12시간) 이상 결석이면 출석 판정은 "부", 성적은 "F"로 처리 됩니다.

 ■ 수강에 특별히 참고할 사항

- 비전공자를 위한 교양 과목으로서 컴퓨터학부는 수강제한이 있습니다.
- 사전 학습이 필요 없으며 수업시간에 배운 내용을 그때 그때 익혀두는 것이 반드시 필요한 과목입니다.
- 매 수업마다 주어지는 실습 문제에는 지난 시간에 배운 내용이 반드시 포함 될 수 밖에 없으므로 실습 시간에 완전히 익히지 못한 부분은 개인적으로 다음 시간이 시작 되기 전에 반드시 익혀 두어야 합니다.
- 기존 'SOHO 비즈니스 프로그래밍' 과목의 대체 교과목입니다.


1. 수업과 관계 없는 창을 활성화할 경우에는 엄중한 조치를 취한다.

2. 수업 중 강의실의 출입을 제한한다.

3. 타인의 파일을 복사하는 경우엔 불이익이 주어진다.

 ■ 주별강의내용

수업목표 및 학습내용

수업방법 및 매체

과제 및 연구문제

01

수업소개
빅데이터 개요
교재1장 -빅데이터 개념
-빅데이터 처리과정과 기술

02

데이터 수집 과 저장하기(1) 교재2장 -데이터베이스 정의 및 구축하기
-외부데이터 가져오기

03

엑셀의 기본 사용법 익히기 교재부록 -엑셀사용법
-엑셀 함수

04

데이터 전처리 및 정형화(1) 교재3장 -데이터 변환과 수식(함수)을 사용하여 데이터 처리하기

05

데이터 전처리 및 정형화(2) 교재3장 -수식을 이용한 통계요약 자료 작성하기

06

데이터 추출하기(1) 교재4장 -참조 수식을 이용하여데이터 추출하기
-참조 수식으로 데이터조회 및 검색하기

07

데이터 추출하기(2) 교재4장 -조건부서식을 이용하여 데이터 추출 및 시각화하기
-필터링을 이용하여 데이터 추출하기

08

중간고사    

09

데이터마이닝 교재5장 -부분합을 이용하여 그룹 데이터 처리 및 요약보고서 만들기
-피벗테이블을 이용하여 데이터 집계 및 분석하기

10

데이터 분석 및시각화(1) 교재6장 -차트를 이용하여 데이터분석 및 시각화하기

11

데이터 분석 및 시각화(2) 교재6장 -데이터 가상분석

12

데이터 통계 분석 및 예측 교재7장 -데이터 기술 통계 분석
-통계분석을 이용 한데이터 예측하기

13

빅데이터 R프로그래밍 기초 교재8장 -기본 문법 배우기
-데이터검색 및 추출하기

14

빅데이터 R프로그래밍 활용 교재9장 -통계분석 및 시각화
-빅데이터 분석

15

기말고사    

수험부정행위시, 경북대학교 수험부정행위에관한처벌규정에 의거 그 정상에 따라 수험자격박탈, 근신, 유기·무기정학, 또는 제적 처분될 수 있으니, 각별히 유의하여 주시기 바람.