본문 바로가기

공부하지안/프라임칼리지[1학년]

제 1강, 데이터와 통계학

용어 정리

데이터(Data) : 판단의 기준이 되는, 관찰이나 조사에서 얻은 숫자 데이터

정보(Information) : 데이터를 목적에 맞게 편집한 것

지식(Knowledge) | 지혜(wisdom) : 정보를 고도의 편집을 통해 보편화한 것

통계(Statatistics) : 일정한 체계에 따라 숫자로 정리한 것

 

통계 정보의 예

1) 날씨 : 강수량 , 기온, 불쾌지수, 빨래지수 등

2) 경제지표 : GDP(국내총생산), 일인당 국민소득, 인플레이션률, 물가지수, 주가지수, 환율, 금리, 실업률, 경제성장률 등

3) 여론조사 : 선거 여론조사, TV 시청률 조사 등

4) 마케팅 : 신상품 수요조사, 소비자 만족도 조사

5) 스포츠 : 타율, 장타율, 점유율 등

6) 교육 : 성적, IQ, EQ 등

 

▶ 통계 정보는 ① 조사, 실험 및 관측을 통해 데이터를 수집하고

② 데이터를 목적에 맞게 정리해 정보가 되어 만들어진다.

③ 정보에 기반한 귀납적 사고방법을 통해 의사결정을 해야 한다.

 

빅데이터 시대

"세계 데이터의 90%는 지난 2년간 만들어졌다"

배경 : 디지털 (PC, 인터넷, 스마트폰) 경제의 확산

특징 : 3V

 ① 양 (Volume) : 물리적 크기가 PB로 확장

 ② 속도 (Velocity) : 생성 및 처리 속도의 향상

 ③ 다양성 (Variety) : 다양한 형태로 구성되어 있음

빅데이터의 형태

 ① 정형화 데이터 : 관계형 데이터베이스 등

 ② 반정형화 데이터 : 메타정보, 센서, 공정제어 데이터 등

 ③ 비정형 데이터 : 사진, 이미지, 멀티미디어 등

빅데이터의 종류

- 건강 금융 관련 데이터, 웹 포털 관련 데이터, 소셜미디어 관련 데이터, 자동차 비행기 운행 데이터

- 퍼스널 빅데이터 : 하루 종일의 행적, 소비, 심박, 혈압, 뇌파 등 ▶ 라이프 트랙킹

▶ 빅데이터 통계분석의 예시

 1) 구글 트렌드

 2) 구글 자동번역

 

모집단과 표본

모집단 (Population) : 관심과 연구의 대상이 되는 집단 또는 모든 개체의 집합

 → 모집단 조사 : 전수 조사

표본 (Sample) : 모집단에서 추출되어 모집단을 대표하는 집단.

 → 표본이 모집단을 대표하기 위해선 표본이 임의로 뽑혀야 한다.

모집단을 통해 얻고자 하는 정보?

 - 중심값(대푯값) , 산포의 정도

 - 중심위치를 나타내는 척도로는 표본 평균(sample mean)과 중앙값(median)이 있다.

 - 중앙값(median)은 산포 한 값의 중심 순위에 위치한 값을 말한다.

 

통계학을 이용하는 가상의 예

1) 사이버교육과 칠판 교육의 효과 비교분석

2) 신제품 케이크의 개발 및 출시

 

결론적으로 통계학이란?

자료를 수집하고 요약정리하여 불확실한 사실에 대한 결론이나 일반적인 규칙성을 이끌어내는 방법을 연구하는 학문.

통계학은 확률이라는 개념을 이용하게 된다

 

통계학은 수학과 컴퓨터, 통계 패키지(R, SAS, SPSS 등)의 도움을 받게 된다.

 

반응형