정성적 데이터
품질 및 특성을 주관적으로 설명하는 측정값을 말합니다. 즉, 숫자로 쉽게 표현할 수 없습니다.
•
영화 제목
•
출연진
정량적 데이터
측정하거나 계산할 수 있고 숫자로 표현할 수 있는 데이터이며, 특정 개수, 양, 범위를 갖습니다.
•
영화의 예산
•
박스 오피스 수익
명목형 데이터
정해진 순서 없이 분류되는 정성적 데이터의 유형입니다. 이 유형의 데이터에는 순서가 없습니다.
•
응답이 그렇다, 아니다, 모른다 등으로 순서가 없는 경우
순서형 데이터
정해진 순서나 크기가 있는 정성적 데이터의 유형입니다.
•
영화를 특정 점수 (1 - 5) 사이로 평가해 달라고 요청한 경우, 영화를 좋아하는 정도에 따라 순서대로 점수가 매겨집니다.
연속형 데이터
타이머를 사용하여 측정 가능하고, 그 값은 소수점 여러 자리로 나타낼 수 있습니다.
이산형 데이터
계산할 수 있고 값으로 취할 수 있는 수치가 제한됩니다. 즉, 부분 측정(평점 0.5 점) 이 허용되지 않고 정수만 허용되는 데이터 입니다.
•
평점
•
포인트
내부 데이터
•
회사의 자체 시스템에 존재하는 데이터 입니다.
•
일반적으로 내부 데이터는 신뢰성이 높고 수집하기 쉽다는 장점이 있습니다.
외부 데이터
•
조직 밖에서 생성되어 존재하는 데이터입니다.
•
분석에 최대한 많은 소스가 필요할 때 특히 유용합니다.
•
외부 데이터는 구조화되어 있다는 장점이 있습니다.
◦
구조화된 데이터는 행과 열처럼 특정 형식으로 구성된 데이터입니다.
◦
스프레드시트와 관계형 데이터베이스는 구조화된 방식으로 데이터를 저장할 수 있는 소프트웨어의 예입니다.