Search

데이터 형식

과정
탐색을 위한 데이터 준비
날짜
2024/01/31

정성적 데이터

품질 및 특성을 주관적으로 설명하는 측정값을 말합니다. 즉, 숫자로 쉽게 표현할 수 없습니다.
영화 제목
출연진

정량적 데이터

측정하거나 계산할 수 있고 숫자로 표현할 수 있는 데이터이며, 특정 개수, 양, 범위를 갖습니다.
영화의 예산
박스 오피스 수익

명목형 데이터

정해진 순서 없이 분류되는 정성적 데이터의 유형입니다. 이 유형의 데이터에는 순서가 없습니다.
응답이 그렇다, 아니다, 모른다 등으로 순서가 없는 경우

순서형 데이터

정해진 순서나 크기가 있는 정성적 데이터의 유형입니다.
영화를 특정 점수 (1 - 5) 사이로 평가해 달라고 요청한 경우, 영화를 좋아하는 정도에 따라 순서대로 점수가 매겨집니다.

연속형 데이터

타이머를 사용하여 측정 가능하고, 그 값은 소수점 여러 자리로 나타낼 수 있습니다.

이산형 데이터

계산할 수 있고 값으로 취할 수 있는 수치가 제한됩니다. 즉, 부분 측정(평점 0.5 점) 이 허용되지 않고 정수만 허용되는 데이터 입니다.
평점
포인트

내부 데이터

회사의 자체 시스템에 존재하는 데이터 입니다.
일반적으로 내부 데이터는 신뢰성이 높고 수집하기 쉽다는 장점이 있습니다.

외부 데이터

조직 밖에서 생성되어 존재하는 데이터입니다.
분석에 최대한 많은 소스가 필요할 때 특히 유용합니다.
외부 데이터는 구조화되어 있다는 장점이 있습니다.
구조화된 데이터는 행과 열처럼 특정 형식으로 구성된 데이터입니다.
스프레드시트와 관계형 데이터베이스는 구조화된 방식으로 데이터를 저장할 수 있는 소프트웨어의 예입니다.