Search

스프레드 시트와 SQL, 그리고 데이터 시각화

과정
기초: 어디에나 존재하는 데이터
날짜
2024/01/15
목차

스프레드 시트

텍스트 줄바꿈 기능

텍스트가 너 원한다면 아래 화면과 같이 선택해주세요.
overflow : 텍스트가 열의 너비를 벗어나면 보이지 않습니다.
wrap : 모든 텍스트가 보이도록 줄바꿈 합니다.
clip : 셀 안의 텍스트를 잘라내서 셀 크기에 맞는 텍스트만 표시 합니다.

속성

열에 라벨을 지정하는 데 사용 되는 데이터의 특성이나 품질 입니다.
속성은 흔히 열의 이름이나 열 라벨, 헤더, 헤더 행이라고 부릅니다.
스프레드 시트의 열은 문자를 기준으로 정렬되고 행은 숫자를 기준으로 정렬됩니다.

관측값

데이터 세트 에서의 행을 말합니다.
관측값은 데이터 테이블에서 행에 있는 대상의 모든 속성을 포함합니다.
모든 데이터를 설명한다는 말과 동급 입니다.

데이터 재구성

데이터가 있는 모든 열을 선택한 뒤 Data 메뉴에서 원하는 옵션을 선택하면 됩니다.
예시 에서는 특정 열을 기준으로 알바벳순 정렬을 보여주었습니다.
이 때 헤더 열이 있다는 것을 주의해야 합니다.

수식

수식은 스프레드 시트에서 데이터를 사용하여 특정 작업을 처리하는 일련의 명령어 입니다.
모든 수식은 등호로 시작합니다.
함수 : 스프레드시트의 데이터를 사용하여 과정이나 작업을 자동으로 처리하도록 사전 설정된 명령어 입니다. (헷갈리지 말기!)

SQL

SQL 은 데이터를 저장하거나 구성하고 분석하는 등의 용도로 사용됩니다. 하지만 무엇보다도 SQL 을 사용하면 대량의 데이터로 더 많은 작업을 처리할 수 있습니다. 초대형 스프레드 시트라고 할 수 있습니다.

Query

데이터 베이스의 데이터나 정보에 관한 요청입니다.
쿼리를 사용하면 특정 조건에 따라 데이터를 필터링할 위치를 추가하여 테이블에서 특정 데이터를 선택할 수 있습니다.
주석을 사용하여 쿼리 작업을 설명합니다.

데이터 시각화

데이터 시각화는 정보를 시각적으로 표현하는 과정 입니다. 데이터 시각화의 중요성으로 인해 대부분의 데이터 애널리틱스 도구(스프레드시트 및 데이터베이스)에는 시각화 요소가 기본으로 제공되지만, Tableau 와 같이 주요 기능이 시각화인 전문 도구도 있습니다.

데이터 시각화 계획 단계

데이터 패턴 살펴보기

시각화 계획

데이터를 자세히 조정하고 분석 결과를 제시해야 합니다.
분석 결과를 이해관계자에게 빠르고 효과적으로 설명하기 위해 데이터 시각화 자료를 만들어야 합니다.

시각 자료 만들기

발표에 적합한 시각화 자료를 생성하거나 이해 관계자와 공유하는 일은 하나의 프로세스와 같습니다.
원하는 결과를 얻을 때까지 다양한 시각화 형식을 시도하고, 조정해야 합니다.

시각화 도구

스프레드 시트

스프레드 시트는 막대 그래프, 원형 차트와 같은 간단한 시각화 자료를 만드는 데 적합하지만 맵, 폭포형, 깔때기형 다이어그램과 같은 고급 시각화 자료도 제공합니다.

Tableau

Tableau는 거의 모든 시스템에서 데이터를 가져와 설득력 있는 시각 자료나 활용 가능한 분석 정보로 전환할 수 있는 인기 있는 데이터 시각화 도구입니다. 이 플랫폼은 권장 시각 자료를 기본 제공하여 데이터를 빠르고, 쉽고, 무엇보다도 유용하게 분석하고 공유할 수 있도록 합니다. 또한 Tableau는 매우 다양한 데이터와 잘 작동하며, 사용자와 이해관계자가 클릭을 통해 데이터를 살펴볼 수 있는 대화형 대시보드를 제공합니다.

R

많은 데이터 애널리스트는 R이라는 프로그래밍 언어로 작업하며, 대부분의 R 사용자는 결국 데이터를 시각화하는 데 통합 개발 환경(IDE)인 RStudio를 사용하게 됩니다. Tableau와 마찬가지로 RStudio를 사용하여 대시보드 형식의 데이터 시각화 자료를 만들 수 있습니다.