Search

데이터 분석

과정
기초: 어디에나 존재하는 데이터
데이터 기반 의사결정을 위한 질문
날짜
2024/01/11

데이터 분석 단계

질문

해결해야 할 문제를 정의하고 이해관계자의 기대치를 온전히 이해했는지 확인합니다. 문제 정의는 현재 상황을 살펴보고 이상적인 상황과 어떻게 다른지 확인한다는 의미입니다. 일반적으로 현재 상황에서는 없애야 할 장애물이나 수정해야 할 오류가 존재합니다. 또한 질문 단계에서는 이해관계자의 기대치를 이해해야 합니다. 아해관계자의 기대치를 파악하면 문제의 증상뿐만 아니라 문제 자체에 계속 집중할 수 있습니다
해결하려는 문제 정의
이해관계자의 기대치를 정확히 파악
주의 분산을 피하고 실제 문제에 집중
이해관계자와 협업하고 열린 소통 채널 유지
한 걸음 물러서서 전체 상황의 맥락 검토
문제는 해결해야 할 장애물이고, 논점은 조사 주제이고, 질문은 정보를 발견하기 위해 고안 됩니다.
데이터 애널리스트는 질문에 답하고 문제를 해결하는 데 이를 비즈니스 작업 이라고 합니다.

준비

데이터 애널리스트가 예정된 분석 과정에서 사용할 데이터를 수집하고 저장하는 단계입니다. 데이터의 다양한 유형에 관해 알아보고 특정 문제를 해결하는 데 가장 유용한 데이터 유형을 파악합니다. 이때의 데이터와 결과는 객관적이고 편향되지 않아야 합니다. 또한 세부사항이 알맞은지 파악합니다. 오타, 비일관성, 누락되거나 부정확한 데이터도 수정해야 합니다. 더 나아가 정리한 데이터를 확인하고 이해관계자와 공유할 전략을 배웁니다.
측정항목 정의
데이터베이스에서 데이터 찾기
데이터를 보호하기 위한 보안 조치 수립

처리

스프레드시트 함수를 사용하여 잘못 입력된 데이터 확인
SQL 함수를 사용하여 불필요한 공백 확인
중복된 항목 삭제
데이터에 편향이 있는지 최대한 확인

분석

유용한 결론을 도출하고, 예측하고, 정보에 기반한 의사결정을 내릴 수 있도록 도구를 사용하여 데이터를 수집, 변환, 구성하는 작업입니다. 도구로는 스프레드시트와 구조적 쿼리 언어가 있습니다.
계산
여러 출처의 데이터 결합
결과를 반영한 표 만들기

공유

데이터 애널리스트가 결과를 해석하고 다른 사람들과 공유하여 이해관계자가 효과적인 데이터 기반 의사 결정을 내리도록 돕는 방법 입니다. 시각화는 데이터 애널리스트가 가장 선호하는 도구 입니다. 알맞은 시각 자료를 사용하면 사실 정보와 수치가 훨씬 보기 쉬워지고 복잡한 개념을 이해하기 쉬워집니다. 이 과정에서 R 이 도구로 많이 사용됩니다.
더 나은 의사결정
정보에 기반한 의사결정
더 강력한 결과 도출
발견 내용의 성공적인 전달

조치

데이터 애널리스트의 도구

스프레드 시트

스프레드 시트는 디지털 워크시트 입니다. 데이터를 저장, 구성, 정렬합니다. 데이터를 스프레드시트에 넣으면 패턴을 보고 정보를 그룹화하고 필요한 정보를 쉽게 찾을 수 있습니다. 스프레드시트에는 수식과 함수라는 정말 유용한 기능도 있습니다.
Microsoft Excel
Google Sheets

SQL

쿼리 언어는 데이터베이스에서 데이터를 가져오고 조작하는 데 사용하는 컴퓨터 프로그래밍 언어 입니다. 데이터 삽입, 삭제, 선택, 업데이트 등 다양한 일을 처리하도록 요청할 수 있습니다.

데이터 시각화

그래프, 맵, 테이블이 있으며, 널리 사용되는 시각화 도구는 Tableau 와 Looker 입니다. Tableau는 이해하기 쉬운 시각 자료를 만드는 데 도움이 되기 때문에 데이터 애널리스트가 선호합니다 Tableau를 사용하면 기술적 지식 없이도 필요한 정보를 얻을 수 있습니다 Looker는 쿼리 결과를 기반으로 시각 자료를 쉽게 만들 수 있기 때문에 데이터 애널리스트가 자주 사용합니다 Looker를 사용하면 이해관계자에게 실제 데이터와 시각화 자료를 보여주면서 작업에 관한 완전한 이미지를 제공할 수 있습니다