Search

데이터 생태계의 이해

과정
기초: 어디에나 존재하는 데이터
날짜
2024/01/08
목차

데이터 생태계란?

데이터 생태계

데이터 : 사실 정보의 모음 입니다.
생태계 : 상호작용 하는 요소의 모음 입니다.
데이터 생태계
데이터를 생성, 관리, 저장, 구성, 분석, 공유 하기 위해 상호작용하는 다양한 요소로 구성 됩니다.
하드웨어와 소프트웨어 도구, 사용자

데이터 클라우드

데이터는 클라우드에도 있습니다. 클라우드는 컴퓨터 하드 드라이브가 아닌 온라인에 데이터를 보관하는 것입니다. 따라서 데이터를 조직의 네트워크 내부 어딘가에 저장하지 않고 인터넷을 통해 엑세스 합니다. 즉, 클라우드는 가상공간을 설명하기 위해 사용하는 용어 입니다.

데이터 생태계에 대한 오해

데이터 과학자와 데이터 애널리스트

데이터 과학자는 원시 데이터를 사용하여 새로운 모델링 방법을 개발하고 미지의 대상을 이해하는 분야 입니다. 즉, 데이터를 사용하여 새로운 질문을 합니다. 반면 데이터 애널리스트는 데이터 소스의 유용한 정보로 기존 질문에 대한 답을 찾습니다.

데이터 분석과 데이터 애널리틱스

데이터 분석은 결론을 도출하고, 예측하고 정보에 기반한 의사결정을 내리기 위해 데이터를 수집, 변환, 구성하는 작업을 말합니다. 반면 애널리틱스는 데이터를 관리하고 사용하는 일을 비롯해 작업자가 매일 사용하는 도구와 방법까지 포함합니다.
따라서 데이터, 데이터 분석, 데이터 생태계 라는 개념은 데이터 애널리틱스라는 상위 개념에 모두 포함됩니다.

데이터를 사용해 정보에 기반한 결정을 내리는 방법

가장 강력한 데이터 활용 방법 중 하나는 데이터 기반 의사결정 입니다. 데이터 기반 의사결정이란 사실을 기반으로 비즈니스 전략을 도출하는 일입니다. 이를 위한 첫 단계는 비즈니스 니즈의 파악 입니다. 이를 최대한 활용하려면 비즈니스 문제를 잘 아는 사람들에게서 유용한 정보를 확보해야 합니다. 이러한 사람들을 분야 전문가라고 합니다.
분야 전분가는 데이터 분석 결과를 살펴보고 비 일관성을 파악하고 불확실한 부분을 해석하여 결정을 검증하는 능력을 가지고 있습니다. 이같이 작업하는 조직은 데이터를 모든 비즈니스 전략의 핵심으로 활용하면서 사람들에게서도 유용한 정보를 얻습니다. 데이터 애널리스트는 조직이 데이터 기반 의사 결정을 내리는 데 핵심적인 역할을 하므로 데이터가 의사결정 과정에서 어떻게 활용 되는지 잘 알고 있어야 합니다.

데이터와 직감

애널리스트는 데이터를 기반으로 의사결정을 내리고 단계별 과정을 따릅니다. 그 과정은 아래 6 단계 입니다.
1. 질문하고 문제를 정의합니다. 2. 정보를 수집하고 저장하여 데이터를 준비합니다. 3. 정보를 정리하고 확인하여 데이터를 처리합니다. 4. 데이터를 분석하여 패턴, 관계, 추세를 찾습니다. 5. 이해관계자와 데이터를 공유합니다. 6. 데이터에 따라 조치를 취하고 분석 결과를 활용합니다.
Plain Text
복사
하지만 이외에도 의사결정 과정에 영향을 미치는 요인이 있습니다. 바로 직감 입니다. 직감은 설명하지 않아도 무언가를 직관적으로 이해하는 것입니다.

하지만 직감은 문제가 될 수 있어요.

데이터 기반 의사결정의 핵심은 데이터입니다. 따라서 데이터 애널리스트는 정보에 기반한 의사결정을 내릴 수 있도록 데이터에 집중해야만 합니다. 자신의 경험을 바탕으로 의사결정을 내리는 것을 선호하여 데이터를 무시하는 경우, 결정이 편향될 수 있습니다. 그러나 뒷받침하는 데이터 없이 직감에 기반 하여 내리는 결정은 실수를 야기할 수 있기 때문에 문제가 될 수 있습니다.
프로젝트와 관련된 데이터를 더 많이 이해할수록 무엇이 필요한지 더 쉽게 파악할 수 있습니다. 이러한 노력은 데이터의 오류와 격차를 파악하는 데도 도움이 되어 분석 결과를 보다 효과적으로 전달할 수 있게 됩니다. 과거의 경험은 때때로 다른 사람이 알아차리지 못하는 연결성을 파악하는 데 도움이 됩니다.

데이터 + 비즈니스 지식 = 사건해결

주니어 데이터 애널리스트의 경우 비즈니스 지식과 데이터를 함께 활용하고 직감적으로 판단하는 업무를 주로 담당하게 될 것입니다. 특정 프로젝트별로 지식과 데이터의 균형을 정확히 알아야 하며, 많은 경우 이는 분석 목표에 따라 달라집니다. 그렇기 때문에 애널리스트들은 "이 프로젝트의 성공을 어떻게 정의할 수 있을까?"라고 질문합니다. 완벽한 균형을 찾는 데 도움이 되도록 프로젝트와 관련해 다음과 같은 질문에 직접 답해보세요.
어떤 종류의 결과가 필요한가?
정보를 받을 대상은 누구인가?
묻는 질문에 제대로 답하고 있는가?
얼마나 빨리 결정을 내려야 하는가?
예를 들어 긴급한 프로젝트를 진행하는 경우에는 평소보다 애널리스트 본인의 지식과 경험에 의존해야 할지도 모릅니다. 사용 가능한 모든 데이터를 철저히 분석할 시간이 충분하지 않기 때문입니다. 많은 시간과 리소스가 요구되는 프로젝트를 진행하는 경우에는 데이터에 기반하여 접근하는 전략이 가장 좋습니다. 여러분은 데이터 애널리스트로서 최선의 선택을 내려야 합니다. 데이터 애널리틱스 커리어를 쌓아 가는 동안 수많은 방법을 통해 데이터와 지식을 함께 활용하게 될 것입니다. 연습하면 할수록 완벽한 균형을 더 잘 찾을 수 있습니다.