Search

데이터 편향과 데이터 신뢰성

과정
탐색을 위한 데이터 준비
날짜
2024/02/01

데이터 편향의 종류

샘플링 편향

샘플이 모집단을 제대로 대표하지 않는 경우를 의미합니다.

관찰자 편향

실험자 편향이나 조사 편향 이라고도 부릅니다.
관찰자 편향은 같은 현미경을 들여다보는 두 명의 과학자가 서로 다른 결과를 관찰한다는 의미입니다.

해석 편향

모호한 상황을 항상 긍정적이거나 부정적으로 해석하는 경향을 의미합니다.
두 사람이 배경정보와 경험이 다르기 때문에 같은 것을 보고 듣더라도 다양한 방식으로 해석한다는 의미입니다.

확증 편향

기존의 믿음을 확증하는 방식으로 정보를 검색하거나 해석하려는 경향을 의미합니다.

좋은 데이터란? 데이터 식별하기 with ROCC

데이터 소스를 선택할 때는 이 세가지를 생각합니다.
누가 데이터 세트를 만들었는가?
신뢰할 수 있는 조직에 속한 사람인가?
마지막으로 데이터를 업데이트한 시기는 언제인가?

Reliable

좋은 데이터 소스는 신뢰할 수 있습니다. 이러한 데이터를 사용하면 검증을 거쳐 사용하기에 적합하다고 입증되었고, 정확하고, 완전하고, 편향되지 않은 정보라고 확신할 수 있습니다.

Comprehensive

최고의 데이터 소스에는 질문에 답하거나 해결책을 찾는 데 필요한 모든 중요한 정보가 포함되어 있습니다.

Current

데이터의 유용성은 시간이 지나면서 감소합니다. 최고의 데이터 소스는 최신이고 당면한 작업과 관련이 있어야 합니다.

Cited

인용은 여러분이 제공하시는 정보의 신뢰성을 높여줍니다.
신뢰할 수 있는 조직의 원본 데이터이고 포괄적이고 최신이고 인용된 데이터가 바로 ROCCC 데이터입니다. 좋은 데이터를 보유하고 있다고 알려진 소스는 많습니다. 검증된 공개 데이터 세트, 학술 논문, 재무 데이터, 정부 기관 데이터를 사용하는 편이 가장 좋습니다.