공공데이터 품질관리

공공데이터의 정의

공공데이터의 제공 및 이용 활성화에 관한 법률에 의하면 ‘공공데이터’란 공공기관이 생성 또는 취득하여 관리하고 있는 광(光) 또는 전자적 방식으로 처리되어 부호 · 문자 · 도형 · 색채 · 음성 · 음향 · 이미지 및 영상 등(이들의 복합체 포함)으로 표현된 모든 종류의 자료 또는 정보를 말합니다.

공공데이터의 정의

정형정보

  • 구조화 (Structured) - 기준정보, 거래정보, 집계정보 등
  • 반구조화 (Semi-Structured) - HTML, XML, GIS 등

비정형정보

  • 비구조화 (Unstructured) - 동영상, 이미지, 사운드, 문서 등

공공데이터 품질관리 필요성

공공기관이 보유한 공공데이터는 최근 들어 민간 공개를 통한 다양한 정보서비스 발굴 · 제공 등 국가정보화를 선진화하는 중요한 자원으로 인식되고 있으므로 품질관리를 통해 원활한 활용을 하도록 해야 합니다.

공공데이터 품질관리

“데이터 품질(Data Quality)”이란 “데이터의 최신성, 정확성, 상호연계성 등을 확보하여 이를 사용자에게 유용한 가치를 줄 수 있는 수준”으로 정의할 수 있습니다. 이러한 데이터 품질을 사용자 관점에서 지속적으로 유지하거나 향상시키기 위해서는 체계적인 관리와 활동이 필요합니다. 따라서 “데이터 품질관리(Data Quality Management)”란 사용자에게 유용한 가치를 제공하도록 “데이터의 품질을 확보하기 위한 품질 목표 설정, 품질 진단 및 개선 등 일련의 활동과 이를 지원하기 위한 관련 도구”를 의미합니다.
일반적으로 데이터 품질관리는 데이터 구축 이후 운영 및 활용단계에서 이루어지는 업무로 인식되어 왔으나 범정부 차원의 공공기관 품질 진단 사업 등의 결과를 살펴보면, 주요 품질 이슈에 대한 원인이 데이터의 운영 및 활용 단계를 포함한 정보시스템 구축 단계의 품질관리 활동 부재에서도 그 원인을 찾을 수 있습니다. 공공기관이 품질관리 활동을 수행함에 있어 아래의 품질관리 개념도처럼 데이터의 구축부터 운영, 활용까지의 정보 생명주기(Life Cycle)를 고려하여 전 단계에 걸쳐 적용되는 체계를 확보하도록 데이터 품질관리를 체계화 하여야 합니다.

공공데이터의 정의

공공데이터 품질관리 관련 매뉴얼 · 지침

공공데이터 제공 표준 안내

공공데이터 제공 표준 개요

공공데이터 제공 및 이용을 활성화하기 위하여 공공데이터 개방 시 적용하기 위한 공통 개방 기준과 데이터 셋 분야별 개방 기준(제공항목, 속성정보, 제공형식 등) 및 기타 데이터 개방 표준을 정의합니다.

적용대상 : 행정기관 및 공공기관

공공데이터 제공 표준 데이터셋 목록 (2020년 기준, 122개)

품질관리 표준

공통표준 용어란?

“공통표준용어”란 공공데이터를 누구나 같은 의미로 이해하고 같은 방식으로 사용할 수 있도록 행정안전부장관이 정한 표준용어를 말합니다.

공통표준용어는 『공공기관의 데이터베이스 표준화 지침』 제11조~제13조에 따라, 공공기관에서 구축하여 운영 중인 모든 공공데이터베이스와 기관표준용어 정의 시 공통표준용어를 적용하여야 합니다.

DB 구축 시 논리 데이터요소인 애트리뷰트정의서와 물리 데이터요소인 컬럼정의서 등에 적용하여야 합니다. 행정·공공기관은 기관 간 데이터를 연계·활용 시, 공통표준용어를 준용하여야 합니다.

공공기관의 데이터베이스 표준화 지침 소개

개요

공공기관의 데이터베이스 표준화 지침 소개 개요

최종개정일 2023.4.(행정안전부고시 제2023-18호)
총괄기관 행정안전부 디지털정부실 공공데이터관리과
대상기관 「공공데이터의 제공 및 이용 활성화에 관한 법률」 제2조 제1호에 따른 공공기관
주요내용 제정목적 및 적용범위, 구축·운영 단계별 표준화 관리, 공통표준용어, 메타데이터, 점검 및 조치 등

공공기관의 데이터베이스 표준화 지침 필요성

개요

공공데이터의 제공 및 이용 활성화에 관한 법률 제23조(공공데이터의 표준화), 전자정부법 제50조(표준화) 및 같은법 시행령 제59조(표준화)에 따라 「공공기관의 데이터기본 표준화 지침」을 개정하였습니다.

공공기관의 데이터베이스 표준화지침 개정내용

  • ○ 관리항목의 유연성 강화(별표 제1호 및 제2호 신설)
      - 데이터 표준 산출물과 별지 및 별표에 포함된 관리항목을 일치시켜 관리항목 등록·관리 유연성 및 편의성 제고함
  • ○ 비표준데이터 관리체계 마련(제8조 제5항)
      - 운영 중인 정보시스템(DB)의 비표준데이터를 표준화된 데이터와 매핑‧관리할 수 있도록 명시함
  • ○ 메타정보 관리항목 정비(별표 제4호)
      - 중앙 메타데이터 관리시스템, 공동활용시스템 등에서 필요한 공통항목으로 메타정보 관리항목을 정비함(기존 : 43개 → 조정 : 38개)
  • ○ 용어 정의 추가(제2조)
      - 데이터 표준 간 관계 및 상위표준 준용 필요성을 명시함
  • ○ 관리시스템 현행화(제4조, 제5조, 제6조, 제8조, 제13조)
      - 표준관리 통합시스템과 메타데이터 관리시스템이 제공하는 기능에 따른 조항별 문구를 조정함

공공기관의 데이터베이스 표준화 지침 다운로드

목적 및 추진근거

목적 및 추진안내

목적

공공기관이 생성, 취득하여 관리하는 공공데이터의 적정한 품질 수준을 확보하기 위한 기관 차원의 품질관리 활동을 평가하고, 기관 내 공공데이터 품질관리 체계 확립과 고품질의 공공데이터를 생성·개방·활용으로 이어지는
선순환 체계 구축

추진근거

「공공데이터의 제공 및 이용 활성화에 관한 법률」 제22조(공공데이터의 표준관리) 및 동법 시행령 제17조(공공데이터의 품질진단 및 개선) 등

평가체계

평가안내

평가항목

2개 영역(데이터 관리체계, 데이터 값) 11개 평가지표

  • 데이터 관리체계 : 기관 차원의 품질기반, 역량강화, 표준화 체계 등 평가
  • 데이터 값 : DB내 저장되어 있는 데이터 및 공공데이터 포털 내 개방 데이터의 오류율 평가
평가점수

기관 품질관리, 데이터 품질관리, 영역별 점수의 합

평가활용

공공데이터 제공 운영실태 평가 및 정부혁신평가 등에 반영

평가지표 체계(안)

공공데이터 품질관리 수준평가

공공데이터 품질관리 수준평가

  • 계획 - 데이터품질관리 기반, 데이터품질관리 역량, 데이터 표준 통합관리 체계
  • 구축 - 데이터 표준적용 확산, 데이터 구조 안정화, 연계 데이터 연계 체계 정비
  • 운영 - 데이터품질진단 및 개선관리, 오류데이터 관리 (데이터 값 오류 진단 기준 : 날짜,번호,여부,코드,집계값,시간순서,참조값,금액,수량,율,선후관계, 논리관계)
  • 활용 - 데이터활용성 제고

평가대상

평가대상 안내

  • 공공데이터법 제2조(정의) 제1호 규정에 해당하는 모든 공공기관이 평가 대상임(국회·법원·헌법재판소·중앙선거관리위원회, 대검찰청, 국민인권위원회는 제외)
  • 2019년도는 중앙행정기관(43개) 및 지방자치단체(시·도 17개, 시·군·구 226개)만을 실시하고 공공기관은 2020년부터 실시
<연도별 수준평가 대상(안)>
연도별 수준평가 대상(안)

품질관리 교육안내

품질진단, 업무규칙 발굴 등 실무중심 교육확대 및 전문교육과정(기본․심화교육 등), 상설교육장 개설 등 기관 중심 품질관리 역량 강화 지원

품질관리 실무 필수교육

- 정책 및 법제도 안내
- 데이터 품질진단
- 도구 사용법 안내

공공데이터 실무 기초 및 기본교육(온라인 예정)

- 데이터의 이해 등 기초 3개 과정
- 공공데이터 품질 표준 기본 4개 과정

공공데이터 기관 맞춤형교육 및 컨설팅(예정)

- 대상 : 신청기관
- 기간 : 하반기