1. 국가의 대기오염물질 배경농도를 측정하고 외국으로부터 오염물질 유입, 유출상태 등을 파악하기 위해 운영중인 국가배경측정소에서 측정한 대기오염물질 측정데이터를 기반으로 결측치를 보강하여 AI학습 테스트용 합성데이터(가상데이터)를 생성하였습니다. 2. 합성데이터 설명 - 원본데이터 이용기간 및 건수: 2022~2024년(3년), 1시간 단위 약 150만건 - 원본데이터 특성 : 1시간 연속측정 데이터, 측정기기 오작동 등 상태코드가 부여된 오류데이터 존재 - 합성데이터 특성 : 결측치 보강, 시계열특성 반영, 범주형 및 수치형 데이터 혼재 - 합성데이터 활용 : 실제 측정 데이터의 구조와 통계적 특성을 반영하되 민감정보를 포함하지 않아 AI학습 테스트 데이터로 활용 가능
1. 국가의 대기오염물질 배경농도를 측정하고 외국으로부터 오염물질 유입, 유출상태 등을 파악하기 위해 운영중인 국가배경측정소에서 측정한 대기오염물질 측정데이터를 기반으로 결측치를 보강하여 AI학습 테스트용 합성데이터(가상데이터)를 생성하였습니다. 2. 합성데이터 설명 - 원본데이터 이용기간 및 건수: 2022~2024년(3년), 1시간 단위 약 150만건 - 원본데이터 특성 : 1시간 연속측정 데이터, 측정기기 오작동 등 상태코드가 부여된 오류데이터 존재 - 합성데이터 특성 : 결측치 보강, 시계열특성 반영, 범주형 및 수치형 데이터 혼재 - 합성데이터 활용 : 실제 측정 데이터의 구조와 통계적 특성을 반영하되 민감정보를 포함하지 않아 AI학습 테스트 데이터로 활용 가능
기타 유의사항
공간범위
시간범위
비용부과유무
무료
비용부과기준 및 단위
건
이용허락범위
공공저작물_출처표시
한국환경공단_대기오염물질 국가배경농도 합성데이터로 파일데이터 정보 표로 분류체계, 제공기관 등 정보를 나타냄
1. 국가의 대기오염물질 배경농도를 측정하고 외국으로부터 오염물질 유입, 유출상태 등을 파악하기 위해 운영중인 국가배경측정소에서 측정한 대기오염물질 측정데이터를 기반으로 결측치를 보강하여 AI학습 테스트용 합성데이터(가상데이터)를 생성하였습니다. 2. 합성데이터 설명 - 원본데이터 이용기간 및 건수: 2022~2024년(3년), 1시간 단위 약 150만건 - 원본데이터 특성 : 1시간 연속측정 데이터, 측정기기 오작동 등 상태코드가 부여된 오류데이터 존재 - 합성데이터 특성 : 결측치 보강, 시계열특성 반영, 범주형 및 수치형 데이터 혼재 - 합성데이터 활용 : 실제 측정 데이터의 구조와 통계적 특성을 반영하되 민감정보를 포함하지 않아 AI학습 테스트 데이터로 활용 가능