{"name":"과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타","alternateName":"과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타_20230828","description":"이 데이터는 빅데이터 개념부터 응용 기술까지 33개 PDF 학습 자료로 이루어져 있습니다. 여상수 교수가 감수한 이 자료는 ‘빅데이터란?’과 ‘빅데이터의 속성(3V·4V)’로 기초 개념을 다지며, MPI·MapReduce·BSP 같은 분산 처리 모델과 Flume·Sqoop 로그 수집 도구를 포함한 데이터 수집·처리 과정을 단계별로 안내합니다. HDFS·GFS 분산 파일 시스템과 Hive·Mahout 분석 도구, Hadoop·Splunk·Dremel·Cloudera Impala 등 국내외 플랫폼 비교를 통해 대용량 데이터 저장 및 분석 환경을 제시하며, 데이터 마이닝·텍스트 마이닝·프로세스 마이닝·지능형 영상분석·실시간 스트림 분석 등의 활용 사례와 빅데이터 표준화 동향까지 다각도로 다룹니다. 누구나 PDF 파일을 내려받아 빅데이터 전 과정을 체계적으로 학습할 수 있도록 구성된 점이 특징입니다.","url":"https://www.data.go.kr/data/15067837/fileData.do","keywords":"교육,빅데이터,과학학습,분산처리,분산파일시스템,데이터마이닝,실시간 스트림 분석,표준화","license":"이용허락범위 제한 없음","dateCreated":"2020-09-28","dateModified":"2025-05-30","datePublished":"2020-09-28","creator":{"name":"과학기술정보통신부 국립중앙과학관","contactPoint":{"contactType":"운영지원과","telephone":"042-601-7871","@type":"ContactPoint"},"@type":"Organization"},"spatialCoverage":"","temporalCoverage":"","additionalType":"교육 - 교육일반","datasetTimeInterval":"수시 (1회성 데이터)","encodingFormat":"CSV","legislation":"","@context":"https://schema.org","@type":"Dataset"}