데이터 상세

과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타

이 데이터는 빅데이터 개념부터 응용 기술까지 33개 PDF 학습 자료로 이루어져 있습니다. 여상수 교수가 감수한 이 자료는 ‘빅데이터란?’과 ‘빅데이터의 속성(3V·4V)’로 기초 개념을 다지며, MPI·MapReduce·BSP 같은 분산 처리 모델과 Flume·Sqoop 로그 수집 도구를 포함한 데이터 수집·처리 과정을 단계별로 안내합니다. HDFS·GFS 분산 파일 시스템과 Hive·Mahout 분석 도구, Hadoop·Splunk·Dremel·Cloudera Impala 등 국내외 플랫폼 비교를 통해 대용량 데이터 저장 및 분석 환경을 제시하며, 데이터 마이닝·텍스트 마이닝·프로세스 마이닝·지능형 영상분석·실시간 스트림 분석 등의 활용 사례와 빅데이터 표준화 동향까지 다각도로 다룹니다. 누구나 PDF 파일을 내려받아 빅데이터 전 과정을 체계적으로 학습할 수 있도록 구성된 점이 특징입니다.
공공데이터활용지원센터는 공공데이터포털에 개방되는 3단계 이상의 오픈 포맷 파일데이터를 오픈 API(RestAPI 기반의 JSON/XML)로 자동변환하여 제공합니다.
오픈 API를 활용하기 위해서는 공공데이터포털 회원 가입 및 활용신청이 필요하며, 활용 관련 문의는 공공데이터활용지원센터로 연락주시기 바라며,
데이터 자체에 대한 문의는 아래 제공기관의 관리부서 전화번호로 연락주시기 바랍니다.
파일데이터는 로그인 없이 다운로드를 통해 이용하실 수 있습니다.
CSV
과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타
다른 사용자들이 활용한 데이터

파일데이터 정보

과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타로 파일데이터 정보 표로 분류체계, 제공기관 등 정보를 나타냄
파일데이터명 과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타_20230828
분류체계 교육 - 교육일반 제공기관 과학기술정보통신부 국립중앙과학관
관리부서명 운영지원과 관리부서 전화번호
보유근거 수집방법
업데이트 주기 수시 (1회성 데이터) 차기 등록 예정일
매체유형 텍스트 전체 행 33
확장자 CSV 키워드 교육,빅데이터,과학학습,분산처리,분산파일시스템,데이터마이닝,실시간 스트림 분석,표준화
데이터 한계 다운로드(바로가기) 704
등록일 2020-09-28 수정일 2025-05-30
제공형태 공공데이터포털에서 다운로드(원문파일등록)
설명 이 데이터는 빅데이터 개념부터 응용 기술까지 33개 PDF 학습 자료로 이루어져 있습니다. 여상수 교수가 감수한 이 자료는 ‘빅데이터란?’과 ‘빅데이터의 속성(3V·4V)’로 기초 개념을 다지며, MPI·MapReduce·BSP 같은 분산 처리 모델과 Flume·Sqoop 로그 수집 도구를 포함한 데이터 수집·처리 과정을 단계별로 안내합니다. HDFS·GFS 분산 파일 시스템과 Hive·Mahout 분석 도구, Hadoop·Splunk·Dremel·Cloudera Impala 등 국내외 플랫폼 비교를 통해 대용량 데이터 저장 및 분석 환경을 제시하며, 데이터 마이닝·텍스트 마이닝·프로세스 마이닝·지능형 영상분석·실시간 스트림 분석 등의 활용 사례와 빅데이터 표준화 동향까지 다각도로 다룹니다. 누구나 PDF 파일을 내려받아 빅데이터 전 과정을 체계적으로 학습할 수 있도록 구성된 점이 특징입니다.
기타 유의사항
공간범위 시간범위
비용부과유무 무료 비용부과기준 및 단위
이용허락범위
공공데이터활용지원센터는 공공데이터포털에 개방되는 3단계 이상의 오픈 포맷 파일데이터를 오픈 API(RestAPI 기반의 JSON/XML)로 자동변환하여 제공합니다.
오픈 API를 활용하기 위해서는 공공데이터포털 회원 가입 및 활용신청이 필요하며, 활용 관련 문의는 공공데이터활용지원센터로 연락주시기 바랍니다.
파일데이터는 로그인 없이 다운로드를 통해 이용하실 수 있습니다.
XML JSON
과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타
다른 사용자들이 활용한 데이터

오픈API 정보

과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타로 api형식의 파일데이터 정보 표로 분류체계, 제공기관 등 정보를 나타냄
서비스 과학기술정보통신부 국립중앙과학관_과학학습콘텐츠_빅데이타_20230828
분류체계 교육 - 교육일반 제공기관 과학기술정보통신부 국립중앙과학관
관리기관 공공데이터활용지원센터 관리기관 전화번호 1566-0025
보유근거 수집방법
업데이트 주기 수시 (1회성 데이터) 차기 등록 예정일
매체유형 텍스트 전체 행 33
확장자 XML, JSON 활용신청 1
데이터 한계 키워드 교육,빅데이터,과학학습,분산처리,분산파일시스템,데이터마이닝,실시간 스트림 분석,표준화
등록일 2020-09-28 수정일 2025-05-30
제공형태 공공데이터포털에서 다운로드(원문파일등록)
설명 이 데이터는 빅데이터 개념부터 응용 기술까지 33개 PDF 학습 자료로 이루어져 있습니다. 여상수 교수가 감수한 이 자료는 ‘빅데이터란?’과 ‘빅데이터의 속성(3V·4V)’로 기초 개념을 다지며, MPI·MapReduce·BSP 같은 분산 처리 모델과 Flume·Sqoop 로그 수집 도구를 포함한 데이터 수집·처리 과정을 단계별로 안내합니다. HDFS·GFS 분산 파일 시스템과 Hive·Mahout 분석 도구, Hadoop·Splunk·Dremel·Cloudera Impala 등 국내외 플랫폼 비교를 통해 대용량 데이터 저장 및 분석 환경을 제시하며, 데이터 마이닝·텍스트 마이닝·프로세스 마이닝·지능형 영상분석·실시간 스트림 분석 등의 활용 사례와 빅데이터 표준화 동향까지 다각도로 다룹니다. 누구나 PDF 파일을 내려받아 빅데이터 전 과정을 체계적으로 학습할 수 있도록 구성된 점이 특징입니다.
기타 유의사항
공간범위 시간범위
비용부과유무 무료 비용부과기준 및 단위
이용허락범위
다른 사용자들이 활용한 데이터
이 데이터와 유사한 데이터