본 데이터는 부산시가 자체 운영하는 통신망의 특정 구간에서 수집한 네트워크 트래픽 정보를 담고 있습니다. 데이터는 ‘샘플링된 플로우 데이터셋’에 명시된 단방향 플로우들에 속하는 개별 패킷들의 헤더 및 시간 정보를 제공합니다. 본 데이터는 플로우 내 패킷 타이밍/크기 분포, 재전송·세그먼트 특성, TTL/TOS 기반 경로·QoS 추정, ‘샘플링된 플로우 데이터셋’과의 결합을 통한 세션-패킷 다각 분석에 활용할 수 있으며, 관련 알고리즘 또는 AI 모델 개발을 위한 학습 데이터로 적합합니다. 본 데이터의 수집 기간은 1일이고 총 946,131 레코드를 포함하고 있습니다. 본 데이터가 제공하는 총 28가지 항목은 아래와 같습니다. ● 시간: packet_capture_time (수집 시각), uni_flow_iat (동일 단방향 플로우 내 이전 패킷과의 시차), flow_start_time (플로우 시작 시각) ● 식별/주소: enc_src_ip, enc_dst_ip, enc_src_port, enc_dst_port, protocol (IANA 기준 값) ● 방향: packet_direction (전방향 패킷: FORWARD / 후방향 패킷: BACKWARD) ● IP 계층: ip_len, ip_hdr_len, ip_tos, ip_ttl ● TCP 계층: tcp_len, tcp_hdr_len, tcp_seq, tcp_ack, tcp_flags_ns/cwr/ecn/urg/ack/push/reset/syn/fin(boolean), tcp_window_size ● UDP 계층: udp_length
원본 패킷의 페이로드는 일절 포함하지 않으며, 식별 가능한 IP 주소, 포트번호 등은 모두 익명화 처리됨. 따라서 개인 식별이나 특정 시스템 추적이 불가능함
다운로드(바로가기)
37
등록일
2025-11-11
수정일
2025-11-13
제공형태
공공데이터포털에서 다운로드(원문파일등록)
설명
본 데이터는 부산시가 자체 운영하는 통신망의 특정 구간에서 수집한 네트워크 트래픽 정보를 담고 있습니다. 데이터는 ‘샘플링된 플로우 데이터셋’에 명시된 단방향 플로우들에 속하는 개별 패킷들의 헤더 및 시간 정보를 제공합니다. 본 데이터는 플로우 내 패킷 타이밍/크기 분포, 재전송·세그먼트 특성, TTL/TOS 기반 경로·QoS 추정, ‘샘플링된 플로우 데이터셋’과의 결합을 통한 세션-패킷 다각 분석에 활용할 수 있으며, 관련 알고리즘 또는 AI 모델 개발을 위한 학습 데이터로 적합합니다. 본 데이터의 수집 기간은 1일이고 총 946,131 레코드를 포함하고 있습니다. 본 데이터가 제공하는 총 28가지 항목은 아래와 같습니다. ● 시간: packet_capture_time (수집 시각), uni_flow_iat (동일 단방향 플로우 내 이전 패킷과의 시차), flow_start_time (플로우 시작 시각) ● 식별/주소: enc_src_ip, enc_dst_ip, enc_src_port, enc_dst_port, protocol (IANA 기준 값) ● 방향: packet_direction (전방향 패킷: FORWARD / 후방향 패킷: BACKWARD) ● IP 계층: ip_len, ip_hdr_len, ip_tos, ip_ttl ● TCP 계층: tcp_len, tcp_hdr_len, tcp_seq, tcp_ack, tcp_flags_ns/cwr/ecn/urg/ack/push/reset/syn/fin(boolean), tcp_window_size ● UDP 계층: udp_length
기타 유의사항
본 파일은 Snappy 코덱으로 압축된 avro 형식입니다. 내용을 조회하려면 Snappy 코덱을 지원하는 Avro 뷰어를 사용하거나, Python의 fastavro 모듈로 로드해 확인할 수 있습니다.
본 데이터는 부산시가 자체 운영하는 통신망의 특정 구간에서 수집한 네트워크 트래픽 정보를 담고 있습니다. 데이터는 ‘샘플링된 플로우 데이터셋’에 명시된 단방향 플로우들에 속하는 개별 패킷들의 헤더 및 시간 정보를 제공합니다. 본 데이터는 플로우 내 패킷 타이밍/크기 분포, 재전송·세그먼트 특성, TTL/TOS 기반 경로·QoS 추정, ‘샘플링된 플로우 데이터셋’과의 결합을 통한 세션-패킷 다각 분석에 활용할 수 있으며, 관련 알고리즘 또는 AI 모델 개발을 위한 학습 데이터로 적합합니다. 본 데이터의 수집 기간은 1일이고 총 946,131 레코드를 포함하고 있습니다. 본 데이터가 제공하는 총 28가지 항목은 아래와 같습니다. ● 시간: packet_capture_time (수집 시각), uni_flow_iat (동일 단방향 플로우 내 이전 패킷과의 시차), flow_start_time (플로우 시작 시각) ● 식별/주소: enc_src_ip, enc_dst_ip, enc_src_port, enc_dst_port, protocol (IANA 기준 값) ● 방향: packet_direction (전방향 패킷: FORWARD / 후방향 패킷: BACKWARD) ● IP 계층: ip_len, ip_hdr_len, ip_tos, ip_ttl ● TCP 계층: tcp_len, tcp_hdr_len, tcp_seq, tcp_ack, tcp_flags_ns/cwr/ecn/urg/ack/push/reset/syn/fin(boolean), tcp_window_size ● UDP 계층: udp_length
기타 유의사항
본 파일은 Snappy 코덱으로 압축된 avro 형식입니다. 내용을 조회하려면 Snappy 코덱을 지원하는 Avro 뷰어를 사용하거나, Python의 fastavro 모듈로 로드해 확인할 수 있습니다.