★ 가장 자주 묻는 질문 — 무게 단위
모든 무게 컬럼은 raw gram (g)입니다. 컬럼명에 _g 접미사가 붙어 있고, kg 단위로 환산하려면 /1000. 총 무게 619423 = 619.4kg.
메타데이터
세션 식별자·시각·GPS 좌표 — 모든 row 의 join·필터·시계열 키.
session_id활동 세션 고유 식별자. 한 번의 플로깅 세션 = 한 row.
10211-2포맷 {plogging_id}-{user_id}. join 키로 활용 가능.
date활동 시작 일시 (KST, UTC+9).
2025-09-15 10:43:50ISO 8601 변형. 시계열 분석 시 KST 기준.
addressGPS 좌표를 역지오코딩한 한국어 주소.
"인천 중구 을왕동"원본 GPS 정밀도는 lat·lng 컬럼 참조. 시·구·동 단위.
region주소 첫 토큰 (광역시·도). region 단위 집계 키.
인천lat위도. WGS84 기준. 원본 정밀도 그대로 (소수 4~6자리).
37.4456GPS 라운딩 적용 X — 핫스팟 분석·조류 영향 연구를 위해 정밀도 보존.
lng경도. WGS84 기준.
126.3712활동 요약
한 세션의 개수·이동 거리. GPS 신호 약한 구간은 결측.
item_count한 세션에서 기록한 개별 쓰레기 개수.
8결측 시 빈 셀. mclear 테이블 row 수와 일치.
distance_km이동 거리. GPS 트랙 기반 자동 계산.
0.31결측 시 빈 셀. GPS 신호 약한 구간은 0 또는 누락 가능.
무게 — 합계
세션별 총 무게 + 플라스틱 / 비플라스틱 분리 합산. 모두 gram.
total_weight_g총 무게. 19종 분류 합산값.
619423★ 단위 주의 — 모든 무게 컬럼은 raw gram. kg 환산 시 /1000.
plastic_weight_g플라스틱 계열 합산 (idx 0~10).
413885non_plastic_weight_g비플라스틱 합산 (idx 11~19).
205538무게 — 19종 ICC 분류
ICC(International Coastal Cleanup) 19종 + 한국 특화 카테고리. 각 컬럼명 = 한국어 명칭 + _g. 모두 raw gram 단위.
| idx | 컬럼명 | 한국어 |
|---|---|---|
| 0 | styrofoam_buoy_g | 스티로폼 부표 |
| 1 | styrofoam_container_g | 스티로폼 용기 |
| 2 | styrofoam_fragment_g | 스티로폼 조각 |
| 3 | plastic_container_g | 플라스틱 용기 |
| 4 | cap_straw_spoon_g | 뚜껑·빨대·수저 |
| 5 | plastic_fragment_g | 플라스틱 조각 |
| 6 | vinyl_bag_g | 비닐 봉투 |
| 7 | product_packaging_g | 제품 포장 |
| 8 | vinyl_fragment_g | 비닐 조각 |
| 9 | fishing_net_rope_g | 어망·밧줄 |
| 10 | packaging_band_g | 포장 끈·밴드 |
| 11 | fabric_fragment_g | 직물 조각 |
| 12 | paper_g | 종이류 |
| 13 | metal_g | 금속류 |
| 14 | wood_g | 목재 |
| 15 | cloth_fabric_g | 옷·신발 |
| 16 | glass_g | 유리류 |
| 17 | rubber_g | 고무류 |
| 18 | cigarette_butt_g | 담배꽁초 |
| 19 | other_g | 기타 |
모바일에서는 설명 컬럼이 숨겨집니다. 자세한 분류 정의는 데이터 표준 페이지의 ICC 분류 체계 섹션 참조.
라이선스
license데이터 라이선스. 모든 row 동일 — 비상업 목적 자유 사용.
CC BY-NC 4.0라이선스 케이스별 사용 가능 여부는 /protocol/opendata/citation 참조.
Quick Start
세 가지 진입 — Excel·Python·시각화 도구. 본인에게 익숙한 도구로 시작하세요.
① 입문 — Excel · Google Sheets
CSV를 더블클릭하면 바로 열립니다. 무게는 g 단위 → 새 열에=B2/1000 입력하면 kg 환산. 피벗 테이블로 지역별·월별 합계 가능.
② 분석 — Python pandas · R
대학원·연구기관 표준 진입. 아래 코드 4 줄로 데이터 로드부터 시계열 분석까지 시작 가능. R도 동일한 방식으로 readr·dplyr 사용.
③ 시각화 — Datawrapper · Flourish · Tableau
기사·인포그래픽·발표용. Datawrapper(무료) 에 CSV 업로드하면 30분 안에 인터랙티브 지도·차트 완성. Tableau Public 도 같은 방식.
# 1. CSV 로드 (Python pandas)
import pandas as pd
df = pd.read_csv("caresea_opendata_full_2026-05-05.csv")
# 2. 무게 단위 변환 (gram → kg)
weight_cols = [c for c in df.columns if c.endswith("_g")]
df[weight_cols] = df[weight_cols] / 1000 # kg
# 3. 지역별 총 무게
df.groupby("region")["total_weight_g"].sum().sort_values(ascending=False)
# 4. 시계열 — 월별 스티로폼 부표 추이
df["date"] = pd.to_datetime(df["date"])
df.set_index("date").resample("M")["styrofoam_buoy_g"].sum()
인용 시: @dataset{caresea2026, license={CC BY-NC 4.0}, ...} — 인용 가이드 참조.
정부 보고서·학술 논문에 인용하실 때 알아두실 수치적 한계입니다. 과대 해석이나 과소 해석 모두 피하시기를 권장합니다.
표본 편향 (Sampling Bias)
활동 호스트 그룹이 활발한 해변에서 표본이 더 많이 수집됩니다. 인적 접근이 어려운 외딴 해안·사유지·보호구역은 표본이 적거나 없습니다. 지역별 총량 비교 시 이 편향을 함께 고려해 주세요.
계절·주기 편향
활동은 주로 봄·가을·주말에 집중됩니다. 겨울·평일 데이터는 상대적으로 적어 연중 추이 분석 시 시기별 표본 수를 함께 표기하시기를 권장합니다.
측정 정밀도 분포
같은 무게 컬럼에 저울 측정과 신체 비유 추정이 함께 들어 있습니다. 정밀도가 중요한 분석은 weight_method = 'measured' 로 필터링한 후 사용해 주세요. 추정 데이터의 ±오차는 카테고리별로 다르며 데이터 표준 페이지에 명시되어 있습니다.
권장 인용 표현
“반려해변에 등록된 시민과학 데이터 N건 분석 결과” 와 같이 전수 조사가 아닌 시민과학 표본임을 함께 명시하시면 신뢰도를 유지하면서 인용할 수 있습니다.
결측값
무게·개수·거리 컬럼은 측정 안 된 경우 빈 셀 또는 0. pandas 에서는 dtype 에 따라 NaN 또는 0 으로 로드됩니다. 무게 합계 분석 시 0 처리 권장 (CSV 출력 시 빈 row 는 0 으로 채움).
3단계 품질 검증
사진 EXIF 대조·GPS 경계 확인·통계적 이상치 탐지를 거친 row 만 본 데이터셋에 포함됩니다. 검증 통과율과 한계는 데이터 표준 페이지에서 확인할 수 있습니다.
변경 이력
ICC 분류 v2.0 (2024.09~) 기준 19종. 이전 v1.0 (2021~2024) 9종 데이터는 매핑 테이블로 호환. 새 분류 추가 시 기존 idx 보존 — 마이그레이션 없음.