책소개
빅데이터 시대가 도래하면서 데이터의 중요성이 더욱 강조되고 있습니다. 기업이나 정부 등 다양한 조직에서는 데이터를 수집하고 분석하여 의사결정에 활용하고 있습니다.
해외 데이터 산업 이슈와 데이터 산업 적용 사례를 통해 데이터 산업의 동향과 전망을 파악할 수 있습니다.
이 책을 통해 독자 여러분이 데이터 분석에 대한 이해를 높이고, 실무에 적용할 수 있는 전략을 습득할 수 있기를 바랍니다.
목차
제1장 빅데이터 개요 및 활용
■ 데이터와 정보, 데이터베이스 | 6p
■ 빅데이터 개요 및 가치 | 17p
■ 데이터 산업의 이해 | 24p
제2장 데이터 기술
■ 데이터 플랫폼 | 36p
■ 데이터 처리 기술 | 43p
■ 데이터와 인공지능 | 59p
제3장 데이터 기술 및 제도
■ 개인정보 개요 | 73p
■ 개인정보법,제도 | 78p
■ 개인정보 비식별화 | 91p
■ 개인정보 활용 | 97p
제4장 데이터 분석 계획
■ 데이터 분석 기획 | 102p
■ 데이터 분석 문제 정의 | 109p
제5장 데이터 아키텍처 상세화하기
■ 데이터 분석 방안 수립 | 134p
■ 데이터 분석 방법론 | 167p
■ 데이터 분석 거버넌스 | 177p
제6장 데이터 아키텍처 현황 분석하기
■ 데이터 분석 수순 진단 | 195p
■ 분석 작업 계획 | 204p
제7장 데이터 수집 및 품질 검증
■ 데이터 수집 | 219p
■ 데이터 유형 및 속성 파악 | 228p
■ 데이터 변환 | 232p
■ 데이터 품질 검증 | 237p
제8장 데이터 비식별화
■ 비식별화 개요 | 242p
■ 가명처리와 총계처리 | 246p
■ 데이터 삭제, 범주화, 마스킹 | 248p
■ 적정성 평가 | 251p
제9장 데이터 적재 및 저장
■ 데이터 적재 | 256p
■ 데이터 저장 | 260p
제10장 데이터에 내재된 변수의 이해
■ 데이터 관련 정의 | 274p
■ 데이터의 종류 | 275p
■ 데이터 정제 | 278p
■ 데이터 결측치 개념 | 281p
■ 결측 데이터의 종류 | 282p
■ 결측값유형의 분석 | 284p
■ 결측값 대치법 | 285p
■ 데이터 이상값 개념 | 288p
■ 이상치의 종류 | 289p
■ 이상치의 발생원인 | 290p
■ 이상치의 문제점 | 292p
■ 이상치의 탐지 | 293p
■ 변수 선택 | 295p
■ 차원 축소 | 298p
■ 파생변수의 생성 | 303p
제11장 분석변수 처리의 파생변수 생성
■ 파생변수의 생성 | 308p
■ 변수 변환 | 313p
■ 불균형 데이터 처리 | 320p
■ 국내 데이터 산업 동향 | 323p
제12장 데이터 산업 현황 및 사례
■ 해외 데이터 산업 이슈 | 333p
■ 데이터 산업 적용 사례 | 348p