[ADsP 요약 정리] 3-2. 데이터 마이닝
III - 2. 데이터 마이닝1. 데이터마이닝1) 데이터마이닝 개요- 정의: 대용량 데이터에서 의미있는 패턴 파악, 예측으로 의사결정에 활용하는 방법- 활용: 시각화분석, 분류, 예측, 군집화, 포캐스팅 2) 작업 유형- 예측 목적분류규칙: 분류모형을 만들어 레코드의 결과값 예측(회귀분석, 판별분석, 신경망, 의사결정나무)- 설명 목적연관규칙: 데이터간 관계 발견(동시 발생 매트릭스)연속규칙: 연관규칙에 시간관련 정보 포함(동시발생 매트릭스)데이터 군집화: 특성에따라 그룹화, 결과값 없음(K-Means Clustering) 3) 학습법- 교사학습: 목적변수가 존재하는 분석의사결정나무, 인공신경망, 일반화 선형 모형(회귀 분석, 로지스틱 회귀 분석), 사례기반 추론, k-Nearest Neighbor- 비..
[ADsP 요약 정리] 3-1. 데이터 분석
III - 1. 데이터 분석1. 데이터 분석 기법1) 데이터 처리- 데이터 웨어하우스, 데이터마트를 통해 분석 데이터 활용- 스테이징, 운영데이터저장소(ODS)에 저장된 신규데이터를 DW, DM에 결합 2) 시각화- 복잡한 분석을 효율적으로 해석(차트, 트리, 다이어그램 맵, 워드 클라우드)- 탐색적 분석시 필수 3) 공간분석- 공간적 차원과 관련된 속성의 시각화- 공간적 차원에 생성한 속성의 크기, 모양, 선굵기 등을 통해 인사이트 도출 4) 탐색적 자료분석(EDA)- 다양한 차원의 값을 조합해가며 관계 도출, 빅데이터에 활용- 주제: 저항성의 강조, 잔차 계산, 자료변수의 재표현, 그래프를 통한 현시성 5) 통계분석- 어떠한 현상을 체계기반으로 숫자, 표, 그림 형태로 표현- 기술통계: 표본의 정보를..