본문 바로가기

자격증/ADsP 요약 정리

(4)
[ADsP 요약 정리] 3-2. 데이터 마이닝 III - 2. 데이터 마이닝1. 데이터마이닝1) 데이터마이닝 개요- 정의: 대용량 데이터에서 의미있는 패턴 파악, 예측으로 의사결정에 활용하는 방법- 활용: 시각화분석, 분류, 예측, 군집화, 포캐스팅 2) 작업 유형- 예측 목적분류규칙: 분류모형을 만들어 레코드의 결과값 예측(회귀분석, 판별분석, 신경망, 의사결정나무)- 설명 목적연관규칙: 데이터간 관계 발견(동시 발생 매트릭스)연속규칙: 연관규칙에 시간관련 정보 포함(동시발생 매트릭스)데이터 군집화: 특성에따라 그룹화, 결과값 없음(K-Means Clustering) 3) 학습법- 교사학습: 목적변수가 존재하는 분석의사결정나무, 인공신경망, 일반화 선형 모형(회귀 분석, 로지스틱 회귀 분석), 사례기반 추론, k-Nearest Neighbor- 비..
[ADsP 요약 정리] 3-1. 데이터 분석 III - 1. 데이터 분석1. 데이터 분석 기법1) 데이터 처리- 데이터 웨어하우스, 데이터마트를 통해 분석 데이터 활용- 스테이징, 운영데이터저장소(ODS)에 저장된 신규데이터를 DW, DM에 결합 2) 시각화- 복잡한 분석을 효율적으로 해석(차트, 트리, 다이어그램 맵, 워드 클라우드)- 탐색적 분석시 필수 3) 공간분석- 공간적 차원과 관련된 속성의 시각화- 공간적 차원에 생성한 속성의 크기, 모양, 선굵기 등을 통해 인사이트 도출 4) 탐색적 자료분석(EDA)- 다양한 차원의 값을 조합해가며 관계 도출, 빅데이터에 활용- 주제: 저항성의 강조, 잔차 계산, 자료변수의 재표현, 그래프를 통한 현시성 5) 통계분석- 어떠한 현상을 체계기반으로 숫자, 표, 그림 형태로 표현- 기술통계: 표본의 정보를..
[ADsP 요약 정리] 2. 데이터 분석 기획 II. 데이터 분석 기획1. 데이터 분석 기획1) 분석 방향성 도출- 분석 기획: 분석과제 정의, 관리 방안 사전 계획- 고려 사항: 데이터에 대한 고려(확보, 유형), 활용방안, 유즈케이스, 장애요소 대책 2) 분석 방법론- KDD: 9개의 프로세스와 5단계의 절차를 통해데이터 마이닝(순차적)데이터셋 선택 -> 데이터 전처리 -> 데이터 변환 -> 데이터 마이닝 -> 결과평과- CRISP-DM: 4계층과 일정치 않은 방향의 6단계 프로세스로 구성된 데이터마이닝(비순차적)업무 이해 데이터이해 -> 데이터준비 모델링 -> 평가 -> 업무이해 회귀 or 전개- 빅데이터: 3계층과 5단계의 절차로 구성분석기획 -> D준비 -> D분석 -> 시스템 구현 -> 평가 및 전개 3) 분석 과제분석 과제 정의서: 소스..
[ADsP 요약 정리] 1. 데이터 이해 I. 데이터 이해1. 데이터의 이해1) 데이터- 존재적 특성: 객관적 사실 - 당위적 특성: 추론, 예측, 전망, 추정을 위한 근거 2) 특징- 정성적 데이터: 언어, 문자- 정량적 데이터: 수치, 도형, 기호 3) 지식- 암묵지: 학습과 경험을 통한 지식(내면화->공통화 필요) - 형식지: 형식화된 지식(표준화-> 연결화) 2. 데이터와 정보1) 데이터의 활용 단계- 데이터: 객관적 사실- 정보: 연관관계=>의미 도출- 지식: 정보 구조화&분류+개인적 경험=내재화- 지혜: 지식의 축적+아이디어=창의적 산물3. 데이터베이스1) 정의- EU: 체계적으로 정리되고 전자식으로 개별접근 가능한 독립된 데이터- 국내 저작권법: 소재를 체계적으로 구성한 편집물로 개별적으로 접근 가능한 것- 국내 컴퓨터 용어사전: ..