투케이2K
82. [IT 용어] [KDD] 데이터마이닝 (Data Mining) 용어 설명 본문
[제 목]
[IT 용어] [KDD] 데이터마이닝 (Data Mining) 용어 설명
[설 명]
1. 데이터마이닝 이란 대규모로 저장된 데이터안에서 체계적이고 자동적으로 통계적규칙이나 짜임을 분석하여, 가치있는 정보를 빼내는 과정
2. 데이터마이닝 은 KDD (데이터베이스속의 지식발견, knowledge-discovery in databases) 라고도 불려집니다
3. 데이터마이닝 은 통계학에서 패턴인식에 이르는 다양한 계량기법을 사용합니다
4. 데이터마이닝 기법 (기술적인 방법론) :
- 통계학 쪽에서 발전 : 탐색적자료분석, 가설 검정, 다변량 분석, 시계열 분석, 일반선형모형 등의 방법론
- 데이터베이스 쪽에서 발전 : OLAP (온라인 분석 처리:On-Line Analytic Processing)
- 인공지능 쪽에서 발전 : SOM, 신경망, 전문가 시스템 등
5. 데이터마이닝의 응용 분야 :
- 신용평점 시스템(Credit Scoring System)의 신용평가모형 개발
- 사기탐지시스템(Fraud Detection System)
- 장바구니 분석(Market Basket Analysis)
- 최적 포트폴리오 구축
6. 데이터마이닝 적용 분야 :
- 분류 (Classification) : 일정한 집단에 대한 특정 정의를 통해 분류 및 구분을 추론한다 (예: 경쟁자에게로 이탈한 고객)
- 군집화(Clustering) : 구체적인 특성을 공유하는 군집을 찾는다. 군집화는 미리 정의된 특성에 대한 정보를 가지지 않는다는 점에서 분류와 다르다 (예:유사 행동 집단의 구분)
- 연관성(Association) : 동시에 발생한 사건간의 관계를 정의한다. (예:장바구니안의 동시에 들어 가는 상품들의 관계 규명)
- 연속성(Sequencing) : 특정 기간에 걸쳐 발생하는 관계를 규명한다. 기간의 특성을 제외하면 연관성 분석과 유사하다 (예: 슈퍼마켓과 금융상품 사용에 대한 반복 방문)
- 예측(Forecasting) : 대용량 데이터집합 내의 패턴을 기반으로 미래를 예측한다 (예: 수요예측)
7. 데이터마이닝 단점 : 자료에 의존하여 현상을 해석하고 개선하려고 하기 때문에 자료가 현실을 충분히 반영하지 못한 상태에서 정보를 추출한 모형을 개발할 경우 잘못된 모형을 구축하는 오류를 범할 수가 있습니다
'IT기술 & IT용어' 카테고리의 다른 글
84. [IT 용어] DI (Dependency Injection) 의존성 주입 용어 설명 (0) | 2022.10.30 |
---|---|
83. [IT 기술] 크롤링 (Crawling) , 스크레이핑(Scraping) 용어 설명 (0) | 2022.10.29 |
81. [IT 용어] 스카우터 (Scouter) 및 APM 용어 설명 (0) | 2022.10.29 |
80. [IT 용어] FTP (File Transfer Protocol) , SFTP (SSH 파일 전송 프로토콜) 용어 설명 (0) | 2022.10.28 |
79. [IT 용어] 스트림 (stream) 용어 설명 (0) | 2022.10.28 |