아래 비교 차트를 사용하여 데이터 마이닝과 데이터웨어 하우징 간의 차이점을 확인하십시오.
비교 차트
비교 근거 | 데이터 수집 | 데이터웨어 하우징 |
---|---|---|
기본 | 데이터 마이닝은 데이터베이스 / 데이터웨어 하우스에서 의미있는 데이터를 검색하거나 추출하는 프로세스입니다. | 데이터웨어 하우스는 여러 소스의 정보가 단일 스키마 아래에 저장되는 저장소입니다. |
데이터 마이닝 정의
데이터 마이닝은 데이터베이스 에 존재 하지 않을 것으로 예상하지 못한 지식 을 발견 하는 프로세스입니다. 기존 쿼리 도구를 사용하면 데이터에서 알려진 정보 만 검색 할 수 있습니다. 그러나 데이터 마이닝은 숨겨진 정보를 데이터 에서 검색 하는 방법을 제공합니다. 데이터 마이닝은 의사 결정에 사용될 수있는 의미있는 정보를 데이터베이스에서 추출합니다.
KDD 라고하는 데이터베이스의 지식 발견은 관계 와 패턴을 보여줍니다. 관계는 동일한 객체의 속성 사이에 두 개 이상의 서로 다른 객체 사이에있을 수 있습니다. 패턴은 의사 결정에 도움이되는 정보의 정규적이고 이해하기 쉬운 순서를 보여주는 데이터 마이닝의 또 다른 결과입니다.
데이터베이스의 KDD 즉 지식 발견과 관련된 단계는 먼저 데이터 마이닝을 수행해야하는 데이터 세트를 선택 하는 것으로 요약 할 수 있습니다. 다음은 일치하지 않는 데이터를 제거하는 전처리 입니다. 그런 다음 데이터가 데이터 마이닝에 적합한 형식으로 변환 되는 데이터 변환이 발생합니다. 다음은 데이터 마이닝입니다 . 여기서 데이터 마이닝 알고리즘이 데이터에 적용됩니다. 그리고 마지막으로 데이터 사이의 관계 또는 패턴을 추출하는 해석 및 평가 .
데이터 마이닝은 집계되고 요약 된 방식으로 데이터를 저장 한 데이터웨어 하우스 환경에 적합합니다. 데이터웨어 하우스에서 데이터를 쉽게 마이닝 할 수있게됨에 따라
데이터웨어 하우징 정의
데이터웨어 하우스 는 여러 원본에서 수집 된 정보 가 단일 통합 스키마 아래에 저장 되는 중앙 위치입니다. 데이터는 처음에는 수집되어 다른 종류의 엔터프라이즈 소스가 데이터웨어 하우스에서 정리 및 변환되고 저장됩니다. 일단 데이터웨어 하우스에 데이터가 입력되면 오랜 시간 동안 그곳에 머 무르므로 계속해서 액세스 할 수 있습니다.
데이터웨어 하우스는 데이터 모델링, 데이터 수집, 데이터 관리, 메타 데이터 관리, 개발 도구 저장 관리 와 같은 완벽한 기술 혼합입니다. 이러한 모든 기술은 데이터 추출, 데이터 변환, 데이터 저장, 데이터 액세스를위한 사용자 인터페이스 제공 과 같은 기능을 지원합니다.
데이터웨어 하우스는 제품 또는 소프트웨어가 아니며 정보 환경으로서 기업의 통합 된 뷰와 같은 정보를 제공합니다. 의사 결정에 도움이되는 기업의 현재 및 과거 데이터에 액세스 할 수 있습니다. 운영 시스템에 영향을 미치지 않으면 서 의사 결정을 위해 만들어진 트랜잭션을 지원합니다. 전략적 정보를 얻을 수있는 유연한 리소스입니다.
데이터 마이닝과 데이터웨어 하우징 간의 주요 차이점
- 데이터 마이닝은 대형 데이터베이스 또는 데이터웨어 하우스에서 의미있는 데이터를 추출하는 프로세스 인 데이터 마이닝과 데이터웨어 하우징을 구분하는 기본적인 차이점이 있습니다. 그러나 데이터웨어 하우스는 데이터를보다 효율적으로 추출하기 위해 데이터 마이닝을 용이하게하는 통합 된 형태로 데이터를 저장하는 환경을 제공합니다.
결론:
데이터 마이닝은 잘 통합 된 대형 데이터베이스 즉 데이터웨어 하우스가있는 경우에만 수행 할 수 있습니다. 따라서 데이터 마이닝을 완료하기 전에 데이터웨어 하우스를 완료해야합니다. 데이터웨어 하우스는 데이터 마이닝이 효율적인 방식으로 지식을 추출 할 수 있도록 잘 통합 된 형식의 정보를 가져야합니다.