추천, 2024

에디터의 선택

데이터 마이닝과 데이터웨어 하우징 간의 차이점

데이터 마이닝과 데이터웨어 하우징은 비즈니스 인텔리전스를 보유하고 의사 결정을 내리는 데 사용됩니다. 그러나 데이터 마이닝과 데이터웨어 하우징 모두 엔터프라이즈 데이터에서 작동하는 측면이 다릅니다. 한편으로, 데이터웨어 하우스 는 기업의 데이터가 수집되고 요약 된 방식으로 수집 및 저장되는 환경입니다. 다른 한편, 데이터 마이닝 은 프로세스입니다. 데이터베이스에 존재하지 않는 데이터에서 지식을 추출하는 알고리즘을 적용합니다.

아래 비교 차트를 사용하여 데이터 마이닝과 데이터웨어 하우징 간의 차이점을 확인하십시오.

비교 차트

비교 근거데이터 수집데이터웨어 하우징
기본데이터 마이닝은 데이터베이스 / 데이터웨어 하우스에서 의미있는 데이터를 검색하거나 추출하는 프로세스입니다.데이터웨어 하우스는 여러 소스의 정보가 단일 스키마 아래에 저장되는 저장소입니다.

데이터 마이닝 정의

데이터 마이닝은 데이터베이스존재 하지 않을 것으로 예상하지 못한 지식발견 하는 프로세스입니다. 기존 쿼리 도구를 사용하면 데이터에서 알려진 정보 만 검색 할 수 있습니다. 그러나 데이터 마이닝은 숨겨진 정보를 데이터 에서 검색 하는 방법을 제공합니다. 데이터 마이닝은 의사 결정에 사용될 수있는 의미있는 정보를 데이터베이스에서 추출합니다.

KDD 라고하는 데이터베이스의 지식 발견은 관계패턴을 보여줍니다. 관계는 동일한 객체의 속성 사이에 두 개 이상의 서로 다른 객체 사이에있을 수 있습니다. 패턴은 의사 ​​결정에 도움이되는 정보의 정규적이고 이해하기 쉬운 순서를 보여주는 데이터 마이닝의 또 다른 결과입니다.

데이터베이스의 KDD 즉 지식 발견과 관련된 단계는 먼저 데이터 마이닝을 수행해야하는 데이터 세트를 선택 하는 것으로 요약 할 수 있습니다. 다음은 일치하지 않는 데이터를 제거하는 전처리 입니다. 그런 다음 데이터가 데이터 마이닝에 적합한 형식으로 변환 되는 데이터 변환이 발생합니다. 다음은 데이터 마이닝입니다 . 여기서 데이터 마이닝 알고리즘이 데이터에 적용됩니다. 그리고 마지막으로 데이터 사이의 관계 또는 패턴을 추출하는 해석 및 평가 .

데이터 마이닝은 집계되고 요약 된 방식으로 데이터를 저장 한 데이터웨어 하우스 환경에 적합합니다. 데이터웨어 하우스에서 데이터를 쉽게 마이닝 할 수있게됨에 따라

데이터웨어 하우징 정의

데이터웨어 하우스여러 원본에서 수집 된 정보 가 단일 통합 스키마 아래에 저장 되는 중앙 위치입니다. 데이터는 처음에는 수집되어 다른 종류의 엔터프라이즈 소스가 데이터웨어 하우스에서 정리 및 변환되고 저장됩니다. 일단 데이터웨어 하우스에 데이터가 입력되면 오랜 시간 동안 그곳에 머 무르므로 계속해서 액세스 할 수 있습니다.

데이터웨어 하우스는 데이터 모델링, 데이터 수집, 데이터 관리, 메타 데이터 관리, 개발 도구 저장 관리 와 같은 완벽한 기술 혼합입니다. 이러한 모든 기술은 데이터 추출, 데이터 변환, 데이터 저장, 데이터 액세스를위한 사용자 인터페이스 제공 과 같은 기능을 지원합니다.

데이터웨어 하우스는 제품 또는 소프트웨어가 아니며 정보 환경으로서 기업의 통합 된 뷰와 같은 정보를 제공합니다. 의사 결정에 도움이되는 기업의 현재 및 과거 데이터에 액세스 할 수 있습니다. 운영 시스템에 영향을 미치지 않으면 서 의사 결정을 위해 만들어진 트랜잭션을 지원합니다. 전략적 정보를 얻을 수있는 유연한 리소스입니다.

데이터 마이닝과 데이터웨어 하우징 간의 주요 차이점

  1. 데이터 마이닝은 대형 데이터베이스 또는 데이터웨어 하우스에서 의미있는 데이터를 추출하는 프로세스 인 데이터 마이닝과 데이터웨어 하우징을 구분하는 기본적인 차이점이 있습니다. 그러나 데이터웨어 하우스는 데이터를보다 효율적으로 추출하기 위해 데이터 마이닝을 용이하게하는 통합 된 형태로 데이터를 저장하는 환경을 제공합니다.

결론:

데이터 마이닝은 잘 통합 된 대형 데이터베이스 즉 데이터웨어 하우스가있는 경우에만 수행 할 수 있습니다. 따라서 데이터 마이닝을 완료하기 전에 데이터웨어 하우스를 완료해야합니다. 데이터웨어 하우스는 데이터 마이닝이 효율적인 방식으로 지식을 추출 할 수 있도록 잘 통합 된 형식의 정보를 가져야합니다.

Top