용어 색인

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z


용어 색인

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z


용어 색인

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z

용어

데이터 마이닝

간략한 정의

데이터 마이닝은 이상치, 패턴 및 상관 관계를 찾아 인사이트를 위한 데이터를 준비하는 것입니다.

주요 내용

 

● 데이터 분석의 한 유형인 데이터 마이닝은 인사이트 발굴과 데이터 활용을 위해 원시 데이터를 준비하는 첫 번째 단계입니다.

● 데이터 마이닝에는 과거 데이터를 취합 및 처리하고, 향후 분석을 위해 준비하는 작업이 포함됩니다.

● 기업은 개인정보보호를 최우선으로 하고, 퍼스트파티 데이터를 중심으로 고객과의 효과적인 가치 교환을 통해 데이터 마이닝과 관련된 잠재적 위험을 피할 수 있습니다.

● 데이터 마이닝 프로세스는 항상 데이터 거버넌스 전략 및 기업 목표와 조화를 이루어야 합니다.

● 머신 러닝과 인공 지능은 기본적인 데이터 마이닝 방법을 통해 데이터를 지속적으로 정제하여 인간이 할 수 없는 패턴과 답을 찾습니다.


Q: 데이터 마이닝이란 무엇입니까?

A: 데이터 분석의 한 유형인 데이터 마이닝은 인사이트 발굴 및 데이터 활용을 위해 원시 데이터를 준비하는 첫 번째 단계입니다. 데이터 마이닝 프로세스 동안 분석가는 대규모 데이터 세트를 검사하여 이상치, 패턴 및 상관 관계를 파악합니다. 데이터 전문가와 마케터는 결과 예측, 비즈니스 비용 절감, 고객 관계 개선, 위험 감소, 기업 전체의 비즈니스 인텔리전스(BI) 향상과 같은 예측 목적으로 이 유용한 정보를 사용할 수 있습니다.

다양한 데이터 마이닝 기법이 있지만, 업계 리더는 "데이터 마이닝"이라는 용어를 "데이터 분석", "데이터 분석 정보"와 같은 용어와 같은 의미로 사용합니다.

Q: 데이터 마이닝이 중요한 이유는 무엇입니까?

A: 데이터 마이닝 프로세스에서는 비정형 데이터를 사용하여 바로 사용할 수 있는 이해하기 쉽고 정리된 시각화 자료를 만듭니다. 비즈니스 인텔리전스 및 마케팅 분석과 같이 데이터 시각화를 사용하는 최신 비즈니스 프로세스에는 많은 양의 데이터가 필요합니다. 데이터 세트는 유용한 정보를 얻을 수 있도록 구조화되어야 합니다. 데이터 웨어하우스에 정보가 마구잡이로 들어 있다면, 데이터 수집은 쓸모가 없습니다. 데이터를 준비하고 관리하는 과정이 반드시 필요합니다.

데이터 마이닝 프로세스는 기업 내 다양한 팀이 더 나은 결정을 내리는 데 도움이 됩니다. 가장 가치 있는 데이터 패턴을 보다 명확하고 빠르게 파악할 수 있습니다. 예를 들어, 비즈니스 인텔리전스 팀은 데이터 인사이트를 사용하여 최적화가 필요한 영역을 파악하고, 분석 팀은 데이터 인사이트를 사용하여 예측 모델을 만들 수 있습니다. 그리고 마케팅 팀은 더 나은 타겟팅과 고객 참여도 향상을 위해 마케팅 캠페인에 필요한 정보를 제공하는 데이터 인사이트를 활용할 수 있습니다.

Q: 데이터 마이닝은 어떻게 작동합니까?

A: 데이터 과학자는 다양한 데이터 마이닝 기법을 사용합니다. 사용하는 분석 기능, 얻고자 하는 해답, 인력 투입이나 머신 러닝 알고리즘의 수준에 따라 사용하는 기법이 다릅니다. 그러나 일반적으로, 다음의 세 가지 기법이 가장 흔히 사용됩니다.

묘사 모델링. 묘사 모델링에서는 데이터 세트에서 공통의 유사성을 찾아내 이벤트 또는 결과의 숨겨진 이유를 파악합니다. 묘사 모델링 방법의 몇 가지 예는 다음과 같습니다.

● 클러스터링 – 유사한 레코드를 그룹화하여 이상치를 감지합니다.

● 연관 규칙 학습 – 데이터 포인트와 다른 레코드 간의 관계를 파악합니다.

● 주성분 분석 – 변수 간의 관계를 발견합니다.

● 선호도 그룹화 – 유사한 목표와 관심을 가진 사람들의 그룹을 세분화하여 행동을 분석합니다.

예측 모델링. 예측 모델링에서는 미래의 이벤트 또는 확인되지 않은 결과에 대한 추정치를 분류합니다. 실제 사례로는, 대출 신청인의 신용 점수로 대출 상환 가능성을 평가하거나, 개인의 과거 지출 행동을 분석하여 신용카드 사기 관련 이상치를 파악하는 것 등이 있습니다. 예측 모델링 방법의 예는 다음과 같습니다.

● 회귀 - 종속 변수와 일련의 독립 변수 간의 관계 강도를 측정합니다.

● 뉴럴 네트워크 – 컴퓨터 프로그램과 학습 알고리즘을 사용하여 패턴을 감지하고 예측합니다.

● 의사 결정 트리 – 나무 모양의 다이어그램으로서 각 분기는 발생 가능성이 있는 이벤트를 나타냅니다.

● 서포트 벡터 머신 – 관련 학습 알고리즘을 갖춘 지도 학습 모델입니다.

처방 모델링. 처방 모델링은 텍스트 마이닝이라는 프로세스를 통해 비정형 데이터를 필터링하고 변환하여 예측 모델에 포함합니다. 처방 모델링은 내부 변수와 외부 변수를 모두 검토하여 행동 방침을 권장합니다. 처방 모델링 방법의 몇 가지 예는 다음과 같습니다.

● 규칙을 사용한 예측 분석 – 패턴에서 IF/THEN 규칙을 개발하여 결과를 예측합니다.

● 마케팅 최적화 – 다양한 유형의 미디어를 실시간으로 시뮬레이션하여 최고의 투자 수익률(ROI)을 얻기 위한 올바른 조합을 결정합니다.

Q: 기업은 데이터 마이닝을 통해 어떠한 인사이트를 얻을 수 있습니까?

A: 한 리테일 업체가 웹 사이트, 모바일 앱, 소셜 미디어, 매장 보고서, 콜센터 등 다양한 채널에서 얻은 제품, 사람, 수익에 대한 원시 데이터를 가지고 있다고 가정해 보겠습니다. 이 리테일 업체는 고객이 이미 구매한 제품 외에 다른 제품에 관심이 있는지 이해하기 위해 제품 간 선호도를 더 자세히 살펴보려고 합니다. 이제 데이터 마이너는 통계, 인공 지능(AI) 또는 머신 러닝과 같은 툴을 사용하여 데이터를 살펴보고, 제품 선호도를 중심으로 다양한 고객 세그먼트를 클러스터링합니다. 이를 통해 고객 행동에 대한 다양한 인사이트를 얻을 수 있습니다. 이 정보를 바탕으로 리테일 업체는 제품에 대한 적절한 광고에 투자하고, 해당 제품을 필요로 하는 사용자를 타겟팅할 수 있습니다. 또한 판매 경로 전반에서 고객 경험을 최적화하여 제품을 적절하게 크로스셀링할 수 있습니다.

Q: 데이터 마이닝의 위험 요소는 무엇입니까?

A: 데이터 과학에서는 민감한 데이터와 관련된 위험성이 항상 존재합니다. 기업이 개인정보보호를 최우선으로 두고, 퍼스트파티 데이터를 중심으로 고객과 효과적인 가치 교환을 한다면 이러한 위험을 피할 수 있습니다.

Q: 데이터 마이닝의 이점은 무엇입니까?

A: 데이터 마이닝이라는 용어가 개인정보를 침해하는 것처럼 들릴 수 있지만, 사실은 단순히 패턴을 찾고 인사이트를 사용하여 고객 경험을 개선하는 것을 의미합니다. 효과적인 데이터 마이닝은 고객과의 상호 작용을 보다 원활하게 만들고, 고객의 요구 사항을 충족하는 데 큰 도움이 됩니다.

Q: 데이터 마이닝의 모범 사례에는 어떤 것이 있습니까?

A: 빅데이터가 있으면 반드시 데이터 마이닝과 데이터에 대한 철저한 준비가 필요합니다. 데이터 마이닝 프로세스는 항상 데이터 거버넌스 전략 및 기업 목표와 조화를 이루어야 합니다. 데이터를 준비하는 데이터 과학자는 도출된 결과가 비즈니스 인텔리전스(BI), 데이터 분석, 마케팅에 어떻게 반영되는지 파악해야 합니다.

Q: 데이터 마이닝은 어떻게 발전해왔습니까?

A: "데이터 마이닝"이라는 용어는 1980년대 후반에서 1990년대 초반에 처음 등장했는데, 당시에는 단순히 데이터베이스 쿼리를 의미했습니다. 당시 클러스터 분석 등의 작업에 사용하는 기초적인 통계 소프트웨어가 있었습니다. 이제는 자동화가 대부분의 작업을 수행합니다. 머신 러닝과 인공 지능은 기본적인 데이터 마이닝 방법을 통해 데이터를 지속적으로 정제하여 인간이 할 수 없는 패턴과 답을 찾습니다.

Q: 데이터 마이닝은 앞으로 어떻게 진화할까요?

A: 미래에는 인공 지능으로 인해 데이터 마이닝이 더욱 발전할 것입니다. 오늘날 대부분의 데이터 마이닝은 플랫 파일과 구조화된 데이터를 대상으로 수행합니다. 미래의 데이터 마이닝은 관계형 데이터, 비관계형 데이터를 망라한 모든 유형의 상호작용 데이터를 대상으로 이루어질 것입니다. 또한 업계에서 이전에 생각하지 못했던 비전통적인 데이터 세트를 마이닝하는 일도 가능해질 것입니다.

Adobe가 도와드리겠습니다

Adobe Experience Cloud를 통해 지식을 행동으로 전환하십시오.