#ffffff

Adobe Real-Time CDP

머신 러닝이란 무엇입니까?

A man writing on a notepad.

간단한 정의: 머신 러닝은 인간보다 빠르고 정확하게 작업하는 컴퓨터 시스템인 인공지능(AI)의 하위 범주로, 데이터가 많을수록 성능이 향상되는 모델을 사용합니다.

대중적으로 접근하기 어려운 고급 기술이라고 생각할지 모르지만 많은 조직이 어렵지 않게 이용할 수 있습니다. 실제로 대부분의 사람은 자신도 모르는 사이에 일상생활에서 머신 러닝을 사용하고 있습니다.

핵심 내용:

  • 머신 러닝 모델은 특정한 결정으로 인한 결과를 '학습'하여 성능을 향상합니다.
  • 머신 러닝은 지도 학습, 비지도 학습, 강화 학습 등 세 가지로 분류할 수 있습니다.
  • 머신 러닝은 인간 작업자가 처리하기 힘들 정도로 데이터가 많거나 시간이 오래 걸리는 작업에 유용합니다.
  • 머신 러닝은 데이터 분석가의 업무 중 번거로운 작업을 대신 처리하여 생산성을 높입니다.

아래 가이드에서 머신 러닝의 작동 방식, 유형, 장단점, 미래에 대해 알아보세요

이 페이지의 섹션 소개

머신 러닝의 작동 방식

#머신-러닝의-작동-방식-1

머신 러닝의 유형

#머신-러닝의-유형-1

머신 러닝 시스템 사용의 이점

#머신-러닝-시스템-사용의-이점-1

머신 러닝 알고리즘의 단점

#머신-러닝-알고리즘의-단점-1

기업이 머신 러닝을 사용하는 방법

#기업이-머신-러닝을-사용하는-방법-1

머신 러닝의 역사

#머신-러닝의-역사-1

머신 러닝의 작동 방식

머신 러닝은 컴퓨터 시스템이 출력을 학습하고 강화하는 데 도움이 되는 기술 유형입니다. 문제 해결 규칙인 알고리즘을 사용하여 시스템에서 더 유용한 결과물을 생성합니다.

대부분의 머신 러닝 모델은 데이터를 알고리즘에 입력하여 작동하고, 그런 다음 예측을 통해 오류를 자동으로 찾습니다. 과거의 예시를 바탕으로 출력을 비교해 문제가 있는지 확인한 뒤에, 인간 사용자가 해당 출력을 받아들이거나 거부합니다. 머신 러닝 모델은 훈련을 거듭할수록 효율성과 정확성이 높아집니다. 머신 러닝 모델이 데이터와 경험을 많이 수집할수록 사람이 개입할 필요성이 줄어듭니다.

머신 러닝은 AI와 유사하지만 작동 방식이 다릅니다. 머신 러닝은 반복을 통해 시간이 지나면서 컴퓨터가 더 지능적으로 작업을 수행하는 프로세스입니다. 반면에, AI를 사용하면 컴퓨터는 사람의 개입 없이 보유한 지식을 활용해 작업을 수행합니다. 두 기술의 가장 큰 차이점은 AI는 인간의 지능을 모방할 수 있지만, 머신 러닝은 단순히 패턴 인식을 기반으로 작업을 수행한다는 것입니다.

머신 러닝의 유형

지도 학습

지도 학습은 레이블을 지정한 데이터를 사용하는, 데이터 과학의 한 종류입니다. 이 데이터는 특정 결과와 관련된 정보가 태그된 데이터입니다. 이 데이터를 가지고 모델을 훈련시켜, 레이블을 지정한 입력 데이터와 연관된 특정 결과를 예측할 수 있도록 도와주는 특징 또는 변수가 무엇인지 학습하게 합니다. 그러면 모델이 출력 데이터의 정보를 사용하여 자체적으로 성능을 평가하고 결과를 예측합니다.

지도 학습의 기본적인 활용 사례로는 분류와 선형 회귀가 있습니다. 분류는 등급 레이블을 예측하는 것입니다. 예를 들어 구매 행동 등의 속성을 토대로 고객이 브랜드와 관계를 끊을 것인지 예측할 수 있습니다.

선형 회귀는 특정 속성을 토대로 예상 고객 수익 등의 수치 레이블을 예측합니다. 이를 통해 얻는 결과는 상태 정보가 아니라 숫자 변수입니다.

지도 학습으로 고품질 결과물을 생성하기 위해서는 탄탄한 머신 러닝 모델이 필요합니다. 머신 러닝 모델이 컴퓨터가 생성할 수 있는 다양한 결과물에 어떤 영향을 미치는지 알아보세요.

비지도 학습

비지도 학습은 레이블을 지정하지 않은 원시 데이터 세트를 사용합니다. 비지도 학습의 주요 목적은 데이터 세트와 사용자가 모델에 입력한 추가 데이터포인트 사이의 연결점을 찾는 것입니다.

비지도 학습은 데이터 속에서 관계에 기반한 그룹 즉, 클러스터를 찾는 것이며, 이를 바탕으로 고객 세그먼트를 생성할 수 있습니다.

강화 학습

강화 학습은 먼저 레이블을 지정하지 않은 원시 데이터 세트를 모델에 입력합니다. 그러면 모델이 행동을 취합니다. 그러고 나서 이 행동을 정확하게 했는지 아니면 부정확하게 했는지에 대한 피드백을 받고, 행동의 결과도 모델이 보고받습니다. 그다음 모델은 또 다른 행동을 계속해서 취하게 되고, 최적화를 이룰 때까지 계속 학습합니다.

강화 학습의 실제 사례로는 Netflix와 같은 영화 스트리밍 서비스 사이트의 추천 알고리즘을 들 수 있습니다. 사이트는 사용자가 좋아할 만한 영화를 제시하고, 사용자가 추천받은 영화에 ‘좋아요’ 또는 ‘싫어요’를 표시하면 이를 토대로 비슷한 종류의 영화를 계속 추천해도 괜찮을지 결정합니다.

머신 러닝의 역사

머신 러닝은 신기술 같지만 사실 수십 년 전부터 사용되었습니다. 오늘날 우리가 알고 있는 머신 러닝의 기원은 1940년대로 거슬러 올라갑니다.

1940년대

1943년, Warren McCulloch와 Walter Pitts는 최초의 신경망을 만들었습니다. 이를 통해 컴퓨터가 사람의 개입 없이도 서로 통신할 수 있게 되었습니다.

1950년대

Alan Turing은 시스템이 인공 지능을 갖추었는지 판별하는 튜링 테스트를 개발했습니다. 현재도 연구진은 튜링 테스트를 사용하여 인간이 생성한 결과와 시스템이 생성한 결과의 차이를 구분할 수 있는지 확인합니다.

1960년대

Thomas Cover와 Peter Hart는 대량의 데이터에서 패턴을 식별할 수 있는 최초의 머신 러닝 알고리즘 중 하나인 KNN(K-Nearest Neighbours) 알고리즘을 발표했습니다.

1970년대

Paul Werbos는 1974년에 신경망이 패턴을 더 정확하게 인식하도록 하는 기술인 역전파의 토대를 마련한 'The Roots of Backpropagation'이라는 논문을 썼습니다.

1980년대

설명 기반 학습(EBL)을 통해 컴퓨터가 스스로 데이터를 분석 및 학습하고, 중요하지 않은 데이터를 무시할 수 있게 되었습니다. 인공 신경망 NetTalk도 영어 텍스트를 정확하게 발음하는 방법을 학습했습니다.

1990년대

1997년 슈퍼컴퓨터 Deep Blue가 인간 체스 전문가에게 승리를 거두며 IBM은 전 세계를 놀라게 했습니다. 이를 통해 머신 러닝이 인간의 능력을 따라잡은 것은 물론, 능가할 수도 있다는 것을 세상에 보여줬습니다.

2000년대

무료 소프트웨어 라이브러리인 Torch(PyTorch라고도 함)는 세계 최초의 대형 머신 러닝 플랫폼이 되어 머신 러닝에 대한 접근성을 크게 높였습니다. 2000년대에는 컴퓨터가 딥러닝을 통해 텍스트와 이미지를 '보는' 방법도 학습했습니다.

2010년대

Google은 Google Brain이라는 개체를 자동으로 분류하는 심층적인 신경망을 개발했으며 Facebook, Amazon, Microsoft도 머신 러닝 모델을 개발합니다.

2020년대

2022년 11월에 OpenAI의 ChatGPT가 돌풍을 일으켰습니다. 이 기술을 통해 일반 사용자도 머신 러닝과 AI에 접근할 수 있게 되었습니다. 구직을 위한 커버 레터 작성부터 이메일 작성까지 다양한 곳에 이 기술을 활용하고 있습니다.

A timeline showing important moments in machine learning history.

머신 러닝 시스템 사용의 이점

머신 러닝이 모든 기업에 유용한 기술인 이유는 다음과 같습니다.

  • 생산성 향상. 직원의 80% 이상이 AI가 업무 성과를 높인다고 생각합니다. 머신 러닝은 사람이 하던 작업을 자동화하여 조직의 생산성을 높일 수 있습니다.
  • 고객 지원. 기업은 머신 러닝을 기반으로 제품을 최적화하여 고객 생활에 편의를 더합니다. 실제로, 소비자의 62%가 더 나은 경험을 제공받을 수 있다면 개인정보를 공유할 의향이 있다고 응답했습니다.
  • 인적 과실 감소. 머신 러닝은 사람의 실수나 오타가 발생하기 쉬운 수작업을 자동화합니다. 따라서 훨씬 명확한 데이터를 활용하여 더 나은 비즈니스 인사이트를 얻을 수 있습니다.
  • 이용 가능성 향상. 소비자의 51%는 기업이 24시간 연중무휴로 운영하기를 바랍니다. 비즈니스에 머신 러닝 솔루션을 활용하면 고객에게 밤낮으로 서비스를 제공할 수 있습니다.
  • 리스크 감소. 규정을 준수하지 못하면 막대한 벌금을 물고 비즈니스에 손실이 발생할 수 있습니다. 다행히도 머신 러닝은 사전 정의된 규칙을 따르므로 규모와 상관없이 규정을 준수할 수 있습니다.
  • 반복 작업 최소화. 머신 러닝은 데이터 입력과 같은 번거로운 작업을 자동화하므로 직원들이 가치가 높은 업무에 집중할 수 있습니다. 실제로, 직원의 68%가 업무에 많은 AI 기반의 기술이 적용되기를 원합니다.
  • 인사이트 확보. 머신 러닝은 인간의 사고 능력을 뛰어넘는 인사이트를 도출할 수 있습니다.

머신 러닝 알고리즘의 단점

머신 러닝 시스템에는 다음과 같은 단점도 있습니다.

  • 대량의 데이터 필요. 머신 러닝 모델이 효과적으로 작동하려면 대량의 데이터가 필요합니다.
  • 데이터 세트의 크기. 데이터 세트의 크기와 품질은 모델의 수준을 결정하는 가장 중요한 요소이며, 데이터가 많을수록 지도 학습에 사용할 데이터에 정확하게 레이블을 지정하는 데 걸리는 시간도 늘어납니다.
  • 데이터 유형 결합. 모델이 인간과 같은 방식으로 결정을 내릴 수 있도록 훈련시켜야 하기 때문에 강력한 모델을 만들기 위해서는 데이터 세트에 어떤 다양한 유형의 데이터를 추가할지도 고민해야 합니다.
  • 잠재적 편향성. 머신 러닝의 또 다른 단점은 윤리적인 문제로, 특히 딥러닝에서 문제가 됩니다. 머신 러닝 모델이 정확히 어떤 과정을 거쳐 의사 결정을 내리는지 알 수 없기 때문에, 의사 결정 과정에서 어떤 요소를 감안하는지도 알 수 없습니다. 모델의 수준은 입력 데이터 수준에 따라 결정되는 것이기는 하지만, 모델이 다양한 요소들 사이에 정확하게 어떤 관계를 파악해 의사 결정을 내리는지, 혹은 도덕적으로 결정을 내린 것인지 알지 못합니다.
  • 잠재적 오류. 머신 러닝이 사람보다 더 효과적으로 결과물을 도출할 수는 있지만 실수하지 않을 거라는 보장은 없습니다. 데이터나 로직에 부정확한 부분이 있으면, 머신 러닝 모델에도 반영됩니다.
  • 비용. 기업에 알맞은 맞춤형 머신 러닝 솔루션을 갖추려면 이러한 모델을 구축하고 유지 관리할 데이터 과학자를 고용하는 비용이 발생합니다. 모델을 사용하기 시작한 때부터 5년 동안 평균적으로 $60,000~$95,000를 지출합니다. 하지만 Adobe Sensei와 같은 솔루션을 선택하면 이러한 비용을 많이 상쇄할 수 있습니다.

머신 러닝이 완벽하지는 않지만, 최적의 시나리오에 적합한 머신 러닝 모델을 채택하면 많은 단점을 해결할 수 있습니다.

기업이 머신 러닝을 사용하는 방법

머신 러닝 알고리즘은 기업의 자원 활용 최적화에 도움이 되는 경우가 많습니다. 그중에서 흔한 활용 사례 하나가 바로 기업이 의사 결정을 내리는 데에 필요하지만 인간 작업자가 일일이 살펴보기는 어려운 빅데이터를 머신 러닝으로 검토하는 것입니다.

비단 기술 기업에만 해당되는 이야기가 아닙니다. 전 세계 기업의 68%가 머신 러닝을 사용하고 있으며, 더 늘어날 전망입니다. 머신 러닝의 유용성을 알아본 다양한 업계에서 사용을 확대하고 있기 때문입니다.

의료

의료 기업은 개인정보 보호법을 준수하면서 많은 환자 데이터를 처리하기 위해 머신 러닝을 사용합니다. 예를 들어, 일부 기업은 머신 러닝을 사용하여 영상 진단의 정확도를 높여 질병을 조기에 발견합니다. 위조 탐지, 오류 발견, 맞춤 치료 제공에도 유용합니다.

제조업

더 스마트한 예방 유지 보수를 위해 머신 러닝을 도입하는 제조업체가 늘고 있습니다. 아직 유지 보수가 필요 없는 기계를 유지 보수하는 데 시간과 비용을 낭비하지 않고 머신 러닝을 사용해 데이터 트렌드를 분석하고 점검이 필요한 기계를 효율적으로 판별합니다.

이뿐만 아니라, 시설 내에서 반자율 주행 및 자율 주행 자동차를 관리하는 데도 이 기술을 활용합니다.

엔터테인먼트

Netflix 계정이 있으신가요? 그렇다면 이미 머신 러닝을 접한 것입니다. 이 스트리밍 서비스는 머신 러닝을 기반으로 썸네일을 개인화하고, 영화와 프로그램을 추천하고, 스트리밍 품질을 최적화합니다.

Netflix interface which highlights machine learning in practice.

마케팅

마케팅 팀이 다양한 고객 세그먼트로부터 수집한 데이터를 검토하는 중이라고 가정하겠습니다. 다양한 고객 속성을 분류하고 이를 바탕으로 성과가 높은 세그먼트를 찾거나 혹은 서로 다른 고객 세그먼트의 기호를 비교하기는 상당히 어렵습니다.

방대한 데이터를 모두 살펴보기도 힘들고, 해당 데이터에서 인사이트를 도출하기는 더욱 어렵기 때문입니다. 이때는 사람보다 머신 러닝이 훨씬 빠르고 효과적입니다.

머신 러닝 자동화를 사용하면 사람이 찾기 어려운 예측 인사이트를 발굴할 수 있습니다.

금융

로보 어드바이저는 금융업계에서 많은 인기를 얻고 있습니다. 예를 들어 Wealthfront와 같은 서비스는 머신 러닝과 AI를 사용하여 사용자의 포트폴리오 관리를 자동화합니다. 금융 기업은 고객의 투자를 관리하는 시간을 줄이면서도 고객에게 투자 관리의 혜택을 제공할 수 있습니다.

머신 러닝을 통해 고객 경험 강화

머신 러닝을 기반으로 세분화와 개인화를 향상하고 싶으신가요? Adobe Real-Time CDP가 도와드리겠습니다.

추천 기사

https://main--bacom--adobecom.hlx.page/fragments/products/cards/rtcdp

#ffffff
맨 위로 https://main--bacom--adobecom.hlx.page/products/real-time-customer-data-platform/what-is-machine-learning#what-is-machine-learning | Up arrow