용어 색인

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z


용어 색인

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z


용어 색인

A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z

용어

머신 러닝

간략한 정의

머신 러닝은 인공지능의 하위 범주로서, 데이터가 많을수록 성능이 올라가는 모델을 사용합니다.

주요 내용

 

● 머신 러닝 모델은 특정한 결정으로 인한 결과를 '학습'하여 성능을 향상합니다.

● 머신 러닝은 지도 학습, 비지도 학습, 강화 학습 등 세 가지로 분류할 수 있습니다.

● 머신 러닝은 인간 작업자가 처리하기 힘들 정도로 데이터가 많거나 긴 시간을 필요로 하는 작업에 유용합니다.

● 머신 러닝은 데이터 분석가의 업무 중 번거로운 작업을 대신 처리하여 생산성을 높입니다.


Alisha Marfatia는 Adobe 인공지능 엔진인 Adobe Sensei의 운영과 전략을 책임지는 제품 관리자입니다. Alisha는 Adobe에서 근무한 지 거의 3년이 되었으며, Adobe에 입사하기 전에는 Threadflip, Everlane 등 여러 기업에서 분석가이자 컨설턴트로 일하면서 데이터 분석을 담당했습니다. Alisha는 데이터 분석 분야에서 10년 이상 경력을 쌓았습니다.

Q: 머신 러닝이란 무엇입니까?

A: 머신 러닝은 인간보다 빠르고 정확하게 작업하는 컴퓨터 시스템인 인공지능(AI)의 애플리케이션입니다. 머신 러닝은 AI의 하위 범주로서, 데이터가 많을수록 성능이 향상되는 모델을 사용합니다.

Q: 머신 러닝의 주요 방식에는 어떤 것이 있습니까?

A: 머신 러닝은 세 가지로 분류할 수 있습니다.

지도 학습은 레이블을 지정한 데이터를 사용하는, 데이터 과학의 한 종류입니다. 이 데이터는 특정 결과와 관련된 정보가 태그된 데이터입니다. 이 데이터를 가지고 모델을 훈련시켜, 레이블을 지정한 입력 데이터와 연관된 특정 결과를 예측할 수 있도록 도와주는 특징 또는 변수가 무엇인지 학습하게 합니다. 그러면 모델이 출력 데이터의 정보를 사용하여 자체적으로 성능을 평가하고 결과를 예측합니다.

지도 학습의 기본적인 활용 사례로는 분류와 선형 회귀, 두 가지가 있습니다. 분류는 등급 레이블을 예측하는 것입니다. 예를 들어 구매 행동 등의 속성을 토대로 고객이 브랜드와 관계를 끊을 것인지 예측할 수 있습니다.

선형 회귀는 특정 속성을 토대로 예상 고객 수익 등의 수치 레이블을 예측합니다. 이를 통해 얻는 결과는 상태 정보가 아니라 일종의 숫자 변수입니다.

비지도 학습은 레이블을 지정하지 않은 원시 데이터세트를 사용합니다. 비지도 학습의 주요 목적은 데이터세트와 사용자가 모델에 입력한 추가 데이터포인트 사이의 연결점을 찾는 것입니다. 비지도 학습은 데이터 속에서 관계에 기반한 그룹 즉, 클러스터를 찾는 것이며, 이를 바탕으로 고객 세그먼트를 생성할 수 있습니다.

강화 학습은 먼저 레이블을 지정하지 않은 원시 데이터 세트를 모델에 입력합니다. 그러면 모델이 어떤 행동을 취합니다. 그러고 나서 이 행동을 정확하게 했는지 아니면 부정확하게 했는지에 대한 피드백을 받고, 행동의 결과도 모델이 보고받습니다. 그다음 모델은 또 다른 행동을 계속해서 취하게 되고, 최적화를 이룰 때까지 계속 학습합니다.

강화 학습의 실제 사례로는Netflix와 같은 영화 스트리밍 서비스 사이트의 추천 알고리즘을 들 수 있습니다. 사이트는 사용자가 좋아할 만한 영화를 제시하고, 사용자가 추천받은 영화에 ‘좋아요’ 또는 ‘싫어요’를 표시하면 이를 토대로 비슷한 종류의 영화를 계속 추천하면 좋을지를 학습합니다.

Q: AI와 머신 러닝의 차이점은 무엇입니까?

A: AI와 머신 러닝의 주요 차이는 규칙과 사양입니다. 예를 들어 미국 고객이 링크를 클릭하면 고객을 특정 광고로 이동시키는 프로그램을 설계한다고 가정해 보겠습니다. 그리고 특별히 아시아 고객이 이 링크를 클릭하면 해당 고객의 모국어로 표시된 광고로 이동하게끔 설계합니다. 이처럼 인공지능은 개발자가 프로그램에 규칙을 명시적으로 정의하는 반면, 머신 러닝은 그렇지 않습니다.

또 다른 예를 들어서, 여러분의 기업에서 고객이 무엇을 클릭하는지, 어디에서 유입된 누구인지, 어떻게 행동하는지에 관한 몇 가지 데이터 속성을 가지고 있다고 가정해 보겠습니다. 모델에 이러한 데이터를 입력하면 각 사용자 페르소나에 대해 특정 역할을 생성할 수 있습니다. 그리고 모델은 기업이 가지고 있는, 사이트 사용자의 이전 데이터와 이들 사용자의 행동 데이터를 함께 반영합니다. 이를 바탕으로 모델은 기업에 많은 정보를 제공합니다. 그러나 더 나아가서 여기에 추가 데이터를 계속 입력하면 특정 배경을 가진 특정 사용자 유형이 특정 링크를 클릭할지 말지 예측할 수 있을 정도로 모델이 정확해집니다. 이러한 시스템은 첫 번째 예시에 언급된 AI 시스템과는 달리 규칙 기반이 아니며 머신 러닝의 대표적인 예라고 할 수 있습니다.

Q: 머신 러닝과 딥 러닝의 차이점은 무엇입니까?

A: 머신 러닝은 AI의 하위 범주이고, 딥 러닝은 머신 러닝의 하위 범주입니다. 머신 러닝은 인간의 뇌에 있는 뉴런이 작동하는 방식을 모방한 머신 러닝 기술입니다. 딥 러닝은 머신 러닝 분야의 획기적인 돌파구를 마련했으며, 이미 많은 기업이 딥 러닝 기능에 투자하고 있습니다.

딥 러닝은 대량의 데이터가 필요하고 신경망을 사용합니다. 일반적으로 딥 러닝은 적정량의 데이터포인트와 적절한 컴퓨팅 성능이 갖추어졌을 때만 사용합니다.

Q: 머신 러닝은 어디에 가장 적합합니까?

A: 머신 러닝 알고리즘은 기업의 자원 활용을 최적화하는 데 도움이 되는 경우가 많습니다. 그중에서 흔한 활용 사례 하나가 바로 기업이 의사 결정을 내리는 데에 필요하지만 인간 작업자가 일일이 살펴보기는 어려운 빅데이터를 머신 러닝으로 검토하는 것입니다.

예를 들어 마케팅 팀이 다양한 고객 세그먼트로부터 수집한 데이터를 검토하는 중이라고 가정해 보겠습니다. 사람이 직접 다양한 고객 속성을 분류해서, 이를 바탕으로 성과가 높은 세그먼트를 찾거나 혹은 서로 다른 고객 세그먼트의 기호를 비교하기가 쉽지 않습니다. 이렇게 방대한 데이터를 사람이 모두 살펴보기도 힘들고, 이 데이터에서 인사이트를 도출하기는 더 어려습니다. 이러한 경우 인간 작업자보다 머신 러닝이 훨씬 빠르고 효과적입니다. 머신 러닝 자동화를 사용하면 사람이 찾기 어려운 예측 인사이트를 발굴할 수 있습니다.

일반적으로 오늘날 AI는 협소한 범위에 사용합니다. 즉, 아주 구체적인 문제를 풀기 위해 정해진 규칙을 적용해 운영합니다. 그래서 AI로는 우수 고객을 파악할 수 없고 고객 행동을 예측하기도 힘듭니다. 활용 사례마다 각각 다른 모델을 사용해야 합니다. 이에 반해 머신 러닝은 사용 범위가 넓고, 문제를 더욱 광범위하게 정의할 수 있기 때문에 우수 고객 파악이나 고객 행동 예측에 적합합니다.

Q: 머신 러닝 시스템이 불필요한 경우는 언제입니까?

A: 많은 시간을 들여 데이터를 수집, 구성 및 연산하는 머신 러닝 모델이 아니라, 매우 구체적인 규칙을 정한 프로그램이 적합한 활용 사례가 일부 있습니다.

Q: 머신 러닝은 어떻게 대중화되었습니까?

A: 오늘날에는 전문 데이터 과학자뿐 아니라 비전문가도 머신 러닝을 사용할 수 있습니다. 다양한 제품에 머신 러닝 기능이 기본으로 내장되면서 더욱 많은 이들이 머신 러닝을 사용할 수 있게 되었습니다. 예를 들어 Adobe는 제품을 고객에게 맞게 최적화하여 머신 러닝의 사용 폭을 확대했습니다. 즉, Adobe의 엔지니어와 데이터 과학자가 고객 활용 사례를 토대로 머신 러닝 모델을 훈련시킨 다음, 이 모델을 제품에 넣어 제품의 유용성과 사용자 친화성을 높입니다.

예를 들어 여러분이 지금 편집하고 있는 이미지에서 사물을 식별하기 위해 Adobe Creative Cloud 애플리케이션의 인공지능을 사용한다고 가정해 보겠습니다. 이 경우, 이미지에서 사물을 잘라내기 쉽도록 Adobe 머신 러닝 모델이 사물의 윤곽을 땁니다. 이처럼 오늘날 사용자가 머신 러닝 모델을 직접 만들지 않고도 머신 러닝을 사용해 작업의 속도를 올릴 수 있게 되었습니다.

머신 러닝 사용을 확대하는 또 다른 방법은 기업이 직접 자체 모델을 훈련시키고 자체 모델 저장소를 생성하는 것입니다. 기업마다 자사의 데이터에 맞는 활용 사례가 모두 다르기 때문에 범용 모델을 천편일률적으로 사용하는 대신 자체 모델을 훈련시킵니다.

이러한 작업을 위해 기업은 자동 머신 러닝으로 눈을 돌리고 있습니다. 자동 머신 러닝을 사용하면 데이터 과학자와 기계 학습 엔지니어가 모델 학습 프로세스의 일부를 자동화하여 모델의 속도를 높이고 최종 사용자도 머신 러닝을 사용할 수 있도록 하는 머신 러닝 대중화 프로그램 및 기술을 만들 수 있습니다.

Q: 머신 러닝 시스템 사용의 이점은 무엇입니까?

A: 머신 러닝의 가장 큰 이점은 번거로운 작업을 자동화하여 생산성을 높일 수 있는 부분입니다. 또한 머신 러닝을 사용하여 제품을 최적화함으로써 고객의 수고를 덜어줄 수 있습니다. 예를 들어 Adobe는 머신 러닝을 기반으로 한 기능을 개발했는데, 이 기능을 사용하면 방대한 양의 데이터를 사람이 일일이 시간을 들여 검토하지 않고도 우수 고객을 찾아낼 수 있습니다.

또한 머신 러닝은 인간 작업자가 생각조차 못 한 인사이트를 발견할 수도 있습니다.

Q: 머신 러닝 알고리즘의 단점은 무엇입니까?

A: 머신 러닝 시스템은 몇 가지 단점이 있습니다. 그중 하나는 효과적인 머신 러닝 모델을 만들기 위해서는 방대한 양의 데이터가 필요하다는 것입니다. 데이터세트 크기와 품질은 모델의 수준을 결정하는 가장 중요한 요소이며, 데이터가 많을수록 지도 학습에 사용할 데이터에 정확하게 레이블을 지정하는 데 걸리는 시간도 늘어납니다. 또한 모델이 인간과 같은 방식으로 결정을 내릴 수 있도록 훈련시켜야 하기 때문에 강력한 모델을 만들기 위해서는 데이터세트에 어떤 다양한 유형의 데이터를 추가할지 고민해야 합니다.

머신 러닝의 또 다른 단점은 윤리적인 문제입니다. 이는 특히 딥 러닝에서 문제가 됩니다. 머신 러닝 모델이 정확히 어떤 과정을 거쳐 의사 결정을 내리는지 알 수 없기 때문에, 의사 결정 과정에서 어떤 요소를 감안하는지도 정확히 알 수 없습니다. 이로 인해 모델이 편향된 예측을 하기도 합니다. 모델의 수준은 입력 데이터 수준에 따라 결정되는 것이기는 하지만, 모델이 다양한 요소들 사이에 정확하게 어떤 관계를 파악해 의사 결정을 내리는지, 혹은 도덕적으로 결정을 내린 것인지 알지 못합니다.

Q: 머신 러닝은 앞으로 어떻게 발전할까요?

A: 미래에는 콘텐츠 제작 분야에서 머신 러닝의 역할이 더 커질 것입니다. 예를 들어 생성적 적대 신경망(GAN)을 통해 모델이 어떤 콘텐츠가 좋을지만 예측하는 것이 아니라, 그 콘텐츠를 직접 만들게 될 것입니다. 그리고 이로 인해 ‘진짜’ 콘텐츠와 ‘가짜’ 콘텐츠의 문제 등 다양한 윤리적인 문제가 발생할 우려가 있습니다. 그러나 한편으로는 마케터가 머신 러닝 모델을 사용하여 훨씬 빠르게 여러 버전의 캠페인 광고를 제작하여 작업 시간을 크게 단축할 수 있을 것입니다.

Adobe가 도와드리겠습니다

Adobe Experience Cloud를 통해 지식을 행동으로 전환하십시오.