지난 5년간 Real Time Bidding(RTB)은 디지털 마케팅 환경을 근본적으로 변화시켜 왔습니다. 무엇보다 RTB의 알고리즘 기반 마케팅 덕분에 광고주는 적절한 가격으로 적절한 잠재 고객을 보다 쉽게 ​​타겟팅 할 수 있게 되었죠. 미국에서 RTB를 활용한 광고비는 2014년과 2018년 사이 3배 증가했으며 2025년 말까지는 290억 달러(약 35조 5천억원)에 이를 것으로 예측됩니다. 그만큼 요즘은 RTB와 프로그래머틱 전략을 이해하는 것이 마케팅 담당자에게 가장 중요한 과제라고 해도 과언이 아닙니다. 하지만 가장 중요한 건, 결국 RTB는 데이터를 활용한다는 것이죠. 광고 파트너의 first-party 데이터가 없으면 몰로코와 같은 광고 자동화 플랫폼(Demand Side Platform, DSP)은 최고의 성과를 낼 수 없습니다.

 

RTB 캠페인을 성공적으로 운영하기 위해 왜 first-party 데이터가 필요할까요? 아래 네 가지 이유로 설명 가능합니다.

  • 광고주의 자사(first-party) 데이터는 머신러닝 모델의 정확성을 높입니다
  • 머신러닝 모델은 각 임프레션 당 다음 액션 전환 가능성을 예측합니다.
  • 러한 예측은 임프레션 당 입찰가를 최적화하는 데 실시간으로 사용됩니다.
  • 최적화 된 입찰가는 더 나은 가격으로 더 많은 액션 전환을 유도합니다.

몰로코의 머신러닝 플랫폼은 앱에 접근한 사용자를 총체적으로 이해하고 이를 학습해 퍼포먼스를 향상시키고자 광고 성과에 기여한(attributed) 데이터뿐만 아니라, 광고 성과에 기여하지 않은(unattributed) 모든 데이터를 필요로 합니다. 특히 이미 앱안으로 유입된 사용자들의 앱 내 액션 전환을 대상으로 하는 리엔게이지먼트 캠페인의 경우, 광고 성과에 기여하지 않았더라도 앱을 사용하는 모든 사용자들을 학습하는 것이 모델의 정확도를 높이는 데 큰 영향을 주죠.

이 엔진은 익스체인지에서 들어오는 각각의 요청에 입찰 가격을 결정하기 때문에 고객이나 캠페인에 따라 달라지는 초기 데이터 없이는 목표를 효과적으로 달성할 수 없습니다. 예를 들어, 사용자 확보(UA) 캠페인 진행 시 몰로코는 광고주에게 기존 사용자 중 high-value 사용자에 대한 데이터를 요청합니다. 그리고 실제로 이 데이터는 캠페인에 유의미한 영향을 주게 되죠.

 
Importance of First Party_1 

위 그래프는 캠페인의 CPA(진한 파란색)와 액션, 이 경우 인앱 구매 전환율(연한 파란색)을 비교한 것입니다. 광고주가 데이터를 공유하기 전, CPA는 몇 주 동안 높고 변동이 심했습니다. 한편 구매량은 여전히 ​​낮았죠. 7월(점 선)부터 광고주는 저희에게 데이터를 공유하기 시작했습니다. 결과는 명확하고 즉각적이었습니다. CPA가 감소하고 안정화되었으며 머신러닝 모델이 학습을 이어감에 따라 전환율이 꾸준히 증가했습니다.

 

자사의 first-party 데이터가 머신러닝 모델 정확성에 미치는 영향을 정확하게 이해하기 위해서는 조금 더 깊이 파고 들어야합니다. 우선 DSP가 어떻게 머신러닝 모델을 개발하는지 살펴봅시다.

 

플랫폼이 머신러닝 모델을 개발하는 방법

UA 캠페인의 예시로 돌아가 보겠습니다. 캠페인의 목표가 CPI 기준으로 최적화하는 것이라면 각 광고 노출에 대한 입찰 가격은 예상 설치 확률을 기준으로 결정됩니다. 모델을 트레이닝 하기 위해서는 과거 광고 노출 하나하나가 교육 샘플이 되고, 이 노출들이 앱 설치를 유도 했는지 여부에 따라 레이블이 정해집니다(긍정 혹은 부정). 모델을 정확하게 학습시키려면 다양한 앱과 넓은 사용자 풀, 그리고 다양한 소재 형식을 가진 여러 임프레션과 함께 충분한 양의 샘플, 특히 긍정적인 샘플이 필요합니다.

 

캠페인 목표가 단순히 앱 설치를 유도하는 것보다 세분화될 경우 first-party 데이터의 역할이 더욱 중요해집니다. 예를 들어 인앱 구매와 같은 설치 후 이벤트를 유도하도록 모델을 교육하려면 플랫폼에 긍정적인 샘플(설치 및 인앱 구매로 이어진 과거 노출에 대한 데이터)이 필요해집니다. 이런 경우, 긍정적 결과 샘플이 광고 노출의 1% 이하로 매우 드물게 발생하므로 캠페인을 진행하기 전 과거 사용자 데이터를 미리 확보하고 시작한다면 더 빠르게 모델을 학습시킬 수 있겠죠. 아래 표는 소재에 따른 평균 이벤트 전환 빈도를 보여줍니다.

 

제한된 데이터 투명성에 따른 비용

 

적절한 데이터를 확보하지 못하고 캠페인을 시작할 경우, 광고주는 머신러닝 엔진이 충분한 정확도에 도달할 때까지 훨씬 많은 시간과 비용을 소비해야 합니다. 이는 여러 가지 이유로 이상적이지 않으며 적어도 광고비를 낭비한다는 점에서 비효율적이죠.

 

기존의 high-value 사용자 데이터가 몰로코의 엔진에 제공되면, 모델은 과거의 광고 노출(예산 투입을 필요로 하는)뿐만 아니라 기존의 high-value 사용자(광고 없이 무료로 얻을 수 있는)의 프로필 모두를 학습합니다. 기존의 high-value 사용자로부터 학습한다는 것은 페이스북이나 링크드인(LinkedIn)과 같은 플랫폼에서 사용하는 "lookalike 잠재 고객 타겟팅”과 유사한 개념입니다. 단일 플랫폼에 대한 lookalike 오디언스 모델을 교육할 때 사용할 수 있는 광고 슬롯은 한정되어 있습니다. 따라서 서로 다른 퍼블리셔와 광고 슬롯의 학습 효과에 대한 고민이 필요하지 않죠. 한편 오픈 익스체인지에서 모델은 퍼블리셔와 사용자 세그먼트 간의 차이를 고려해야 합니다.

*Lookalike 잠재 고객 타겟킹: 기존에 보유하고 있는 데이터로 머신을 학습시키고 해당 데이터와 특정 정보(예. 디바이스에 설치된 앱 리스트)가 유사한(lookalike) 사용자를 대상으로 타겟팅 하는 프로그래매틱 마케팅 기법

 

이해를 돕기 위해, 페이스북이나 링크드인과 같은 폐쇄된 시스템과 비교해 프로그래밍 방식 생태계가 얼마나 복잡할 수 있을지 설명드리겠습니다.

  • 몰로코는 방대한 양의 퍼블리셔에 입찰합니다. 실제로 매월 250만 개 이상의 앱에 대한 임프레션 입찰을 합니다. 이때 앱 별로 예상되는 전환 확률은 모두 다르게 적용됩니다.
  • 퍼블리셔의 이질성(heterogeneity)이 두드러집니다. 이는 동일한 사용자나 동일한 캠페인에 대한 확률을 예측하는 경우에도 그렇습니다. 이러한 예측 전환 확률의 중앙 계수(median coefficient)는 1.22입니다. 이는 평균에 대한 표준 편차를 취해 알 수 있는데, 계수 0은 변동이 존재하지 않음을 의미하는 반면, 1.22는 유의미 한 이질성을 의미합니다.
  • 사용자 이질성(heterogeneity) 또한 두드러집니다. 동일한 앱이나 캠페인에 대한 여러 다른 사용자 간의 예측 전환 확률의 중앙 변동 계수(median coefficient of variation)는 1.90입니다.

 

이러한 요소를 완화하기 위해 몰로코 플랫폼은 first-party 데이터를 활용합니다. 파트너의 기존 high-value 사용자 데이터와 직접 캠페인 운영하며 얻은 실시간 결과를 바탕으로 모델을 학습 시키는 거죠. 몰로코는 이러한 알고리즘과 first-party 데이터를 사용하여 일반적으로 평균 3-4주 내에 UA 캠페인에서 목표로 하는 ROAS에 도달할 수 있습니다. 최상의 시나리오로는 최소 2주 내에도 목표를 달성할 수 있습니다. First-party 데이터 없이는 3개월이 걸리는 일을 말이죠.

 

일부 RTB를 사용하는 DSP들은 (처음에는 성능이 떨어질 것이라는 경고와 함께) first-party 데이터 없이 캠페인을 시작하기도 합니다. 하지만 몰로코는 파트너들을 위해 최고의 결과만을 목표로 합니다. 때문에 first-party 데이터 없이는 RTB 캠페인을 론칭하지 않습니다. 결국, 입찰 가격을 높이고 목표 ROAS를 달성시키기 위해서는 무엇보다 머신러닝 모델의 정확도를 높이는 것이 가장 중요합니다.

 

---

몰로코의 뛰어난 머신러닝 엔진과 인프라로 자사만을 위한 독립된 마케팅 플랫폼을 운영하고 싶나요?

몰로코의 최신 솔루션 MOLOCO Cloud를 찾아주세요.

데이터의 숨겨진 가치를 발견할 준비가 되셨다면, 지금 바로 연락주세요!