Context Calculator

iOS 14의 IDFA 폐지로 인해 광고주는 성장이라는 동일한 목표 하에 경쟁력있는 CPI와 가치있는 사용자 확보를 위한 대체 비사용자 기반 타겟팅 솔루션을 찾는 데 어려움을 겪고 있습니다.


컨텍스트 타켓팅이 중앙무대를 차지함에 따라, 각 스토어 카테고리에서 쉽게 조작될 수 있는 정보 이외의 정보를 수집하기 위해, 당사는 앱 사이의 컨텍스트 ‘거리′를 측정함으로써 각 번들을 벡터로 표현하기 위해 단어 표현 방법이라 불리는 ELMo를 사용합니다. 이 계산된 거리는 다른 수백가지 특징 중의 하나로 당사의 예측 모델에 제공되며 당사의 비딩 로직에서 중요한 역할을 합니다.


이 방법의 효과를 보여드리기 위해 컨텍스트 거리 계산기를 제작하였습니다. 계산기를 사용하면 각 앱스토어 소개문 간의 정교한 비교를 통해 작동방식, 테마, 특징 등이 가장 유사한 앱을 알 수 있습니다.

컨텍스트가 유사한 앱 찾기

  • App Icon

    앱 이름

    카테코리

컨텍스트 관련 앱 순위

#앱 이름확신도
1mockBillion Cash Slots-Casino Game
100%

확신도 값

100% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

2mockEon Slots Casino Vegas Game
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

3mockCash Tornado Slots - Casino
50%

확신도 값

50% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

4mockSuper Vegas Slots Casino Games
44%

확신도 값

44% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

5mockVegas Nights Slots
40%

확신도 값

40% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

6mockTycoon Casino - Vegas Slots
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

7mockWinning Slots Las Vegas Casino
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

8mockCash Frenzy - Slots Casino
60%

확신도 값

60% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

9mockVegas Slots - 7Heart Casino
10%

확신도 값

10% - 저 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

10mockSlots Casino - Vegas Slot Machine Games
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

1
mockBillion Cash Slots-Casino Game
100%

확신도 값

100% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

2
mockEon Slots Casino Vegas Game
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

3
mockCash Tornado Slots - Casino
50%

확신도 값

50% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

4
mockSuper Vegas Slots Casino Games
44%

확신도 값

44% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

5
mockVegas Nights Slots
40%

확신도 값

40% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

6
mockTycoon Casino - Vegas Slots
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

7
mockWinning Slots Las Vegas Casino
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

8
mockCash Frenzy - Slots Casino
60%

확신도 값

60% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

9
mockVegas Slots - 7Heart Casino
10%

확신도 값

10% - 저 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

10
mockSlots Casino - Vegas Slot Machine Games
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

#앱 이름확신도
11mockEpic Vegas Slots - Casino Game
40%

확신도 값

40% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

12mockSlots of Vegas
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

13mockSlots: Vegas Casino Slot Games
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

14mockVegas Casino & Slots: Slottist
88%

확신도 값

88% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

15mockLuckyBomb Casino Slots
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

16mockSlots Mega Win Casino Game
75%

확신도 값

75% - 중-고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

17mockHigh 5 Casino: Home of Slots
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

18mockWinner Slots Casino Games
20%

확신도 값

20% - 저 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

19mockCash Tap Casino: Slot Machines
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

20mockCash Tap Casino: Slot Machines
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

11
mockEpic Vegas Slots - Casino Game
40%

확신도 값

40% - 중 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

12
mockSlots of Vegas
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

13
mockSlots: Vegas Casino Slot Games
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

14
mockVegas Casino & Slots: Slottist
88%

확신도 값

88% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

15
mockLuckyBomb Casino Slots
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

16
mockSlots Mega Win Casino Game
75%

확신도 값

75% - 중-고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

17
mockHigh 5 Casino: Home of Slots
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

18
mockWinner Slots Casino Games
20%

확신도 값

20% - 저 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

19
mockCash Tap Casino: Slot Machines
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

20
mockCash Tap Casino: Slot Machines
90%

확신도 값

90% - 고 확신도

컨텍스트는 아주 미묘하므로 두 앱간 컨텍스트 관계에 높은 확신도로 저희 모델에 입력합니다.

확신도는 앱 소개문의 길이, 모호한 단어의 숫자와 전반적 명확성으로 계산됩니다.

번들 결과

번들 ID를 입력하고 '계산'을 클릭하면 컨텍스트가 가장 유사한 앱을 볼 수 있습니다.

ElMo를 사용하는 이유

설치 및 구매 예측 모델을 위한 컨텍스트 유사 기능을 개발할 때 두 가지 주요 원칙을 고려했습니다: 첫째, 컨텍스트는 사용자 행동 및 광고 참여를 예측하는 데 중요한 역할을 하고, 둘째, 컨텍스트는 상당히 미묘한 차이가 있을 수 있습니다.


이 개념은 내재된 편견을 포함하고 경우에 따라 ASO 문제로 인한 노골적인 부정확성 및 주제 모델링 방법(예: LDAW2V)을 사용하여 클러스터링하는 직접 카테고리를 만드는 것과 같은 다른 접근 방식을 포함하므로 스토어 카테고리 사용을 무의미하게 만들며 우리가 목표로 한 정보 획득과 정확성 향상을 생성하고, 우리는 각각의 모든 번들을 개별적으로 표현할 방법을 찾아야 한다는 것을 깨달았습니다.


기계 학습의 언어 관련 문제를 해결하는 데 일반적으로 사용되는 작업의 복잡성과 도구를 평가한 후, 당사 데이터 사이언티스트의 연구를 통해 ELMo를 테스트하는 것으로 결론지었습니다. ELMo는 55억 개의 방대한 토큰(단어 및 구성 부분) 데이터 세트 내에서 사용되는 구문을 학습함으로써 서로 다른 컨텍스트를 사용할 때 단어와 의미 간의 연관성을 학습하기 위해 신경망을 사용합니다.


ELMo 모델이 학습된 후 각 단어를 벡터로 표현하여 의미체계의 레벨과 구문간의 유사성을 알려주는 각 단어 사이의 코사인 거리를 측정할 수 있습니다. 각 단어는 컨텍스트를 이해하는 것이 매우 중요하므로, ELMo는 복잡한 작업을 위한 가장 신뢰할 수 있는 방법이라는 것이 입증되었습니다.

유사성 거리에 의해 효과적으로 측정되는 동안 단어 벡터가 컨텍스트 상황에 따라 얼마나 가까운지에 대한 예시

mock
mock
  • Cluster 1
  • Cluster 2
  • Cluster 3
  • Word Vectors
  • Weight
  • Bundle Representation
  • Ml Model
Scheme

단어의 가중합에서 번들 벡터가 생성되는 모습

번들 벡터 묘사

단어 벡터를 생성한 후 다음 단계는 컨텍스트를 효과적으로 표현하는 방식으로 각 번들에 대해 단어벡터를 합하는 것입니다. 표면적으로는 앱스토어 소개문 전체를 단일 벡터 표현에 포함하여 서로 다른 앱 간의 컨텍스트 '거리'를 측정할 수 있습니다.

당사 연구 개발 과정에서 이 단계가 가장 난해한 것으로 밝혀졌습니다. 앱스토어 소개문에 있는 모든 단어의 벡터를 평균화하는 것만으로도 충분해 보이지만 특정 앱의 스토어 소개문 및 전체 말뭉치 내에서 특정 단어가 나타나거나 반복되는 빈도와 관련된 귀중한 데이터를 잃어 버리게 됩니다.

많은 테스트 후 가장 많은 정보를 얻을 수 있는 접근 방식은 NLP(자연어처리, 텍스트 분석에 중점을 둔 기계 학습의 한 분야) -TFIDF-Term Frequency Inverse (to) Document 빈도 : 기본적으로 말뭉치 내 특정 단어의 희소성을 나타냄 - 의 주요 수치 통계를 기반임을 발견했습니다.

따라서, 번들 표현은 각 앱의 고유 테마, 작동방식 및 기능을 일반적으로 표현하는 더 희귀하고 미묘한 단어에 중점을 두기 위해 각 단어 벡터의 가중 평균에 TFIDF값을 곱하여 매우 세분화되어 있지만 가치있는 정보를 제공하는 모델로 발전하였습니다.

시작하시겠어요?

컨텍스트 타겟팅을 기반으로 효과적인 머신러닝 기반 UA캠페인 운영하기