В предыдущей статье была решена задача регулировки цены клика в зависимости от коэффициента конверсии. Однако это решение не учитывало статистическую значимость полученных коэффициентов конверсии. В этой статье мы попробуем учесть тот факт, что данные по конверсиям имеют довольно значительный статистический разброс. Учет достоверности статистических данных позволяет в большей степени увеличить конверсию по сравнению с предыдущим случаем.

Алгоритм 1.

Одна из вполне логичных математических моделей этого процесса будет выглядеть следующим образом. До момента достижения первой цели мы исходим из предположения одинаковости коэффициентов конверсий для всех фраз. При этом будет получаться максимально возможное количество переходов на сайт. Начиная с момента достижения первой цели, можно вычислять средний коэффициент конверсии для всех фраз – как частное от деления общего количества достижений цели на общее количество кликов. Каждой фразе изначально (при отсутствии кликов по ней) присваивается средний коэффициент конверсии. Чем больше кликов по фразе при отсутствии достижения цели по ней, тем ниже будет у нее коэффициент конверсии.

Напишем формулу для коэффициента конверсии в рамках этой модели:

conversion-01          (1.1)

Здесь:

kicor – коэффициент конверсии для i-й фразы в прошедшем периоде, увеличенный на некоторую корректирующую величину ∆kicor таким образом, чтобы учесть статистическую значимость полученных данных;

ka – средний по всем фразам коэффициент конверсии;

ki – реальный коэффициент конверсии для i-й фразы в прошедшем периоде;

∆kicor – величина, корректирующая реальный коэффициент конверсии и вводимая для учета статистической значимости полученных данных;

Ci — количество кликов по i-й фразе.

На практике удобнее пользоваться нормированным коэффициентом конверсии. Для этого поделим коэффициент конверсии для каждой фразы на средний коэффициент конверсии по кампании в целом:

conversion-02          (1.2)

Здесь:

kni – расчетный нормированный коэффициент конверсии для i-й фразы;

∆ki – величина, корректирующая реальный нормированный коэффициент конверсии для учета статистической значимости полученных данных;

conversion-07 — суммарное достижение целей по всем фразам.

Если в кампании еще нет достижений цели (conversion-07=0) или по i-й фразе еще не было кликов (Ci=0), то нормированный коэффициент конверсии для i-й фразы равен единице. Если же в кампании было хотя бы одно достижение цели (conversion-07>0) и по i-й фразе был хотя бы один клик (Ci>0), то нормированный коэффициент конверсии для i-й фразы рассчитывается по второй формуле.

Напишем формулу для величины, корректирующей реальный коэффициент конверсии:

conversion-03                    (1.3)

Здесь:

C0 (кликов) – постоянный коэффициент, отвечающий за скорость убывания корректирующей величины для какой-либо фразы с увеличением количества кликов по ней.

В рамках данной модели мы, по сути, увеличиваем реальный коэффициент конверсии для каждой фразы на некоторую корректирующую величину. Тот факт, что при этом все коэффициенты конверсии увеличиваются по сравнению с реальными коэффициентами, не столь важен, поскольку для расчета цен клика значимыми являются только отношения между коэффициентами конверсий, а не их абсолютные величины.

Рассмотрим, как изменяется коэффициент конверсии какой-либо фразы при увеличении количества кликов по ней:

  1. Ci=0. При отсутствии кликов по какой-либо фразе коэффициент конверсии этой фразы считается равным среднему по всем фразам коэффициенту конверсии (ki=ka, а kni=1). Действительно, в отсутствие статистических данных нет оснований считать, что фраза будет иметь больший или меньший коэффициент конверсии.
  2. Ci=C0. В тот момент, когда количество кликов по фразе становится равным C0, корректирующая величина снижается в 2 раза. В частности, если к этому моменту у фразы еще не было ни одного достижения цели (ki=0), то коэффициент конверсии фразы становится равным половине среднего для всех фраз коэффициента конверсии (ki=ka/2, а kni=1/2).
  3. Ci→∞. При стремлении количества кликов по фразе к бесконечности, коэффициент конверсии стремится к реальному коэффициенту конверсии ki=Ki/Ci. Это решение, которое было получено в предыдущей статье, при условии полной статистической значимости получаемых данных.

Теперь рассмотрим, как изменяется расчетный коэффициент конверсии в зависимости от коэффициента C0:

  1. Если C0=1, то это соответствует случаю очень быстрого уменьшения величины, корректирующей коэффициент конверсии фразы. При этом ∆ki=1/(Ci+1). Т.е. при увеличении количества кликов корректирующая величина снижается практически в количество кликов раз.
  2. Если C0=1/ka, то корректирующий коэффициент для i-й фразы снижается вдвое, если конверсий у i-й фразы еще нет, а количество кликов по i-й фразе равно такому количеству кликов в кампании, при котором в среднем происходит одна конверсия. При этом ∆ki=1/(Ci·ka+1).
  3. Если C0→∞, то ki=Ki/Ci+ka вне зависимости от количества кликов по фразе. Т.е. к реальному коэффициенту конверсии всегда прибавляется средний по кампании коэффициент конверсии.

Теперь учтем тот факт, что величина C0 должна зависеть от величины среднего коэффициента конверсии. Если средний коэффициент конверсии мал, то и величина C0 должна быть большой и наоборот. Для учета этого введем дополнительные параметры в существующую модель. При этом формулы (1.1) и (1.2) останутся без изменений, а формула (1.3) может быть преобразована следующим образом:

conversion-04                            (1.4)

Величина C0 означает количество кликов, при котором величина ∆ki, корректирующая коэффициент конверсии, уменьшится в 2 раза по сравнению с нулевым количеством кликов при больших значениях ka. Например, когда в качестве значения коэффициента конверсии принимается глубина просмотра. Разумное значение величины C0 лежит в пределах 5-30 кликов.

При больших значениях ka (больше единицы) экспонента фактически будет равна нулю, поэтому эта формула будет равносильна формуле (1.3).

При малых значениях ka (ka → 0) формула (1.4) преобразуется следующим образом:

conversion-05                      (1.5)

Обратим внимание на то, что величина, обратная ka, есть не что иное, как количество кликов по всем фразам, за которое происходит одно достижение цели. Поэтому совершенно разумно, что величина ∆ki, корректирующая коэффициент конверсии, уменьшится в 2 раза по сравнению с нулевым количеством кликов примерно за количество кликов, обратно пропорциональное ka.

Напишем окончательную формулу для первого алгоритма:

conversion-06

Алгоритм 2.

И еще одна математическая модель, лишенная недостатков первого алгоритма, выглядит следующим образом:

conversion-16                (3.1)

Где f(ka) вычисляется так же, как и для 2-го алгоритма по формуле (2.3).

В предельных случаях эта модель дает те же значения, что и в первых двух алгоритмах: kni = 1 при Ci = 0 и kni = ki / ka при Ci → ∞.

Обратим внимание на два момента, отличающие этот алгоритм от первых двух. Во-первых, эта формула корректна при условии Ci = 0. Поэтому в данном случае нет необходимости выделять это условие в отдельную формулу. Во-вторых, эта формула в существенно меньшей степени зависит от коэффициента C0. Такая слабая зависимость от коэффициента C0 определяется тем, что экспонента фигурирует как в числителе, так и в знаменателе. Что в значительной степени нивелирует влияние коэффициента при экспоненте на конечный результат.

Недостатком этого алгоритма является то, что мы, по сути, прибавляем единицу (при малом количестве кликов) в числителе и в знаменателе. Если же в качестве коэффициента конверсии используется довольно большая величина (близкая к единице или даже больше, например, глубина просмотра), то такая формула будет давать не совсем достоверные результаты при малом количестве кликов.

Алгоритм 3.

Теперь попытаемся создать математическую модель в случае наличия двух целей. Введем дополнительные обозначения:

K1i – количество достижений 1-й цели у i-й фразы;

K2i – количество достижений 2-й цели у i-й фразы;

conversion-17 – коэффициент конверсии для 1-й цели у i-й фразы;

conversion-18 – коэффициент конверсии для 2-й цели у i-й фразы;

conversion-19 – средний по кампании коэффициент конверсии для 1-й цели;

conversion-20 – средний по кампании коэффициент конверсии для 2-й цели;

Предположим, что первая цель приоритетнее второй. При этом статистическая достоверность данных по первой цели должна быть меньше, чем для второй цели. (В противном случае учет 2-й цели теряет смысл.) Другими словами, почти всегда должно выполняться неравенство K1i << K2i. Это означает, что коэффициенты конверсий по разным целям будут сильно отличаться друг от друга. Чтобы нормировать коэффициенты конверсий, поделим их на средние коэффициенты конверсий по кампании:

conversion-21 – нормированный коэффициент конверсии для 1-й цели у i-й фразы;

conversion-22 – нормированный коэффициент конверсии для 2-й цели у i-й фразы;

Тогда по смыслу должны выполняться следующие условия:

kni = 1 при Ci = 0;

kni → kn2i при 0 < Ci < ∞;

kni → kn1i при Ci → ∞.

Этим условиям удовлетворяет следующая модель:

conversion-23    (4.1), где

conversion-24                                     (4.2)

Рассмотрим, как ведет себя эта функция:

Если по фразе еще не было ни одного клика (Ci = 0), то kni = 1.

Если были клики, но не было конверсий ни по одной цели (k1i = k2i = 0), то kni будет уменьшаться, поскольку будет уменьшаться вторая экспонента.

Если появились конверсии по второй цели, а по первой цели конверсий еще нет, то ввиду малости величины k1a, величина conversion-28 будет практически равна единице. Поэтому придем к следующей формуле:

conversion-25

Нетрудно видеть, что эта формула идентична формуле для нормированного коэффициента конверсии в случае одной цели.

И, наконец, при большом количестве кликов экспоненты стремятся к нулю, поэтому нормированный коэффициент конверсии стремится к реальному коэффициенту конверсии, деленному на средний по кампании коэффициент конверсии для первой цели:

conversion-26

Алгоритм 4.

И еще одна возможная математическая модель в случае наличия двух целей выглядит так:

conversion-27          (5.1)

где f(k1a) и f(k2a) вычисляются по формуле (4.2).

Рассмотрим, как ведет себя эта функция:

Если по фразе еще не было ни одного клика (Ci = 0, а значит и K1i = K2i = 0), то kni = 1.

Если были клики, но не было конверсий ни по одной цели (K1i = K2i = 0), то kni будет уменьшаться, поскольку числитель будет меньше знаменателя.

Если появились конверсии по второй цели, а по первой цели конверсий еще нет, то ввиду малости величины k1a, величина conversion-28 будет практически равна единице, а величина Ci×k1a будет существенно меньше величины Ci×k2a. Поэтому придем к следующей формуле:

conversion-29

Нетрудно видеть, что эта формула идентична формуле для нормированного коэффициента конверсии в случае одной цели.

И, наконец, при большом количестве кликов экспоненты стремятся к нулю, поэтому нормированный коэффициент конверсии стремится к реальному коэффициенту конверсии, деленному на средний по кампании коэффициент конверсии для первой цели:

conversion-30

Недостатком этого алгоритма, так же, как и третьего алгоритма, является не слишком достоверный результат в случае малого количества кликов.

Пояснение алгоритма 1 на простейших примерах.

Как и в предыдущей статье возьмем 2 фразы и предположим, что за прошедший месяц:

  1. По ним было сделано одинаковое количество кликов – например, по 100 кликов.
  2. По 1-й фразе пришел 1 клиент, а по 2-й фразе – ни одного.

Предыдущее решение (без учета статистической значимости полученных данных) исходило бы из того, что в следующем месяце статистика была бы такой же. Что  дало бы следующий результат:

  1. 1-я фраза имеет коэффициент конверсии 1% (2 клиента делим на 200 кликов).
  2. 2-я фраза имеет коэффициент конверсии 0% (0 клиентов на 200 кликов).

И решение задачи увеличения конверсии заключалось бы в том, что 2-ю фразу нужно отключить, а весь расход сосредоточить на 1-й фразе. Однако понятно, что всегда есть ненулевая вероятность того, что по 2-й фразе в будущем тоже могут придти клиенты. Без учета этого факта конверсия может не увеличиться, а даже уменьшиться. Предположим, что в течение следующего месяца:

  1. По обеим фразам будет сделано такое же количество кликов – по 100 кликов.
  2. По 2-й фразе придет 1 клиент.
  3. По 1-й фразе придет 1 клиент, как и в прошлом месяце. Однако чтобы не ущемлять 1-ю фразу по сравнению со 2-й фразой, добавим к ней еще одного клиента.

Получаем суммарно за 2 месяца (за прошлый и за следующий):

  1. 1-я фраза имеет коэффициент конверсии 1,5% (3 клиента делим на 200 кликов).
  2. 2-я фраза имеет коэффициент конверсии 0,5% (1 клиент на 200 кликов).

Обратим внимание на следующий момент. Поскольку мы добавили к статистике по одному клиенту к каждой фразе, то коэффициенты конверсий увеличились по сравнению с исходным вариантом. Но нас интересует не абсолютная величина коэффициентов конверсий, а их относительная величина между фразами. Таким образом, получаем, что на 1-ю фразу нужно установить в 3 раза больше цену клика, чем на 2-ю фразу. Разница с предыдущим решением очевидна – 2-ю фразу нужно не отключать совсем, а всего лишь пессимизировать ее, установив на нее в 3 раза меньшую цену клика, чем на 1-ю фразу.

Теперь предположим, что по 2-й фразе придет 1 клиент, но в течение не одного месяца, а в течение двух последующих месяцев. Тогда по 1-й фразе в течение тех же двух месяцев придет 2 клиента плюс один дополнительный – чтобы опять-таки не ущемлять эту фразу по сравнению со 2-й фразой.

Получаем суммарно за 3 месяца (за один прошлый и за два следующих):

  1. 1-я фраза имеет коэффициент конверсии 1,33% (4 клиента делим на 300 кликов).
  2. 2-я фраза имеет коэффициент конверсии 0,33% (1 клиент на 300 кликов).

Видим, что разница в коэффициентах конверсий увеличилась до четырех раз. Нетрудно продолжить эту логическую цепочку и понять, что в предположении получения клиента для 2-й фразы (и дополнительного для 1-й фразы) в бесконечности, мы получим вырожденное решение, когда коэффициент конверсии для 1-й фразы будет 1%, а для 2-й фразы – 0%. Таким образом, получится точно такое же решение, какое было получено в предыдущей статье. Т.е. в предположении полной статистической достоверности данных за прошлый месяц.

И, наконец, если предположить, что по каждой фразе придет по одному клиенту сразу же в начале следующего периода (т.е. на первом же клике), то разница в коэффициентах конверсий будет практически в 2 раза. Для 1-й фразы – 2% (2 клиента делим на 101 клик), а для 2-й фразы – 1% (1 клиент делим на 101 клик).

Таким образом, видим, что при начальных условиях, когда в прошлом месяце получен 1 клиент для 1-й фразы и ни одного – для 2-й фразы, есть 2 крайних варианта. Первый – когда коэффициенты конверсий будут отличаться в 2 раза. И последний – когда коэффициенты конверсий будут отличаться в бесконечное число раз (что равносильно случаю, когда по 2-й фразе клиент не будет получен никогда). Как первый, так и последний варианты маловероятны. Поэтому с практической точки зрения имеет смысл предполагать разницу в коэффициентах конверсий в 3-5 раз.

Другими словами, выбор периода, в течение которого будет все-таки получен клиент для той фразы, у которой по результатам прошлого месяца не было получено клиентов, является ничем иным, как выбором доверительного интервала для полученных данных.

Однако все эти расчеты были сделаны в предположении равного количества кликов по обеим фразам за прошедший период. Теперь предположим, что:

  1. По 1-й фразе было сделано 100 кликов, и был получен 1 клиент.
  2. По 2-й фразе было сделано 10 кликов, и не было получено ни одного клиента.

Если предположить, что по каждой фразе в самом начале следующего периода придет по одному клиенту, то получится, что коэффициент конверсии у 1-й фразы будет примерно 2% (2/101), а у 2-й фразы – примерно 9% (1/11). И это будет нарушать логику, поскольку получается, что фраза, по которой не было получено клиентов, будет иметь больший коэффициент конверсии. В данном случае лучше исходить из предположения, что чем меньше кликов было по какой-либо фразе, тем ближе значение ее коэффициента конверсии к среднему коэффициенту конверсии по всем фразам. Т.е. мы придем к такому решению задачи увеличения конверсий, которая была приведена в начале статьи.

Оставьте Комментарий