Определение перспективного тарифа для телеком компании

Цель: Определить выгодный тарифный план для корректировки рекламного бюджета.

Выборка. Данные 500 пользователей тарифных планов «Смарт» и «Ультра»: кто они, откуда, каким тарифом пользуются, сколько звонков и сообщений каждый отправил за 2018 год.

Примечание: «Мегалайн» всегда округляет вверх значения минут и мегабайтов. Если пользователь проговорил всего 1 секунду, в тарифе засчитывается целая минута.

Подготовка данных для анализа

Изучение датасета с информацией о звонках

Таблица calls (информация о звонках):

Промежуточный вывод

Изучение датасета с информацией об интернет-сессиях

Таблица internet (информация об интернет-сессиях):

Промежуточный вывод

Изучение датасета с информацией о сообщениях

Таблица messages (информация о сообщениях):

Промежуточные выводы

Изучение датасета с информацией о пользователях

Таблица users (информация о пользователях):

Промежуточные выводы

Дополнительные вычисления

Количество сделанных звонков и израсходованных минут разговора по месяцам

Количество отправленных сообщений по месяцам

Объём израсходованного интернет-трафика по месяцам

Объединение таблиц для вычисления выручки

Объединение таблиц прошло верно.

Получается, что информация представлена не по всем пятистам пользователям.

Промежуточный вывод

Данные по двум абонентам отсутствуют из-за того, что они подключились к тарифу и отключились от него в течение одного месяца.

Описание тарифов

Тариф «Смарт»

Тариф «Ультра»

Таблица tariffs (информация о тарифах):

Расчёт помесячной выручки с каждого пользователя

Исследование данных

Опишите поведение клиентов оператора, исходя из выборки. Сколько минут разговора, сколько сообщений и какой объём интернет-трафика требуется пользователям каждого тарифа в месяц? Посчитайте среднее количество, дисперсию и стандартное отклонение. Постройте гистограммы. Опишите распределения.

Анализ длительности разговоров

Промежуточный вывод

Средняя длительность разговоров у абонентов тарифа Ultra больше, чем у абонентов тарифа Smart. В течение года пользователи обоих тарифов увеличивают среднюю продолжительность своих разговоров. Рост средней длительности разговоров у абонентов тарифа Smart равномерный в течение года. Пользователи тарифа Ultra не проявляют подобной линейной стабильности. Стоит отметить, что феврале у абонентов обоих тарифных планов наблюдались самые низкие показатели.

Промежуточный вывод

Распределение стандартного отклонения длительности разговоров абонентов тарифа Smart приближено к нормальному распределению. Стандартное отклонение длительности разговоров абонентов тарифа Ultra намного выше, чем у абонентов Smart. Пользователи тарифа Ultra нестабильны в использовании тарифа.

Промежуточный вывод

Распределение дисперсии длительности звонков приближено к нормальному распределению. Дисперсия длительности звонков абонентов тарифа Ultra намного больше, чем дисперсия длительности разговоров у абонентов Smart.

Анализ количества сообщений

Промежуточный вывод

В среднем пользователи тарифа Ultra отправляют почти на 20 сообщений больше, чем пользователи тарифа Smart. Количество сообщений в течение года на обоих тарифах растёт. Динамика отправки сообщений схожа с тенденциями по длительности разговоров: в феврале отмечено наименьшее количество сообщений за год, и пользователи тарифа Ultra также проявляют нелинейную положительную динамику.

Промежуточные выводы

Распределение стандартного отклонения количества сообщений далеко от нормального распределения. Явно видно разделение на несколько групп — по типу тарифа. Стандартное отклонение больше у пользователей тарифного плана Ultra — это связано с тем, что пользователи этого тарифного плана проявляют довольно разную активность.

Промежуточные выводы

Дисперсия количества отправленных сообщений в разных тарифных планах не типична для нормального распределения.

Анализ объема интернет-трафика

Промежуточные выводы

Меньше всего пользователи использовали интернет в январе, феврале и апреле. Чаще всего абоненты тарифа Smart тратят 15-17 Гб, а абоненты тарифного плана Ultra — 19-20 ГБ. Также распределение среднего значения объёма трафика тарифных планов Ultra и Smart не типично для нормального распределения.

Промежуточный вывод

Показатели объема трафика тарифа Smart менее рассеяны вокруг среднего значения, к тому же среднее отклонение интернет-трафика постепенно уменьшается в течение года, что нельзя сказать о привычках пользователей тарифного плана Ultra.

Промежуточный вывод

Дисперсия интернет-трафика тарифа Smart более приближена к нормальному распределению, чем дисперсия тарифа Ultra.

Исследовательский анализ выручки

Промежуточные выводы

В среднем пользователи тарифа Ultra чаще всего не выходят за рамки абонентской платы в 1950 рублей. Абоненты Smart нередко превышают лимиты, установленные в рамках абонентской платы в 550 рублей. Именно у пользователей тарифа Smart отмечена максимальная среднемесячная выручка — 4375 рублей.

Проверка гипотез

Средняя выручка пользователей тарифов «Ультра» и «Смарт» различается.

Н0 — средняя выручка пользователей тарифов «Ультра» и «Смарт» равны, т.е. средние значения равны.

Н1 — средняя выручка пользователей тарифов «Ультра» и «Смарт» не равны, т.е. средние значения не равны.

Для проверки гипотезы будет использоваться критерий p-value.

P-значение достаточно мало, что даёт основание отвергнуть предположение об отсутствии различий между выручками у разных тарифных планов, т.е. маловероятна случайность результатов теста гипотезы.

Средняя выручка пользователей из Москвы отличается от выручки пользователей из других регионов.

Н0 — средняя выручка пользователей из Москвы не отличается от выручки пользователей из других регионов, т.е. средние значения равны.

Н1 — средняя выручка пользователей из Москвы отличается от выручки пользователей из других регионов, т.е. средние значения не равны.

Для проверки гипотезы будет использоваться критерий p-value.

Полученное значение p-value говорит о том, что средняя выручка пользователей из Москвы и из других регионов отличается, но с вероятностью в почти 58% такое различие можно получить случайно. Это слишком высокая вероятность для того, чтобы делать выводы о значимом различии между средними значениями выручки.

Общий вывод по проекту

Активность пользователей тарифных планов отличается друг от друга, как показал анализ распределений средних значений и вариативности предоставляемых услуг.

Пользователи тарифа Ultra ведут траты хаотично, чёткой тенденции по месяцам не прослеживается. Тем не менее, в среднем большинство клиентов укладываются в абонентскую планту — менее четверти клиентов доплачивают за превышение лимитов.

Чаще всего пользователи превышали лимиты по интернет-трафику. Именно этим обусловлен бо́льший процент выручки у пользователей тарифа Smart. К тому же, именно у абонента этого тарифного плана отмечена максимальная выручка в выборке.

Таким образом, для оператора будет выгоднее тариф Smart с сохранением текущих лимитов по абонентской плате.