Jakie ma znaczenie i jaką rolę może odegrać Big Data? Oto praktyczne zastosowanie nowoczesnych metod analitycznych przez jednego z największych operatorów telekomunikacyjnych w Europie Zachodniej.
W artykule przedstawiono korzyści biznesowe, jakie można osiągnąć w wyniku zastosowania analityki Big Data, w szczególności analiz sekwencji zdarzeń i interakcji klienta z operatorem. Analizy te pozwalają lepiej zrozumieć zachowania i oczekiwania klientów, co umożliwia z kolei poprawę standardów i efektywności obsługi klientów oraz w ostatecznym rozrachunku zwiększenie dochodów operatora.

Partnerem merytorycznym materiału jest Teradata, światowy lider oferujący kompleksowe platformy analizy danych, aplikacje marketingowe i analityczne, a także usługi doradcze wspierające organizacje w dążeniach do zwiększenia konkurencyjności dzięki podniesieniu jakości danych oraz relacji z klientami. Więcej informacji na stronach teradata.com i teradata.pl.
Tło problemu
Niewiele branż zostało w ostatnich latach zmuszonych do tak fundamentalnych zmian modelu biznesowego, jak to się stało w przypadku dostawców usług telekomunikacyjnych. Przez wiele lat firmy te miały przewidywalne i niezawodne źródło dochodów oparte na świadczonych usługach głosowych. Obecnie firmy zmuszone są do oferowania znacznie szerszej gamy usług, nie tylko telekomunikacyjnych. Coraz wyraźniejszy trend spadku przychodów z usług głosowych jest tylko częściowo kompensowany poprzez nowe typy usług opartych na transmisji danych. Jednak nawet te przychody z nowych typów usług są obecnie zagrożone przez nową konkurencję. Firmy, takie jak Netflix, Spotify, aż po Google i Apple, korzystają z infrastruktury operatorów telekomunikacyjnych i zaczynają dominować na rynku w dostarczaniu treści w tzw. modelu „over‑the‑top” (OTT).
Jednym z głównych zagrożeń biznesu operatorów jest rosnące ryzyko odejścia klientów (tzw. churn), co wymusza poszukiwanie nowych sposobów na zatrzymanie klientów i zwiększenie ich lojalności. Zwłaszcza że branża usług telekomunikacyjnych, również w Polsce, charakteryzuje się mocno konkurującymi ze sobą uczestnikami rynku. Szansą na znalezienie nowych sposobów ograniczenia odejść klientów staje się wykorzystanie analityki Big Data.
Big Data w dzisiejszym świecie
Codziennie zalewa nas potop danych tworzony przez interakcje miliardów osób korzystających z komputerów, tabletów oraz telefonów komórkowych. Firmy pragną obecnie przechwytywać biliony bajtów informacji o swoich klientach, dostawcach i wszelkich działaniach związanych z biznesem. Sieciowe czujniki w urządzeniach, takich jak telefony komórkowe, inteligentne liczniki energii, samochody i maszyny przemysłowe, tworzą i przekazują dane praktycznie nieustannie. W cyfrowym świecie istnieje już około 2,7 Zetabajtów danych. Skala liczb wokół Big Data oszałamia.
Na potrzeby tego artykułu przyjęliśmy, że pod nazwą Big Data rozumiemy zarówno strukturalne jak i wielostrukturalne dane behawioralne, ale również dedykowane algorytmy w formie skalowalnej liniowo analityki
Przykładem danych wielostrukturalnych mogą być dane opisujące aktywność klientów online składowane częściowo w tzw. Web‑logach.
Analizy Big Data wymagają ogromnej mocy obliczeniowej. Na szczęście dzisiaj, dzięki nowoczesnym technologiom i implementacjom paradygmatu Map‑Reduce moc obliczeniowa przestaje być istotną barierą technologiczną i kosztową.
Hipoteza
Operatorzy telekomunikacyjni, którzy potrafią skutecznie wykorzystywać techniki analiz Big Data (wliczając w to zarówno analizę danych strukturalnych, jak i danych wielostrukturalnych), mogą uzyskać bardziej precyzyjny obraz klienta, być w stanie lepiej przewidywać jego potrzeby oraz zwiększyć jego lojalność, przez co zmniejszy się ilość odejść klientów, tzw. churn.
Analiza odejść klientów (analiza churn)
W celu lepszego zrozumienia istoty analityki w obszarze churn spójrzmy na typowego dużego operatora mobilnych usług telekomunikacyjnych (na potrzeby tego artykułu nie omawiamy usług przedpłaconych). Posiada on bazę klientów abonamentowych przekraczającą 5 mln, która generuje codziennie ogromną ilość danych transakcyjnych. Dane te powinny być analizowane w czasie często krótszym niż jedna doba. Analiza tych danych umożliwi operatorowi lepsze przewidywanie odejść klientów, a w następnym kroku podjęcie działań zmierzających do redukcji odejść klientów.
Robiąc ostrożne szacunki, przyjmijmy, że każdy z wyżej wspomnianych 5 mln klientów generuje tzw. ARPU (ang. average revenue per user) około 50 złotych. Średni czas życia klienta to 24 miesiące, a wskaźnik odejścia klientów oscyluje na poziomie 10% rocznie (uwaga: wszystkie wartości zostały świadomie zaniżone w celu uzyskania bardziej konserwatywnych wyników). Zatem kwota, która jest zagrożona odejściem klientów, wynosi 600 mln złotych i to tylko dla średniego czasu życia klienta (24 miesiące×50 złotych×10%×5 mln). Należy dodać, że powyższa kwota nie zawiera nawet utraconych kosztów akwizycji.
Analityka Big Data
Termin Big Data przeżywa obecnie medialny renesans. Dzisiaj analityka Big Data jest traktowana jako złoty środek na poprawę skuteczności biznesu i osiągnięcie przewagi konkurencyjnej. Tak jest mimo tego, że rozumienie samego terminu Big Data jest rozmyte, a wiele firm próbuje, każda na swój sposób, dokładniej zrozumieć, co analityka Big Data naprawdę oznacza dla ich biznesu.
Kosztowne w sensie obliczeniowym algorytmy analityczne, które w przeszłości ze względu na brak dostępnej mocy nie zyskały na popularności, są dzisiaj całkowicie możliwe do wykorzystania w biznesie. Jednocześnie dostępność wystarczającej wydajności obliczeniowej umożliwiła powstanie nowych typów analiz, zwanych analizami eksploracyjnymi. Cechuje je znacznie większa swoboda w podejściu zarówno do analizowanych danych, jak i wyboru samych analiz, ale także iteracyjny charakter zapytań w cyklu: hipoteza – dowód, hipoteza – dowód itd. Im więcej przeprowadzonych cykli hipoteza – dowód, tym większe szanse na dokonanie ciekawych odkryć w zależnościach danych i tym samym większe szanse na zwiększenie skuteczności modelu przewidywania odejść.
Większość dużych firm telekomunikacyjnych od dawna wykonuje regularnie analizy statyczne związane z danymi strukturalnymi. W tym celu firmy wykorzystują zazwyczaj korporacyjne hurtownie danych lub też rzadziej mniejsze operacyjne bazy danych. Hurtownie zapewniają sprawny proces selekcji i transformacji danych oraz przechowywania tych danych w odpowiednich strukturach, dostosowanych do zakresu i rodzaju wykonywanych analiz. Hurtownie są też w stanie efektywnie przechowywać typowe dane transakcyjne, takie jak np. wykonane połączenia, czy też dane (miary) pochodne, jak np. średnia liczba wykonanych połączeń w danym okresie rozliczeniowym wraz z lokalizacją geoprzestrzenną klienta.
W przeciwieństwie do danych strukturalnych dane wielostrukturalne jest trudniej mierzyć, niełatwo uzyskać, trudno przechowywać, a także niełatwo łączyć z danymi strukturalnymi. Oznacza to, że dane wielostrukturalne nie są przechowywane w tradycyjnej indeksowanej relacyjnej bazie danych. Natomiast znaczenie danych wielostrukturalnych jest ogromne, ponieważ dane te opisują interakcje między klientem a firmą i nie są ograniczone jedynie do danych opisujących transakcje. Niestety dane wielostrukturalne nie są ani przechwytywane, ani składowane tak jak dane strukturalne (tradycyjne) i wymagają one innych, dedykowanych rozwiązań.
Analityka Big Data. Wizualizacja
Na poniższym rysunku widać koncentracje wybranych zdarzeń pochodzących z różnych kanałów kontaktu klienta z operatorem, takich jak: wizyta w punkcie sprzedaży, rozmowa z call center, a także aktywność w sieci Web, które wszystkie zakończyły się ostatecznie zmianą statusu subskrypcji na „nieaktywny”.
Z kolei analiza aktywności w sieci Web uwidacznia, że aktywność sprowadza się głównie do weryfikacji kontraktu, przejrzenia zestawu najczęściej zadawanych pytań z odpowiedziami w kwestii wypowiedzenia umów. Na pozór prosta poniższa analiza wymaga transformacji wielu terabajtów danych pochodzących z wielu różnych systemów informatycznych. Ujednolicenie tych danych to jedno z głównych wyzwań w analizie Big Data.

Eksploracja nowych zmiennych
W analityce Big Data bardzo ważnym elementem jest możliwość wizualizacji danych. Osoby, które miały już do czynienia z modelowaniem, wiedzą najlepiej, jak ważnym aspektem jest odpowiednia wizualizacja w szukaniu ścieżek sekwencji i wzorca. Przykładowo, nowoczesne platformy analityki Big Data umożliwiają szybką i łatwą wizualizację przepływu zdarzeń w postaci grafu odzwierciedlającego wszystkie możliwe ścieżki przepływu. Dedykowane wizualizacje pozwalają na szybkie uchwycenie ścieżek prowadzących do odejścia klienta. Identyfikacja takich ścieżek wykonywana jest za pomocą funkcji npath, którą wywołuje się bezpośrednio z języka SQL.
Odpowiednia wizualizacja istotnie zwiększa produktywność modelowania, ponieważ pozwala na odciążenie analityków od uciążliwych i pracochłonnych niskopoziomowych prac przygotowawczych. Umożliwia to analitykom skupienie się na poszukiwaniu zjawisk, które mogą mieć istotną wartość biznesową dla firmy.
Odpowiednia platforma analityki Big Data – posiadająca dobre, zintegrowane narzędzia wizualizacji danych Big Data – pozwala wykonać skomplikowaną, iteracyjną analizę poszukiwania zjawisk. W ten sposób możliwe jest uchwycenie już na wstępnym etapie właściwych sekwencji i zdarzeń, które prowadzą do odejścia klienta. Wnioski z odpowiednio zwizualizowanych danych (wykresów) mogą zostać szybko przetransformowane na zmienne, które zastosowane w tradycyjnych modelach zwiększą skuteczność przewidywania odejść klientów.
Dwa modele analizy danych
Na poniższym rysunku widać doskonale komplementarność dwóch modeli. Operator, który zdecyduje się na wdrożenie analiz szukania wzorca, dostrzeże, że oba modele, tj. tradycyjny i Big Data, wyłapują zupełnie innych klientów zagrożonych odejściem. Dlatego też można postawić tezę, że sukces biznesowy wdrożenia analityki Big Data w dużej mierze będzie zależeć od funkcjonowania obu modeli równolegle.

Trzy argumenty przemawiające za Big Data
Potencjał tkwiący w metodach analizy Big Data jest od kilku już lat skutecznie wykorzystywany przez firmy internetowe (e‑commerce). Obecnie podobny trend zaczyna być obserwowany w sektorze telekomunikacyjnym i sektorze finansowym. Firmy zaczynają powoli odnosić wymierne korzyści biznesowe płynące z praktycznego wdrożenia rozwiązań Big Data w ich działalności operacyjnej.
W analityce Big Data bardzo ważnym elementem jest możliwość wizualizacji danych. Jest ona ważnym aspektem w szukaniu ścieżek sekwencji i wzorca.
Podsumujmy korzyści wynikające z zastosowania analityki Big Data.
Po pierwsze, dzięki np. wykorzystaniu analizy sekwencji zdarzeń, szukaniu wzorców opartych na wszystkich dostępnych danych strukturalnych i wielostrukturalnych (np. Web logs), można stworzyć szereg nowych markerów behawioralnych. Pozwalają one zbudować bardziej precyzyjne modele churn zdolne przewidywać odejścia klientów.
Po drugie, analityka Big Data stopniowo zmienia obecny sposób wykorzystania danych dotyczących zachowań klientów. Wiedza uzyskana poprzez analizę danych wielostrukturalnych pozwala na znacznie wcześniejszym etapie testować i dostosowywać praktyki biznesowe. Operator posiadający zdolność analizy Big Data może szybciej uzyskać dostęp do wiedzy, która wskaże, jakie zachowania klientów i operatora mogą doprowadzić do zerwania kontraktu. Dzięki tej informacji operator może podjąć działania, które mogą ten proces powstrzymać.
Po trzecie, analityka Big Data nie eliminuje tradycyjnych metod, które z powodzeniem mogą być stosowane, co ma istotne znaczenie z punktu widzenia ochrony wcześniej dokonanych inwestycji. Nie można zastąpić metod tradycyjnych metodami Big Data (i odwrotnie). Należy stosować równolegle obie metody, a zastosowanie tych dwóch metod pozwoli na osiągnięcie najlepszego wyniku końcowego.
Przedstawiony przykład odnosi się do projektów Big Data przeprowadzonych dla operatorów telekomunikacyjnych, ale zastosowanie przedstawionej metody może być łatwo dostosowane do specyfiki innych branż.