Resumo: | O conceito "valor de tempo de vida do cliente",Customer Lifetime Value(CLV) da literaturaanglo-saxónica, surgiu devido à necessidade de ao longo dos anos, as empresas reteremos clientes mais lucrativos. Conhecendo o valor de cada um dos seus clientes, as empresasconseguem alocar os seus recursos de forma mais consciente, bem como determinar omáximo de investimento que é viável fazer em cada cliente para o conseguir reter.Ao longo dos anos têm sido desenvolvidos vários métodos para a medição do CLV como,por exemplo, as abordagens RFM (Recency, Frequency and Monetetary Value), em que ovalor do cliente é calculado tendo por base as variáveis recência, frequência e valor mo-netário da compra, ou SOW (Share-of-Wallet) que consiste na simples segmentação dosclientes como "bons" ou "maus". Este tipo de soluções, mais antigas, tem como principaldesvantagem o facto de segmentarem os clientes, tendo apenas em conta a contribui-ção passada do cliente. Para ultrapassar este problema alguns autores propuseram, maisrecentemente, a utilização de modelos deMachine Learningeframeworksdebig datacon-seguindo obter uma maior precisão na previsão do CLV.Os objetivos deste estudo são a construção de modelos preditivos do CLV.Neste estudo, numa primeira fase, foi feita a revisão de literatura sobre o conceito deCLV, bem como sobre as técnicas usadas para o calcular e modelar. Seguiu-se a imple-mentação de modelos deMachine Learningnomeadamente dos modelosClassification andRegression Trees(CART),Random Forest(RF), Cadeias de Markov,Multi Layer Perceptron(MLP) e algoritmos declustering. No final fez-se uma comparação entre esses métodos ecaracterização de cada um dos grupos resultante da análise declusters.Odatasetusado provêm de uma instituição bancária portuguesa, incluindo variáveisdemográficas e sócio-económicas. A partir do conjunto inicial de variáveis foi feita aconstrução de novas variáveis, que foi sempre apoiada na revisão da literatura e simulta-neamente ajustada ao negócio bancário.Conclui-se que, as RF são o modelo que apresenta maior eficácia na previsão do CLV,registando um erro percentual de 5.98%.Neste estudo, foi também realizada uma análise declusterscom o propósito de obter ummelhor conhecimento dos produtos que suscitam interesse a cada grupo de clientes e con-sequentemente servir de base para desenhar campanhas demarketingpersonalizadas. Emparticular, foram encontrados 5clustersde clientes interesses e valores de CLV distintos.
|