Saturno, Machine Learning e Personas (como tudo isso está correlacionado)
Product Ride #3 - Como encontrar personas utilizando o algoritmo K-means do Machine Learning.
👋 Olá, aqui é o Sulivan Santiago, CTO da Lincon Health. Na minha caminhada ajudei milhares de empreendedores e intraempreendedores a lançarem seus produtos no mercado. Esta newsletter é um compilado de insights, análises, conteúdo e minhas próprias loucuras na jornada de zero a um.
Hoje começamos a là “Documentário”. O conteúdo está denso, com vídeos, ferramentas e muita leitura. Pegue sua pipoca e vamos nessa.
Em 1608 um holandês de nome Hans Lipperhey anunciou um novo instrumento que fazia objetos distantes parecerem mais perto. Galileu Galilei (físico, matemático, filósofo e astrônomo italiano) ficou maravilhado na época, a tal ponto de construir o seu próprio! A invenção? O telescópio. Desde então, Galileu nunca mais olhou para o céu da mesma forma. Diversas descobertas da astronomia viriam a partir dali. Particulamente, em 1610, ele observou Saturno pela primeira vez por meio do instrumento. Algo estava estranho. O planeta parecia completamente diferente se comparado ao que era visto pelos olhos nus dos nossos ancestrais.
Curiosidade😳: Saturno é um dos 5 planetas que podem ser vistos a olho nu da terra (os outros são Mercúrio, Vênus, Marte e Júpiter)
Pela qualidade rudimentar do equipamento ele observou que Saturno era formado por 3 corpos celestiais, o planeta em si e outras duas grandes luas, sendo uma de cada lado. Ele documentou desta forma:
Saturno por Galileo Galilei em 1610, imagem meramente ilustrativa.
Poucos anos depois Galileu olhou de novo para Saturno e não haviam mais “luas” lá. Elas tinham sumido (hoje sabe-se que ele olhou para os anéis em um ângulo que não era possível percebê-las, de lado). Em 1616 ele volta a ver as “luas”. Porém, agora tinham um formato diferente. Pareciam “braços”.
🛸👽 Mistério 👽🛸
49 anos mais tarde Christiaan Huygens resolveu o problema. Graças ao avanço ótico nos telescópios ele deduziu corretamente que existia um sistema de anéis.
Saturno por Christiaan Huygens (publicação de 1655)
A dupla telescópio e olho nu continuam jogando forte até hoje. Juntos, formam o método Direct Imaging para detectar planetas diretamente. Em 2018 foram descobertos mais de 20 planetas desta forma.
Mas, há limitações no Direct Imaging e são necessários outros caminhos se quisermos ir além. Um método popular nos dias de hoje se chama Transiting. Ele mede a intensidade da luz das estrelas e deriva potencias planetas que as orbitam quando há uma queda na luminoside. Difícil de entender por palavras, mas a imagem abaixo explica por si só.
Fonte: American Museum of Natural History
Em 2018 foram encontrados mais de 3.000 planetas com essa tecnologia. Que salto expressivo! O método Transiting é 150x mais poderoso que o Direct Imaging. 😮
Esta história toda me lembra a forma tradicional de como criamos personas.
A forma tradicional, digamos que seja o equivalente ao Direct Imaging, funciona mais ou menos assim:
Uma pesquisa é realizada com seus usuários
Então, identifica-se padrões comportamentais e demográficos de forma mais artística e manual
Por fim, cria-se a persona (podendo ser ainda um protótipo a ser refinado, o que chamamos de proto-persona, ou algo mais definitivo)
O desafio vem para produtos com uma escala significativa de usuários. Acaba-se perdendo a habilidade de refinar/definir/encontrar personas por meio do método tradicional.
Indo além com Machine Learning e algoritmos de categorização (ou “clusterização”)
⛔ Pausa! ⛔
🚩 Nota ao leitor: Fique comigo, não vou ficar falando de matemática, estatística, programação ou lógica de forma pesada. O objetivo é tornar o complexo tangível e fácil.
Nosso equivalente ao Transiting, uma ferramenta 150x melhor, é o uso do Machine Learning. Especialmente algoritmos de clusterização. Clusterização é a a identificação de elementos não categorizados feita automaticamente. Veja a imagem abaixo:
Fonte: https://www.javatpoint.com/clustering-in-machine-learning
Nós não dizemos ao computador o que é uma pêra, maçã ou morango. Ele simplesmente as identifica automaticamente por similaridades. Daí a aplicação para personas! Imagine reunir informações de comportamentos de seus usuários e entregar ao algoritmo para que sejam identificados os similares? Você pegou a ideia né!? Não se aprende a nadar sem entrar na água. Então, vamos mergulhar!
Aplicando na prática.
[os dados a seguir foram alterados e anonimizados]
Antes de mais nada, eu preciso agradecer ao Rubem Vasconcellos que me ajudou com os dados do estudo. Ele é super estudioso da área de produtos e tecnologia! Grande amigo e parceiro. Vale dizer que os dados são anonimizados! Logo, estamos cobertos pela LGPD. A LGPD classifica dados anonimizados como aqueles que não são possíveis de fazer engenharia reversa para identificar o seu titular. Você vai observar que a planilha possui dados como idade e valores, mas estes foram também alterados impossibilitando assim a identificação dos usuários por qualquer meio técnico do nosso lado.
Passo 1: Reúna os comportamentos que você acredita ser importante. É necessário que seja um número. Por exemplo: Número de Compras, Quantidade de Downloads, Número de Visitas e etc. É importante entender, no seu contexto, quais variáveis de comportamento têm forte influência na categorização dos seus dados. Para ilustrar, para um ecommerce dados como quantidade de compras por ano, ticket médio e quantidade de itens médio por compra são melhores opções frente a quantidade de tempo no site ou número de comentários por exemplo. É importante pensar com calma nos atributos que você vai considerar. Aqui vale um brainstorm com seu time para entender que dados estão disponíveis e a qualidade deles.
Crie uma planilha e exporte para .csv. Ela será utilizada no Passo 2.
Print das primeiras 5 linhas da planilha de dados modelo do artigo.
Passo 2: Rodar o algoritmo! Configurar um ambiente de machine learning pode ser desafiador para quem não é da área. Então, para superar esta potencial dificuldade, vamos utilizar o Google Colab (um ambiente já montado em máquina virtual para você rodar seu estudo). Você não precisa configurar nada. Basta acessar este link e mudar algumas coisinhas que vou te mostrar abaixo.
Passo 3: Customizar para sua necessidade. Neste passo eu separei um vídeo de 7min para você me acompanhar nos ajustes (dica, coloque na velocidade 1.5x).
Pass 4: Retirar conclusões e definir um plano de ação. No nosso exemplo as seguintes personas foram identificadas:
Como lemos os dados acima? O grupo blue (azul) seria assim:
São clientes de 173 dias de cadastro. Transformando os dias para meses temos 5.7 meses. Na média são 38 anos de idade, com ticket médio de R$2.907 e 24 produtos no carrinho (arredondando).
Temos que fazer isso para todos os grupos identificados e em seguida tirar as nossas conclusões:
Persona 1 (blue/azul):
Tempo como cliente: 5.7meses
Idade: 38 anos
Ticket Médio: R$2.907
Produtos no Carrinho: 24
Persona 2 (red/vermelho):
Tempo como cliente: 1 ano e 3meses
Idade: 41 anos
Ticket Médio: R$458
Produtos no Carrinho: 6
Persona 3 (green /verde):
Tempo como cliente: 5.4 meses
Idade: 39 anos
Ticket Médio: R$531
Produtos no Carrinho: 4
Quais seriam as possíveis recomendações/plano de ação baseado no aprendizado acima?
Grupo blue/azul: São clientes recentes com muitos produtos adquiridos e um ticket médio alto. Você poderia sugerir mais produtos de ticket alto para eles, ofertar produtos complementares ou trabalhar estratégias de member-get-member, já que são possíveis fãs pelo pouco tempo e alto volume de produtos.
Grupo red/vermelho: São clientes mais antigos que consomem pouco e com ticket médio baixo. Ações de engajamento como ofertas e promoções podem ser muito efetivas neste público. Outro detalhe é na visão de produto. Por que não entrevistá-los para entender o motivo que não compraram mais e de forma recorrente?
Grupo green/verde: São clientes recentes, com ticket baixo e poucos produtos adquiridos. Podemos ter ofertas exclusivas para este público que sejam voltadas ao engajamento. Como por exemplo, aproveite este cupom válido para suas primeiras 10 compras. Uma hipótese, já que existe o grupo azul, é que as pessoas estão com dificuldade de navegar no site para encontrar o produto ou tem uma objeção não respondida. Valeria também entrevistar esse pessoal para ir a fundo.
As conclusões acima podem ser muito mais poderesas se tivermos mais contexto de negócio e trouxermos mais características para análise. Um outro detalhe interessante é, você pode extrapolar esta análise para ações de vendas, marketing, melhoria de produto, testes segmentados… a criatividade aqui é infinita.
“In God we trust; all others must bring data”
- William Edwards Deming
Se gostou, não esqueça de encaminhar essa edição para seus amigos e parceiros.
Obrigado por ler até aqui. Fique à vontade para comentar abaixo ou me responder este e-mail contando o que achou.
Abraço,😉
Muito bom!!!