# Melhorias QL
## Descrição do produto atual

**Figura 1:** Interface atual do produto
O produto atual, descrito na figura 1, se divide em duas features: (1) Nível de interesse, (2) Preferências do cliente.
### (1) Nível de interesse
Essa feature retorna a qualificação do lead realizado por um **usuário** para um determinado **carro**, com base nos últimos **três meses** de histórico de interações desse usuário com o site do iCarros.
Para gerar essa qualificação, primeiramente duas inferências são feitas, (1) uma medida do interesse do usuário pelo carro e (2) uma medida da indecisão do usuário.
A combinação dessas duas medidas geram um score (figura 2), o score por sua vez gera a mensagem (figura 3) que aparece no produto final (figura 1).

**Figura 2:** Mapa dos scores gerados pela combinação das medidas de "interesse" e "indecisão" do usuário

**Figura 3:** Mensagens geradas no produto final, com base nos possíveis scores gerados pelo processamento dos dados do usuário
#### (1) interesse pelo carro
Seja \<c\> o carro que o usuário interagiu, a medida "interesse pelo carro" é definida por:
$$
\dfrac{\text{Quantidade de interações com o carro <c>}}{\text{Quantidade total de carros que o usuário interagiu}}
$$
#### (2) Indecisão do usuário
A medida de indecisão leva em conta o quão diferente são os outros carros que o usuário interagiu, em relação ao carro \<c\>. Para definir o quão diferente os carros são, uma tabela fixa de distâncias de categorias de carros é utilizada, também existe uma tabela de distâncias entre classes de carros que é utilizada no processamento.

**Figura 4:** Distâncias pré estabelecidas de cada combinação de categorias de carros, ou seja, medidas das diferenças entre as categorias
### (2) Preferências do cliente
Essa feature apresenta os top 5 valores de características dos carros que o usuário mais interagiu nos últimos três meses, sendo estas:
1. Categoria
2. Marca
3. Modelo
4. Preço
5. Cor
6. Ano do modelo
7. Cidade do anúncio
## Mudanças - próxima versão
### (1) Nível de interesse
- Ainda levamos em conta as interações do usuário com o site nos últimos três meses para chegar no resultado do qualificador, porém o processamento nos dados esta bem diferente.
Primeiramente, foi implementada uma forma mais robusta de definir o quão diferente são dois carros, levando em conta as diferenças das seguintes características:
- anoinicial
- anofinal
- potencia
- torque
- velocidademax
- tempo0a100
- tanque
- consumocidade
- consumoestrada
- altura
- largura
- comprimento
- portamalas
- cilindradas
- precozerokm
- ocupantes
- entreeixos
- Partindo dessa nova forma de calcular as distâncias entre os carros, um modelo de machine learning é aplicado, Gaussian mixture model (GMN), para agrupar os carros em que o usuário interagiu, ja comparando esses carros com o carro \<c\> (\<c\> ainda é o carro que o usuário fez o lead e estamos qualificando).
O resultado final do processamento é definido em cima dos valores retornados pelo GMN, médias e pesos dos grupos.

**Figura 5:** Resultado do modelo do agrupamento dos carros para um caso específico. Quanto mais mais próximo de zero for a média do grupo, significa que este é mais parecido com o carro que o usuário fez o lead. O peso do grupo indica o quão representativo este grupo é para o usuário
- Atualização do resultado: Com o passar do tempo, o comportamento do usuário no site pode mudar e com isso o resultado do qualificador também. Nessa nova versão teremos uma entrega dinâmica do nível de interesse do usuário, para isso é necessário que alguma notificação de mudança de resultado seja entrege ao anunciante, penso também que seja importante o anunciante conseguir acompanhar todo o histórico de interesse do usuário.
- Novas mensagens:
- **Cliente no início da busca por carros -** O cliente parece estar começando a entrar na jornada de compra de um carro, pois realizou poucas buscas em nosso catálogo. Não há informações suficientes para gerar um relatório, mas é uma boa chance de ajudá-lo a tomar boas decisões em relação à qual carro comprar e, futuramente, fechar uma venda.
- **Cliente mais interessado em outros tipos de carro -** O cliente costuma procurar por carros diferentes desse tipo nas últimas semanas, apresentando maior intenção de compra para outros carros, de acordo com suas buscas pelo catálogo da iCarros. Seus interesses podem estar começando a mudar ultimamente. Tente destacar as vantagens do seu carro ao tentar captar este cliente.
- **Usuário curioso pelo carro anunciado -** O usuário busca por diversos carros diferentes, o que gera uma incerteza quanto a sua decisão de compra. Tente destacar as vantagens do seu carro ao tentar captar este cliente.
- **Usuário demonstra bastante interesse por carros como o anunciado -** O usuário se mostra bastante interessado por carros como o anunciado, segundo suas buscas na iCarros, porém apresenta interesse por outros modelos bem diferentes. Tente destacar as vantagens do seu carro ao tentar captar este cliente.
- **Cliente muito interessado em carros como o anunciado -** O cliente tem se mostrado MUITO interessado por carros desse tipo nas últimas semanas, de acordo com suas buscas pelo catálogo da iCarros. Essa é uma boa oportunidade de captar um cliente e fechar uma venda.
**Obs:** As mensagens acima resumem o resultado obtido pelo processamento, mas definir a melhor forma de informar o resultado para o cliente vai além do escopo da ciência de dados. Por isso peço que validem essas mensagens, criem ideias mantendo a essência de cada mensagem.
### (2) Preferências do cliente
- Adição da **km** nas características exibidas.
### (3) Inclusão de uma nova feature
Nessa feature, será passado para o anunciante os carros que ele possui no seu estoque (que possuem anúncios ativos no site do iCarros) que mais podem interessar ao usuário, em ordem de interesse e com um score bem definido, no valor de 1-10.
**Obs:** Para a implementação dessa nova feature é necessário planejar o front-end do produto, onde e de qual maneira essa feature será exibida para o anunciante?
## Esforço - novas melhorias
1. Informar a quantidade de leads gerados/ enviados no icarros pelo lead/prospect
- esforço: baixo
3. Informar a quantidade de simulações de financiamento realizadas (finalizadas ou não) pelo lead/prospect
- esforço: baixo
5. Tempo de jornada do cliente pesquisando no site icarros
- esforço: baixo
7. Incluir a categorização de Lead Super Quente para melhorar a percepção de valor do QL
- esforço: alto
- obs: Em uma conversa com o Michele ele levantou a questão da utilidade dessa informação para o anunciante. Já ocorreu alguma coleta de feedbacks desse questionamento com os clientes?
9. Permitir qualificar os leads dos concorrentes dentro do GL que tiveram interação no site do icarros/hotsite do feirão através das simulação de financiamento, envio de propostas/ leads, etc.
- esforço: indefinido
- obs: Em relação ao time de data science, é preciso:
1. mapear onde estão os dados
2. Entender melhor o desafio para avaliar a dificuldade da criação dos scripts que irão gerar os resultados.