Aluguéis em São Paulo – Um benchmark

No link abaixo criei um simulador de preços de aluguéis. Com ele é possível observar um benchmark de preços em alguns bairros de SP considerando diferentes variáveis. Clique nos círculos para ver o preço:

https://sandortucakov.shinyapps.io/Aluguel_Demo_1

Simulador de Aluguéis

Motivação – Qual o preço justo para pagar em um aluguel?

Trocar de imóvel é uma decisão complicada que envolve vários fatores, como pesar todos esses fatores na hora de tomar uma decisão e ainda pagar um preço justo por ele? Ou, se temos um imóvel para alugar, qual é o maior preço que posso cobrar ao mesmo tempo em que alugo meu imóvel rapidamente?

Até algum tempo atrás nossa única opção seria conversar com um corretor, afinal, eles possuem a informação que eu preciso, certo? Ou fazer a boa e velha conta de padeiro onde descobrimos perguntando para o porteiro/zelador do prédio por quanto o apartamento do vizinho foi alugado, fazemos aquele cálculo rápido para avaliar as condições do nosso imóvel em relação ao que foi alugado e definimos um preço.

A profissão do corretor é uma que está com os dias contados. Toda vez que tenho que falar com um, saio com um estranho sentimento de dependência, de que não tenho toda informação necessária para tomar uma decisão e de que posso estar pagando mais caro do que eu deveria por algo.

Acredito que no caso de uma pessoa que tem um imóvel para alugar o sentimento é o mesmo, porém as dúvidas são basicamente duas, cobro barato para alugar rápido ou aguardo um pouco?

Quando o mercado estava em ascensão até 2014 a resposta era fácil, mas agora o jogo é outro…

Informação, informação por todo lado

Vivemos na era da informação e hoje é possível conseguir muitos dados sobre produtos/serviços que antigamente lucravam exclusivamente da falta de informação de uma das partes.

Ainda não é possível eliminar totalmente a assimetria. No mercado de carros um limão continua sendo um limão e um imóvel lindo que você visitou no domingo de manhã pode ser tristemente localizado perto de um boteco que toca forró de sábado a noite ou o vizinho de cima do apartamento tem duas crianças lindas que não param de pular o dia inteiro!

Mas convenhamos, um corretor nunca vai te contar esses detalhes mesmo…

Felizmente, existem alguns sites que facilitam a descoberta de informações. Variáveis como tamanho do imóvel, número de quartos, localização e até seu preço são disponibilizadas para facilitar a vida do usuário…

Ou não…

O problema…

Fui fazer uma pesquisa simples no Zap Imóveis: ‘Apartamento, São Paulo’ para ver o que aparecia e rapidamente apareceram 1.630 páginas com 20 anúncios cada (+32.000), refinar a pesquisa ajuda, mas ainda assim é tanta informação que é fácil se perder…

A Solução…

A solução foi baixar uma grande quantidade de dados do próprio Zap Imóveis e montar um sistema para tentar entender o lado da oferta de imóveis. Baixei mais de 8.085 anúncios no Zap imóveis com a seguinte pesquisa: ‘Apartamento, São Paulo’, nesses anúncios temos:

Bairro, Tipo (só apartamento), Rua, Cidade (Só São Paulo), Tamanho(em Metros quadrados), Preço do aluguel, Número de quartos, suítes e vagas.

Com o nome das ruas, utilizei o API do HERE (https://developer.here.com/) para descobrir a posição geográfica de cada um desses imóveis (latitude e longitude), depois calculei a distância desses imóveis do Metrô com a hipótese que imóveis próximos ao Metrô são mais caros.

De posse de todas essas variáveis, criei um modelo de Machine Learning para tentar prever o preço de aluguel de um imóvel baseado nessas variáveis.

O resultado pode ser visto no simulador

Próximos passos

Existem várias iniciativas que podem ser tomadas para melhora-lo, como por exemplo olhar o tipo de zoneamento de cada rua ou região, valor do condomínio, ano de construção do imóvel, características do imóvel e das áreas comuns, ‘tempo’ do anúncio, qualidade das fotos e por fim microrregiões dentro da cidade, afinal a mesma rua pode ser precificada de maneiras diferentes dependendo de onde o imóvel se encontra. Se possível, ter o endereço completo pode melhorar ainda mais o modelo.

Esses dados representam somente do lado da oferta, porém algo que fica fora do alcance da minha aplicação são os dados do lado da demanda. Quais imóveis estão sendo efetivamente alugados? Por quanto? Quanto tempo um anúncio fica em média no site? Supondo uma economia mais fraca para 2016, o que acontece? Qual a probabilidade de se alugar um imóvel pelo preço X?

E por aí vai…