Never leave it in the hands of the judges

Como a grande maioria dos pre-adolescentes bobos nos anos 90 eu adorava assistir filmes de luta como “O grande dragão branco”, “Leão branco”, “Kickboxer”, você já entendeu a tendência…Todos os filmes do Van Damme, basicamente.

Porém, toda a graça acabou como um passe de mágica quando um colega e eu alugamos 3 fitas de video com os primeiros “The ultimate fighting championship” (UFC), era como se um sonho tivesse virado realidade já que era possível ver lutadores de diferentes estilos em combates totalmente livres de regras, era como “O grande dragão branco” com muito menos carisma.

Vinte e poucos anos se passaram desde aquele momento de descoberta e aquilo que era considerado uma barbárie ganhou regras, se profissionalizou e hoje é um dos esportes que mais cresce no mundo conseguindo chegar a um tamanho inimaginável pelos fans do esporte, sendo recentemente vendido por $4 bilhões de dólares.

Provavelmente assisti 90% de todos os eventos oficiais (os numerados), alguns UFC fight nights e até alguns “The ultimate fighters”, então é bem provável que eu tenha assistido alguns milhares de combates, porém em uma recente conversa com amigos, declarei que não tenho mais o interesse que tinha antes pelo esporte, exceto por algumas poucas lutas principais, o problema é que não consegui explicar o porque disso.

Os fãs citam diversos fatores, entre eles o principal sendo o excesso de exposição, já que é possível ver eventos praticamente todas as semanas, então não é mais um bem tão escasso como era antigamente, porém eu desconfio que não é só isso, minha opinião é que os eventos estão mais chatos* na média, que muitos lutadores lutam para não perder ao invés de ganhar e que a grande maioria de técnicas já está arbitrada, portanto é mais difícil surpreender o oponente e principalmente a audiência com uma técnica nova, como a revolução que o jiu-jitsu Brasileiro fez no esporte.

Primeiramente tenho que definir o que é um ‘evento chato’. Nocautes e Submissões são legais, são surpreendentes e inesperados, não existe uma forma melhor de definir o triunfo de um lutador sobre o outro. Em contraste, lutas que terminam por pontos são menos interessantes, pois elas terminam (na grande maioria dos casos) sem um vencedor claro e esse término é artificial, forçado e, pior ainda, são 15 ou 25 minutos em que nada aconteceu. Portanto, um evento como um todo pode ser definido como chato ou interessante baseado no número de KOs/Submissões sobre o número total de lutas.

Dada esta definição, vamos olhar para o comportamento dos eventos ao longo do tempo. No gráfico abaixo calculo a razão entre KO+Sub sobre o número total de lutas. Os eventos vão desde o primeiro UFC em 1993 até o Fight Night 83 em 2016-02-21, para um total de 3.569 lutas (os dados podem ser encontrados nesse link)

ko_sub

Nos primeiros eventos, até o final dos anos 90, as regras eram poucas (bem poucas) e as lutas não eram divididas em rounds, o que obviamente infla o número de finalizações de lutas, mas mesmo com uma grande variância entre os eventos, na média o número de finalizações caiu de 3 em cada 4 para pouco mais que 1 a cada 2 lutas.

Uma das explicações para esse número em declínio pode ser que o Jiu Jitsu foi assimilado pelos lutadores e atualmente finalizações por submissão são bem mais raras do que antigamente. Olhando para o gráfico abaixo é difícil tomar essa explicação como sendo a maior causa do problema, pois o o número de KOs em relação as Submissões aumentou um pouco ao longo do tempo, mas ainda 1 em cada 3 finalizações é devido a submissões.

ko_sub

Outra explicação pode ser dada com a introdução de categorias de peso mais baixas, principalmente depois da compra do WEC (World Extreme Cagefighting) a qual era a casa dos lutadores menores. O gráfico abaixo mostra o percentual de lutas finalizadas por classe de peso.

weight

Tem um tempo que comento com meus colegas que pouca coisa é mais legal que luta de pesos pesados no UFC, imagine duas pessoas que possuem mais músculos e gordura do que é humanamente aceitável, os quais possuem força para nocautear seus oponentes com apenas 1 soco e são incapazes de se esquivar tão bem quanto as categorias mais leves. Toda luta é uma surpresa, nenhum campeão dos pesos pesados conseguiu manter seu cinturão por muito tempo, é a roleta russa do UFC, por isso uma de minhas lutas preferidas foi a do Minotauro vs Bob Sapp em 2002. Ok, o Bob Sapp nem era um oponente tão respeitado assim, mas vale lembrar que sem o espetáculo não teríamos uma empresa tão grande quanto o UFC é hoje.

Acredito que consegui quantificar parte da minha insatisfação com o UFC atualmente, não é o excesso de eventos, mas sim o excesso de lutas em que nada acontece, com lutadores pequenos que ficam pulando por 25 minutos na tela incapazes de realizar qualquer movimento remotamente ameaçador. O UFC tem feito um bom trabalho em manter o evento interessante e os lutadores chatos são removidos dos eventos principais através da seleção natural, mas dificilmente retornaremos para os números do passado, não enquanto os lutadores estiverem lutando para não perder ao invés de lutando para ganhar.

Por fim, existe uma probabilidade de 29% de uma luta acabar no primeiro round com um KO ou Submissão, se isso não aconteceu, essa probabilidade cai para 23% de acontecer no segundo round, porém se a luta não terminou ainda, a probabilidade de uma finalização no terceiro round cai para 15,5% nos próximos rounds (caso a luta vá até 5), ou seja, se nada aconteceu no primeiro round, pode até ser que ocorra no segundo, caso nada ocorra, pode ser um bom motivo para desligar a televisão e ir dormir mais cedo, visitar o banheiro, buscar uma cerveja, abrir o facebook etc, pois é bem provável que nada aconteça mesmo…

Arborização e o preço dos imóveis em São Paulo

Parece meio óbvio, mas será que é possível verificar uma correlação positiva entre a arborização de um local e os preços dos imóveis?

Outro dia, ao ir almoçar sozinho debaixo de um belo sol ‘de rachar’, de camiseta preta e sem uma única sombra para me ajudar comecei a delirar divagar sobre os prós e contras daquele local de trabalho. Por conta do momento, a falta de arborização naquele local era um ‘contra’, mas em oposição um fator positivo era o custo do aluguel (entre outros).

Por sorte temos o site http://geosampa.prefeitura.sp.gov.br/ que disponibiliza dados gerais sobre a cidade, como arborização, por exemplo:

arvores

Com esses dados, agregados aos da prefeitura de tamanho das subprefeituras e distritos podemos calcular o número de árvores por km²

top10

Eu poderia parar a análise por aqui já que quem mora/conhece a cidade de São Paulo sabe que esses são os bairros mais caros, porém vale a pena dar uma olhada nos preço médio do m² e comparar com a arborização do local.

Usando dados do properatidata.cartodb.com de preço de m² por distrito é possível criar o gráfico abaixo:

modelo

Razoável…

Obviamente existem diversos fatores que contribuem para o preço de um imóvel e é bem possível que a arborização de um local tenha uma importância boa em um modelo para prever preços de imóveis, como um modelo mais complexo que criei há um tempo atrás…

https://dadosdadosdados.wordpress.com/2015/09/15/alugueis-em-sao-paulo-um-benchmark/

Aluguéis em São Paulo – Um benchmark

No link abaixo criei um simulador de preços de aluguéis. Com ele é possível observar um benchmark de preços em alguns bairros de SP considerando diferentes variáveis. Clique nos círculos para ver o preço:

https://sandortucakov.shinyapps.io/Aluguel_Demo_1

Simulador de Aluguéis

Motivação – Qual o preço justo para pagar em um aluguel?

Trocar de imóvel é uma decisão complicada que envolve vários fatores, como pesar todos esses fatores na hora de tomar uma decisão e ainda pagar um preço justo por ele? Ou, se temos um imóvel para alugar, qual é o maior preço que posso cobrar ao mesmo tempo em que alugo meu imóvel rapidamente?

Até algum tempo atrás nossa única opção seria conversar com um corretor, afinal, eles possuem a informação que eu preciso, certo? Ou fazer a boa e velha conta de padeiro onde descobrimos perguntando para o porteiro/zelador do prédio por quanto o apartamento do vizinho foi alugado, fazemos aquele cálculo rápido para avaliar as condições do nosso imóvel em relação ao que foi alugado e definimos um preço.

A profissão do corretor é uma que está com os dias contados. Toda vez que tenho que falar com um, saio com um estranho sentimento de dependência, de que não tenho toda informação necessária para tomar uma decisão e de que posso estar pagando mais caro do que eu deveria por algo.

Acredito que no caso de uma pessoa que tem um imóvel para alugar o sentimento é o mesmo, porém as dúvidas são basicamente duas, cobro barato para alugar rápido ou aguardo um pouco?

Quando o mercado estava em ascensão até 2014 a resposta era fácil, mas agora o jogo é outro…

Informação, informação por todo lado

Vivemos na era da informação e hoje é possível conseguir muitos dados sobre produtos/serviços que antigamente lucravam exclusivamente da falta de informação de uma das partes.

Ainda não é possível eliminar totalmente a assimetria. No mercado de carros um limão continua sendo um limão e um imóvel lindo que você visitou no domingo de manhã pode ser tristemente localizado perto de um boteco que toca forró de sábado a noite ou o vizinho de cima do apartamento tem duas crianças lindas que não param de pular o dia inteiro!

Mas convenhamos, um corretor nunca vai te contar esses detalhes mesmo…

Felizmente, existem alguns sites que facilitam a descoberta de informações. Variáveis como tamanho do imóvel, número de quartos, localização e até seu preço são disponibilizadas para facilitar a vida do usuário…

Ou não…

O problema…

Fui fazer uma pesquisa simples no Zap Imóveis: ‘Apartamento, São Paulo’ para ver o que aparecia e rapidamente apareceram 1.630 páginas com 20 anúncios cada (+32.000), refinar a pesquisa ajuda, mas ainda assim é tanta informação que é fácil se perder…

A Solução…

A solução foi baixar uma grande quantidade de dados do próprio Zap Imóveis e montar um sistema para tentar entender o lado da oferta de imóveis. Baixei mais de 8.085 anúncios no Zap imóveis com a seguinte pesquisa: ‘Apartamento, São Paulo’, nesses anúncios temos:

Bairro, Tipo (só apartamento), Rua, Cidade (Só São Paulo), Tamanho(em Metros quadrados), Preço do aluguel, Número de quartos, suítes e vagas.

Com o nome das ruas, utilizei o API do HERE (https://developer.here.com/) para descobrir a posição geográfica de cada um desses imóveis (latitude e longitude), depois calculei a distância desses imóveis do Metrô com a hipótese que imóveis próximos ao Metrô são mais caros.

De posse de todas essas variáveis, criei um modelo de Machine Learning para tentar prever o preço de aluguel de um imóvel baseado nessas variáveis.

O resultado pode ser visto no simulador

Próximos passos

Existem várias iniciativas que podem ser tomadas para melhora-lo, como por exemplo olhar o tipo de zoneamento de cada rua ou região, valor do condomínio, ano de construção do imóvel, características do imóvel e das áreas comuns, ‘tempo’ do anúncio, qualidade das fotos e por fim microrregiões dentro da cidade, afinal a mesma rua pode ser precificada de maneiras diferentes dependendo de onde o imóvel se encontra. Se possível, ter o endereço completo pode melhorar ainda mais o modelo.

Esses dados representam somente do lado da oferta, porém algo que fica fora do alcance da minha aplicação são os dados do lado da demanda. Quais imóveis estão sendo efetivamente alugados? Por quanto? Quanto tempo um anúncio fica em média no site? Supondo uma economia mais fraca para 2016, o que acontece? Qual a probabilidade de se alugar um imóvel pelo preço X?

E por aí vai…