Sistemas de Recomendação - Parte 2
-
Upload
ralph-rassweiler -
Category
Data & Analytics
-
view
162 -
download
1
Transcript of Sistemas de Recomendação - Parte 2
![Page 1: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/1.jpg)
Sistemas de Recomendação: uma visão geral (Parte 2)
Ralph J. R. Filho
![Page 2: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/2.jpg)
Tópicos
Parte I● Conceitos básicos● Exemplos usando MovieLens
Parte II● Algoritmos● Aplicações na Indústria● Pesquisa● Considerações Finais
![Page 3: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/3.jpg)
Parte IIIII. Algoritmos
![Page 4: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/4.jpg)
/ralphrass/recsysQuick and dirty
![Page 5: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/5.jpg)
COMO FAZER?Filtro colaborativo usuário-usuário
![Page 6: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/6.jpg)
Implementação
• Montar matriz de avaliações (Usuário x Item)• Calcular similaridades• Montar matriz de correlações
• Prever notas
• Ordenar as previsões • Mostrar os resultados
![Page 7: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/7.jpg)
Correlação
Toy Story Shawshank Redemption
Shindler’s list
Silence of the Lambs
Ana 4.5 5 4.5 4
Bruno 4 5 5 4.5
Similaridade: 0.426
![Page 8: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/8.jpg)
Correlação
Toy Story Shawshank Redemption
Shindler’s list
Silence of the Lambs
Filme Raro X
Ana 4.5 5 4.5 4 4
Bruno 4 5 5 4.5 1
Similaridade: 0.607
![Page 9: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/9.jpg)
Toy Story Shawshank Redemption
Shindler’s list
Silence of the Lambs
Filme Raro X
Ana 4.5 5 4.5 4 4
Bruno 4 5 5 4.5 1
Correlação
Similaridade: 0.607
![Page 10: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/10.jpg)
Correlação
• Simples e eficiente
• Ganha de várias outras medidas de similaridades para o filtro colaborativo entre usuários [Herlocker et al. 1999]
• Desconsidera popularidade dos itens (boa ou ruim)
• Predições saem da escala de avaliação (1-5 pode produzir predições de 6 ou até 7)
• Usuários que concordam em poucos, mas importantes, itens podem ter uma baixa correlação
![Page 11: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/11.jpg)
Filtro Colaborativo
•k-NN
• k entre 20 e 50 (Herlocker et al. 2002)
• k entre 20 e 30 (Coursera MOOC)
![Page 12: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/12.jpg)
Filtro Colaborativo
• Entre itens (Amazon)
• Pode ser calculado off-line porque as notas dos itens tendem a ser mais estáveis que as dos usuários (Sarwar B. et al. 2001)
• Indicado utilizar similaridade cosseno (Sarwar B. et al. 2001)
![Page 13: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/13.jpg)
COMO FAZER?Filtro colaborativo entre itens
![Page 14: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/14.jpg)
Implementação
• Montar matriz de avaliações (Item x Usuário)• Montar matriz de correlações (cosseno ajustado –
média do usuário)
• Prever avaliações para cada item para cada usuário com base na similaridade entre itens que o usuário avaliou
• Ordenar as previsões e apresentar as recomendações
![Page 15: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/15.jpg)
Filtro Colaborativo
• Quando escolher I-I ou U-U?
![Page 16: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/16.jpg)
Filtro Colaborativo
• Quando escolher I-I ou U-U?• p = max de avaliações por usuário• q = max de avaliações por item• k = max de vizinhos
Ricci, F. et al. (eds.), Recommender Systems Handbook pg. 120
![Page 17: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/17.jpg)
Filtro Colaborativo
• DataSet MovieLens:• ≈ 700 users• ≈ 10,000 movies• ≈ 100,000 ratings
Ricci, F. et al. (eds.), Recommender Systems Handbook pg. 120
![Page 18: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/18.jpg)
Filtro Colaborativo
• Quando escolher I-I ou U-U?
• Preferências dos itens tendem a ser mais estáveis do que as preferências dos usuários
• Avaliar nro de itens versus usuários
• U-U favorece serendipidade (Ekstrand et al. 2011)
• Ressaltando, filtro colaborativo utiliza unicamente as avaliações, ignorando completamente os atributos
![Page 19: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/19.jpg)
Filtro Colaborativo
• Para o filtro baseado em conteúdo, a abordagem mais utilizada é a similaridade cosseno.
• É claro, pode ter várias dimensões
https://kallistec.wordpress.com/tag/k-nearest-neighbors/
![Page 20: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/20.jpg)
COMO FAZER?Filtro baseado em conteúdo
![Page 21: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/21.jpg)
Implementação ingênua
• Definir vetor de palavras-chave• Construir perfil dos itens (vetor binário assimétrico)
• temFeatureX = 1• Construir perfil dos usuários (contagem simples)
• (rating > limiar) ? +1
• (rating < limiar) ? -1
• senão, 0• Calcular dot-product entre os perfis de itens e usuários• Ordenar e mostrar os resultados
![Page 22: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/22.jpg)
Sistemas de Recomendação
• Desafios
• 0-1 ou contagem
• Feedback implícito
• Preferência versus importância de palavra-chave
• Como normalizar os vetores?
• Como atribuir pesos?
• Melhores formas de atualizar os vetores (on-line)?
![Page 23: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/23.jpg)
Sistemas de Recomendação
• Como extrair atributos qualitativos (contexto)?• Se eu avaliar bem um filme de comédia, não quer dizer que o
gênero apenas seja representativo o suficiente para a minha preferência
• Tags tentam capturar isto
• “Genres, actors, director are not the content of a movie. It is knowledge about it” Recommender Systems – An Introduction
• Fatoração matricial (filtro colaborativo)
![Page 24: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/24.jpg)
Sistemas de Recomendação
• Combinação de dois ou mais algoritmos
http://dataconomy.com/an-introduction-to-recommendation-engines/
![Page 25: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/25.jpg)
Sistemas de Recomendação
Burke, R., 2002 - Hybrid Recommender Systems: Survey and Experiments
Técnica Vantagens Desvantagens
Filtro Colaborativo A. Pode identificar nichosB. Conhecimento de domínio
não é necessárioC. Feedback implícito é
suficienteD. A qualidade melhora com o
tempo
E. Cold-start para usuário F. Cold-start para itemG. Problema da ovelha-
negraH. Qualidade depende do
históricoI. Problema da
estabilidade VS Plasticidade
Baseado em conteúdo
B, C, D E, H, I
![Page 26: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/26.jpg)
Sistemas de Recomendação
Burke, R., 2002 - Hybrid Recommender Systems: Survey and Experiments
Método Descrição
Pesos Combinar os escores de diferentes técnicas de recomendação para produzir uma única recomendação
Switching Muda o algoritmo dependendo da situação
Misto Mistura as recomendações geradas por diferentes técnicas
Combinação de características
Características de diferentes técnicas de recomendação são unidas em um único algoritmo
Cascata Um algoritmo filtra as recomendações gerada por outo
Ampliação de características
A saída de uma técnica é usada como entrada de outra
Meta-nível O modelo aprendido por uma técnica é usado como entrada para outra
![Page 27: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/27.jpg)
Sistemas de Recomendação
•Avaliação
• Esparcidade
• MAE / NMAE, RMSE
• Precision, Recall e Medida-F
• Rank
• Cobertura
![Page 28: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/28.jpg)
Avaliação
• R = avaliações, I = Itens, U = Usuários
• MovieLens 100k current DataSet tem esparcidade = 0,978 (2,2%)
![Page 29: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/29.jpg)
Avaliação
• U = Usuários• testsetu = Conjunto de itens que o usuário u avaliou
• rec(u, i) = avaliação prevista para o usuário u no item i• ru,i é a avaliação real do usuário u para o item i
• MovieLens MAE = 0.83
![Page 30: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/30.jpg)
Avaliação
• Precision (relevância) (Pu), Recall (entre os top) (Ru) e Medida-F (F1)
• hitsu é o número de recomendações relevantes presentes no top-n
• recsetu é o valor de top-n
• testsetu é o total de recomendações relevantes
http://aimotion.blogspot.com.br/2011/05/evaluating-recommender-systems.html
![Page 31: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/31.jpg)
Avaliação
• Usuário “Alice”
Filme Avaliação (0.5 – 5.0)
Toy Story 5.0
Alien 2.0
Titanic 4.5
Indiana Jones and the Raiders… 3.0
Pirates of the Caribean and the Curse…
3.5
![Page 32: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/32.jpg)
Avaliação
Filme Recomendado Previsão
Toy Story 4,89
Matrix 4,78
Inception 4,32
Titanic 4,18
Band of Brothers 3,99
Precisão: 1/3Recall: 1/2
Recomendações, Top-3
![Page 33: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/33.jpg)
Avaliação
Filme Recomendado Previsão
Iron Man 4,95
Mulan 4,77
Prometheus 4,71
Alien 4,63
Terminator 2 4,61
Predator 4,59
The Expandables 4,50
First Blood 4,42
Precision: ?Recall: ?
Recomendações, Top-5
Usuário assistiu e gostou (top)
Usuário assistiu e gostou
![Page 34: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/34.jpg)
Avaliação
Filme Recomendado Previsão
Iron Man 4,95
Mulan 4,77
Prometheus 4,71
Alien 4,63
Terminator 2 4,61
Predator 4,59
The Expandables 4,50
First Blood 4,42
Precision: 2/5Recall: 2/4
Recomendações, Top-5
Usuário assistiu e gostou (top)
Usuário assistiu e gostou
![Page 35: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/35.jpg)
Avaliação
• Qualidade do ranking
![Page 36: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/36.jpg)
Avaliação
• Usuário “234” com 20 itens na lista de recomendação e hits nas posições 04 e 20
• Pode-se notar que um item posicionado acima no ranking tem um peso maior
![Page 37: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/37.jpg)
Avaliação
• Cobertura de Usuários (Ucov), Cobertura de Catálogo (Ccov)
• Útil para avaliar usuários com poucas avaliações (listas não-vazias de recomendações são geradas)
• Deve ser usado em conjunto com métricas de erro (MAE)
![Page 38: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/38.jpg)
Avaliação
•Existem outras•Área em aberto para pesquisa•Para Herlocker e McLaughlin (2004) Precision e Recall reflete melhor a experiência do usuário do que MAE
•No entanto, vários experimentos usam MAE / RMSE como medida
•Netflix Prize pedia para reduzir o RMSE em 10%
![Page 39: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/39.jpg)
Avaliação
•Como ranquear?
http://www.evanmiller.org/how-not-to-sort-by-average-rating.html
![Page 40: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/40.jpg)
Avaliação
•#Up - #Down
http://www.evanmiller.org/how-not-to-sort-by-average-rating.html
![Page 41: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/41.jpg)
Avaliação
•#Up - #Down
http://www.evanmiller.org/how-not-to-sort-by-average-rating.html
![Page 42: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/42.jpg)
Avaliação
•#Up / #Total
http://www.evanmiller.org/how-not-to-sort-by-average-rating.html
![Page 43: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/43.jpg)
Avaliação
•#Up / #Total
http://www.evanmiller.org/how-not-to-sort-by-average-rating.html
![Page 44: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/44.jpg)
Avaliação
● Balancear a proporção de avaliações positivas com um grau de incerteza de uma parte das observações (Edwin Wilson)
● 95% de chance da fração “real” de avaliações positivas ser de “quanto” (valor mínimo)?
http://www.evanmiller.org/how-not-to-sort-by-average-rating.html
![Page 45: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/45.jpg)
Sistemas de Recomendação
• Ferramentas• Apache Mahout (Java)• MyMediaLight (C# / .Net)• GraphLab (C++ / Java)• HTTP REST (EasyRec, PredictionIO)
• Libs• crab (Python)• mrec (Python)• recommenderlab (R)• SUGGEST (C)• RecDB (PostgreSQL)
![Page 46: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/46.jpg)
Parte IIIV. Exemplos na Indústria
![Page 47: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/47.jpg)
Sistemas de Recomendação
• Exemplos na Indústria
• Spotify
• Amazon
• Netflix
• Baidu
• Target
![Page 48: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/48.jpg)
Sistemas de Recomendação
• Uma pergunta antes
![Page 49: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/49.jpg)
Um motor de busca é um sistema de recomendação?
![Page 50: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/50.jpg)
Sistemas de Recomendação
• Motor de Busca
• Busca
• Filtra
• Faz previsões
• Apresenta uma lista
• Falta apenas uma coisa
![Page 51: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/51.jpg)
As preferências do usuário
a.k.a. Perfil do Usuário
![Page 52: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/52.jpg)
Sistemas de Recomendação
• O motor de busca considera aspectos como:
• Histórico de navegação
• Localização geográfica
• Línguas de domínio
• Caso positivo, pode sim ser considerado um SR
• CBF ou CF?
• Caso contrário, pode ser considerado SR não-personalizado
![Page 53: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/53.jpg)
Sistemas de Recomendação
![Page 54: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/54.jpg)
Sistemas de Recomendação
duckduckgo.com
![Page 55: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/55.jpg)
Sistemas de Recomendação
• Busca personalizada do Google pode ser desligada
![Page 56: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/56.jpg)
Sistemas de Recomendação
• 1 bilhão de usuários
• 100 bilhões de avaliações (likes)
• Milhões de itens (grupos, jogos, etc.)
https://code.facebook.com/posts/861999383875667/recommending-items-to-more-than-a-billion-people
![Page 57: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/57.jpg)
Sistemas de Recomendação
https://code.facebook.com/posts/861999383875667/recommending-items-to-more-than-a-billion-people
![Page 58: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/58.jpg)
Sistemas de Recomendação
• Amazon
• Exemplo clássico de aplicação de sistemas de recomendação com sucesso
• Filtro colaborativo Item-Item
![Page 59: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/59.jpg)
Sistemas de Recomendação
• “Our mission is to delight our customers by allowing them to serendipitously discover great products”
http://fortune.com/2012/07/30/amazons-recommendation-secret/
![Page 60: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/60.jpg)
Sistemas de Recomendação
• Patentes
![Page 61: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/61.jpg)
Sistemas de Recomendação
![Page 62: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/62.jpg)
Sistemas de Recomendação
•A Amazon permite a edição do histórico de navegação para melhorar a acurácia das recomendações
![Page 63: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/63.jpg)
Sistemas de Recomendação
![Page 64: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/64.jpg)
Sistemas de Recomendação
![Page 65: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/65.jpg)
Sistemas de Recomendação
•Panaceia de Sistemas de Recomendação da Amazon
![Page 66: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/66.jpg)
Sistemas de Recomendação
![Page 67: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/67.jpg)
Sistemas de Recomendação
• Netflix• 3 mil títulos (em media, por país)• 75 milhões de usuários• 75% das visualizações vem de recomendações• “Search is that thing the people do when they don’t get
good recommendations” Xavier A.• As categorias representam não apenas gêneros, mas
também o humor do usuário
![Page 68: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/68.jpg)
Sistemas de Recomendação
• Netflix mantém controle de muitos dados implícitos• Pause, rewind ou fast forward
• O dia da semana em que cada conteúdo é acessado
• Horas e minutos em que cada conteúdo é acessado
• Localização geográfica
• Aparelhos utilizados
• Avaliações (explícito)
• Buscas
• “We are not optimizing for ratings” Xavier A.• Avaliações explícitas diminuíram
![Page 69: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/69.jpg)
Sistemas de Recomendação
http://pt.slideshare.net/xamat/recsys-2014-tutorial-the-recommender-problem-revisited
![Page 70: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/70.jpg)
Sistemas de Recomendação
http://pt.slideshare.net/xamat/recsys-2014-tutorial-the-recommender-problem-revisited
![Page 71: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/71.jpg)
Sistemas de Recomendação
http://pt.slideshare.net/xamat/recsys-2014-tutorial-the-recommender-problem-revisited
![Page 72: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/72.jpg)
Sistemas de Recomendação
• Motor de busca dominante na China (80%)
• Um país com 700 milhões de internautas
• Está ganhando destaque por inovar os filtros de conteúdo
![Page 73: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/73.jpg)
Sistemas de Recomendação
• “Baidu invested over U$ 100,000,000 in Content Recommendation Engine “Teboola””
• Querem usar o contexto do usuário como parâmetros para as buscas
• Querem evoluir as propagandas, evitar mais do mesmo (se eu compro item x não quero ver mais propaganda do mesmo item)
http://www.geektime.com/2015/05/18/baidu-invests-millions-in-content-recommendation-engine-taboola/
![Page 74: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/74.jpg)
Sistemas de Recomendação
• 1792 lojas nos EUA
• 347000 funcionários
• U$ 72 bilhões em faturamento (2014)
https://corporate.target.com/press/corporate
![Page 75: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/75.jpg)
Sistemas de Recomendação
• “Every time you go shopping, you share intimate details about your consumption patterns with retailers”
• “And many of those retailers are studying those details to figure out what you like, what you need, and which coupons are most likely to make you happy”
•
http://www.forbes.com/sites/kashmirhill/2012/02/16/how-target-figured-out-a-teen-girl-was-pregnant-before-her-father-did/#44c424c434c6
http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html
![Page 76: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/76.jpg)
Sistemas de Recomendação
• Estatísticos contratados pela empresa descobriram que uma alta porcentagem de mulheres no registro de bebês que estavam no segundo trimestre compraram loção sem cheiro e suprimentos de cálcio, magnésio e zinco (regras de associação)
![Page 77: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/77.jpg)
Sistemas de Recomendação
• Target passou a enviar cupons para itens de bebês de acordo com a probabilidade de gravidez (Recomendações orgânicas)
• Mulheres que compravam os itens e que atendiam aos requisitos demográficos (faixa etária, renda, se era casada, se já tinha filhos, etc.)
• Faturamento • U$ 44 bilhões em 2002 • U$ 67 bilhões em 2010
![Page 78: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/78.jpg)
Sistemas de Recomendação
• “For companies like Target, the exhaustive rendering of our conscious and unconscious patterns into data sets and algorithms has revolutionized what they know about us and, therefore, how precisely they can sell.”
![Page 79: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/79.jpg)
Sistemas de Recomendação
• Streaming de música sob demanda
• 40 milhões de músicas
• 24 milhões de usuários ativos
• 1 bilhão de playlists
• Filtro colaborativo em produção
• Filtro baseado em conteúdo usando espectros de áudio e letras em estudo.
• Criar filtros representativos baseado em padrões encontrados nas músicas
![Page 80: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/80.jpg)
Sistemas de Recomendação
http://pt.slideshare.net/erikbern/music-recommendations-mlconf-2014
![Page 81: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/81.jpg)
Sistemas de Recomendação
“[…] our main problem: how do you model a function similarity(x, y)
For item similarity it’s also much easier to acquire good test set data, unlike personal recommendations. It’s hard to evaluate personal recommendations – most offline metrics like precision are irrelevant.”
Erik Bernhardsson – Gerente de Engenharia
http://pt.slideshare.net/erikbern/music-recommendations-mlconf-2014
![Page 82: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/82.jpg)
Sistemas de Recomendação
http://pt.slideshare.net/erikbern/music-recommendations-mlconf-2014
![Page 83: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/83.jpg)
Sistemas de Recomendação
• Music Genome Project• Patente US 7003515 B1 (2006) – Consumer item matching
method and system (Pandora Media, Inc.)
“25 or so music analysts have to assign either one-to-five rankings or more quantitative measures (say, beats per minute) for as many as 450 "genome units" per song”
http://boingboing.net/2014/05/24/pandoras-music-genome-proj.html
![Page 84: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/84.jpg)
Sistemas de Recomendação
• Oord A. – “Deep content-based music recommendation”, 2013 propõe encontrar funcionalidades latentes utilizando rede neural (algoritmo t-SNE)
• Fragmentos de 3 segundos de espectrogramas de áudios em duas redes convolucionais com duas camadas
![Page 85: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/85.jpg)
Sistemas de Recomendação
![Page 86: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/86.jpg)
Sistemas de Recomendação
• Dieleman, S. “End-to-End learning for music audio”, 2015
![Page 87: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/87.jpg)
Sistemas de Recomendação
http://benanne.github.io/2014/08/05/spotify-cnns.html
![Page 88: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/88.jpg)
![Page 89: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/89.jpg)
![Page 90: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/90.jpg)
Parte IIV. Pesquisa
![Page 91: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/91.jpg)
Sistemas de Recomendação
•Mais dados ou melhores modelos?•Qual técnica é melhor?
![Page 92: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/92.jpg)
Sistemas de Recomendação
![Page 93: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/93.jpg)
Sistemas de Recomendação
• Netflix (2012)
![Page 94: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/94.jpg)
Sistemas de Recomendação
![Page 95: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/95.jpg)
Sistemas de Recomendação
• No centro do Sistema de recomendação está o usuário e suas preferências
• Contraexemplo: loja de departamentos
• Usuário: “Procuro uma televisão”
• Vendedor: “Tenho o modelo perfeito para você! A recém-chegada 104 polegadas 8K”
![Page 96: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/96.jpg)
Sistemas de Recomendação
Artigos por ano
Artigos por domínio
Park, D. H. et al - A literature review and classification of recommender systems research (2011)
2006: Netflix Prize2007: ACM RecSys
![Page 97: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/97.jpg)
Sistemas de Recomendação
Bobadilla, J. et al – Recommender Systems Survey (2013)
![Page 98: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/98.jpg)
Sistemas de Recomendação
Bobadilla, J. et al – Recommender Systems Survey (2013)
![Page 99: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/99.jpg)
Sistemas de Recomendação
• Uma recomendação é um problema que pode ser resolvido com técnicas de aprendizado de máquina / data mining
• Áreas relacionadas
• Information Retrieval
• Information Filtering
• Data Mining
• Machine Learning
![Page 100: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/100.jpg)
RS + Data Mining
Amatriain, X. et al - Data Mining Methods for Recommender Systems
Visualização
![Page 101: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/101.jpg)
Em aberto
• Explicações
• Ataques
• Confiança
• Cold-Start
• Esparcidade
• Escalabilidade
• Métodos de avaliação
• Técnicas de ranking
• Implementações ad-hoc
![Page 102: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/102.jpg)
Parte VIConsiderações finais
![Page 103: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/103.jpg)
Sistemas de Recomendação
•Alto interesse da indústria•“[...] common problem at Silicon Valley”•“[...] little atention of the research community”
•Andrew Ng (2011)
![Page 104: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/104.jpg)
Sistemas de Recomendação
• Internet amadureceu e hoje oferece (muita) informação
• A era da informação (overload) está se tornando a era da recomendação
• “The coming era of on-demand marketing”
• Serviços tendem a serem personalizados para os usuários
• Recomendações podem ser Orgânicas ou Explícitas
• Explícitas pode dar a sensação de espionagem (caso da Target)
http://www.mckinsey.com/business-functions/marketing-and-sales/our-insights/the-coming-era-of-on-demand-marketing
![Page 105: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/105.jpg)
Steam
![Page 106: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/106.jpg)
![Page 107: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/107.jpg)
“Dress like a celebrity”
![Page 108: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/108.jpg)
“Dress like a celebrity”
![Page 109: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/109.jpg)
Shazam
![Page 110: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/110.jpg)
Quora
![Page 111: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/111.jpg)
![Page 112: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/112.jpg)
Matching de Pessoas
![Page 113: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/113.jpg)
Sistemas de Recomendação
•"Too many choices cause paralysis on people“
Barry Schwartz, “The Paradox of Choice”
![Page 114: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/114.jpg)
Sistemas de Recomendação
![Page 115: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/115.jpg)
Sistemas de Recomendação
• Acuracidade de predição de avaliação não significa boas recomendações
• Dados úteis vem de feedbacks implícitos• Não há um modelo ideal para todos os cenários (No Free Lunch)
• Construir e tunar bons modelos é um problema em aberto
• Carência de bons DataSets para pesquisa• Trade-off entre performance e acurácia (online / offline)
![Page 116: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/116.jpg)
Referências
• Coursera
• https://www.coursera.org/learn/recommender-systems/
• ACM RecSys Wiki
• ACM RecSys Conference
![Page 117: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/117.jpg)
Referências - Livros
![Page 118: Sistemas de Recomendação - Parte 2](https://reader034.fdocument.pub/reader034/viewer/2022042605/58eec4801a28aba5798b4583/html5/thumbnails/118.jpg)