¿El tamano importa? Medir e investigar en lablogosfera
F. Tricas (Depto Informatica e Ing. de Sistemas, U. Zaragoza)Juan J. Merelo ( U. Granada, Spain)
Vıctor R. Ruiz, (Blogalia y +)
9 de mayo de 2007
Agenda
I Algunas definiciones
I Trabajos interesantes
I ¿Que sabemos hacer?
I Conclusiones, futuro
Sobre los hombros de gigantes
I Beatriz Prieto, Alberto Prieto, Gustavo Romero-Lopez, PedroCastillo Valdivieso (U. Granada)
I Jose L. Orihuela (U. Navarra)
I Guillermo Lopez (U. Valencia)
I Jose Carpio Canadas (U. Huelva)
¿A quien le interesa?
I HP Information Dynamics Labhttp://www.hpl.hp.com/research/idl/results.html
I Microsoft. Social Computing Grouphttp://research.microsoft.com/scg/
I Google. Hypertext and the Webhttp://labs.google.com/papers.html
I IBM.http://www.almaden.ibm.com/cs/projects/web/
¿Que es una bitacora (o blog, o weblog)?
¿Por que?
I Compartir conocimiento, informacion
I Opinar, diarios personales
I Relaciones publicas
I ‘Periodismo’
I Notas, pensamientos, ideas, ...
I Literatura
I Polıtica
I Busqueda de almas gemelas
I Porque si
Algunas herramientas interesantes
I RSS (y otros...)
I Buscadores especıficos
I Edicion extremadamente simple
I Incluso API’s especıficas
I Trackback
La blogosfera hispana
¡Algo complejo!
I Muchos paıses
I Varias lenguas (4 oficiales, y ademas en otros, claro ingles,frances, holandes, ...)
I tambien bilingues y trilinguesPor si acaso ... http://oreneta.com/baldie/blog
I ¡Podemos discutirlo!
Tools
Blogometro (http://blogometro.blogalia.com/)
I A crawler, each day a ranking of fresh linksI Open source, written in Python, PostgresSQL
I http://sourceforge.net/projects/blogometro
I Data from November, 15, 2002
I Some purging
Numero de bitacoras en sitios populares
Alojamiento Blogometro Estimacion Publicado
msn.com 65493 300000 2000000(+)blogia.com 31178 34277 (*)ya.com 19807 500000 n.d.diariogratis.com 6052 90000 n.d.blogspot.com 5940 90000 n.d.acelblog.com 4481 4600 (*)bitacoras.com 3215 50000 32800 (*)zonalibre.org 2419 n.d.lamevaweb.info 1702 n.d.barrapunto.com 1571 1633 (*)zoomblog.com 1271 4000 (*)barcelonablogs.com 1271 n.d.lacoctelera.com 1148 8000(+)
Principio de 2006El tamano de la blogosfera: medidas y herramientas.
Fernando Tricas, Juan Julian Merelo-Guervos, Vıctor R. Ruiz
Dinamica de la informacion
Dinamica
Blog Epidemic Analyzer (interes sostenido, ascenso-pico-descenso,‘efecto’ Slashdot, otros sitios caida lenta).http://www.hpl.hp.com/research/idl/projects/blogs/
¿Tenemos algo en comun?
http://anjo.blogs.com/metis/2004/10/sigmund on the 2.html
¿Tenemos algo en comun? (II)
Tercer debate:
I Kerry: minimum wage (8 mentions), health insurance (6mentions), and social security (6 mentions)
I Bush: my opponent (7), four years (6), and best way (5)
http://overstated.net/04/10/14-the-final-presidential-debate
Information diffusion
Chibi (verde, pico), Microsoft (azul, charla y picos), Alzheimer(rojo, charla) http://theory.csail.mit.edu/∼dln/papers/blogs/idib.pdf
Information Difussion Through BlogspaceDaniel Gruhl, R. Guba, David Liben-Novell, Andrew Tomkins
Information diffusion (II)
Microsoft (tratando de quitar los picos)http://theory.csail.mit.edu/∼dln/papers/blogs/idib.pdf
Algunos intentos . . .
http://fernand0.blogalia.com/historias/12671
Podemos buscar cosas
http://lavidadelosmemes.bloxus.com/historias/1048
Hay gente buscando . . .
http://www.hpl.hp.com/research/idl/people/eytan/moblog/
Usage Patterns for Cameraphone Driven MoblogsEytan Adar (Mayo 2004)
Medir influencia
http://fernand0.blogalia.com/historias/12049
Un dıa da para mucho
Primero, el enlace a la historia de Arcadi Espada.http://www.arcadi.espasa.com/000287.html
I Dıa 1eCuaderno v.2.0: 11S y 11M http://www.ecuaderno.com/archives/000400.php
Barcepundit http://barcepundit.blogspot.com/2004/09/un-da-da-para-mucho.html
Mangas Verdes Morbicidad y arrepentimientohttp://www.proyectoisla.com/mangasverdes/index.php?p=186
Un dıa da para mucho (II)
I Dıa 2http://www.escolar.net/http://www.sdelavega.tk/Elastico.net: Anuncios sin palabrashttp://www.elastico.net/archives/001294.htmlhttp://www.diariodeunjabali.com/Isopixelhttp://www.isopixel.net/archives/001982.htmlSonia Blancohttp://www.filmica.com/sonia blanco/archivos/000657.htmlPuedoprometeryprometo.comhttp://www.puedoprometeryprometo.com/2004 09 01 archivo.html#109536146956858137
Un dıa da para mucho (III)
I Dıa 2 (cont.)
Anotaciones de un periodista raro: El Paıs pide perdon por una campanade publicidad y los gurus hacen el ridıculohttp://gbareno.blogspot.com/2004/09/el-pas-pide-perdn-por-una-campaa-de.html
http://www.abordaje.net/
Ası no son las cosas: Fuera de controlhttp://asinosonlascosas.blogspot.com/2004/09/fuera-de-control.html
. . .
Que pasaba en internet?
Visitas
Que pasaba en internet?
Enlaces
Que pasaba en internet?
Enlaces desde la blogosfera
Medios digitales, transmision de informacion y formacion del espacio publico:comunicacion de masas y comunicacion en red ante el 11M
Guillermo Lopez Garcıa, Juan Julian Merelo Guervos, Fernando Tricas Garcıa.
Pero . . .
http://www.plasticbag.org/archives/2003/05/discussion and citation in the blogosphere.shtml
O sea, esto
http://www-idl.hpl.hp.com/blogstuff/
http://www.blogpulse.com/showcase.html
Ademas . . .
http://hammeroftruth.com/2004/03/08/how-news-travels-on-the-internet/
Y en el desarrollo de programas?
Algunas ideas
I Personas
I Modulos
I BibliotecasI Trozos de codigo (‘snippets’)
I Seguridad!
Y en el desarrollo de programas?
R Ferenc, I Siket, T Gyimothy. ‘Extracting facts from Open SourceSoftware’
I LCOM (Lack of Cohesion on Methods): numero de parejas defunciones miembro sin variables compartidas, menos el numerode parejas de funciones miembro con variables compartidas.Hipotesis: Clases con poca cohesion sugieren disenoinapropiado.
R Ferenc, I Siket, T Gyimothy. ‘Extracting facts from Open SourceSoftware’
I CBO (Coupling Between Object classes): una claseesta acoplada a otra si usa sus funciones y o variables.Hipotesis: Clases muy acopladas son mas propensas a losfallos
Comunidades
Comunidades
Comunidades
http://www.cibersociedad.net/congres2004/grups/fitxacom publica2.php?grup=43&id=625&idioma=es
Visualizacion de la evolucion de una red social generada por weblogs
Juan Julian Merelo / Fernando Tricas Garcıa / Beatriz Prieto
Me interesa . . . ?
I Word based systems (Google, Yahoo, Altavista, . . . ) don’twork well because of lack of semantics and speed.
I Specialized tools (Technorati, PubSub, BlogPulse, . . . ) solvethe speed problem, but not the others (tags can help)
I Link based tools help but not every people links to the samesites, even being interested in the same things.
We had some data. . .
I First Spanish webloggers and blog readers poll.(‘I Encuesta a webloggers y lectores de blogs’http://tintachina.com/archivo/cat i encuesta webloggers.php)
I Gemma Ferreres, Antonio CambroneroI Self–administeredI May, 31, June, 18 2004I 1662 replied (1125 bloggers, 537 readers)I Some interesting findingsI Questions about blog reading
I There was a second edition, 2005 (almost doubledparticipation)
We had some data. . .
I First Spanish webloggers and blog readers poll.(‘I Encuesta a webloggers y lectores de blogs’http://tintachina.com/archivo/cat i encuesta webloggers.php)
I Gemma Ferreres, Antonio CambroneroI Self–administeredI May, 31, June, 18 2004I 1662 replied (1125 bloggers, 537 readers)I Some interesting findingsI Questions about blog readingI There was a second edition, 2005 (almost doubled
participation)
Data mining to the rescue
I Process of extraction of knowledge from huge amounts ofdata [DataMining, Concepts and Techniques]
I In this case, extraction of association rules:I Recommendation of weblogs from sets of weblogs read by
users.
Association rules I
I Composed of:
Antecedent → Consecuent
I CD Burner → Blank CDs
A Priori algorithm.
I Developed by Agrawal to analyze user purchase intentions insupermarkets (market basket analysis).
I From a database of supermarket baskets, or ‘itemsets’, a setof association rules that predict purchase patterns can beextracted
I If you buy a computer, you’ll want a subscription to acomputer mag(other did it before you)
Association rules I
I Composed of:
Antecedent → Consecuent
I CD Burner → Blank CDs
A Priori algorithm.
I Developed by Agrawal to analyze user purchase intentions insupermarkets (market basket analysis).
I From a database of supermarket baskets, or ‘itemsets’, a setof association rules that predict purchase patterns can beextracted
I If you buy a computer, you’ll want a subscription to acomputer mag(other did it before you)
Some work . . .
I Data cleaning (noise, inconsistent data, . . . )
I Data integration (combination of several sources)
I Data selection (more relevant ones)
I Data transformation (adequate format)
I Data minig (pattern extraction)
I Pattern evaluation (Obtaining the interesting rules)
I Knowledge representation
Consejo
Conclusiones
I Queremos medir la propagacion de la informacionI ¿Que es interesante?I ¿Por donde viaja?I Y la ‘materia oscura’I Con dibujos, mas bonito
I Y mas cosas . . .
Pero . . .
I No todo el mundo esta en internet
I Y no todos los que estan participan
Conclusiones
I Queremos medir la propagacion de la informacionI ¿Que es interesante?I ¿Por donde viaja?I Y la ‘materia oscura’I Con dibujos, mas bonito
I Y mas cosas . . .
Pero . . .
I No todo el mundo esta en internet
I Y no todos los que estan participan
El futuro
I Mejorar la arana
I Difundir los resultados
I Rellenar los ‘huecos’
I Otras medidas (palabras, frases, ...)
I Otros mundos
I ...
Por si acaso ...
Tenemos...
I Ancho de banda
I Ideas
I Entusiasmo
Necesitamos...
I Memoria, hw
I Mas ideas
I Gente
¡Gracias!
Top Related