Cory Doctorow, es un periodista canadiense conocido por ser el editor de boing boing, activista de varias causas ecologistas y de DRM, y por si esto fuera poco también escribe muy buena ciencia ficción, sus libros, como era de esperar, se distribuyen bajo licencia CC. Pero el motivo por el cual lo cito hoy es por un artículo que escribió en 2001: Metacrap: Putting the torch to seven straw-men of the meta-utopia.

El término Metacrap es una unión entre metadata + crap, y es una crítica directa hacia los metadatos explícitos, entendiendo por este término aquella información sobre un contenido en particular que aportan las personas por ejemplo una catalogación que puede ser tan simple como una etiqueta o tan compleja como una ficha catalográfica.

¿Por qué para Doctorow los datos explícitos de los usuarios le parecen basura?

En su artículo, aborda siete razones por las cuales los metadatos que construyen las personas nunca servirían para organizar la web:

  1. Las personas mienten
  2. Las personas son perezosas
  3. Las personas son estúpidas
  4. Las personas no se conocen a sí mismas
  5. Los esquemas no son neutrales
  6. Las métricas influencian los resultados
  7. Existe más de una forma de describir algo

El problema es inherente a la naturaleza humana: la gente miente, claro que no todos lo hacen de malos, algunos no son conscientes de ello, dicen lo que creen que queremos escuchar, o lo que ellos creen que piensan aunque no tenga nada que ver con sus creencias, de cualquier manera el resultado es el mismo: la información que brindan no sirve.

Por ejemplo podemos encontrar webmasters inescrupulosos que en los meta-keywords de su sitio incluyan palabras clave tales como: “sex”, “xxx”, “free”, “music” con la esperanza de que los buscadores los indexen por esos términos y cuando alguien busque por esas palabras (que son muy populares en internet) su sitio se encuentre entre los resultdos de búsqueda y gane el ingreso de algunos incautos acumulando, de esa manera, visitas para la estadística.

En un post anterior revisábamos cómo google armaba los resultados de búsqueda, en donde, por ejemplo, les daba más preponderancia a la descripción que hacía el Open directory Proyect de un sitio antes que la de los propios usuarios.

Según Doctorow puede pasar que los usuarios desconozcan el valor de catalogar la información o simplemente sean perezosos con lo cual las categorizaciones que hacen son escasas o incorrectas. Para ejemplificar esta situación Doctorow postula que si descargamos 10 mp3 al azar de internet, las posibilidades indican que al menos uno no tendrá título, artista o cualquier otra información del track.

Otras de las teorías de Doctorow avala de que la gente es estúpida, pero mejor no entrar en detalles. ahora el problema no es solo la gente, también tenemos problemas de tipo: no podemos ponernos de acuerdo acerca de cual es la mejor manera de clasificar la información, a esto se refiere cuando habla de que los esquemas de clasificación no son neutrales, y si, depende quien los haga dependerá entonces de qué jerarquías construya, tiene que ver con su recorte de la realidad, diría Max Weber. También está el tema de las métricas, las mismas influyen los resultados de manera de privilegiar las mediciones más altas y para terminar el hecho de que existen más de una forma de clasificar un mismo objeto.

Estos postulados van en dirección contraria a lo que él denomina la meta-utopía, que son los postulados de Berners Lee en relación a la web semántica, donde se habla de metadatos puristas y exhaustivos que les permitan a las máquinas entender e interactuar con los usuarios.

¿Y cuál es la solución?

Como antídoto al fracaso de los metadatos explícitos, Doctorow propone darles su lugar a los metadatos implícitos, los cuales se construyen a partir de las acciones del usuario en su interacción con internet y que permiten inferir patrones de comportamiento de los usuarios en este caso, en relación con la clasificación de recursos. Por ejemplo, Google explota los metadatos implícitos para devolver resultados usables a los usuarios. ¿Cómo lo logra? Se fija en el número de autores de sitios que linkean a un sitio en particular bajo el supuesto que si lo linkean es porque lo consideran de valor, lo que deriva en una alta tasa de credibilidad sobre el detalle de la búsqueda.

Si consideramos que el artículo citado fue escrito en el 2001, que desde entonces ha sido tomado como un texto de culto, cómo queda parado al pasar el tiempo?, en la internet de 2001 no existía el tagging social por ejemplo, tampoco el blogging y ni hablar de aplicaciones populares para sitios personales, poner metadatos era tarea de quien sabía y aún así era tedioso. Hoy, siete años después nos encontramos con un panorama completamente distinto, inclusive contamos con generaciones que no conocieron la vida antes de internet :) Igualmente hay que hacer la salvedad de que al autor del artículo se refiere a los metadatos expuestos por los autores de los sitios, que son muy distintos, porque se basan en intereses distintos de aquellos que puedan agregar los usuarios de un sitio o de una comunidad.

Si bien todo lo que se describe anteriormente es cierto: los metadatos no son confiables y son escasos en un gran número de casos, a mi parecer no es a causa de que la gente sea perezosa, ni mala analizando información, ni ignorantes y ni mucho menos estúpida, creo que tiene que ver conque no les interesa o más bien no le encuentran el rédito, por eso es, que funciona el tagging porque es una explotación colectiva de individuos que redunda en beneficios para cada uno de ellos, y eso en lo que las personas que taggean sus fotos en flickr o sus links en del.icio.us comprenden bien.

Y mientras todos hablábamos acerca de si metadata explícita o implícita, acerca de la cantidad de campos para definir un objeto, de si la web semántica era inalcanzable o no, si la web se perdería en el caos o sería salvada por los tecnólogos, si el poder quedaría finalmente del lado de las máquinas, o habría una brecha de esperanza ante la inundación de información, la mismas redes sociales encontraron una solución simple, potente y sin compromisos fuertes que la debilitaran: el tagging.

En una entrevista que realizó David Weinberger, Doctorow afirmaba que “…Los tags parecen haber dominado el truco de guiar a la gente hacia una convergencia, y en algunas instancias con un tecnología tan simple como la opción de autocompletar el tag… … entonces el incentivo social de taggear como otros también sirve a la convergencia donde obtienes colaboración efectiva basada en el tagging…”.

¡Hasta la próxima!

Enlaces recomendados: