23/02/2017
Se trata del mismo equipo de alumnos y profesores que en noviembre de 2016 había obtenido el primer lugar en otra competencia internacional en Japón.
Una vez más, el equipo obtuvo el primer lugar en una competencia internacional. En este caso, el grupo alumnos y profesores triunfó en la WSDM Cup 2017, organizada anualmente en conjunto por las universidades alemanas de Padeborn, Weimar y Freiburg.
Dos de los integrantes del equipo viajaron en representación del conjunto a la Universidad de Cambridge en Inglaterra, sede de la competencia este año, el 9 de febrero para defender su trabajo en persona y recibir su premio de u$s 1.500.
La WSDM Cup 2017 (Web Search and Data Mining) constó de dos tareas, y en una de ellas el equipo de la Universidad Austral conformado por Rafael Crescenzi, Marcelo Fernández, Federico Garcia Calabria, Pablo Albani, Diego Tauziet, Adriana Baravalle y Andrés D’Ambrosio venció a cuatro equipos de Estados Unidos, Japón y Alemania. Se trata de una profesora de la Facultad de Ingeniería de la Austral, Baravalle, y cinco alumnos de la Maestría en Explotación de Datos y Gestión del Conocimiento (MEDGC) de la misma casa de estudios.
El equipo ganador de la Austral venía de coronarse en la Competencia 2016 de Ciberseguridad y Data Mining (CDMC2016), un certamen organizado por la Universidad de Kyoto de Japón, en el que superaron a 42 equipos de 14 países, entre ellos Japón, China, Corea, Malasia, Australia y Estados Unidos.
Se trata del segundo triunfo consecutivo del equipo argentino en certámenes internacionales, tanto de las principales universidades del mundo como de grandes empresas. Por ejemplo, un equipo de Yahoo Japón finalizó en el 4º lugar en una de las dos tareas de la WSDM Cup 2017.
La WSDM Cup 2017 se desarrolló dentro del marco de la “ACM International Conference on Web Search and Data Mining”, una de las más prestigiosas conferencias de Data Science del mundo. Fue organizada este año por la Universidad de Cambridge, Google, la Universidad de Amsterdam, Microsoft, Huawei y University College of London (UCL), entre otros.
LA TAREA
El trabajo consistió en desarrollar un software para detectar ediciones maliciosas – “Vandalism Detection” – en la base de datos colaborativa Wikidata, algo imprescindible para proteger la integridad de esa base de conocimiento, así como la de todos los sistemas informáticos que utilizan sus datos. La página de la WSDM Cup señala que “Wikidata es frecuentemente vandalizada, exponiendo a todos sus usuarios al riesgo de propagación de información vandalizada y falsificada”.
Para Crescenzi, uno de los integrantes del equipo vencedor que pudo viajar a Inglaterra, “participar de la competencia fue una experiencia valiosísima”. En ese sentido agregó que “para ganarla debimos procesar una cantidad inmensa de datos (medio terabyte), lidiando con las complejidades de la forma en la cual se encontraban almacenadas”.
“Nos enfrentarnos a algunos de los mayores exponentes académicos del área, como la Universidad de Illinois e incluso un equipo de investigadores de Yahoo. Con todo, la experiencia fue muy satisfactoria, desafiante y educativa”, concluyó.
Del mismo modo, García Calabria destacó que “con poco tiempo y organización se pudo llegar a buenos resultados”.
“Sin la proactividad y rápida adquisición de conocimiento que caracteriza a este equipo, esto no hubiera sido posible”, sentenció.
Por su parte, Baravalle, profesora de la Facultad de Ingeniería de la Austral y alumna de la maestría, resaltó “dos avances respecto de la competencia anterior: nos aceptaron un paper que también fue presentado en la conferencia, y además, la solución presentada en el trabajo ya está disponible en formato libre, o ‘open-source’, y podría ser incorporada a los actuales sistemas de Wikidata en el transcurso de este año”.
“Sin dudas esta competencia tuvo un nivel de complejidad superior al de Japon”, afirmó.
¿QUÉ ES WIKIDATA?
Wikidata, mantenida por la Fundación Wikimedia, consiste en una base de conocimientos estructurados que subyace a otros sitios wikis de la organización, como Wikipedia, pero que también es libremente consultable por métodos automáticos y en formatos estándares. Entre los usos que se le da a esta base se encuentran los buscadores web que, ante consultas adecuadas, suelen disponer información relevante extraída de Wikidata al costado de los resultados tradicionales. Por ejemplo, ante la búsqueda de un actor, Google presenta a la derecha de los resultados, un pequeño resumen con la foto de la persona, una breve descripción, datos biográficos -como fecha de nacimiento, estatura, hijos, entre otros datos- y parte de sus obras. Toda esta información se obtiene de una manera automática de Wikidata.
La principal fortaleza de este tipo de bases de conocimientos es la posibilidad de ser editadas por sus usuarios. Sin embargo, esta característica positiva tiene una desventaja. Existen usuarios que, en lugar de realizar revisiones que coadyuven a la construcción de base, la degradan mediante modificaciones maliciosas, sesgadas o simplemente imprudentes.
¿QUÉ ES UNA EDICIÓN MALICIOSA DE WIKIDATA?
Este tipo de actitudes nocivas usualmente se observa cuando un usuario edita una entidad con el fin de vandalizar esa entrada. Por ejemplo en la sección de una persona famosa, se generaría una edición maliciosa al ingresar insultos en la descripción.
Para mayor información, haga click aquí.