inicio mail me! sindicaci;ón

Comenzando con Aleli

Fue ya hace casi un mes, el 24 de octubre, cuando recibí el comunicado de Forja-RedIRIS de que se había aprobado el proyecto con el que participo en el I Concurso Universitario de Software Libre. Y desde entonces, entre asignaturas, cursos y compromisos apenas he conseguido tiempo para rebañar un poco de documentación sobre lex y yacc, que son unos de los recursos que pienso emplear para desarrollar este proyecto.

Aleli es un proyecto orientado a obtener estadísticas sobre una lista de correo, de forma que a partir de su histórico en formato mbox (p.ej. este) se pueda ver cuántos mensajes se han enviado por día del mes, día de la semana, semana, mes, usuario, etc. La salida sería en el formato de gnuplot para representarla fácilmente.
El primer objetivo será ser capaz de parsear una entrada en formato mbox y abstraerla en una estructura de datos (aparte de verificar si la entrada es correcta). Precisamente para esto es para lo que voy a recurrir a lex y yacc.
Los siguientes objetivos poco a poco los voy perfilando, y mejor ir poco a poco: más vale pájaro en mano que ciento volando, ¿no? Además de que ir maleando los objetivos “en caliente” permite ajustarse mucho mejor a las necesidades reales.

Gravatar

herraiz said,

May 10, 2007 @ 13:30

En el grupo Libresoft hemos desarrollado una herramienta similar a la que quieres desarrollar.

Está escrita en Python. En Python hay ya módulos que parsean mboxes, así que no es necesario usar lex o yacc. Quizás te interesaría colaborar con nosotros. Si quieres, ábrete una cuenta en nuestra forja, y únete al proyecto.

Si quieres, antes puedes probar la herramienta. La última release es la 0.3.1, aunque yo te recomiendo que pruebes la versión de desarrollo actual (para bajar las fuentes desde el repositorio SVN te tienes que unir al proyecto antes, es un pequeño fallo que tiene la forja que está pendiente de ser arreglado).

Si le pasas la herramienta a una lista de correo, échale un vistazo a la base de datos que genera. En este momento el informe que crea la herramienta es muy breve, y no incluye toda la información que está presente en la base de datos.

Gravatar

PerkiPat said,

June 15, 2007 @ 12:02

De momento ando liado con exámenes, y todavía me queda. Cuando saque tiempo le echaré un vistazo, tanto a vuestro proyecto como a la idea en general, que no le he invertido nada de tiempo pese a apuntarme al concurso.

Además se me ha ocurrido que es mejor una vez parseada la entrada mbox meterla en una base de datos, para poder aplicar técnicas de minería de datos con más facilidad.

RSS feed for comments on this post · TrackBack URI

Leave a Comment