Informeme na Final do Arena Info

September 4th, 2009

tela inicial do informeme

O Informeme, site que criei como parte do meu projeto de mestrado está na final do concurso Arena Info de Software.

Os concorrentes do Informeme na categoria aplicação web são:

  • OpSys - Mineração de opiniões sobre empresas usando técnica de PLN (Processamento de Linguage Natural;
  • Posto Seguro - Mashup com Google maps que mostra postos confiáveis/ não confiáveis no mapa e permite busca por endereço;
  • SIGEA - Sistema para administração de escritório de advocacia e processos jurídicos.
  • Gartic Image Editor - Editor gráfico em javascript no estilo paint.

Caso você tenha gostado da minha aplicação e tenha considerado ela mais interessante que os concorrentes, peço o seu voto!

Para ver os participantes das outras categorias (aplicativo para plataforma Android, Widgets e Jogos) e poder votar acesse (http://info.abril.com.br/arena/votacao/

A versão inicial do aplicativo web, que está concorrendo no Arena Info, se concentra basicamente em dois aspectos: capturar notícias de diferentes feeds RSS (principalmente jornais e portais de notícia) e a classificação em uma hierarquia de categorias usando o algoritmo Multinomial Naïve Bayes que é treinado com notícias classificadas manualmente (através da interface do administrador do sistema) e com notícias que já vem pré-classificadas. Acho que é comum para alguns agregadores empregar a classificação plana e o clustering (agrupamento), mas não encontrei nenhum sistema usando classificação hierárquica (apenas em trabalhos acadêmicos).

Atualmente estou realizando experimentos com o classificador hierárquico, estes serão colocados na minha dissertação de mestrado e permitirão determinar quais os melhores parâmetros para se executar o classificar, suas vantagens, desvantagens e possíveis melhorias. Terminado isso, devo criar algumas funcionalidades novas no sistema e então focar na área de sistemas recomendadores.

A aplicação foi criada com o framework web Ruby on Rails, o classificador também é feito em Ruby com algumas bibliotecas em C.

Qualquer dúvida sobre a aplicação ou sugestão, deixe seu comentário.

É isso!

Finalmente finalizei a minha qualificação (etapa anterior a defesa da dissertação de mestrado). Provavelmente colocarei minha tese aqui quando ela estiver pronta e liberarei sobre alguma licença creative commons.

Se você tiver interesse sobre o Informeme ou quiser saber um pouco sobre mineração de dados, classificação de textos e sistemas recomendadores, baixe minha qualificação (Arquivo PDF com pouco mais de 1mb) e faça uma boa leitura. Há também o arquivo da minha dissertação de mestrado (arquivo PDF com 2,3mb).