06 julho 2012

Etiquetagem em curso

Conforme referi atrás, resolvi etiquetar o Glosa Crua e não está a ser fácil nem rápido. Vejamos. Primeiro tratei em off cerca de 100 dos 1000 posts e defini as etiquetas, agregando-as em : Pessoas individuais, Pessoas/entidades colectivas, Lugares, Eventos, Doenças (terminadas em “ite” e não só), estados de espírito e, finalmente, qualidades gerais que, infelizmente foi a mais representada. Depois fiz alguma consolidação e homogeneização e arranquei para a actualização no blog desses 100 posts. Terminado, passei aos 100 seguintes procurando minimizar a introdução de etiquetas adicionais. Em seguida suspendi a fase vertical e passei à horizontal, que não quer dizer a dormir.

Para cada etiqueta procurei todos os posts em que a palavra aparecia para verificar se já lá estava e, caso negativo, se faria sentido inclui-la. Para os posts encontrados e não etiquetados ainda, fiz-lhes a etiquetagem completa.  

Quando terminar esta fase horizontal irei correr verticalmente o blog para ver se escapou algum post. Será estranho mas pode acontecer. Depois, há que identificar as etiquetas pouco representadas e tentar consolidá-las. Terei que analisar bem a cobertura dos “estados de espírito”. Por exemplo, criei recentemente um chamado “Grrr” que precisa de ter análise retroactiva e cuja identificação não se encontra por pesquisa directa do texto.

Parece complicado? Não, neste correr das etiquetas vou na letra… B.

Sem comentários: