@MASTERSTHESIS{ 2009:1181128739, title = {Uma abordagem flex?vel para extra??o de metadados em cita??es bibliogr?ficas}, year = {2009}, url = "http://tede.ufam.edu.br/handle/tede/2947", abstract = "Nesta disserta??o apresentamos o FLUX-CiM, um novo m?todo de extra??o de componentes de cita??es bibliogr?ficas tais como nomes de autores, t?tulos de artigo, n?meros de p?gina, etc. Tal m?todo n?o se baseia em padr?es espec?ficos de codi?ca??o de delimitadores de um determinado estilo de cita??o que nos d? um alto grau de automa??o e flexibilidade e permite a extra??o de metadados a partir de cita??es em qualquer estilo. Diferentemente de abordagens anteriores que dependem de treinamento manual para realizar o reconhecimento de componentes em uma cita??o, no nosso caso, o m?todo baseia-se em uma base de conhecimento automaticamente constru?da a partir de um conjunto existente de registros de metadados de um dado dom?nio, por exemplo: Ci?ncia da Computa??o, Ci?ncias da Sa?de, Ci?ncias Sociais, etc. Tal conjunto de registros com metadados pode ser facilmente obtido na Web ou atrav?s de outros reposit?rios de dados. Para demonstrar a e?c?cia e aplicabilidade do m?todo proposto, apresentamos uma serie de experimentos que visam extrair dados de cita??es bibliogr??cas de artigos. Os resultados destes experimento apresentam n?veis precis?o e revoca??o acima de 94% para todos os dom?nios, bem como extra??o perfeita para a grande maioria das cita??es testadas. Al?m disso, em uma compara??o com o m?todo que representa o estado da arte de extra??o de informa??o, o FLUX-CiM produziu resultados superiores sem a fase de treino que ? exigida por esse m?todo. Por ?m, apresentamos uma estrat?gia para a utiliza??o de dados bibliogr??cos resultante do processo de extra??o com FLUX-CIM para automaticamente atualizar e expandir a base de conhecimento de um determinado dom?nio. Mostramos que esta estrat?gia pode ser usada para alcan?ar bons resultados de extra??o mesmo quando apenas uma pequena amostra inicial de registros bibliogr??cos est? dispon?vel para a constru??o da base de conhecimento.", publisher = {Universidade Federal do Amazonas}, scholl = {Programa de P?s-gradua??o em Inform?tica}, note = {Instituto de Computa??o} }