???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.ufam.edu.br/handle/tede/2947
Full metadata record
DC FieldValueLanguage
dc.creatorVilarinho, Eli Cortez Custódio-
dc.contributor.advisor1Silva, Altigran Soares da-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3405503472010994por
dc.date.available2010-12-11-
dc.date.issued2009-04-03-
dc.identifier.citationVILARINHO, Eli Cortez Custódio. Uma abordagem flexível para extração de metadados em citações bibliográficas. 2009. 57 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2009.por
dc.identifier.urihttp://tede.ufam.edu.br/handle/tede/2947-
dc.description.resumoNesta dissertação apresentamos o FLUX-CiM, um novo método de extração de componentes de citações bibliográficas tais como nomes de autores, títulos de artigo, números de página, etc. Tal método não se baseia em padrões específicos de codificação de delimitadores de um determinado estilo de citação que nos dá um alto grau de automação e flexibilidade e permite a extração de metadados a partir de citações em qualquer estilo. Diferentemente de abordagens anteriores que dependem de treinamento manual para realizar o reconhecimento de componentes em uma citação, no nosso caso, o método baseia-se em uma base de conhecimento automaticamente construída a partir de um conjunto existente de registros de metadados de um dado domínio, por exemplo: Ciência da Computação, Ciências da Saúde, Ciências Sociais, etc. Tal conjunto de registros com metadados pode ser facilmente obtido na Web ou através de outros repositórios de dados. Para demonstrar a eficácia e aplicabilidade do método proposto, apresentamos uma serie de experimentos que visam extrair dados de citações bibliográficas de artigos. Os resultados destes experimento apresentam níveis precisão e revocação acima de 94% para todos os domínios, bem como extração perfeita para a grande maioria das citações testadas. Além disso, em uma comparação com o método que representa o estado da arte de extração de informação, o FLUX-CiM produziu resultados superiores sem a fase de treino que é exigida por esse método. Por fim, apresentamos uma estratégia para a utilização de dados bibliográficos resultante do processo de extração com FLUX-CIM para automaticamente atualizar e expandir a base de conhecimento de um determinado domínio. Mostramos que esta estratégia pode ser usada para alcançar bons resultados de extração mesmo quando apenas uma pequena amostra inicial de registros bibliográficos está disponível para a construção da base de conhecimento.por
dc.description.abstractIn this dissertation, we present FLUX-CiM, a novel method for extracting components (e.g., author names, article titles, venues, page numbers) from bibliographic citations. Our method does not rely on patterns encoding specific delimiters used in a particular citation style. This feature yields a high degree of automation and flexibility and allows FLUX-CiM to extract from citations in any given format. Differently from previous methods that are based on models learned from user-driven training, our method relies on a knowledge-base automatically constructed from an existing set of sample metadata records from a given field (e.g., computer science, health sciences, social science, etc). These records are usually available on the Web or other public data repositories. To demonstrate the effectiveness and applicability of our proposed method we present a serie of experiments in which we apply it to extract bibliographic data from citations in articles of different fields. Results of these experiments exhibit precision and recall levels above 94% for all fields as well as perfect extraction for the large majority of citations tested. Also, in a comparison against a state-of-art information extraction method, ours produced superior results without the training phase required by that method. Finally, we present a strategy for using bibliographic data resulting from the extraction process with FLUX- CiM to automatically update and expand the knowledge-base of a given domain. We show that this strategy can be used to achieve good extraction results even if only a very small initial sample of bibliographic records is available for building the knowledge-base.eng
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado do Amazonas-
dc.formatapplication/pdfpor
dc.thumbnail.urlhttp://200.129.163.131:8080//retrieve/7306/Disserta%c3%a7%c3%a3o%20-%20Eli%20Cortez%20Cust%c3%b3dio%20Vilarinho.pdf.jpg*
dc.languageporpor
dc.publisherUniversidade Federal do Amazonaspor
dc.publisher.departmentInstituto de Computaçãopor
dc.publisher.countryBRpor
dc.publisher.initialsUFAMpor
dc.publisher.programPrograma de Pós-graduação em Informáticapor
dc.rightsAcesso Abertopor
dc.subjectGerenciamento de citaçõespor
dc.subjectExtração de metadadospor
dc.subjectCitation managementeng
dc.subjectMetadata extractioneng
dc.subject.cnpqCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOpor
dc.titleUma abordagem flexível para extração de metadados em citações bibliográficaspor
dc.typeDissertaçãopor
Appears in Collections:Mestrado em Informática

Files in This Item:
File Description SizeFormat 
Dissertação - Eli Cortez Custódio Vilarinho.pdfDissertação - Eli Cortez Custódio Vilarinho.pdf1.35 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.