Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas

DSpace Repository

A- A A+

Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas

Show simple item record

dc.contributor Universidade Federal de Santa Catarina pt_BR
dc.contributor.advisor Lima, Ronaldo pt_BR
dc.contributor.author Bartholamei Junior, Lautenai Antonio pt_BR
dc.date.accessioned 2015-03-18T20:50:24Z
dc.date.available 2015-03-18T20:50:24Z
dc.date.issued 2013 pt_BR
dc.identifier.other 328193 pt_BR
dc.identifier.uri https://repositorio.ufsc.br/xmlui/handle/123456789/130892
dc.description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Estudos da Tradução, Florianópolis, 2013. pt_BR
dc.description.abstract A extração terminológica bilíngue cada vez mais se firma como um campo de pesquisa explorado por pesquisadores no âmbito dos Estudos da Tradução. Parte considerável das investigações atualmente desenvolvidas volta-se à operacionalização das tarefas de extração terminológica por meio de ferramentas computacionais, produzindo glossários para servirem como ferramenta de apoio aos tradutores. Esta pesquisa de doutoramento desenvolve uma proposta sequencial para a extração terminológica na área das Ciências Médicas, centrando-se principalmente em uma lacuna detectada em estudos anteriores, a saber: a busca por correspondentes tradutórios dos candidatos a termos, geralmente realizada, de forma manual. Nesta perspectiva, o estudo emprega ferramentas fornecidas pelo Processamento da Linguagem Natural (PLN), evocando principalmente as seguintes disciplinas: Linguística de Corpus, Corpora nos Estudos da Tradução, Terminologia e Extração Terminológica, com o intuito de oferecer um processo sistemático que contemple o processo de extração terminológica. Na presente proposta, os dados obtidos evidenciam altos níveis de precisão, que levam a supor que por meio da referida abordagem a recuperação de candidatos a termos e a busca por seus correspondentes tradutórios pode efetivamente ser otimizadas, revelando-se tão eficiente quanto a extração terminológica realizada analogicamente por especialistas. Em uma escala numérica de 0 (zero) a 1 (um), a probabilidade de 0,822645962, 0.969518 e, em alguns casos, 1 (um), explicita a precisão dos correspondentes tradutórios. Os resultados ainda demonstraram que, embora os corpora utilizados para análise estejam expostos em português europeu, e circunscritos uma área especifica do conhecimento, os valores semânticos dos correspondentes tradutórios foram mantido. Na proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos, a ordem sequencial proposta, tal como os sistemas informáticos desenvolvidos para o processamento dos dados tratam do par de idiomas inglês-português, no entanto, poderão ser utilizados outros pares de línguas e corpora de outros campos do conhecimento.<br> pt_BR
dc.description.abstract Abstract : Bilingual terminology extraction increasingly firm as a field of research explored by scholars in the context of Translation Studies. Considerable part of the researches currently carried back to the operationalization of terminology extraction tasks by using computational tools, producing glossaries to serve as a support tool for translators. The research developed in this PhD dissertation aims to develop a sequential proposal for terminology extraction in the field of Medical Sciences focusing mainly on a gap detected in previous studies, viz., searching for matching translation equivalents for terms candidates generally heldmanually. In this perspective, the study uses tools provided by Natural Language Processing (NLP), mostly evoking the following disciplines: Corpus Linguistics, Corpora in Translation Studies, Terminology and Terminology Extraction, in order to offer a systematic process that addresses the terminology extraction task. In the proposal, data gathered presented high levels of accuracy, leading us to believe that through this approach for retrieval of translation equivalents for the terms candidates can be optimized effectively, preserving as efficient in terminology extraction as performed by specialists. In a numerical scale from 0 (zero) to 1 (one), probabilities as in 0.822645962 , 0.969518 , and in some cases 1 (one) explicit translation equivalents retrieval accuracy. The results also showed that, although the corpora used for analysis are exposed in European Portuguese, and circumscribed a specific area of knowledge, the semantic value of the translation equivalents was maintained. In the sequential order proposal and creation of systems for bilingual terminology extraction in parallel corpora , the sequential order proposed, as well the computational systems developed for data processing dealing with the English-Portuguese language pair, however, it cloud be used to other languages pairs and corpora to other fields of knowledge. en
dc.format.extent 200 p.| il., grafs., tabs. pt_BR
dc.language.iso por pt_BR
dc.subject.classification Tradução e interpretação pt_BR
dc.subject.classification Linguistica - pt_BR
dc.subject.classification Processamento de dados pt_BR
dc.subject.classification Tradução mecânica pt_BR
dc.subject.classification Ciências médicas pt_BR
dc.subject.classification Terminologia pt_BR
dc.title Proposta de ordem sequencial e criação de sistemas informáticos para extração terminológica bilíngue em corpora paralelos - inglês/português - com vistas à tradução de texto das ciências médicas pt_BR
dc.type Tese (Doutorado) pt_BR
dc.contributor.advisor-co Durand, Alain-Philippe pt_BR


Files in this item

Files Size Format View
328193.pdf 1.948Mb PDF View/Open

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar