Training and analyzing a Transformer-based machine translation model

Pimentel, Clóvis Henrique Martins; Pires, Thiago Blanch

Acessibilidade / Reportar erro

Brasil

Español English

sumário « anterior atual seguinte »

Sumário

Artigos • Texto livre 17 • 2024 • https://doi.org/10.1590/1983-3652.2024.49118 copy

Training and analyzing a Transformer-based machine translation model

Authorship SCIMAGO INSTITUTIONS RANKINGS

abstract

The objective of this work is to analyze transformer-based machine translation models. It aims to test the feasibility of using trained models based on specialized corpus. For the training of such model, a parallel English-French corpus was built with seven texts related to the Convention of 25 October 1980 on the Civil Aspects of International Child Abduction. The translation results obtained by the trained model were compared with those produced by Google Translate. For the evaluation stage, sacreBLEU automatic evaluation and human evaluation methods were used. The outcome of the automatic evaluation of sentences produced by the trained model was, on average, higher than those generated by the non-trained model. The human evaluation of the sentences revealed that there were adequacy errors in the use of language specific to the subject matter of the 1980 Hague Convention both in sentences generated by the trained model and in sentences generated by the Google Translate model.

Keywords:
Computational Linguistics; Machine translation; Transformer; Parallel corpus; Machine translation evaluation

Texto em Inglês	Texto em Francês
Convention on the Civil Aspects of International Child Abduction	Convention Sur Les Aspects Civils De L’enlèvement International D’enfants
Concluded 25 October 1980	Conclue le 25 octobre 1980
The States signatory to the present Convention,	Les Etats signataires de la présente Convention,
Firmly convinced that the interests of children are of paramount importance in matters relating to their custody,	Profondément convaincus que l’intérêt de l’enfant est d’une importance primordiale pour toute question relative à sa garde,
Desiring to protect children internationally from the harmful effects of their wrongful removal or retention and to establish procedures to ensure their prompt return to the State of their habitual residence, as well as to secure protection for rights of access,	Désirant protéger l’enfant, sur le plan international, contre les effets nuisibles d’un déplacement ou d’un non-retour illicites et établir des procédures en vue de garantir le retour immédiat de l’enfant dans l’Etat de sa résidence habituelle, ainsi que d’assurer la protection du droit de visite,
Have resolved to conclude a Convention to this effect and have agreed upon the following provisions.	Ont résolu de conclure une Convention à cet effet, et sont convenus des dispositions suivantes.

Chave	Score sacreBLEU	Modelo Treinado
316	32,5	32,6
384	29,5	58,1
635	71,9	50,7
796	22,8	23,2
852	8,3	6,3
950	20,6	12,6
965	21	63,9
1013	82,4	91,2
1166	7,3	7,1
1377	22	26,3
1390	33	7,8
1399	49,2	11,4
1411	49,8	36,1
1418	23,4	10
1437	5,7	14,1
1451	14,4	9,4
1455	29	24,6
1471	37,5	33,5
1486	41,4	34,8
1520	31,9	27,2
Média	31,7	29,0

Frase EN para tradução	FR Referência	Resultado Tradução Modelo	Resultado Tradução Google
Convention of cooperation among authorities [Convenção de cooperação entre autoridades]	Une convention de coopération entre autorités [Uma convenção de cooperação entre autoridade]	Convention de coopération entre les autorités [Uma convenção de cooperação entre as autoridades]	Convention de coopération entre collectivités [Uma convenção de cooperação entre as autoridades territoriais]

Frase EN para tradução	Frase FR Referência	Resultado Tradução Modelo	Resultado Tradução Google
Requesting Central Authorities are often under pressure from applicants (usually left-behind parents) to provide daily reports of progress [Autoridades Centrais requerentes geralmente estão sob pressão dos demandantes (geralmente os genitores que foram deixados para trás) para fornecer relatórios diários de progresso]	Les demandeurs (généralement les parents privés de leur enfant) exercent souvent des pressions sur les Autorités centrales pour qu’elles leur fournissent des rapports de suivi journaliers [Os demandantes (geralmente os pais privados de seus filhos) geralmente fazem pressão nas Autoridades Centrais para que elas lhes forneça relatórios diários de monitoramento]	Les Autorités centrales requises sont souvent soumises à des pressions de la part des demandeurs (habituellement des parents laissés derrière eux) pour fournir des rapports quotidiens sur les progrès accomplis [As autoridades centrais requeridas estão frequentemente sob pressão dos demandantes (geralmente os pais deixados para trás) para fornecer relatórios diários de progresso]	Les Autorités centrales requérantes subissent souvent des pressions de la part des demandeurs (généralement des parents délaissés) pour qu’elles fournissent des rapports quotidiens sur les progrès [As Autoridades Centrais Requerentes são frequentemente pressionadas pelos demandantes (geralmente pais deixados para trás) a fornecer relatórios diários de progresso]

Universidade Federal de Minas Gerais - UFMG Av. Antônio Carlos, 6627 - Pampulha, Cep: 31270-901, Belo Horizonte - Minas Gerais / Brasil, Tel: +55 (31) 3409-6009 - Belo Horizonte - MG - Brazil
E-mail: revistatextolivre@letras.ufmg.br

Acompanhe os números deste periódico no seu leitor de RSS

[1] ^* Email: clovismpimentel@gmail.com