Distância diacrónica automática entre variantes diatópicas do português e do espanhol
Linguamática 12(1) : 117-126 (2020)
Abstract
[POR] O objetivo deste trabalho é aplicar uma metodologia baseada na perplexidade, para calcular automaticamente a distância interlinguística entre diferentes períodos históricos de variantes diatópicas de idiomas. Esta metodologia aplica-se a um corpus construído adhoc em ortografia original, numa base equilibrada de ficção e não-ficção, que mede a distância histórica entre o português europeu e do Brasil, por um lado, e o espanhol europeu e o da Argentina, por outro. Os resultados mostram distâncias muito próximas em ortografia original e transcrita automaticamente, entre as variedades diatópicas do português e do espanhol, com ligeiras convergências/divergências desde meados do século XX até hoje. É de salientar que o método não é supervisionado e pode ser aplicado a outras variedades diatópicas de línguas. [EN] The objective of this work is to apply a perplexitybased
methodology to automatically calculate the
cross-lingual distance between different historical periods
of diatopic language variants. This methodology
applies to an adhoc constructed corpus in original
spelling, on a balanced basis of fiction and non-fiction,
which measures the historical distance between European
and Brazilian Portuguese on the one hand,
and European and Argentinian Spanish on the other.
The results show very close distances, both in original
spelling and automatically transcribed spelling,
between the diatopic varieties of Portuguese and Spanish,
with slight convergences/divergences from the
middle of the 20th century until today. It should be noted that the method is not supervised and can be
applied to other diatopic varieties of languages.