<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD with OASIS Tables with MathML3 v1.3 20210610//EN" "https://jats.nlm.nih.gov/publishing/1.3/JATS-journalpublishing-oasis-article1-3-mathml3.dtd">
<?xml-model type="application/xml-dtd" href="http://jats.nlm.nih.gov/publishing/1.3/JATS-journalpublishing-oasis-article1-3-mathml3.dtd"?>
<article xmlns:ali="http://www.niso.org/schemas/ali/1.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" dtd-version="1.3" article-type="research-article" xml:lang="pt">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">ELG</journal-id>
      <journal-title-group>
        <journal-title specific-use="original">Estudos de Lingüística Galega</journal-title>
      </journal-title-group>
      <issn pub-type="ppub">1889-2566</issn>
      <issn publication-format="electronic">1989-578X</issn>
      <publisher>
        <publisher-name>Universidade de Santiago de Compostela</publisher-name>
        <publisher-loc>
          <country>España</country>
          <email>sepinter@usc.es</email>
        </publisher-loc>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="art-access-id">9812</article-id>
      <article-id pub-id-type="doi">https://doi.org/10.15304/elg.17.9812</article-id>
      <article-categories>
        <subj-group subj-group-type="heading">
          <subject>Pescuda</subject>
        </subj-group>
      </article-categories>
      <title-group>
        <article-title>Evidências do Português Médio no <italic>Corpus de Textos Antigos</italic></article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Evidences of Middle Portuguese in the <italic>Corpus of Ancient Texts</italic></trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-6280-9417</contrib-id>
          <name>
            <surname>Bico</surname>
            <given-names>Maria Inês</given-names>
          </name>
          <xref ref-type="aff" rid="aff-1-9812"><sup>1</sup></xref>
          <xref ref-type="aff" rid="aff-2-9812"><sup>2</sup></xref>
          <xref ref-type="corresp" rid="corr-1-9812"><sup>a</sup></xref>
        </contrib>
        <contrib contrib-type="author" corresp="no">
          <contrib-id contrib-id-type="orcid">https://orcid.org/0000-0003-4700-9830</contrib-id>
          <name>
            <surname>Cardeira</surname>
            <given-names>Esperança</given-names>
          </name>
          <xref ref-type="aff" rid="aff-1-9812"><sup>1</sup></xref>
          <xref ref-type="aff" rid="aff-2-9812"><sup>2</sup></xref>
        </contrib>
        <contrib contrib-type="author" corresp="no">
          <contrib-id contrib-id-type="orcid">https://orcid.org/0000-0003-4603-4364</contrib-id>
          <name>
            <surname>Baptista</surname>
            <given-names>Jorge</given-names>
          </name>
          <xref ref-type="aff" rid="aff-3-9812"><sup>3</sup></xref>
          <xref ref-type="aff" rid="aff-4-9812"><sup>4</sup></xref>
        </contrib>
        <contrib contrib-type="author" corresp="no">
          <contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-1075-0177</contrib-id>
          <name>
            <surname>Batista</surname>
            <given-names>Fernando</given-names>
          </name>
          <xref ref-type="aff" rid="aff-3-9812"><sup>3</sup></xref>
          <xref ref-type="aff" rid="aff-5-9812"><sup>5</sup></xref>
        </contrib>
        </contrib-group>
        <aff id="aff-1-9812">
          <label><sup>1</sup></label>
          <institution content-type="original">Centro de Linguística da Universidade de Lisboa (Portugal)</institution>
          <institution content-type="orgname">Universidade de Lisboa</institution>
          <institution content-type="orgdiv1">Universidade de Lisboa</institution>
          <country country="PT">Portugal</country>
        </aff>
        <aff id="aff-2-9812">
          <label><sup>2</sup></label>
          <institution content-type="original">Faculdade de Letras da Universidade de Lisboa (Portugal)</institution>
          <institution content-type="orgname">Universidade de Lisboa</institution>
          <institution content-type="orgdiv1">Faculdade de Letras</institution>
          <country country="PT">Portugal</country>
        </aff>
        <aff id="aff-3-9812">
          <label><sup>3</sup></label>
          <institution content-type="original">INESC-ID Lisboa (Portugal)</institution>
          <institution content-type="orgname">Instituto de Ingeniería de Sistemas e Computadores - Investigación y Desarrollo</institution>
          <country country="PT">Portugal</country>
        </aff>
        <aff id="aff-4-9812">
          <label><sup>4</sup></label>
          <institution content-type="original">Universidade do Algarve (Portugal)</institution>
          <institution content-type="orgname">Universidade do Algarve</institution>
          <country country="PT">Portugal</country>
        </aff>
        <aff id="aff-5-9812">
          <label><sup>5</sup></label>
          <institution content-type="original">ISCTE-IUL (Portugal)</institution>
          <institution content-type="orgname">Instituto Superior de Ciências do Trabalho e da Empresa-Instituto Universitário de Lisboa</institution>
          <country country="PT">Portugal</country>
        </aff>
      <author-notes>
        <corresp id="corr-1-9812"><sup>a</sup> <email xlink:href="mariainesb1@edu.ulisboa.pt">mariainesb1@edu.ulisboa.pt</email></corresp>
      </author-notes>
      <pub-date date-type="pub" publication-format="electronic" iso-8601-date="2025-06-30">
        <day>30</day>
        <month>06</month>
        <year>2025</year>
      </pub-date>
      <pub-date date-type="collection" publication-format="electronic">
        <month>06</month>
        <year>2025</year>
      </pub-date>
      <volume>17</volume>
      <elocation-id>9812</elocation-id>
      <history>
        <date date-type="received" iso-8601-date="2024-04-08">
          <day>08</day>
          <month>04</month>
          <year>2024</year>
        </date>
        <date date-type="accepted" iso-8601-date="2025-04-09">
          <day>09</day>
          <month>04</month>
          <year>2025</year>
        </date>
      </history>
      <permissions>
        <copyright-statement>Copyright © Universidad de Santiago de Compostela</copyright-statement>
        <copyright-year>2025</copyright-year>
        <copyright-holder>Universidad de Santiago de Compostela</copyright-holder>
        <ali:free_to_read/>
        <license license-type="open-access" xlink:href="https://creativecommons.org/licenses/by-nc-nd/4.0/">
          <ali:license_ref>https://creativecommons.org/licenses/by-nc-nd/4.0/</ali:license_ref>
          <license-p>Artículo en acceso abierto distribuido bajo los términos de la licencia Atribución-NoComercial-SinObraDerivada 4.0 Internacional (CC BY-NC-ND 4.0)</license-p>
        </license>
      </permissions>
      <abstract>
        <title>Resumo</title>
        <p>A partir de um conjunto de dados semi-automaticamente anotados do <italic>Corpus de Textos Antigos</italic> (CTA), este artigo propõe-se a analisar os resultados obtidos sobre a síncope de <italic>-d-</italic> intervocálico no morfema da 2.ª pessoa plural, e a consequente resolução do hiato, e as terminações de Particípio Passado <italic>-udo/-ido</italic> nos verbos com origem etimológica nas 2.ª e 3.ª conjugações latinas. A novidade deste artigo está no recurso a métodos de Processamento de Linguagem Natural (PLN) para a otimização da obtenção e extração sistemática dos dados relevantes para análise, contribuindo para um estudo que engloba um maior conjunto de textos. É apresentada a metodologia adotada para a anotação dos dados, e consequente extração dos dados relevantes à análise, afirmando-se a importância do recurso a métodos e ferramentas de PLN para o estudo linguístico e para a descrição dos estados anteriores da língua portuguesa.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <title>Abstract</title>
        <p>Based on a set of semi-automatically annotated data from the <italic>Corpus of Ancient Texts</italic> (CTA), this paper aims at analysing the results obtained on the syncopation of intervocalic <italic>-d-</italic> in the second-person plural morpheme, resulting in a hiatus resolution, and the past participle ending forms <italic>-udo/-ido</italic> in verbs with an etymological origin in the 2nd and 3rd Latin conjugations. The novelty of this article lies in the use of Natural Language Processing (NLP) methods to optimise the systematic collection and extraction of relevant data for analysis, contributing to a study that encompasses a larger set of texts. The methodology used for annotating the data and, consequently, extracting the relevant data for analysis is presented, stating the importance of resorting to NLP methods and tools for the purpose of linguistic study and for describing previous stages of the Portuguese language.</p>
      </trans-abstract>
      <kwd-group>
        <title>Palabras-chave</title>
        <kwd>Português Médio</kwd>
        <kwd>Corpus de Textos Antigos</kwd>
        <kwd>História do Português</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <title>Keywords</title>
        <kwd>Middle Portuguese</kwd>
        <kwd>Corpus of Ancient Texts</kwd>
        <kwd>History of Portuguese</kwd>
      </kwd-group>
      <funding-group id="fug-1-9812">
        <award-group award-type="contract" id="awg-1-9812">
          <funding-source id="fus-1-9812">
            <institution-wrap>
              <institution>Fundos Nacionais da Fundação para a Ciência e a Tecnologia</institution>
            </institution-wrap>
          </funding-source>
          <award-id id="awi-1-9812">UIDB/50021/2020</award-id>
          <principal-award-recipient>
            <name>
              <surname>Baptista</surname>
              <given-names>J.</given-names>
            </name>
          </principal-award-recipient>
          <principal-award-recipient>
            <name>
              <surname>Baptista</surname>
              <given-names>F.</given-names>
            </name>
          </principal-award-recipient>
        </award-group>
        <award-group award-type="contract" id="awg-2-9812">
          <funding-source id="fus-2-9812">
            <institution-wrap>
              <institution>Faculdade de Letras da Universidade de Lisboa</institution>
            </institution-wrap>
          </funding-source>
          <award-id id="awi-2-9812">UIDP/00214/2020</award-id>
          <principal-award-recipient>
            <name>
              <surname>Cardeira</surname>
              <given-names>E.</given-names>
            </name>
          </principal-award-recipient>
        </award-group>
        <award-group award-type="contract" id="awg-3-9812">
          <funding-source id="fus-3-9812">
            <institution-wrap>
              <institution>Centro de Linguística da Universidade de Lisboa</institution>
            </institution-wrap>
          </funding-source>
          <award-id id="awi-3-9812">UIDP/00214/2020</award-id>
          <principal-award-recipient>
            <name>
              <surname>Cardeira</surname>
              <given-names>E.</given-names>
            </name>
          </principal-award-recipient>
        </award-group>
        <award-group award-type="contract" id="awg-4-9812">
          <funding-source id="fus-4-9812">
            <institution-wrap>
              <institution>Bolsa de Doutoramento</institution>
            </institution-wrap>
          </funding-source>
          <award-id id="awi-4-9812">UI/BD/152806/2022</award-id>
          <principal-award-recipient>
            <name>
              <surname>Bico</surname>
              <given-names>M.I.</given-names>
            </name>
          </principal-award-recipient>
        </award-group>
        <funding-statement>A investigação para este trabalho foi financiada por Fundos Nacionais da Fundação para a Ciência e a Tecnologia: J. Baptista e F. Batista (INESC-ID Lisboa, proj. ref UIDB/50021/2020), E. Cardeira (Faculdade de Letras da Universidade de Lisboa, Centro de Linguística da Universidade de Lisboa, proj. ref. UIDP/00214/2020) e M.I. Bico pela Bolsa de Doutoramento (proj. ref. UI/BD/152806/2022).</funding-statement>
      </funding-group>
      <counts>
        <fig-count count="3"/>
        <table-count count="3"/>
        <equation-count count="0"/>
        <ref-count count="25"/>
      </counts>
    </article-meta>
  </front>
  <body>
    <sec sec-type="intro" id="sec-1-9812">
      <title>1. INTRODUÇÃO</title>
      <p>A periodização de uma língua é uma “ilusão útil” (Castro 2006:73). Dada a própria natureza da língua, não é possível determinar o momento concreto da mudança, que só é percebida <italic>a posteriori</italic>. No entanto o estabelecimento de balizas temporais que se podem estender por largos anos ou séculos auxilia a situar o investigador, sem que seja necessário precisar datas. As datas sugeridas para a delimitação do Português Médio são entre 1385 e 1420 para o seu início e entre 1536 e 1550 para o seu término (Castro 2006: 73). Não sendo datas consensuais entre a comunidade académica (<xref rid="ref-4-9812" ref-type="bibr">Cardeira 2005:28</xref>), são datas que se baseiam em acontecimentos extralinguísticos: a vitória a favor dos portugueses na Batalha de Aljubarrota (1385) e a concretização da mudança de paradigma na sociedade (1420); a publicação da primeira gramática da Língua Portuguesa (1536) e o efeito desta reflexão metalinguística nos anos subsequentes (1550).</p>
      <p>Independentemente das datas aqui apresentadas, este período que se estende por cerca de século e meio é entendido como um “período crítico, crucial na história da língua portuguesa” (<xref rid="ref-4-9812" ref-type="bibr">Cardeira 2005: 292</xref>). É um período que simultaneamente se afasta das formas e construções do galego-português e seleciona e elabora aquelas que constituem a base do português clássico e do português moderno. As razões para a identificação e caracterização deste período foram amplamente apresentadas por <xref rid="ref-4-9812" ref-type="bibr">Cardeira (2005)</xref>, mas é de destacar o processo de elaboração a que a língua foi sujeita. Com a vitória em Aljubarrota, a dinastia de Avis consolida o seu poder a Sul, na cidade de Lisboa, que se desenvolve como centro urbano e de ação política, e ponto de partida para a expansão marítima. A classe burguesa, que apoiara o Mestre de Avis na defesa da independência, floresce, enquanto a antiga nobreza que apoiara Castela cai em desfavorecimento. O novo modelo é a corte de Avis e o dialeto centro-meridional do eixo Lisboa-Coimbra. É neste contexto que se verificam mudanças que se caracterizam pela “rejeição de marcas setentrionais, dialetais e antigas” (Castro 2006:154) e pela demarcação de diferenças com as línguas vizinhas, em especial o galego.</p>
      <p>No presente artigo, iremos explorar algumas das mudanças observadas neste período da história da língua. A partir dos textos presentes no Corpus de Textos Antigos (CTA)<sup><xref ref-type="fn" rid="fn-1-9812">1</xref></sup> (<xref rid="ref-8-9812" ref-type="bibr">CLUL 2015</xref>) e do trabalho já realizado no sentido de enriquecer os dados do corpus (<xref rid="ref-3-9812" ref-type="bibr">Bico et al. 2022</xref>), foram selecionados dois dos fenómenos linguísticos –a síncope de <italic>-d-</italic> intervocálico e as terminações <italic>-udo</italic> e <italic>-ido</italic> nas formas de Particípio Passado– que caracterizam o Português Médio e o afastam do Português Antigo. A análise alargada destes fenómenos a um conjunto de sete textos terá dois objetivos. Em primeiro lugar, caracterizar o estado da língua de cada texto e confrontar os resultados obtidos à luz daquilo que se sabe sobre a datação do momento de escrita e do momento de cópia. Em segundo lugar, a análise a um maior conjunto de textos permite comparar os vários resultados entre si, culminando na criação de uma linha temporal.</p>
      <p>Este artigo estrutura-se da seguinte forma: na Secção 2 apresenta-se o CTA e todo o trabalho já desenvolvido neste projeto; a Secção 3 faz uma apresentação sumária dos textos selecionados para análise, os contextos de produção e de cópia; a Secção 4 apresenta a metodologia adotada; na Secção 5 apresentam-se os resultados da análise da síncope de <italic>-d-</italic> intervocálico (5.1) e das terminações <italic>-udo</italic> e <italic>-ido</italic> nas formas de Particípio Passado (5.2); na Secção 6 discutem-se os resultados; a Secção 7 apresenta as principais conclusões e trabalho futuro.</p>
    </sec>
    <sec id="sec-2-9812">
      <title>2. CORPUS DE TEXTOS ANTIGOS</title>
      <p>O Corpus de Textos Antigos (CTA) é um projeto do Centro de Linguística da Universidade de Lisboa, iniciado em 2015. O corpus tem como objetivo tornar disponível edições de alta-fidelidade aos testemunhos dos textos, procurando ter uma intervenção editorial mínima. Neste sentido, são preservados todos os erros, as lacunas, bem como a grafia original dos testemunhos. Com este objetivo, o CTA procura fornecer dados que ajudem a análise linguística e o estudo da transmissão dos variados textos, além de dar acesso a textos até então inéditos. Os textos publicados no CTA deverão ter sido escritos ou traduzidos para o português até 1525<sup><xref ref-type="fn" rid="fn-2-9812">2</xref></sup>, podendo os testemunhos ser posteriores a esta data. O CTA utiliza a plataforma TEITOK (<xref rid="ref-15-9812" ref-type="bibr">Janssen 2016</xref>), uma ferramenta com uma interface amiga do utilizador, que permite a coexistência de informação linguística e informação textual.</p>
      <p>Em fevereiro de 2024, o corpus é composto por 32 edições, existindo três textos que estão representados por mais do que um testemunho: o <italic>Horto do Esposo</italic>, com um manuscrito e três fragmentos; a <italic>Vida de Santa Maria Egipcíaca</italic>, com dois testemunhos; e a <italic>Vida e Milagres de Santa Senhorinha de Basto</italic>, com quatro testemunhos.</p>
      <p>Com o intuito de enriquecer os dados já presentes no CTA, recorreu-se a ferramentas e métodos de Processamento de Linguagem Natural. Alguns dos textos do corpus foram selecionados para experiências de lematização e anotação de categorias morfossintáticas (part-of-speech). O presente trabalho utiliza a tokenização feita pelo TEITOK aquando da inserção dos textos na plataforma. Esta decisão teve por motivo a necessidade de não alterar os ficheiros XML de onde foram extraídos os dados e a consequente alteração das edições feitas por vários editores.</p>
      <p>Primeiro, definiram-se as linhas orientadoras para a lematização e definiu-se o conjunto de etiquetas de anotação (<italic>tagset</italic>) para a anotação morfossintática e respetivos valores flexionais. Para além do princípio da preservação da tokenização feita pelo TEITOK, adotou-se um princípio de simplicidade na anotação, que tinha como objetivo a otimização do esforço inicial da anotação manual dos dados de treino. As linhas orientadoras para a lematização definem que cada lema deve corresponder, sempre que possível, à tradição lexicográfica, isto é: singular nas palavras variáveis em número; masculino nas palavras variáveis em género; infinitivo nos verbos, etc.. Por razões histórico-linguísticas, algumas formas são anotadas com palavras que já não fazem parte do léxico do Português Contemporâneo, como por exemplo as formas átonas dos determinantes possessivos femininos <italic>ma</italic>, <italic>ta</italic>, <italic>sa</italic> e os determinantes/pronomes <italic>esto</italic>, <italic>esso</italic>, <italic>aquesto</italic>, <italic>aqueste</italic>. Também está definido que teriam lemas distintos palavras que, apesar da mesma raiz etimológica, tivessem sofrido processos de evolução distintos, consoante o momento de entrada na língua, independentemente de terem conservado o mesmo significado (exemplo: <italic>paço/palácio</italic>). Foi definida a norma para a anotação dos pronomes pessoais, que seriam registados sob o lema <italic>eu</italic>, estando a informação morfossintática distinguida por meio das respetivas etiquetas (caso, pessoa, número, género).</p>
      <p>Quanto à anotação morfossintática, adotou-se um conjunto de etiquetas originalmente desenvolvidas e aplicadas para o Português Contemporâneo (<xref rid="ref-11-9812" ref-type="bibr">Eleutério et al. 1995</xref>; <xref rid="ref-18-9812" ref-type="bibr">Ranchhod 2001</xref>; <xref rid="ref-17-9812" ref-type="bibr">Ranchhod et al. 1999</xref>), adaptando-o às particularidades do Português Medieval. São contempladas nove categorias: nome, adjetivo, verbo, pronome, advérbio, preposição, conjunção, determinante e interjeição. No <italic>tagset</italic> incluem-se também subcategorias que descrevem com maior granularidade as palavras. Por exemplo, neste conjunto inclui-se a etiqueta para os nomes próprios, para os pronomes/determinantes possessivos, demonstrativos, indefinidos, etc. São também definidas as etiquetas para os valores flexionais de género (masculino/feminino), número (singular/plural), pessoa (1.ª/2.ª/3.ª). No caso dos verbos, um conjunto de 14 etiquetas identifica simultaneamente o Tempo e o Modo verbal de cada forma verbal; também nos pronomes pessoais se faz a identificação do caso (nominativo, acusativo, dativo, oblíquo, reflexivo) através de um conjunto de etiquetas próprias. Todas as marcas gráficas de pontuação têm como lema ‘_’ e como etiqueta ‘SENT’. Para as palavras que expressam a negação, como por exemplo <italic>não</italic>, <italic>nada</italic>, <italic>nenhum</italic>, é aplicada a etiqueta ‘neg’ que é assinalada como traço (<italic>feature</italic>). A atribuição de uma categoria morfossintática e dos respetivos valores flexionais de determinada forma está condicionada pelo contexto particular em que esta se insere.</p>
      <p>Posteriormente, selecionou-se o texto do ms. A do <italic>Horto do Esposo</italic> (doravante HdE-A) para a tarefa de anotação manual com vista à criação de um conjunto de dados de treino para a anotação automática. Foram anotados cerca de 150 mil tokens, incluindo pontuação.</p>
      <p>Conforme apresentado em <xref rid="ref-3-9812" ref-type="bibr">Bico et. al (2022)</xref>, com estes dados foi treinado um primeiro modelo de anotação, usando o TreeTagger (<xref rid="ref-19-9812" ref-type="bibr">Schmid 1994</xref>, <xref rid="ref-20-9812" ref-type="bibr">1999</xref>), que por sua vez foi aplicado a um conjunto de dados proveniente de dois novos textos: os fragmentos D, C e E do <italic>Horto do Esposo</italic> (HdE-DCE) e o manuscrito G1 da <italic>Vida e Milagres de Santa Senhorinha de Basto</italic> (VMSSB-G1).  O comando para a anotação automática dos textos é feito através da linha de comandos. Este comando gera um ficheiro XLSX com os dados verticalizados, isto é, um token por linha<sup><xref ref-type="fn" rid="fn-3-9812">3</xref></sup>. Para além do token, do lema e da etiqueta morfossintática, este ficheiro contém a identificação do token, o contexto à direita e à esquerda do token. A presença do contexto imediato do token permite a revisão manual dos resultados dados pelo sistema e a sua correção, sempre que necessário.</p>
      <p>Na primeira experiência de anotação, os resultados de precisão variaram entre 67% e 90%. A precisão de 90% obtida em HdE-DCE é motivada pelo facto de se tratar de um conjunto de fragmentos do mesmo texto cujos dados foram utilizados para treinar o modelo. O resultado obtido em VMSB-G1 (67%) evidencia a multiplicidade de novas formas gráficas, que, sendo desconhecidas do sistema, isto é, não estando presentes no conjunto de dados de treino, não foram corretamente identificadas. A título de exemplo, no campo da pontuação, VMSB-G1 utiliza frequentemente a vírgula. No entanto, HdE-A não regista nenhuma ocorrência deste sinal, pelo que os dados de treino não contemplavam esta forma.</p>
      <p>Para melhor serem utilizados, os dados anotados automaticamente foram sujeitos a uma fase de revisão manual. A revisão dos dados permitiu que os dois textos anotados na experiência 1 fossem incluídos no conjunto de dados utilizados para treinar um segundo modelo de anotação. O modelo 2 foi treinado com pouco mais de 160 mil tokens, tendo sido posteriormente aplicado a quatro outros textos: o ms. E da <italic>Vida e Milagres de Santa Senhorinha de Basto</italic> (VMSSB-E), o <italic>Memorial da Infanta Santa Joana</italic> (MISJ), o <italic>Livro dos Mártires</italic> (LdM) e a <italic>História de mui nobre Vespasiano</italic> (Vespasiano). Face à primeira experiência, a precisão aumentou, com os resultados a variar entre os 76% e os 82% para cada um dos diferentes textos. O aumento da precisão evidencia a noção elementar de que quantos mais forem os dados de treino, melhores serão os resultados obtidos. Os resultados desta experiência revelam ainda alguma dificuldade em identificar marcas de pontuação, afetando o desempenho do anotador. Também a entrada de novo léxico, em particular nos textos que não têm nenhum outro testemunho nos dados de treino (isto é, em MISJ, Vespasiano e LdM) diminuiu os valores de precisão. Também foi possível verificar, particularmente em MISJ, que se encontram também palavras indevidamente segmentadas e, por isso, incorretamente tokenizadas. Todas estas instâncias são identificadas e anotadas de forma que os dados sejam inutilizados. A presença destes casos aumenta o número de tokens com lema e etiqueta morfossintática errados, diminuindo a precisão.</p>
      <p>O total de dados anotados linguisticamente, no final das duas experiências, é de cerca de meio milhão de tokens (510.366 tokens).</p>
    </sec>
    <sec id="sec-3-9812">
      <title>3. CTA: TEXTOS SELECIONADOS</title>
      <p>São sete os textos do CTA que estão lematizados e morfossintaticamente anotados. Nesta secção, apresentamos cada um deles, de modo a melhor contextualizá-los no período em que se inserem.</p>
      <p>Oriunda do <italic>scriptorium</italic> do Mosteiro de Alcobaça, <italic>Horto do Esposo</italic> é uma obra originalmente escrita em português, mas cuja autoria é desconhecida. Terá sido escrita entre 1390 e 1407, sendo um dos textos mais antigos presentes no CTA. Conhecem-se dois testemunhos, o Alc. 198 e o Alc. 212, guardados na Biblioteca Nacional de Portugal, estando as digitalizações disponíveis online<sup><xref ref-type="fn" rid="fn-4-9812">4</xref></sup>. Conhecem-se ainda os fragmentos D, C e E provenientes de um códice do Mosteiro do Lorvão que foi desmembrado e reutilizado na encadernação de livros notariais. O testemunho que se encontra editado no CTA é o Alc. 198, datado de finais do século XIV (1390-1437). Recorrendo a <italic>exempla</italic>, a obra aborda os mais diversos assuntos de uma perspetiva moral, didática e ascética, recorrendo às <italic>auctoritas</italic> e à Sagrada Escritura para ilustrar os seus argumentos (<xref rid="ref-12-9812" ref-type="bibr">Ferrero &amp; Peixeiro 1993: 315-317</xref>).</p>
      <p>Da <italic>História de mui nobre Vespasiano</italic> conhece-se apenas um incunábulo, impresso na oficina de Valentim Fernandes a 20 de abril de 1496, conforme indica o cólofon. Julga-se que este romance terá descendido do romance francês <italic>La Venjace Nostre Seigneur</italic>, escrito entre os séculos XII e XIII. A tradução portuguesa terá sido realizada por intermédio da tradução castelhana. Esta relação estabelece-se pela existência particular aos testemunhos peninsulares (para além do incunábulo português, conhecem-se quatro testemunhos castelhanos). A narrativa centra-se em torno da figura do imperador Vespasiano que, para curar-se da lepra, procura relíquias vindas de Jerusalém. Após a sua cura milagrosa, Vespasiano parte para Jerusalém que conquista e destrói (<xref rid="ref-6-9812" ref-type="bibr">Castro 1993: 311-312</xref>).</p>
      <p>Originalmente escrito em castelhano por Bernardo de Briuega, o <italic>Livro dos Mártires</italic> é a terceira parte de um projeto de cinco livros, encomendado por D. Afonso X de Castela. De natureza hagiográfica, relata a história de vida de santos e mártires, com particular destaque para mártires romanos e os Padres do Deserto. No reinado de D. Dinis (1279-1325), o texto foi traduzido para português. Apesar de hoje não se conhecer nenhum manuscrito da época, esta ilação advém da identificação de formas típicas do português do século XIV na edição de 1513, cujo exemplar único se encontra transcrito no CTA (<xref rid="ref-21-9812" ref-type="bibr">Sobral &amp; Cardeira 2018</xref>).</p>
      <p>O <italic>Memorial da Infanta Santa Joana</italic> narra a história da Infanta Joana (1453-1590), filha do rei D. Afonso V e da sua entrada e vida no Mosteiro de Jesus de Aveiro. Conhece-se um testemunho deste texto guardado na Biblioteca do Museu de Aveiro com a cota PT/MA/COD 9. Este testemunho conta com duas narrativas: a <italic>Crónica da Fundação do Mosteiro de Aveiro</italic> e o <italic>Memorial da Infanta Santa Joana</italic>. Embora distintos, ambos os textos mostram a “preexistência de um plano conjunto de ação” (<xref rid="ref-22-9812" ref-type="bibr">Sobral 2015:215</xref>). A autoria será feminina e dominicana aveirense, mas o nome em concreto é discutido: para <xref rid="ref-16-9812" ref-type="bibr">Madahil (1939)</xref>, terá sido Margarida Pinheiro, noviça no mosteiro com entrada em 1467; para <xref rid="ref-22-9812" ref-type="bibr">Sobral (2015:215)</xref>, terá sido Isabel Luís, irmã responsável pela instrução das noviças e copista no <italic>scriptorium</italic>. Sobre as balizas temporais, delimita-se o período entre 1513 e 1525 para o momento da escrita do texto, sendo o testemunho posterior a 1525.</p>
      <p>A <italic>Vida e Milagres de Santa Senhorinha de Basto</italic> relata a história de Santa Senhorinha, abadessa portuguesa do século X. São conhecidos quatro testemunhos da versão portuguesa, todos editados no CTA. Para o estudo do presente artigo, porém, apenas dois são contemplados (os mss. G1 e E), por estarem linguisticamente anotados. A data de redação inicial do texto terá ocorrido entre 1248 e 1284. O testemunho G1 terá sido produzido entre 1620 e 1645; o testemunho E é uma cópia autógrafa de Torcato Peixoto de Azevedo, realizada entre 1692 e 1705. A análise estemática da tradição de VMSSB levada a cabo por <xref rid="ref-9-9812" ref-type="bibr">Cruz (2018)</xref> concluiu que o testemunho G1 se encontra mais próximo do arquétipo, enquanto o testemunho E está dependente de um sub-arquétipo e terá sofrido contaminação de G1. O testemunho G1 é aquele que também está mais próximo do estado da língua do século XIII.</p>
    </sec>
    <sec sec-type="methods" id="sec-4-9812">
      <title>4. METODOLOGIA</title>
      <p>O conjunto de textos selecionados perfaz um total de cerca de meio milhão de <italic>tokens</italic>. A identificação e a extração dos dados relevantes para a análise linguística tornam-se pouco exequíveis sem o recurso a ferramentas de pesquisa e filtragem automáticas. Neste sentido, a lematização e a granularidade da anotação morfossintática, que inclui os valores flexionais, facilitam o processo de extração destes dados.</p>
      <p>Assim, para a análise da síncope de <italic>-d-</italic> intervocálico, a pesquisa focou-se na identificação de todos os tokens com a etiqueta ‘V’, relativa à categoria Verbo, e os valores flexionais ‘2p’ que indicam a 2.ª pessoa do plural. Esta pesquisa foi aplicada sobre todos os tempos e modos verbais em que o fenómeno acontece: no Presente (‘P’), no Pretérito Perfeito (‘J’), no Pretérito Imperfeito (‘I’), no Pretérito Mais-Que-Perfeito (‘M’) e no Futuro (‘F’) do Indicativo; no Presente (‘S’) e no Pretérito Imperfeito (‘T’) do Conjuntivo; e nos modos Condicional (‘C’) e Imperativo (‘Y’). Após este levantamento, foram identificadas todas as formas que continham <italic>-d-</italic> intervocálico no morfema e separadas daquelas que já não tinham este grafema.</p>
      <p>Para recolha de todas as ocorrências das formas de Particípio Passado, todos os textos foram filtrados para a identificação de uma das seguintes etiquetas –‘V:Kms’, ‘V:Kfs’, ‘V:Kmp’, ‘V:Kfp’– nas quais ‘V’ representa a categoria Verbo, ‘K’ indica o tempo e o modo verbal em causa (Particípio Passado), ‘m’ e ‘f’ dão conta da flexão em género (masculino e feminino); e ‘s’ e ‘p’ (singular e plural) dão indicação da flexão em número. Entre todas as instâncias obtidas, foram apenas selecionadas as formas pertencentes a verbos com origem etimológica na 2.ª ou na 3ª conjugações latinas (–ERE e –IRE), as únicas pertinentes para o estudo deste fenómeno.</p>
    </sec>
    <sec sec-type="results" id="sec-5-9812">
      <title>5. RESULTADOS</title>
      <sec id="sec-6-9812">
        <title>5.1. Síncope de <italic>-d-</italic> intervocálico e resolução de hiato</title>
        <p>No Português Antigo, o <italic>-t-</italic> intervocálico na terminação da 2.ª pessoa plural de todos os tempos do latim clássico na voz ativa sonorizou-se para <italic>-d-</italic> em todos os tempos verbais (ex.: <italic>amatis</italic> &gt; <italic>amades</italic>), exceto no Pretérito Perfeito. Posteriormente, o <italic>-d-</italic> intervocálico acaba por sofrer a síncope (ex.: <italic>amades</italic> &gt; <italic>ama-es</italic>), daí resultando um encontro vocálico que é resolvido durante o Português Médio. Para Bechara, este é o “fenómeno balizador por excelência” (<xref rid="ref-2-9812" ref-type="bibr">1991:70</xref>). Segundo a cronologia estabelecida por <xref rid="ref-4-9812" ref-type="bibr">Cardeira (2005:185-186)</xref>, até ao início do século XV, as <italic>formas plenas</italic>, isto é, aquelas que conservam o <italic>-d-</italic> intervocálico, são superiores às <italic>formas sincopadas</italic>, aquelas que evidenciam a síncope, e que ocorrem esporadicamente na escrita, mas poderiam ser mais frequentes no registo oral. A tendência inverte-se entre 1410 e 1430, e na segunda metade do século XVI, as formas plenas são raras e arcaicas.</p>
        <p>O encontro vocálico resultante da síncope de <italic>-d-</italic> intervocálico é resolvido através da ditongação (ex.: <italic>mandades</italic> &gt; <italic>manda-es</italic> &gt; <italic>mandais</italic>) no Presente do Indicativo, no Imperativo da 1.ª e 2.ª conjugação, no Futuro do Indicativo, no Presente do Conjuntivo e no Pretérito-Imperfeito do Conjuntivo de todos os verbos. No Pretérito-Imperfeito, no Pretérito-Mais-Que-Perfeito e no Condicional ocorrem dois fenómenos: assimilação e ditongação (ex.: <italic>mandavades</italic> &gt; <italic>mandava-es</italic> &gt; <italic>mandavees</italic> &gt; <italic>mandaveis</italic>).  No Presente do Indicativo e no Imperativo dos verbos da 3.ª conjugação ocorre uma crase (ex.: <italic>dormides</italic> &gt; <italic>dormi-es</italic> &gt; <italic>dormis</italic>).</p>
        <p>Atente-se agora nos dados obtidos nos textos anotados do CTA, relativamente à síncope de <italic>-d-</italic> intervocálico no morfema da 2.ª pessoa plural (<xref rid="taw-1-9812" ref-type="table">Tabela 1</xref>).</p>
        <p>
        <table-wrap id="taw-1-9812">
          <label>Tabela 1</label>
          <caption>
            <title>Total das formas plenas e das formas sincopadas (valores absolutos)</title>
          </caption>
          <table style="font-size:11pt;font-family:'Cambria';" id="tab-1-9812">
            <thead>
              <tr>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;text-align:center;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;"><sc>Texto</sc></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;text-align:center;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;"><sc>Formas plenas</sc></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;text-align:center;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;"><sc>Formas sincopadas</sc></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;text-align:center;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;"><sc>Total</sc></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;text-align:center;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;white-space:pre-line"><sc>Proporção de 
                formas sincopadas</sc></th>
              </tr>
            </thead>
            <tbody>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">VMSSB-G1</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">21</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">1</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">22</td>
                <td style="background-color:#F3FCFF;color:#000000;text-align:center;border-bottom:0.5pt solid;">4.5%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">VMSSB-E</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">19</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">1</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">20</td>
                <td style="background-color:#D9E2F3;color:#000;text-align:center;border-bottom:0.5pt solid;">5.0%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">LdM</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">750</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">81</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">831</td>
                <td style="background-color:#D9E2F3;color:#000;text-align:center;border-bottom:0.5pt solid;">9.7%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">HdE-A</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">141</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">1</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">142</td>
                <td style="background-color:#FEFFFF;color:#000000;text-align:center;border-bottom:0.5pt solid;">0.7%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">HdE-DCE</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">2</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">0</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">2</td>
                <td style="background-color:#FFFFFF;color:#000000;text-align:center;border-bottom:0.5pt solid;">0.0%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">Vespasiano</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">20</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">126</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">146</td>
                <td style="background-color:#8EAADB;color:#000;text-align:center;border-bottom:0.5pt solid;">86.3%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">MISJ</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">3</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">28</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">31</td>
                <td style="background-color:#8EAADB;color:#000;text-align:center;border-bottom:0.5pt solid;">90.3%</td>
              </tr>
              <tr>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">Total</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">956</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">238</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">1,194</td>
                <td style="background-color:#B4C6E7;color:#000;border-bottom:1.5pt solid #000;text-align:center;">19.9%</td>
              </tr>
            </tbody>
          </table>
        </table-wrap>
      </p>
        <p>Em primeiro lugar, tanto HdE-A como os fragmentos HdE-DCE apresentam um resultado expectável, com uma esmagadora presença de formas plenas. Este resultado pode ser explicado sobretudo pelas datas de produção e cópia dos testemunhos: finais do século XIV, início do século XV (1390-1437). Aquando da cópia, as formas plenas ainda seriam aquelas mais frequentes e as forças da mudança ainda não se faziam sentir. Poder-se-á, também, admitir o conservadorismo do contexto de produção. O testemunho HdE-A é proveniente do <italic>scriptorium</italic> de Alcobaça. Como mostrado por <xref rid="ref-4-9812" ref-type="bibr">Cardeira (2005: 180)</xref>, nas <italic>Vidas de Santos</italic>, oriundas do mesmo <italic>scriptorium</italic> em data parcialmente coincidente (1431-1446) as formas plenas prevalecem sobre as formas sincopadas.</p>
        <p>Os testemunhos G1 e E da VMSSB são cópias altamente conservadoras deste fenómeno. Para o copista do século XVII, as formas plenas seriam meros vestígios de um estado anterior da língua e já não seriam as mais frequentemente usadas. A preservação de formas plenas, em ambos os manuscritos, aponta, como conclui <xref rid="ref-9-9812" ref-type="bibr">Cruz (2018:256)</xref> para o século XIII, época em que estas formas ainda predominavam, e, consequentemente, para o arquétipo destes testemunhos.</p>
        <p>Os textos Vespasiano e MISJ já se encontram num momento da inversão da tendência, ou até de estabilização da nova variante sincopada, que representa 86,30% e 90,32% das formas, respetivamente.</p>
        <p>Inesperadamente, o LdM apresenta a mais elevada presença de formas plenas, que representam 85,96%. Dada a data de produção do testemunho (1513) seria expectável o resultado inverso, ou seja, a prevalência das formas sincopadas e a raridade de formas plenas. Conforme notado por <xref rid="ref-21-9812" ref-type="bibr">Sobral e Cardeira (2018:134)</xref>, este resultado coloca o <italic>Livro dos Mártires</italic> “em época anterior a 1438 [...] em época muito próxima do <italic>Orto do Esposo</italic>”. <xref rid="ref-7-9812" ref-type="bibr">Cepeda (1993:508)</xref> comprovou a existência de um testemunho manuscrito português do século XV, do qual se conhece hoje apenas um fragmento, datando a tradução do texto nele copiada do final do reinado de D. Dinis (1279-1325). <xref rid="ref-21-9812" ref-type="bibr">Sobral e Cardeira (2018: 138-139)</xref>, através da análise de alguns fenómenos linguísticos, entre eles a síncope de <italic>-d-</italic> intervocálico, concluem que, apesar de já apresentar traços correspondentes ao estado da língua no início do século XVI, o impresso de 1513 conserva traços arcaizantes da língua. A preservação destes traços permite: i) confirmar a datação da tradução do <italic>Livro dos Mártires</italic> no reinado de D. Dinis; ii) admitir a existência de uma cópia do século XV que terá sido usada como original de impressa.</p>
        <p>Para a análise das novas regras fonológicas, isto é, as regras fonológicas provocadas pela síncope de <italic>-d-</italic> intervocálico, foi utilizado um subconjunto dos dados anotados. Do total do conjunto dos sete textos, foram selecionados apenas os tempos verbais que registavam mais de 100 ocorrências. Assim, este subconjunto de dados contempla formas do Presente Indicativo, do Presente Conjuntivo e do Imperativo. Feita a distinção entre formas plenas e formas sincopadas, obtiveram-se 55 formas sincopadas do Presente Indicativo, 64 do Presente do Conjuntivo e 92 do Imperativo. Em valores absolutos, estes números poderão não revelar muita informação, mas uma análise mais pormenorizada das várias grafias por tempo e por conjugação verbal poderá ajudar a fazer sentido dos fenómenos observados. A <xref rid="taw-2-9812" ref-type="table">Tabela 2</xref> mostra a distribuição das diferentes terminações gráficas das formas sincopadas por texto, por tempo e conjugação verbal.</p>
        <p>
        <table-wrap id="taw-2-9812">
          <label>Tabela 2</label>
          <caption>
            <title>Diferentes terminações por modelo de conjugação e por texto/testemunho</title>
          </caption>
          <table style="font-size:11pt;font-family:'Cambria';" id="tab-2-9812">
            <thead>
              <tr>
                <th style="text-align:center;border-top:1pt solid #ffffff;border-bottom:1pt solid #ffffff;" rowspan="2"/>
                <th style="border-top:1pt solid #ffffff;border-bottom:1.5pt solid #000;border-right:1pt solid #000;text-align:center;" colspan="3"><sc>Presente Indicativo</sc></th>
                <th style="border-top:1pt solid #ffffff;border-left:1pt solid #000;border-bottom:1.5pt solid #000;border-right:1pt solid #000;text-align:center;" colspan="3"><sc>Presente Conjuntivo</sc></th>
                <th style="border-top:1pt solid #ffffff;border-bottom:1.5pt solid #000;border-left:1pt solid #000;text-align:center;" colspan="3"><sc>Imperativo</sc></th>
              </tr>
              <tr>
                <th style="text-align:center;border-bottom:0.5pt solid;"><bold><sc>-AR</sc></bold></th>
                <th style="text-align:center;border-bottom:0.5pt solid;"><bold><sc>-ER</sc></bold></th>
                <th style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;"><bold><sc>-IR</sc></bold></th>
                <th style="border-left:1pt solid #000;text-align:center;border-bottom:0.5pt solid;"><bold><sc>-AR</sc></bold></th>
                <th style="text-align:center;border-bottom:0.5pt solid;"><bold><sc>-ER</sc></bold></th>
                <th style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;"><bold><sc>-IR</sc></bold></th>
                <th style="border-left:1pt solid #000;text-align:center;border-bottom:0.5pt solid;"><bold><sc>-AR</sc></bold></th>
                <th style="text-align:center;border-bottom:0.5pt solid;"><bold><sc>-ER</sc></bold></th>
                <th style="text-align:center;border-bottom:0.5pt solid;"><bold><sc>-IR</sc></bold></th>
              </tr>
            </thead>
            <tbody>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">LdM</td>
                <td style="text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-ais (1)
                -aaes (2)
              -aes (4)
                </td>
                <td style="text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-ees (7)
                  -eys (2)
                </td>
                <td style="border-right:1pt solid #000;text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-is (1)
                  -ijs (1)
                </td>
                <td style="border-left:1pt solid #000;text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-ees (3)
                  -es (1)
                </td>
                <td style="text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-aes (4)
                  -aaes (2)
                </td>
                <td style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="border-left:1pt solid #000;text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-ay (18)
                  -aj (1)
                -ai (1)
                -ae (2)
                </td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-ey (10)</td>
                <td style="text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-ij (1) 
                -ye (2)
              -y (1)
              -i (2)
                </td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">MISJ</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-ees (6)</td>
                <td style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="border-left:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">-ees (3)</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-aes (4)</td>
                <td style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="border-left:1pt solid #000;text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-aae (3)
                -ay (4)
                -ae (3)
                </td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-é (1)</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-ij (1)</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">Vespasiano</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-aaes (1)</td>
                <td style="text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-ees (17)
                -es (2)
                -eeis (1)
                </td>
                <td style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">-</td>
                <td style="border-left:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">-ees (16)</td>
                <td style="text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-aes (15)
                -aaes (2)
              -aees (1)
              -ays (1)
                </td>
                <td style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">-aaes (1)</td>
                <td style="border-left:1pt solid #000;text-align:center;white-space:pre-line;border-bottom:0.5pt solid;">-ay (7)
                -ai (1)
              -ae (12)
              -aae (1)
                </td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-ee (20)</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">VMSSB-E</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">-is (1)</td>
                <td style="border-left:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">-es (2)</td>
                <td style="border-right:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="border-left:1pt solid #000;text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">–</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">–</td>
              </tr>
              <tr>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">VMSSB-G1</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">–</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">–</td>
                <td style="border-bottom:1.5pt solid #000;border-right:1pt solid #000;text-align:center;">-is (1)</td>
                <td style="border-bottom:1.5pt solid #000;border-left:1pt solid #000;text-align:center;">–</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">-es (2)</td>
                <td style="border-bottom:1.5pt solid #000;border-right:1pt solid #000;text-align:center;">–</td>
                <td style="border-left:1pt solid #000;border-bottom:1.5pt solid #000;text-align:center;">–</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">–</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">–</td>
              </tr>
            </tbody>
          </table>
        </table-wrap>
      </p>
        <p>A duplicação da vogal na terminação <italic>-aaes</italic> no Presente do Indicativo da 1.ª conjugação (ex.: <italic>assaaes</italic>, Vesp.; <italic>firmaaes</italic>, LdM) e no Presente do Conjuntivo da 2.ª conjugação (ex: <italic>façaaes</italic>, Vesp.; creaaes, LdM), encontrada no LdM e no Vespasiano poderá denotar a tonicidade da vogal &lt;aa&gt;, com &lt;e&gt; a representar a semi-vogal. Mais frequentes são as formas <italic>-aes</italic> e <italic>-ees</italic>, enquanto as formas <italic>-ais</italic> e <italic>-eys</italic> no Presente do Indicativo e a forma <italic>-ays</italic> no Presente do Conjuntivo são mais raras. Esta oscilação entre &lt;e&gt;, &lt;y&gt; e &lt;i&gt; para representar a semi-vogal do ditongo é encontrada desde o início do século XV (<xref rid="ref-4-9812" ref-type="bibr">Cardeira 2005:201</xref>). Neste conjunto de dados, é no modo Imperativo que esta oscilação se torna mais evidente e onde é possível estabelecer comparações entre um maior número de textos.  Nos textos LdM, MISJ e Vespasiano, todos elaborados no decorrer do século XV ou posteriormente, observa-se a alternância de grafias <italic>-ay, -aj, -ai, -ae e -aae</italic>, com estas duas últimas a terem pouca representatividade em LdM e MISJ.</p>
        <p>Na 3.ª conjugação, todas as formas encontradas do Presente do Indicativo já apresentam a crase (<italic>fugis</italic>, HdE-A; <italic>dormis</italic>, VMSSB-G1, VMSSB-E, LdM; <italic>sentijs</italic>, LdM), mas um conjunto de quatro ocorrências não constitui uma base suficiente para uma análise mais aprofundada.</p>
        <p>No Imperativo, a forma <italic>destruye</italic> com duas ocorrências no LdM poderá ser equiparada à forma <italic>abrij</italic> se se entender a presença dos dois elementos vocálicos como marcação da vogal tónica, tendo a crase já acontecido. A inexistência de outras formas semelhantes e a pouca frequência de verbos da 3.ª conjugação com formas sincopadas não permitem tirar conclusões mais seguras. No MISJ, encontra-se a terminação de ocorrência única <italic>-é</italic>, na forma <italic>fazé</italic>. Pode-se supor a hipótese de esta forma ser um ensaio de uma crase que não vingou.</p>
        <p>Apenas com um maior conjunto de dados, obtidos através da inclusão de mais e maiores textos, poderá a análise da representação de novas regras fonológicas obter conclusões mais seguras. Conclusões mais seguras sobre a representação das novas regras fonológicas poderão ser obtidas. Neste sentido, a utilização de um corpus anotado traz a vantagem do fator tempo, uma vez que reduz em muito o tempo que o investigador utiliza na procura por estas formas. Acresce também o facto de a utilização de ferramentas e métodos de PLN permitir uma maior facilidade de pesquisa e extração sistemática e exaustiva de informação de um largo conjunto de dados, possibilitando a comparação entre textos e através do tempo.</p>
      </sec>
      <sec id="sec-7-9812">
        <title>5.2. Particípios em <italic>-udo</italic> / <italic>-ido</italic></title>
        <p>No Português Antigo, conservavam-se três terminações de particípios passados: <italic>-ado</italic>, <italic>-udo</italic> e <italic>-ido</italic>. A divergência relativamente ao latim deve-se à fusão da 2.ª e 3.ª conjugações latinas ainda durante o latim vulgar (<xref rid="ref-4-9812" ref-type="bibr">Cardeira 2005:203</xref>). Deste modo, “só aos verbos com origem na 4.ª conjugação latina (-IRE, <italic>salīre</italic>) correspondia o Particípio Passado em <italic>-ido</italic> (-ITU); a terminação do Particípio dos verbos de vogal temática <italic>e</italic> (da segunda e da terceira conjugações latinas, respetivamente -ĔRE e -ĒRE) era <italic>-udo</italic>” (<xref rid="ref-4-9812" ref-type="bibr">Cardeira 2005:204</xref>). Assim era no Português Antigo até que a terminação <italic>-udo</italic> começa a desaparecer e a ser substituída por <italic>-ido</italic>, encontrando-se formas esporádicas já no final do século XIII. Durante o século XIV, a alternância entre as formas seria mera variação. No século XV, a variante <italic>-ido</italic> é acolhida pela corte e adquire prestígio, permitindo a sua rápida expansão (<xref rid="ref-4-9812" ref-type="bibr">Cardeira 2005:214</xref>). Na <xref rid="taw-3-9812" ref-type="table">Tabela 3</xref> mostram-se os dados obtidos no conjunto dos sete textos selecionados.</p>
        <p>Em HdE-A, a alternância entre formas é bastante visível: 56,70% das formas de verbos com origem na 2.ª e na 3.ª conjugação latina terminam em <italic>-ido</italic> e 43,30% em <italic>-udo</italic>. A proporção de formas <italic>-udo</italic> obtidas nesta recolha é superior àquela apresentada por <xref rid="ref-5-9812" ref-type="bibr">Carvalho (1996:92)</xref>, que indica uma representação de 35% destas formas no HdE-A. Entre as formas terminadas em <italic>-udo</italic>, 30,95% (equivalentes a 26 formas) correspondem ao verbo <italic>ter</italic> ou verbos derivados (<italic>conter</italic>, <italic>manter</italic>, <italic>reter</italic>, <italic>suster</italic>). O verbo <italic>ter</italic> e todos os verbos dele derivados apresentam apenas as terminações em <italic>-udo</italic>. O mesmo sucede para os verbos <italic>ler</italic> e <italic>haver</italic> (5 e 4 ocorrências, respetivamente). São 12 os verbos com e latino nos quais se regista variação: <italic>aprimir</italic> (=<italic>oprimir</italic>), <italic>confundir</italic>, <italic>crescer</italic>, <italic>derreter</italic>, <italic>dever</italic>, <italic>entender</italic>, <italic>esconder</italic>, <italic>meter</italic>, <italic>perceber</italic>, <italic>resolver</italic>, <italic>saber</italic> e <italic>vencer</italic>. Em seis destes verbos, a variante <italic>-ido</italic> é mais frequente, representando entre 60% e 96% das formas dos respetivos verbos. Destaque-se o verbo <italic>esconder</italic>, que regista 24 ocorrências de particípio terminado em <italic>-ido</italic> e apenas uma com o etimológico <italic>-udo</italic>.</p>
        <p>
        <table-wrap id="taw-3-9812">
          <label>Tabela 3</label>
          <caption>
            <title>Total de formas de particípio passado em verbos da 2.ª e 3.ª conjugações latinas</title>
          </caption>
          <table style="font-size:11pt;font-family:'Cambria';" id="tab-3-9812">
            <thead>
              <tr>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;text-align:center;"><sc>Texto</sc></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;text-align:center;"><italic><sc>Formas -udo</sc></italic></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;text-align:center;"><italic><sc>Formas -ido</sc></italic></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;text-align:center;"><sc>Total</sc></th>
                <th style="padding:0cm 0.5cm 0cm 0.5cm;border-bottom:1.5pt solid #000;border-top:1pt solid #FFFFFF;text-align:center;white-space:pre-line"><sc>Proporção de 
                  formas <italic>-ido</italic></sc></th>
              </tr>
            </thead>
            <tbody>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">VMSSB-G1</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">4</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">4</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">8</td>
                <td style="background-color:#D9E2F3;color:#000;text-align:center;border-bottom:0.5pt solid;">50%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">VMSSB-E</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">3</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">6</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">9</td>
                <td style="background-color:#B4C6E7;color:#000;text-align:center;border-bottom:0.5pt solid;">67%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">LdM</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">46</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">697</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">743</td>
                <td style="background-color:#8EAADB;color:#000;text-align:center;border-bottom:0.5pt solid;">94%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">HdE-A</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">84</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">110</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">194</td>
                <td style="background-color:#B4C6E7;color:#000;text-align:center;border-bottom:0.5pt solid;">57%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">HdE-DCE</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">0</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">0</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">0</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">0</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">Vespasiano</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">0</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">40</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">40</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">100%</td>
              </tr>
              <tr>
                <td style="text-align:center;border-bottom:0.5pt solid;">MISJ</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">0</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">127</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">127</td>
                <td style="text-align:center;border-bottom:0.5pt solid;">100%</td>
              </tr>
              <tr>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">Total</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">137</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">984</td>
                <td style="border-bottom:1.5pt solid #000;text-align:center;">1,121</td>
                <td style="border-bottom:1.5pt solid #000;background-color:#8EAADB;color:#000;text-align:center;">88%</td>
              </tr>
            </tbody>
          </table>
        </table-wrap>
      </p>
        <p>No LdM, são apenas 6,19% os verbos que têm a forma de Particípio terminada em <italic>-udo</italic>, e que correspondem a 46 formas. Estas formas distribuem-se por 14 verbos. Em dez destes verbos há variação na terminação, sendo <italic>-ido</italic> predominante em sete verbos (<italic>esconder</italic>, <italic>ler</italic>, <italic>meter</italic>, <italic>receber</italic>, <italic>saber</italic> e <italic>vencer</italic>). Os verbos <italic>crer</italic> e <italic>haver</italic> apresentam igual distribuição entre terminações (5) e, nos verbos <italic>descrer, conter</italic> e <italic>ter</italic> regista-se um maior número de formas <italic>-udo</italic> (<italic>descrer</italic>: 4 <italic>-udo</italic>, 1 <italic>-ido; conter</italic>: 7 <italic>-udo</italic>, 1 <italic>-ido</italic>; <italic>ter</italic>: 18 <italic>-ido</italic>). Em dois verbos (<italic>descer</italic> (1) e <italic>manter</italic> (3)) não ocorre variação, sendo a terminação sempre <italic>-udo</italic>.</p>
        <p>Textos publicados no mesmo espaço temporal que LdM, como o <italic>Flos Sanctorum</italic> (1513) e o <italic>Cancioneiro Geral</italic> de Garcia de Resende (1516) contêm alguns vestígios desta terminação, quer por razões rimáticas, quer por força da cristalização das formas (ex.: verbo <italic>ter</italic> - <italic>teudo</italic>). Se se admitir que as formas dos Particípios Passados do verbo <italic>ter</italic> e verbos derivados possam ter cristalizado devido ao frequente uso, as ocorrências da terminação <italic>-udo</italic> poderão ser consideradas meros vestígios de uma alternância que no início do século XVI já estava estabilizada. Ao mesmo tempo, a presença da terminação <italic>-udo</italic> no LdM, ainda que diminuta no contexto geral do texto, aponta novamente para o manuscrito do século XV que serviu de base ao original de imprensa. Por meio de comparação com outros textos, <xref rid="ref-21-9812" ref-type="bibr">Sobral e Cardeira (2018: 135)</xref> colocam o LdM entre 1416 e 1438. Ficará, porém, por responder, por ausência dos testemunhos que permitem estabelecer a comparação, até que ponto o copista do século XV atualizou linguisticamente a tradução do século XIII.</p>
        <p>No Vespasiano e no MISJ não se encontraram formas de Particípio terminadas em <italic>-udo</italic>, somente em <italic>-ido</italic>. O incunábulo do Vespasiano data de 1496 e o <italic>Memorial da Infanta Santa Joana</italic> é redigido no primeiro quartel do século XVI, evidenciando que o processo de substituição já estava estabilizado.</p>
        <p>Na VMSSB-G1, texto do século XIII em testemunho do século XVII (1620-1645), às formas <italic>perdudo</italic> (2), <italic>estendudo</italic> (1), <italic>estendudos</italic> (1), <italic>metido</italic> (1), <italic>offrecido</italic> (1), já identificadas por <xref rid="ref-9-9812" ref-type="bibr">Cruz (2018:275)</xref>, acresce a forma <italic>escondidas</italic> (2). São, assim, as 8 formas de verbos com origem etimológica na 2.ª e na 3.ª conjugações latinas, cujas terminações de particípio passado se distribuem em igual proporção. Com base nos seus resultados, <xref rid="ref-9-9812" ref-type="bibr">Cruz (2018:275.)</xref> obtém uma proporção de 66,7% de formas em <italic>-udo</italic> e 33,3% em <italic>-ido</italic>. As evidências, no entanto, são escassas para se tirar conclusões mais significativas: nem no momento de redação do apógrafo no século XIII, nem no momento da cópia, no século XVII, existia a alternância de formas. Se, no século XIII, já fosse possível encontrar formas em <italic>-ido</italic>, estas eram esporádicas e raras; no século XVII, as formas <italic>-udo</italic> já teriam saído por completo da gramática dos falantes. A presença, portanto, das formas em <italic>-udo</italic> atesta este estado anterior da língua e as formas <italic>-ido</italic> podem ser resultado da interferência da língua do copista seiscentista. O testemunho E de VMSSB contrapõe três formas <italic>-udo</italic> e seis em <italic>-ido</italic>. Destas últimas, uma é exclusiva a este testemunho (<italic>offendido</italic>), a outra é a atualização de uma das ocorrências de <italic>perdudo</italic> em G1 que em E figura como <italic>perdido</italic>. As ilações retiradas são, assim, semelhantes àquelas obtidas na análise de VMSSB-G1.</p>
      </sec>
    </sec>
    <sec id="sec-8-9812">
      <title>6. PARA UM MELHOR CONHECIMENTO DOS TEXTOS</title>
      <p>Dado aquilo que se sabe sobre a datação da produção do texto, a linha cronológica criada pelo conjunto dos sete textos anotados poderia ser representada através da <xref rid="fig-1-9812" ref-type="fig">Figura 1</xref>. O primeiro texto escrito terá sido a <italic>Vida e Milagres de Santa Senhorinha de Basto</italic>, ainda no século XIII, seguindo-se a tradução portuguesa do <italic>Livro dos Mártires</italic>, durante o reinado de D. Dinis, e o <italic>Horto do Esposo</italic> durante o século XIV; no final deste século terá sido escrito o <italic>Vespasiano</italic>; e só durante o primeiro quartel do século XVI é que o <italic>Memorial da Infanta Santa Joana</italic> terá sido escrito.</p>
      <p>
      <fig id="fig-1-9812">
        <label>Figura 1</label>
        <caption>
          <title>Cronologia das datas de produção dos textos selecionados.</title>
        </caption>
        <graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="9812_gf1.png" position="anchor" orientation="portrait" id="gra-1-9812">
          <alt-text>Figura 1. Cronologia das datas de produção dos textos selecionados.</alt-text>
        </graphic>
      </fig>
    </p>
      <p>Porém, os testemunhos presentes no <italic>corpus</italic> não são originais, mas antes cópias mais ou menos distantes do original. O alinhamento cronológico por data dos testemunhos é, por isso, diferente (<xref rid="fig-2-9812" ref-type="fig">Figura 2</xref>). Por se distanciarem do original, estes testemunhos trazem a marca da transmissão dos textos, quer através de sucessivas atualizações linguísticas, que atestam a evolução da língua, quer através da inserção, consciente ou não, de erros.</p>
      <p>
      <fig id="fig-2-9812">
        <label>Figura 2</label>
        <caption>
          <title>Cronologia das datas de cópias dos testemunhos.</title>
        </caption>
        <graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="9812_gf2.png" position="anchor" orientation="portrait" id="gra-2-9812">
          <alt-text>Figura 2. Cronologia das datas de cópias dos testemunhos.</alt-text>
        </graphic>
      </fig>
    </p>
      <p>No campo da História da Língua, em particular do Português Médio, observámos dois fenómenos caracterizadores deste período: a síncope de <italic>-d-</italic> intervocálico no morfema de flexão da 2.ª pessoa plural e as formas de Particípio Passado de verbos com origem etimológica na 2.ª e 3.ª conjugações latinas. A conjugação de todos os resultados (<xref rid="fig-3-9812" ref-type="fig">Figura 3</xref>) permite tecer alguns comentários face ao estado da língua de cada texto relativamente ao momento de produção e ao momento da cópia.</p>
      <p>
      <fig id="fig-3-9812">
        <label>Figura 3</label>
        <caption>
          <title>Total percentual dos resultados obtidos nos dois fenómenos.</title>
        </caption>
        <graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="9812_gf3.png" position="anchor" orientation="portrait" id="gra-3-9812">
          <alt-text>Figura 3. Total percentual dos resultados obtidos nos dois fenómenos.</alt-text>
        </graphic>
      </fig>
    </p>
      <p>Em primeiro lugar, HdE-A, Vespasiano e MISJ são os testemunhos cujo estado da língua presente no texto mais se aproxima do estado da língua do momento da produção. No caso do HdE-A, o texto é escrito na viragem do século XIV para o século XV; no Vespasiano e no MISJ, na viragem do século XV para o século XVI. A quase totalidade de formas da 2.ª pessoa plural no HdE-A são formas plenas e há uma alternância relativamente equiparada entre as terminações <italic>-udo</italic> (57,59%) e <italic>-ido</italic> (42,41%) nas formas de Particípio Passado. A combinação destes fatores, coloca o HdE-A mais recuado na linha temporal aqui ensaiada. O mesmo sucede para os fragmentos HdE-DCE. Por sua vez, e em sentido inverso, o estado da língua do Vespasiano e do MISJ, pelo que é observável nos dois fenómenos analisados, coloca estes testemunhos em pontos mais avançados na linha cronológica. A presença de formas plenas é minoritária em ambos os textos (9,68% em MISJ e 13,70% no Vespasiano) e nenhum deles apresenta formas de Particípio Passado terminadas em <italic>-udo</italic>.</p>
      <p>Por um lado, os dois testemunhos da <italic>Vida e Milagres de Santa Senhorinha de Basto</italic> atestam a língua falada em Portugal em meados do século XIII, principalmente através da preservação do <italic>-d-</italic> intervocálico no morfema de pessoa-número na flexão verbal. Por outro, como evidenciado aquando da análise das formas de Particípio Passado, aquelas terminadas em <italic>-ido</italic> não são próprias do século XIII, nem aquelas terminadas em <italic>-udo</italic> próprias do século XVII. É observável, então, uma atualização linguística que o copista consciente ou inconscientemente fez. Curiosa é, porém, a diferente atitude perante os dois fenómenos. Perante a síncope de <italic>-d-</italic> o copista seiscentista é altamente conservador, mas quanto ao Particípio Passado deixa mais facilmente o seu estado da língua permear o trabalho de cópia. É possível que o copista tenha conservado as formas com <italic>-d-</italic> para manter o carácter arcaizante do texto, atualizando, por outro lado, talvez de forma inconsciente, as terminações do Particípio Passado, já completamente anacrónicas.</p>
      <p>Os resultados obtidos no LdM apontam em direções opostas. Contrariamente ao que seria expectável para um testemunho do início do século XVI, o LdM apresenta ainda uma considerável representação de formas plenas, que conservam o <italic>-d-</italic> intervocálico (85%). Simultaneamente, as formas sincopadas apontam já para a resolução do encontro vocálico provocado pela síncope, quer através da duplicação da vogal tónica, quer pela utilização de vários elementos gráficos para representar o elemento menos vocálico do ditongo. Se este último aspeto aproxima o testemunho do momento da sua produção, o conservadorismo nas formas plenas afasta-o do século XIV, aproximando-o mais dos séculos XIII e XIV e, consequentemente, do momento da tradução do texto para o português. Conforme anteriormente dito, terá existido um manuscrito do século XV, feito a partir da tradução trecentista, que terá servido como original de imprensa do incunábulo de 1513 (<xref rid="ref-7-9812" ref-type="bibr">Cepeda 1993</xref>; <xref rid="ref-21-9812" ref-type="bibr">Sobral &amp; Cardeira 2018</xref>). Deste modo, o incunábulo atesta a língua de quatrocentos, apontando para uma fase mais recuada ainda. Na variação das terminações do Particípio Passado, o LdM apresenta apenas 6,85% de formas em <italic>-udo</italic>, sendo muitas delas pertencentes do verbo <italic>ter</italic> ou verbos derivados. A presença relativamente residual destas formas aponta já para uma estabilização da variação. Ficará por responder, porém, em que medida terá o incunábulo de 1513 atualizado estas formas relativamente ao manuscrito do século XV.</p>
      <p>Assim, entre todos os textos, os testemunhos do HdE (A e DCE), o incunábulo do Vespasiano e o testemunho de MISJ serão aqueles cujo estado da língua no momento de cópia mais se aproxima daquele no momento de produção. Estes quatro testemunhos colacar-se-iam em pontas opostas da linha temporal: os testemunhos A e DCE do <italic>Horto do Esposo</italic> revelam a língua falada no final do século XIV e nos inícios do século XV; Vespasiano e MISJ apontam já para a língua de Quinhentos, no advento do Português Clássico.  O testemunho do LdM é ambivalente: se, por um lado, apresenta traços que o aproximam do momento de produção do original (séc. XIII-XIV), por outro lado, outros traços o aproximam do momento de produção.</p>
      <p>Se a presença residual de formas de Particípio Passado em <italic>-udo</italic> podem evidenciar a estabilização da inversão da tendência no início do século XVI, a elevada frequência de formas plenas não é coerente com a língua de 1513, mas antes com a língua de um ou dois séculos antes. Os testemunhos G1 e E da <italic>Vida e Milagres de Santa Senhorinha de Basto</italic> têm comportamento semelhante, com os traços mais modernos a serem reflexo da influência linguística dos seus copistas.</p>
    </sec>
    <sec sec-type="conclusions" id="sec-9-9812">
      <title>7. CONCLUSÕES</title>
      <p>Neste artigo, procurou-se aprofundar o conhecimento de uma seleção de sete textos presentes no <italic>Corpus de Textos Antigos</italic> (CTA) relativamente a dois fenómenos caracterizadores do Português Médio, período da história do português que decorre desde meados do século XIV até aos inícios do século XVI. O conjunto dos sete textos selecionados perfaz um total de cerca de meio milhão de tokens que se encontram lematizados e anotados morfossintaticamente. Recorrendo a esta anotação foi, assim, possível extrair sistematicamente do corpus todas as instâncias relevantes para o estudo da síncope de <italic>-d-</italic> intervocálica no morfema da 2.ª pessoa do plural e da variação entre <italic>-ido</italic> e <italic>-udo</italic> nas terminações do Particípio Passado nos verbos com origem etimológica na 2.ª e 3.ª conjugações latinas. Desta recolha, obtiveram-se 1,194 formas verbais correspondentes à 2.ª pessoa do plural, repartindo-se entre 956 formas plenas e 238 formas sincopadas; e 972 formas de Particípio Passado.</p>
      <p>A análise subsequente procurou caracterizar o estado da língua nos vários testemunhos face à datação e cronologia dos vários fenómenos. Quanto à síncope de <italic>-d-</italic>, HdE-A, MISJ e Vespasiano obtiveram resultados expectáveis face à data de cópia dos testemunhos: HdE-A apresenta uma esmagadora presença de formas plenas; MISJ e Vespasiano evidenciam já a inversão da tendência, se não mesmo a sua estabilização. Apesar de serem os testemunhos mais tardios, VMSSB-G1 e VMSSB-E são conservadores na cópia, o que, por um lado, mostra o zelo dos seus copistas durante o processo da cópia. Por outro lado, estes testemunhos atestam a existência do arquétipo duocentista. Por sua vez, LdM apresenta os resultados mais inesperados, com a prevalência das formas plenas sobre as formas sincopadas. Este resultado parece comprovar a existência de um testemunho anterior, datado do século XV, que teria usado um testemunho anterior do século XIII, onde a alternância entre formas não se faria sentir. Não obstante, as formas sincopadas presentes apontam já para um período da evolução da língua no qual os hiatos resultantes da síncope de <italic>-d-</italic> já estariam resolvidos. No que diz respeito às terminações do Particípio Passado, HdE-A apresenta uma alternância entre as formas, que evidencia o período em que as duas formas ainda coexistiam em variação; em LdM, as formas <italic>-udo</italic> são percentualmente reduzidas, podendo admitir-se o seu uso em formas cristalizadas ou ainda como vestígio do manuscrito do século XV; no Vespasiano e no MISJ não há presença das formas <italic>-udo</italic>, apontando, assim, para o momento em que a mudança já estava estabilizada. Quanto aos dois testemunhos de VMSSB (G1 e E), a presença de formas em <italic>-ido</italic> não se coadunam com o arquétipo duocentista, sendo, por esta razão, marcas da influência da língua do século XVII dos copistas.</p>
      <p>A comparação destes dois fenómenos no conjunto dos dados anotados permitiu a comparação do estado da língua representada nos textos face ao estado da língua do momento de produção e ao momento de cópia. Esta análise evidencia a importância da análise linguística para o conhecimento da história da transmissão dos textos. A presença ou a ausência de determinadas particularidades linguísticas permite desvendar o trilho que determinado texto percorreu até chegar aos dias de hoje. Como demonstrado no LdM, cujo testemunho data do início do século XVI, a presença de formas atípicas a este tempo põe a descoberto a existência de um manuscrito contemporâneo de tais formas. Do ponto de vista linguístico, esta análise ajuda também a compreender e a datar melhor a progressão dos fenómenos linguísticos.</p>
      <p>O recurso a dados anotados e a sua extração automática possibilita a recolha sistemática e exaustiva de uma maior quantidade de dados num menor período de tempo e uma análise comparativa em maior escala. Se é verdade que o mesmo esforço pode ser feito manualmente, o recurso a ferramentas e a métodos (semi-)automáticos otimiza o tempo utilizado, libertando o tempo do investigador para a análise, permitindo-lhe colocar perguntas talvez até agora não colocadas. Este trabalho não quis ser exaustivo no estudo dos fenómenos linguísticos caracterizadores do Português Médio. Procurou antes pôr em evidência a utilidade que um corpus anotado e ferramentas de extração automática da informação podem ter em estudos desta envergadura. Como trabalho futuro, estará a extensão da análise a outros textos do CTA e a outros fenómenos do Português Médio. Por exemplo, a análise da convergência das terminações nasais em <italic>-ão</italic>, que abundam no português e ostentam múltiplas formas gráficas, beneficiará de uma abordagem semelhante de extração automática dos dados.</p>
    </sec>
  </body>
  <back>
    <sec id="sec-10-9812">
      <title>Financiamento</title>
      <p>A investigação para este trabalho foi financiada por Fundos Nacionais da Fundação para a Ciência e a Tecnologia: J. Baptista e F. Batista (INESC-ID Lisboa, proj. ref UIDB/50021/2020), E. Cardeira (Faculdade de Letras da Universidade de Lisboa, Centro de Linguística da Universidade de Lisboa, proj. ref. UIDP/00214/2020) e M.I. Bico pela Bolsa de Doutoramento (proj. ref. UI/BD/152806/2022).</p>
    </sec>
    <ref-list id="refl-1-9812">
      <title>Referências bibliográficas</title>
      <ref id="ref-1-9812">
        <mixed-citation publication-type="webpage">Almeida, Maria Inês. s.d. <italic>História de mui nobre Vespasiano</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;amp;id=M1008T1008.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;amp;id=M1008T1008.xml</ext-link>[02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <name>
              <surname>Almeida</surname>
              <given-names>Maria Inês</given-names>
            </name>
          </person-group>
          <source>História de mui nobre Vespasiano</source>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;amp;id=M1008T1008.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;amp;id=M1008T1008.xml</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-2-9812">
        <mixed-citation publication-type="book">Bechara, Evanildo. 1991. As fases da língua portuguesa escrita. Em Dieter Kremer (ed.), <italic>Actes du XVIIIe Congrès International de Linguistique et de Philologie Romanes</italic>, vol. III. 68-76. Tübingen: Max Niemeyer Verlag.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Bechara</surname>
              <given-names>Evanildo</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Kremer</surname>
              <given-names>Dieter</given-names>
            </name>
          </person-group>
          <source>Actes du XVIIIe Congrès International de Linguistique et de Philologie Romanes</source>
          <chapter-title>As fases da língua portuguesa escrita</chapter-title>
          <publisher-name>Max Niemeyer Verlag</publisher-name>
          <publisher-loc>Tübingen</publisher-loc>
          <year>1991</year>
          <volume>III</volume>
          <fpage>68</fpage>
          <lpage>76</lpage>
        </element-citation>
      </ref>
      <ref id="ref-3-9812">
        <mixed-citation publication-type="book">Bico, Maria Inês, Jorge Baptista, Fernando Batista &amp; Esperança Cardeira. 2022. Early Experiments on Automatic Annotation of Portuguese Medieval Texts. Em Gianmaria Silvello, Oscar Corcho, Paolo Manghi, Giorgio Maria Di Nunzio, Koraljka Golub, Nicola Ferro &amp; Antonella Poggi G. Silvello (eds.), <italic>Linking Theory and Practice of Digital Libraries. TPDL 2022. Lecture Notes in Computer Science</italic>, vol 13541. Cham: Springer, Cham. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://doi.org/10.1007/978-3-031-16802-4_44">https://doi.org/10.1007/978-3-031-16802-4_44</ext-link> [02-04-2025].</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Bico</surname>
              <given-names>Maria Inês</given-names>
            </name>
            <name>
              <surname>Baptista</surname>
              <given-names>Jorge</given-names>
            </name>
            <name>
              <surname>Batista</surname>
              <given-names>Fernando</given-names>
            </name>
            <name>
              <surname>Cardeira</surname>
              <given-names>Esperança</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Silvello</surname>
              <given-names>Gianmaria</given-names>
            </name>
            <name>
              <surname>Corcho</surname>
              <given-names>Oscar</given-names>
            </name>
            <name>
              <surname>Manghi</surname>
              <given-names>Paolo</given-names>
            </name>
            <name>
              <surname>Di Nunzio</surname>
              <given-names>Giorgio Maria</given-names>
            </name>
            <name>
              <surname>Golub</surname>
              <given-names>Koraljka</given-names>
            </name>
            <name>
              <surname>Ferro</surname>
              <given-names>Nicola</given-names>
            </name>
            <name>
              <surname>Poggi</surname>
              <given-names>Antonella</given-names>
            </name>
            <name>
              <surname>Silvello</surname>
              <given-names>G.</given-names>
            </name>
          </person-group>
          <source>Linking Theory and Practice of Digital Libraries. TPDL 2022. Lecture Notes in Computer Science</source>
          <chapter-title>Early Experiments on Automatic Annotation of Portuguese Medieval Texts</chapter-title>
          <publisher-name>Springer</publisher-name>
          <year>2022</year>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <volume>13541</volume>
          <pub-id pub-id-type="doi">10.1007/978-3-031-16802-4_44</pub-id>
        </element-citation>
      </ref>
      <ref id="ref-4-9812">
        <mixed-citation publication-type="book">Cardeira, Esperança. 2005. <italic>Entre o Português Antigo e o Português Clássico</italic>. Lisboa: Imprensa Nacional – Casa da Moeda.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Cardeira</surname>
              <given-names>Esperança</given-names>
            </name>
          </person-group>
          <source>Entre o Português Antigo e o Português Clássico</source>
          <publisher-name>Imprensa Nacional – Casa da Moeda</publisher-name>
          <publisher-loc>Lisboa</publisher-loc>
          <year>2005</year>
        </element-citation>
      </ref>
      <ref id="ref-5-9812">
        <mixed-citation publication-type="thesis">Carvalho, Maria José Simões Pereira de. 1996. <italic>Do Português Arcaico ao Português Moderno. Contributos para uma nova proposta de periodização</italic>. [Dissertação de Mestrado]. Coimbra: Faculdade de Letras da Universidade de Coimbra.</mixed-citation>
        <element-citation publication-type="thesis">
          <person-group person-group-type="author">
            <name>
              <surname>Carvalho</surname>
              <given-names>Maria José Simões Pereira de</given-names>
            </name>
          </person-group>
          <source>Do Português Arcaico ao Português Moderno. Contributos para uma nova proposta de periodização</source>
          <publisher-name>Faculdade de Letras da Universidade de Coimbra</publisher-name>
          <publisher-loc>Coimbra</publisher-loc>
          <year>1996</year>
          <comment content-type="degree">Dissertação de Mestrado</comment>
        </element-citation>
      </ref>
      <ref id="ref-6-9812">
        <mixed-citation publication-type="book">Castro, Ivo. 1993. História de Vespasiano. Em Giulia Lanciani &amp; Giuseppe Tavani (coords.), <italic>Diccionário da Literatura Medieval Galega Portuguesa</italic>. 311-312. Lisboa: Caminho.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Castro</surname>
              <given-names>Ivo</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Lanciani</surname>
              <given-names>Giulia</given-names>
            </name>
            <name>
              <surname>Tavani</surname>
              <given-names>Giuseppe</given-names>
            </name>
          </person-group>
          <source>Diccionário da Literatura Medieval Galega Portuguesa</source>
          <chapter-title>História de Vespasiano</chapter-title>
          <publisher-name>Caminho</publisher-name>
          <publisher-loc>Lisboa</publisher-loc>
          <year>1993</year>
          <fpage>311</fpage>
          <lpage>312</lpage>
        </element-citation>
      </ref>
      <ref id="ref-7-9812">
        <mixed-citation publication-type="journal">Cepeda, Isabel Vilares. 1993. Os «Quarenta Mártires de Sebaste». Um testemunho manuscrito do século XV em português. <italic>Theologica</italic> 28(2), 507-514. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://doi.org/10.34632/theologica.1993.11938">https://doi.org/10.34632/theologica.1993.11938</ext-link> [02-04-2025].</mixed-citation>
        <element-citation publication-type="journal">
          <person-group person-group-type="author">
            <name>
              <surname>Cepeda</surname>
              <given-names>Isabel Vilares</given-names>
            </name>
          </person-group>
          <source>Theologica</source>
          <article-title>Os «Quarenta Mártires de Sebaste». Um testemunho manuscrito do século XV em português</article-title>
          <year>1993</year>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <volume>28</volume>
          <issue>2</issue>
          <fpage>507</fpage>
          <lpage>514</lpage>
          <pub-id pub-id-type="doi">10.34632/theologica.1993.11938</pub-id>
        </element-citation>
      </ref>
      <ref id="ref-8-9812">
        <mixed-citation publication-type="webpage">CLUL. 2015. <italic>Corpus de Textos Antigos até 1525</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=home">http://teitok.clul.ul.pt/teitok/cta/index.php?action=home</ext-link> [02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <collab>CLUL</collab>
          </person-group>
          <source>Corpus de Textos Antigos até 1525</source>
          <year>2015</year>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=home">http://teitok.clul.ul.pt/teitok/cta/index.php?action=home</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-9-9812">
        <mixed-citation publication-type="thesis">Cruz, Marta. 2018. <italic>A vida de Santa Senhorinha de Basto em português: estudo estemático e linguístico</italic>. [Dissertação de Mestrado]. Lisboa: Faculdade de Letras da Universidade de Lisboa. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://repositorio.ulisboa.pt/handle/10451/34477">https://repositorio.ulisboa.pt/handle/10451/34477</ext-link>. [02-04-2025].</mixed-citation>
        <element-citation publication-type="thesis">
          <person-group person-group-type="author">
            <name>
              <surname>Cruz</surname>
              <given-names>Marta</given-names>
            </name>
          </person-group>
          <source>A vida de Santa Senhorinha de Basto em português: estudo estemático e linguístico</source>
          <publisher-name>Faculdade de Letras da Universidade de Lisboa</publisher-name>
          <publisher-loc>Lisboa</publisher-loc>
          <year>2018</year>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://repositorio.ulisboa.pt/handle/10451/34477">https://repositorio.ulisboa.pt/handle/10451/34477</ext-link>
          <comment content-type="degree">Dissertação de Mestrado</comment>
        </element-citation>
      </ref>
      <ref id="ref-10-9812">
        <mixed-citation publication-type="webpage">Cruz, Marta. s.d. <italic>Vida e Milagres de Santa Senhorinha de Basto – E</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M5602T12967.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M5602T12967.xml</ext-link>. [02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <name>
              <surname>Cruz</surname>
              <given-names>Marta</given-names>
            </name>
          </person-group>
          <source>Vida e Milagres de Santa Senhorinha de Basto – E</source>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M5602T12967.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M5602T12967.xml</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-11-9812">
        <mixed-citation publication-type="journal">Eleutério, Samuel., Ranchhod, Elisabete Marques, Freire, Helena, &amp; Baptista, Jorge. 1995. A System of Electronic Dictionaries of Portuguese. <italic>Lingvisticae Investigationes</italic> XIX (1), 57–82.</mixed-citation>
        <element-citation publication-type="journal">
          <person-group person-group-type="author">
            <name>
              <surname>Eleutério</surname>
              <given-names>Samuel</given-names>
            </name>
            <name>
              <surname>Ranchhod</surname>
              <given-names>Elisabete Marques</given-names>
            </name>
            <name>
              <surname>Freire</surname>
              <given-names>Helena</given-names>
            </name>
            <name>
              <surname>Baptista</surname>
              <given-names>Jorge</given-names>
            </name>
          </person-group>
          <source>Lingvisticae Investigationes</source>
          <article-title>A System of Electronic Dictionaries of Portuguese</article-title>
          <year>1995</year>
          <volume>XIX</volume>
          <issue>1</issue>
          <fpage>57</fpage>
          <lpage>82</lpage>
        </element-citation>
      </ref>
      <ref id="ref-12-9812">
        <mixed-citation publication-type="book">Ferrero, Ana Diaz &amp; Horácio Peixoto. 1993. Horto do Esposo. Em Giulia Lanciani &amp; Giuseppe Tavani (coords.), <italic>Diccionário da Literatura Medieval Galega Portuguesa</italic>. 315-317. Lisboa: Caminho.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Ferrero</surname>
              <given-names>Ana Diaz</given-names>
            </name>
            <name>
              <surname>Peixoto</surname>
              <given-names>Horácio</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Lanciani</surname>
              <given-names>Giulia</given-names>
            </name>
            <name>
              <surname>Tavani</surname>
              <given-names>Giuseppe</given-names>
            </name>
          </person-group>
          <source>Diccionário da Literatura Medieval Galega Portuguesa</source>
          <chapter-title>Horto do Esposo</chapter-title>
          <publisher-name>Caminho</publisher-name>
          <publisher-loc>Lisboa</publisher-loc>
          <year>1993</year>
          <fpage>315</fpage>
          <lpage>317</lpage>
        </element-citation>
      </ref>
      <ref id="ref-13-9812">
        <mixed-citation publication-type="webpage">Firmino, Jessica &amp; Cristina Sobral. s.d. <italic>Memorial da Infanta Santa Joana</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1093T6287.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1093T6287.xml</ext-link>. [02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <name>
              <surname>Firmino</surname>
              <given-names>Jessica</given-names>
            </name>
            <name>
              <surname>Sobral</surname>
              <given-names>Cristina</given-names>
            </name>
          </person-group>
          <source>Memorial da Infanta Santa Joana</source>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1093T6287.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1093T6287.xml</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-14-9812">
        <mixed-citation publication-type="webpage">Franco, Patrícia &amp; Cristina Sobral. s.d. <italic>Horto do Esposo – A</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1114T1082.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1114T1082.xml</ext-link>. [02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <name>
              <surname>Franco</surname>
              <given-names>Patrícia</given-names>
            </name>
            <name>
              <surname>Sobral</surname>
              <given-names>Cristina</given-names>
            </name>
          </person-group>
          <source>Horto do Esposo – A</source>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1114T1082.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1114T1082.xml</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-15-9812">
        <mixed-citation publication-type="book">Janssen, Maarten. 2016. TEITOK: Text-Faithful Annotated Corpora. Em Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Sara Goggi, Marko Grobelnik, Bente Maegaard, Joseph Mariani, Helene Mazo, Asuncion Moreno, Jan Odijk, &amp; Stelios Piperidis (eds.), <italic>Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16)</italic>. 4037–4043. European Language Resources Association (ELRA). <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://aclanthology.org/L16-1637">https://aclanthology.org/L16-1637</ext-link>. [02-04-2025].</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Janssen</surname>
              <given-names>Maarten</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Calzolari</surname>
              <given-names>Nicoletta</given-names>
            </name>
            <name>
              <surname>Choukri</surname>
              <given-names>Khalid</given-names>
            </name>
            <name>
              <surname>Declerck</surname>
              <given-names>Thierry</given-names>
            </name>
            <name>
              <surname>Goggi</surname>
              <given-names>Sara</given-names>
            </name>
            <name>
              <surname>Grobelnik</surname>
              <given-names>Marko</given-names>
            </name>
            <name>
              <surname>Maegaard</surname>
              <given-names>Bente</given-names>
            </name>
            <name>
              <surname>Mariani</surname>
              <given-names>Joseph</given-names>
            </name>
            <name>
              <surname>Mazo</surname>
              <given-names>Helene</given-names>
            </name>
            <name>
              <surname>Moreno</surname>
              <given-names>Asuncion</given-names>
            </name>
            <name>
              <surname>Odijk</surname>
              <given-names>Jan</given-names>
            </name>
            <name>
              <surname>Piperidis</surname>
              <given-names>Stelios</given-names>
            </name>
          </person-group>
          <source>Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’16)</source>
          <chapter-title>TEITOK: Text-Faithful Annotated Corpora</chapter-title>
          <publisher-name>European Language Resources Association (ELRA)</publisher-name>
          <year>2016</year>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <fpage>4037</fpage>
          <lpage>4043</lpage>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://aclanthology.org/L16-1637">https://aclanthology.org/L16-1637</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-16-9812">
        <mixed-citation publication-type="book">Madahil, António Gomes da Rocha. 1939. <italic>Crónica da fundação do Mosteiro de Jesus, de Aveiro, e memorial da infanta santa Joana: filha del Rei Dom Afonso V (códice quinhentista)</italic>. Aveiro: Edição de Prof. Francisco Ferreira Neves.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Madahil</surname>
              <given-names>António Gomes da Rocha</given-names>
            </name>
          </person-group>
          <source>Crónica da fundação do Mosteiro de Jesus, de Aveiro, e memorial da infanta santa Joana: filha del Rei Dom Afonso V (códice quinhentista)</source>
          <publisher-name>Edição de Prof. Francisco Ferreira Neves</publisher-name>
          <publisher-loc>Aveiro</publisher-loc>
          <year>1939</year>
        </element-citation>
      </ref>
      <ref id="ref-17-9812">
        <mixed-citation publication-type="book">Ranchhod, Elisabete Marques. 1999. Construções com Nomes Predicativos na Crónica Geral de Espanha de 1344. Em Isabel Hub Faria (ed.), <italic>Lindley Cintra. Homenagem ao Homem, ao Mestre e ao Cidadão</italic>. 667–682. Lisboa: Edições Cosmo / Faculdade de Letras da Universidade de Lisboa. </mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Ranchhod</surname>
              <given-names>Elisabete Marques</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Hub Faria</surname>
              <given-names>Isabel</given-names>
            </name>
          </person-group>
          <source>Lindley Cintra. Homenagem ao Homem, ao Mestre e ao Cidadão</source>
          <chapter-title>Construções com Nomes Predicativos na Crónica Geral de Espanha de 1344</chapter-title>
          <publisher-name>Edições Cosmo</publisher-name>
          <publisher-name>Faculdade de Letras da Universidade de Lisboa</publisher-name>
          <publisher-loc>Lisboa</publisher-loc>
          <year>1999</year>
          <fpage>667</fpage>
          <lpage>682</lpage>
        </element-citation>
      </ref>
      <ref id="ref-18-9812">
        <mixed-citation publication-type="book">Ranchhod, Elisabete Marques. 2001. O uso de dicionários e de autómatos finitos na representação lexical das línguas naturais. Em Elisabete Marque Ranchhod (ed.), <italic>Tratamento das Línguas por Computador: Uma introdução à Linguística Computacional e suas aplicações</italic>. 13–47. Lisboa: Editorial Caminho.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Ranchhod</surname>
              <given-names>Elisabete Marques</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Marque Ranchhod</surname>
              <given-names>Elisabete</given-names>
            </name>
          </person-group>
          <source>Tratamento das Línguas por Computador: Uma introdução à Linguística Computacional e suas aplicações</source>
          <chapter-title>O uso de dicionários e de autómatos finitos na representação lexical das línguas naturais</chapter-title>
          <publisher-name>Editorial Caminho</publisher-name>
          <publisher-loc>Lisboa</publisher-loc>
          <year>2001</year>
          <fpage>13</fpage>
          <lpage>47</lpage>
        </element-citation>
      </ref>
      <ref id="ref-19-9812">
        <mixed-citation publication-type="book">Schmid, Helmut. 1994. Probabilistic part-of-speech tagging using decision trees. Em <italic>Proceedings of International Conference on New Methods in Language Processing</italic>. 44-49. Stuttgart: Association for Computational Linguistics.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Schmid</surname>
              <given-names>Helmut</given-names>
            </name>
          </person-group>
          <source>Proceedings of International Conference on New Methods in Language Processing</source>
          <chapter-title>Probabilistic part-of-speech tagging using decision trees</chapter-title>
          <publisher-name>Association for Computational Linguistics</publisher-name>
          <publisher-loc>Stuttgart</publisher-loc>
          <year>1994</year>
          <fpage>44</fpage>
          <lpage>49</lpage>
        </element-citation>
      </ref>
      <ref id="ref-20-9812">
        <mixed-citation publication-type="book">Schmid, Helmut. 1999. Improvements in Part-of-Speech Tagging with an Application to German. Em Susan Armstrong, S. Kenneth Church, Pierre Isabelle, Sandra Manzi, Evelyne Tzoukermann &amp; David Yarowsky (eds.), <italic>Natural Language Processing Using Very Large Corpora</italic>, volume 11. 13-25. Dordrecht: Kluwer Academic Publishers.</mixed-citation>
        <element-citation publication-type="book">
          <person-group person-group-type="author">
            <name>
              <surname>Schmid</surname>
              <given-names>Helmut</given-names>
            </name>
          </person-group>
          <person-group person-group-type="editor">
            <name>
              <surname>Armstrong</surname>
              <given-names>Susan</given-names>
            </name>
            <name>
              <surname>Church</surname>
              <given-names>S. Kenneth</given-names>
            </name>
            <name>
              <surname>Isabelle</surname>
              <given-names>Pierre</given-names>
            </name>
            <name>
              <surname>Manzi</surname>
              <given-names>Sandra</given-names>
            </name>
            <name>
              <surname>Tzoukermann</surname>
              <given-names>Evelyne</given-names>
            </name>
            <name>
              <surname>Yarowsky</surname>
              <given-names>David</given-names>
            </name>
          </person-group>
          <source>Natural Language Processing Using Very Large Corpora</source>
          <chapter-title>Improvements in Part-of-Speech Tagging with an Application to German</chapter-title>
          <publisher-name>Kluwer Academic Publishers</publisher-name>
          <publisher-loc>Dordrecht</publisher-loc>
          <year>1999</year>
          <volume>11</volume>
          <fpage>13</fpage>
          <lpage>25</lpage>
        </element-citation>
      </ref>
      <ref id="ref-21-9812">
        <mixed-citation publication-type="journal">Sobral, Cristina &amp; Esperança Cardeira. 2018. O Livro dos Mártires de Bernardo de Brihuega: dois séculos de leitura em português. <italic>Estudos de Lingüística Galega</italic> 10, 129-141. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://doi.org/10.15304/elg.10.4613">https://doi.org/10.15304/elg.10.4613</ext-link>.</mixed-citation>
        <element-citation publication-type="journal">
          <person-group person-group-type="author">
            <name>
              <surname>Sobral</surname>
              <given-names>Cristina</given-names>
            </name>
            <name>
              <surname>Cardeira</surname>
              <given-names>Esperança</given-names>
            </name>
          </person-group>
          <source>Estudos de Lingüística Galega</source>
          <article-title>O Livro dos Mártires de Bernardo de Brihuega: dois séculos de leitura em português</article-title>
          <year>2018</year>
          <volume>10</volume>
          <fpage>129</fpage>
          <lpage>141</lpage>
          <pub-id pub-id-type="doi">10.15304/elg.10.4613</pub-id>
        </element-citation>
      </ref>
      <ref id="ref-22-9812">
        <mixed-citation publication-type="journal">Sobral, Cristina. 2015. A Vida da Princesa Santa Joana de Portugal: hipóteses de autoria. <italic>Revista de Literatura Medieval</italic> 27, 213-224. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://hdl.handle.net/10017/28060">http://hdl.handle.net/10017/28060</ext-link>.</mixed-citation>
        <element-citation publication-type="journal">
          <person-group person-group-type="author">
            <name>
              <surname>Sobral</surname>
              <given-names>Cristina</given-names>
            </name>
          </person-group>
          <source>Revista de Literatura Medieval</source>
          <article-title>A Vida da Princesa Santa Joana de Portugal: hipóteses de autoria</article-title>
          <year>2015</year>
          <volume>27</volume>
          <fpage>213</fpage>
          <lpage>224</lpage>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://hdl.handle.net/10017/28060">http://hdl.handle.net/10017/28060</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-23-9812">
        <mixed-citation publication-type="webpage">Sobral, Cristina. s.d. <italic>Horto do Esposo – DCE</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M3397T1082.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M3397T1082.xml</ext-link> [02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <name>
              <surname>Sobral</surname>
              <given-names>Cristina</given-names>
            </name>
          </person-group>
          <source>Horto do Esposo – DCE</source>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M3397T1082.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M3397T1082.xml</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-24-9812">
        <mixed-citation publication-type="webpage">Sobral, Cristina. s.d. <italic>Vida e Milagres de Santa Senhorinha de Basto – G1</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1614T12967.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1614T12967.xml</ext-link> [02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <name>
              <surname>Sobral</surname>
              <given-names>Cristina</given-names>
            </name>
          </person-group>
          <source>Vida e Milagres de Santa Senhorinha de Basto – G1</source>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1614T12967.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=M1614T12967.xml</ext-link>
        </element-citation>
      </ref>
      <ref id="ref-25-9812">
        <mixed-citation publication-type="webpage">Sonsino, Ana, Marta Cruz &amp; Cristina Sobral. s.d. <italic>Livro dos Mártires</italic>. <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=2265.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=2265.xml</ext-link> [02-04-2025].</mixed-citation>
        <element-citation publication-type="webpage">
          <person-group person-group-type="author">
            <name>
              <surname>Sonsino</surname>
              <given-names>Ana</given-names>
            </name>
            <name>
              <surname>Cruz</surname>
              <given-names>Marta</given-names>
            </name>
            <name>
              <surname>Sobral</surname>
              <given-names>Cristina</given-names>
            </name>
          </person-group>
          <source>Livro dos Mártires</source>
          <date-in-citation content-type="access-date" iso-8601-date="2025-04-02">02-04-2025</date-in-citation>
          <ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=2265.xml">http://teitok.clul.ul.pt/teitok/cta/index.php?action=file&amp;id=2265.xml</ext-link>
        </element-citation>
      </ref>
    </ref-list>
    <fn-group>
      <title>Notes</title>
      <fn fn-type="other" id="fn-1-9812">
        <label><sup>1</sup></label>
        <p><ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="http://teitok.clul.ul.pt/teitok/cta/index.php?action=home">http://teitok.clul.ul.pt/teitok/cta/index.php?action=home</ext-link> [02-04-2025]</p>
      </fn>
      <fn fn-type="other" id="fn-2-9812">
        <label><sup>2</sup></label>
        <p>O limite temporal (1525) deve-se à indexação presente na base de dados da Bibliografia de Textos Antigos Galegos e Portugueses (BITAGAP), que tem catalogados todos os textos e testemunhos que foram inicialmente escritos ou traduzidos para português, galego ou galego-português durante o período medieval.</p>
      </fn>
      <fn fn-type="other" id="fn-3-9812">
        <label><sup>3</sup></label>
        <p>Um dos objetivos futuros do projeto é a atualização dos ficheiros XML presentes no Corpus de Textos Antigos, de modo que estes incluam os dados linguísticos obtidos através da anotação automática.</p>
      </fn>
      <fn fn-type="other" id="fn-4-9812">
        <label><sup>4</sup></label>
        <p>As digitalizações dos códices alcobacenses estão disponíveis na página da Biblioteca Nacional Digital de Portugal (<ext-link ext-link-type="uri" xlink:title="enlace" xlink:href="https://bndigital.bnportugal.gov.pt/">https://bndigital.bnportugal.gov.pt/</ext-link> [02-04-2025]).</p>
      </fn>
    </fn-group>
  </back>
</article>