Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[pt] Disambiguator fixes verb/noun: had to remove two rules #10979

Merged
merged 4 commits into from
Nov 3, 2024
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Original file line number Diff line number Diff line change
Expand Up @@ -225,9 +225,22 @@
<example type="untouched">Ela ficou tão bonita!</example>
</rule>
<rulegroup id="RARE_POS" name="rare POS tags">
<rule> <!-- Used ChatGPT 4o to verify the 1446 results -->
<pattern>
<token postag="SPS00:DA0FS0" postag_regexp="no"/>
<marker>
<and>
<token postag="VMIP3S0|VMM02S0|VMSP2S0|VMIP2S0|VMN02S0|VMSF2S0|VMIP1S0|VMP00SM" postag_regexp="yes"/>
<token postag="NC.+" postag_regexp="yes"/>
</and>
<token postag="SPS00|SPS00:D[AI].+" postag_regexp="yes"/>
</marker>
</pattern>
<disambig action="remove" postag="V.*"/>
</rule>
<rule> <!-- Used ChatGPT 4o to verify the 22981 results -->
<pattern>
<token postag="V.+" postag_regexp="yes"><exception postag_regexp='yes' postag='CS|RG|NC.+|AQ.+'/></token>
<token postag="V.+" postag_regexp="yes"><exception postag_regexp='yes' postag='CS|RG|NC.+|AQ.+|CC|SPS.+'/></token>
<token postag="(SPS00:)?D[AI].+|PP.+|Z0.+" postag_regexp="yes"><exception postag_regexp='yes' postag='PI.+'/></token>
<marker>
<and>
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -48,19 +48,6 @@ USA

<rules lang="pt" xsi:noNamespaceSchemaLocation="https://raw.githubusercontent.com/languagetool-org/languagetool/master/languagetool-core/src/main/resources/org/languagetool/rules/rules.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xs="http://www.w3.org/2001/XMLSchema">
<category id="STYLE" name="Style" type="style">
<rule id="RETO_POSSESSIVO_PT" name="Substituição de pronome reto por pronome possessivo" tone_tags="formal" tags="picky">
<!-- IDEA shorten_it -->
<pattern>
<token>à</token>
<!-- this makes no sense, the procura here is a noun... looks like a mistake -->
<token postag='V.+' postag_regexp='yes'/>
<token>de</token>
<token>vocês</token>
</pattern>
<message>Substitua por <suggestion>à sua \2</suggestion>.</message>
<example correction="à sua procura">Eles andaram meses <marker>à procura de vocês</marker>.</example>
<example>Eles andaram meses <marker>à sua procura</marker>.</example>
</rule>

<rule id="ENTRAR_DENTRO_BR" name="Entrar" tone_tags="objective">
<!-- IDEA shorten_it -->
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -3913,132 +3913,6 @@ USA
<category id='SHORTEN_IT_PT_PT' name="[pt-PT] Linguagem concisa" type="style">


<rule id='SIMPLIFICAR_À_VERBO_DE' name="[pt-PT][Simplificar] À + Verbo + De → A + Verbo Infinitivo" type="style">
<!-- IDEA shorten_it -->
<!-- Created by Marco A.G.Pinto, Portuguese rule 2021-11-11/12/15 (25-JUN-2021+) -->
<!--
O Rui anda à procura de material científico. → O Rui anda a procurar material científico.
-->

<antipattern>
<token postag_regexp='yes' postag='VMSI.+|VMG0000|VMP00.+'/>
<token>à</token>
<token postag_regexp='yes' postag='NC.+|AQ.+|NP.+'/>
<token>de</token>
<token postag_regexp='yes' postag='NC.+|AQ.+|NP.+|DI.+|CS|V.+'/>
<example>Ele pediu que o adicionasse à lista de acesso da sala de chat.</example>
<example>A vida das pessoas, a autoestima e seus relacionamentos estão totalmente atrelados à forma de como se mostram ao mundo.</example>
<example>Esta ação evita que problemas e gastos excessivos ligados à falta de lubrificação, apareçam futuramente.</example>
<example>São tantas as páginas do meu livro marcadas à espera de serem lidas, que me perco sem saber qual delas ler primeiro.</example>
<example>Nós estamos indo à festa de aniversário do filho de Tom.</example>
<example>Conceitos fundamentais associados à obra de Bakhtin incluem o dialogismo, a polifonia (linguística), a heteroglossia e o carnavalesco.</example>
<example>A calorimetria é uma ramificação da termologia que analisa os problemas relacionados à troca de calor em sistemas de temperaturas diversas.</example>
</antipattern>

<!--
Em maio de 1863, submeteu-se à prova de admissão para o ingresso na Faculdade de Direito do Recife sendo reprovado.
E, ao se referir-se à visita de Lula, informou que "Lula honra Berlim e Hamburgo" com sua visita.
Em 25 de março de 1509, o papa Júlio II alia-se à Liga de Cambrai.
-->
<antipattern>
<token>se</token>
<token>à</token>
<token postag='VMIP3S0'/>
<token>de</token>
<token/>
</antipattern>
<!--
Estes dias estão ligados à vida de Jesus Cristo ou à história dos primórdios do movimento cristão.
Existe alguma possibilidade de que Tom tenha ido à casa de Mary ontem à noite?
Os problemas da educação da Bolívia não são necessariamente atribuídos à falta de fundos.
"Ele foi enviado à zona de operações onde foi seriamente ferido pela explosão de uma granada."
O homem está sujeito à pena de morte.
Tom não foi à casa de Marie?
Ele veio à procura de esclarecimentos.
Tom foi à casa de massagem.
Certa vez fomos à casa de tia Elisabete e encontramos a linda senhora desolada.
Fomos à praia assistir à queima de fogos de artifício.
Manuel, ateu, recusou-se a assistir à missa de sétimo dia do amigo que falecera.
Com um PIB per capita aproximado em 7.300 dólares americanos, o país pertence à faixa de renda média-baixa.
-->
<antipattern>
<token postag='VMP00.+|VMIS.+|VMIP3.+|VMN0000' postag_regexp='yes'>
<exception postag_regexp='yes' postag='AQ.+|NC.'/>
<exception regexp='yes' inflected='yes'>estar|andar</exception>
</token>
<token>à</token>
<token postag='VMIP3S0'/>
<token>de</token>
<token postag='RG|NP.+|AQ.+|NC.+|PI.+' postag_regexp='yes'/>
</antipattern>
<antipattern>
<token>à</token>
<token>prova</token>
<token>de</token>
</antipattern>
<antipattern>
<token postag_regexp='yes' postag='VMIP.+'/>
<token min='0' max='1' postag='RG'/>
<token>à</token>
<token postag_regexp='yes' postag='AQ.[CM].+|NC[CM].+'/>
<token>de</token>
<token postag_regexp='yes' postag='NC.+|AQ.+|NP.+|DI.+|CS|V.+'/>
<example>Estou sempre à cuca de palavras em falta nos dicionários open-source.</example>
<example>Os títulos estão à guarda de Bancos sólidos e as suas cotações diárias são observáveis em qualquer praça financeira mundial.</example>
</antipattern>
<pattern>
<token negate="yes">se</token>
<or>
<token postag='V.+|RG' postag_regexp='yes'>
<exception postag_regexp='yes' postag='SPS.+|AQ..S.+|VMI[MS]3P.+|I'/>
</token>
<token>,</token>
</or>
<marker>
<token>à</token>
<token postag='VMIP3S0'>
<exception regexp='yes'>academia|aldeia|banda|bandeira|boca|casa|comarca|condessa|data|empresa|estrada|faixa|figura|ideia|ilha|pena|porta|vida|zona|palavra|terra|seu|meu|sala|força</exception>
</token>
<token>de</token>
</marker>
<token negate_pos="yes" postag='DI.+' postag_regexp='yes'/>
</pattern>
<message>Em certos contextos, esta perífrase pode ser simplificada.</message>
<suggestion>a <match no='4' postag='VMN0000' postag_replace='VMIP3S0'/></suggestion>
<example correction="a procurar">O Rui anda <marker>à procura de</marker> material científico.</example>
<example>Lista dos viajantes que aportaram à ilha de Santa Catarina nos séculos XVIII e XIX</example>
<example>Já a multimidialidade se refere à mistura de diferentes mídias tradicionais (imagem, texto e som) para narrar um facto.</example>
<example>Ele se agarrou à esperança de que iria vê-la novamente algum dia.</example>
<example>Talvez esta noite eu vá à casa de minha irmã caçula.</example>
<example>Vamos à casa de chá!</example>
<example>Vou à casa da minha avó.</example>
<example>No Afeganistão, por exemplo, a homossexualidade levava à pena de morte sob o regime talibã.</example>
<example>Geralmente com pinturas alusivas à rosa-dos-ventos, à data de construção e às iniciais do proprietário.</example>
<example>Em 1839, pertencia à comarca de Ponte de Lima e, em 1852, à de Arcos de Valdevez.</example>
<example>Mais tarde regressou à banda de Basie.</example>
<example>Fez parte de um antigo mosteiro doado, entre 1032 e 1043, à condessa de Ildnara por mestre Savarigo.</example>
<example>Conecta a prefeitura de Aomori, na ilha japonesa de Honshu, à ilha de Hokkaido.</example>
<example>A palavra elegbara significa “aquele que é possuidor do poder (agbará)” e está ligado à figura de Exu.</example>

<example>Em maio de 1863, submeteu-se à prova de admissão para o ingresso na Faculdade de Direito do Recife sendo reprovado.</example>
<example>E, ao se referir-se à visita de Lula, informou que "Lula honra Berlim e Hamburgo" com sua visita.</example>
<example>Em 25 de março de 1509, o papa Júlio II alia-se à Liga de Cambrai.</example>

<example>Estes dias estão ligados à vida de Jesus Cristo ou à história dos primórdios do movimento cristão.</example>
<example>Existe alguma possibilidade de que Tom tenha ido à casa de Mary ontem à noite?</example>
<example>Os problemas da educação da Bolívia não são necessariamente atribuídos à falta de fundos.</example>
<example>"Ele foi enviado à zona de operações onde foi seriamente ferido pela explosão de uma granada."</example>
<example>O homem está sujeito à pena de morte.</example>
<example>Tom não foi à casa de Marie?</example>
<example>Ele veio à procura de esclarecimentos.</example>
<example>Tom foi à casa de massagem.</example>
<example>Certa vez fomos à casa de tia Elisabete e encontramos a linda senhora desolada.</example>
<example>Fomos à praia assistir à queima de fogos de artifício.</example>
<example>Manuel, ateu, recusou-se a assistir à missa de sétimo dia do amigo que falecera.</example>
<example>Com um PIB per capita aproximado em 7.300 dólares americanos, o país pertence à faixa de renda média-baixa.</example>
</rule>


<rule id='SIMPLIFICAR_A_XXX_DE_VOCÊS' name="[pt-PT][Simplificar] A XXX de vocês → a vossa XXX" tone_tags="objective">
<!-- IDEA shorten_it -->
<antipattern>
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -11939,56 +11939,6 @@ USA
<example correction="eficiente">O processo foi resolvido <marker>eficientemente</marker>, permanentemente e consistentemente.</example>
</rule>
</rulegroup>
<rulegroup id='À_MINHA-TUA-SUA-VOSSA_VERB' name="à + minha/tua/sua/vossa(s) + verbo" tags="picky" tone_tags="objective">
<!-- Created by Marco A.G.Pinto, Portuguese rule - 2020-09-07 (2-JUL-2020+) -->
<rule>
<pattern>
<token>à</token>
<token postag='V.+' postag_regexp='yes'/>
<token>de</token>
<token>mim</token>
</pattern>
<message>Substitua por <suggestion>à minha \2</suggestion>.</message>
<example correction="à minha procura">Eles andaram meses <marker>à procura de mim</marker>.</example>
<example>Eles andaram meses <marker>à minha procura</marker>.</example>
</rule>
<rule>
<pattern>
<token>à</token>
<token postag='V.+' postag_regexp='yes'/>
<token>de</token>
<token>ti</token>
</pattern>
<message>Substitua por <suggestion>à tua \2</suggestion>.</message>
<example correction="à tua procura">Eles andaram meses <marker>à procura de ti</marker>.</example>
<example>Eles andaram meses <marker>à tua procura</marker>.</example>
</rule>
<rule>
<pattern>
<token>à</token>
<token postag='V.+' postag_regexp='yes'/>
<token>de</token>
<token>si</token>
</pattern>
<message>Substitua por <suggestion>à sua \2</suggestion>.</message>
<example correction="à sua procura">Eles andaram meses <marker>à procura de si</marker>.</example>
<example>Eles andaram meses <marker>à sua procura</marker>.</example>
</rule>
<rule>
<pattern>
<token>à</token>
<token postag='V.+' postag_regexp='yes'/>
<token>de</token>
<token>você</token>
</pattern>
<message>Substitua por </message>
<suggestion>à sua \2</suggestion>
<suggestion>à tua \2</suggestion>
<example correction="à sua procura|à tua procura">Eles andaram meses <marker>à procura de você</marker>.</example>
<example>Eles andaram meses <marker>à sua procura</marker>.</example>
<example>Eles andaram meses <marker>à tua procura</marker>.</example>
</rule>
</rulegroup>
<!-- DENOMINADA(O)(S) COMO SENDO denominada(o)(s) -->
<rule id='DENOMINADA' name="Denominada(o)(s)" tone_tags="objective">
<!-- IDEA shorten_it -->
Expand Down Expand Up @@ -14945,7 +14895,7 @@ USA
<token regexp='yes'>às?</token>
<token min="0" max="1" postag='_QUOT' postag_regexp='no'/>
<token postag='V.+' postag_regexp='yes'/>
<example>Temos as leoas que se movem à procura de alimento.</example>
<!-- <example>Temos as leoas que se movem à procura de alimento.</example> -->
</antipattern>

<pattern>
Expand Down