Edward Villegas-Pulgarin

Results 65 comments of Edward Villegas-Pulgarin

Tenemos aún pendientes 1132 lemas :(

@eksperimental en eksperimental/qorpora#1 reporte 236 lemas para incluir en la lista negra con el respectivo motivo de exclusión. Aún tengo una lista de 162 lemas pendientes de validar (posibles noRAE)...

Para ir adelantando, el reporte 95 tiene pendientes los siguientes lemas RAE (los noRAE los tengo pendientes por validar): https://gist.github.com/cosmoscalibur/34f5d326efc5864a65b9c022b0fc792d Por la cantidad, dispongo este avance en la revisión de...

@eksperimental puedes validar las frecuencias de la lista del reporte #15 ([lista](https://gist.github.com/cosmoscalibur/f89526d0432911b4ab57309432c10b0d)). Y con la lista del #11 (la original del reporte). Sería de gran ayuda para priorizar los lemas...

Gracias @eksperimental . Estoy validando con esas listas reducidas cuales nos faltan para priorizar.

¿Deberíamos incluir una bandera para diminutivos y aumentativos que admitan los dos géneros y el plural? ¿Deberíamos crear un preprocesador para los afijos que permita encadenar varias banderas y que...

Claro @RickieES , ese es el motivo por el cual lo pregunto, porque incluiste "enfermo" y "enferma" como lemas separados para poder formar los diminutivos. Caso que con una bandera...

Hola @santilin. Dentro de RLA-ES los lemas se clasifican según: + Pertenencia a RAE: RAE o noRAE. + Distribución geográfica de uso: Se usa la forma estándar para la localización,...

Igualmente @santilin, como lo mencione en el otro tópico al final, pienso trabajar en la rutina de clasificación. He visto varios proyectos que pueden ser de ayuda que se mantienen...

Hola @santilin , si justamente te interesa un corrector gramatical es necesaria con mayor razón la clasificación en ficheros (por comodidad para posprocesamiento). Yo me estoy documentando respecto a los...