python-docs-pt-br icon indicating copy to clipboard operation
python-docs-pt-br copied to clipboard

Script para ler e processar planilha de páginas mais acessadas

Open rffontenelle opened this issue 4 years ago • 14 comments

Criar um script que leia planilhas como a relacionada abaixo, processe-a e emita uma lista de prioridades de tradução.

https://docs.google.com/spreadsheets/d/1RJapw9QAoLcdSV6et9G67LNTM3Pcn6XIv_h5S5ksFNk/edit?usp=sharing

A planilha acima apresenta as páginas mais requisitadas da documentação do Python no Brasil.

Conteúdo desejável da lista de prioridades:

  • nome do recursos (ex., library--datetime)
  • URL para tradução no Transifex)
  • (URL da documentação?)

Por exemplo: A URL https://docs.python.org/3/library/datetime.html resultaria no recurso de Transifex "library--datetime" ("/" substituída por "--", prefixo e extensão removida), resultando na URL para tradução: https://www.transifex.com/python-doc/python-39/translate/#pt_BR/library--datetime

Na URL para tradução, a parte "python-39" é o nome do projeto, composto de python-VERSÃO (VERSÃO retirado o ponto, 27, 39, 310). A versão pode ser atualizada, de forma que ser uma variável ajustável pode ser interessante.

rffontenelle avatar Jun 15 '21 00:06 rffontenelle

Acho que para a maioria dos casos, especialmente o que está abaixo de /library, isso se aplica bem.

Para para algumas seções, como /tutorial, as páginas poderiam ser agrupadas. Faz mais sentido dizer que o tutorial é prioridade do que um capítulo específico dele. Não tenho certeza se outra seção se encaixa nisso ou apenas o tutorial.

adorilson avatar Jun 15 '21 10:06 adorilson

o link da linha 545 está quebrado dentro da planilha. @rffontenelle pode dar uma olhadinha?

image

fecaridade avatar Jun 17 '21 19:06 fecaridade

Corrigido @fecaridade

rougeth avatar Jun 17 '21 19:06 rougeth

Obrigado!.

fecaridade avatar Jun 17 '21 21:06 fecaridade

@rougeth Qual é o formato original dessa planilha? É um arquivo CSV? É Planilha Google mesmo? Outro? Se não for a Planilha Google, poderia compartilhar aqui?

adorilson avatar Jun 18 '21 17:06 adorilson

Eu recebi nesse mesmo formato, apenas fiz uma cópia para a minha conta e divulguei com vocês.

On 18 Jun 2021, at 18:43, Adorilson Bezerra @.***> wrote:

@rougeth Qual é o formato original dessa planilha? É um arquivo CSV? É Planilha Google mesmo? Outro? Se não for a Planilha Google, poderia compartilhar aqui?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

rougeth avatar Jun 19 '21 00:06 rougeth

@adorilson considerando que dificilmente nova versão aparece e a aparente falta de padrão do arquivo, talvez não compense um script. O que acha?

rffontenelle avatar Dec 12 '21 14:12 rffontenelle

@adorilson considerando que dificilmente nova versão aparece e a aparente falta de padrão do arquivo, talvez não compense um script. O que acha?

Acho que vale. Discutindo com Caridade, uma ideia foi o script pegar a porcentagem da tradução no Transifex e só mostrar o que tá com menos de 100%.

Mas bom mesmo era ver o PR, né?

@fecaridade compareça.

adorilson avatar Dec 15 '21 01:12 adorilson

se for para fazer o script que pega a porcentagem da tradução do Transifex e mostrar o que estão com menos de 100% eu consigo criar o script @adorilson apareci :)

fecaridade avatar Dec 15 '21 02:12 fecaridade

se for para fazer o script que pega a porcentagem da tradução do Transifex e mostrar o que estão com menos de 100% eu consigo criar o script @adorilson apareci :)

Faz o PR com o que você já tem (isso é comparecer, não aparecer. :p )

E implementa essa questão aí das porcentagens de tradução.

adorilson avatar Dec 15 '21 02:12 adorilson

Isso ainda é uma coisa a ser feita?

guilhermesrc avatar Nov 10 '23 00:11 guilhermesrc

Isso ainda é uma coisa a ser feita?

Embora as páginas mais acessadas (top 10, talvez 20) já estejam traduzidas, eu acredito que sim.

@fecaridade Ainda tem esse código aí para não (re)começarmos isso do zero?

adorilson avatar Nov 10 '23 09:11 adorilson

@adorilson estou procurando aqui o código, colocarei no repositorio assim que encontrar!.

fecaridade avatar Nov 10 '23 15:11 fecaridade

Olá @adorilson e @rffontenelle,

Encontrei meu script de 2021 no repositório github. No entanto, notei que ainda precisa passar por uma refatoração e corrigir alguns links.

O script atual é capaz de gerar links no formato da Transifex, mas ainda há algumas funcionalidades que precisam ser aprimoradas:

  • [ ] tornar a versão do link ajustável
  • [ ] lidar com links que estão fora do padrão, como os links "dev"
  • [ ] melhorar a abordagem para obter o nome da biblioteca e construir o link

Se tiverem sugestões ou preferências específicas, por favor, compartilhem!

fecaridade avatar Nov 11 '23 12:11 fecaridade