Blog
Uma proposta de blog hospedado em basedosdados.org, construído em cima do Next.
Visão Geral
- As postagens são arquivos markdown
- O nome do arquivo é a URL (
slugsem a extensão.md) da postagem e estão emnext/blog/ - Cada postagem tem os metadados no cabeçalho em um bloco
yaml, delimitado por---e---. Nem todos os campos são obrigatórios.
Descrição dos campos:
-
title(obrigatório): Título do post -
description(opcional): Descrição do post -
date(obrigatório)-
created: Data de criação do post, deve ser uma string"2024-02-29"no formato ISO 8601. Esse campo define a ordem das postagem em/bloge em/blog/category/name. -
updated(opcional): Data que o post foi atualizado. Mesmo formato decreated
-
-
thumbnail(opcional): Caminho para uma imagem. Se um caminho não for definido ou campo não estiver presente vamos colocar uma thumbnail padrão. -
categories(opcional): uma lista com as categorias.- As postagens com categoria estarão em
/blog/category/categoryName - Não está definido se um post pode ter mais de uma categoria
- As postagens com categoria estarão em
-
authors(opcional): Uma lista de autores. Cada autor tem o seguintes campos:-
name(obrigatório): Nome do autor -
role(opcional): Qual foi o papel dessa pessoa no post -
social(opcional): Uma URL para alguma rede social da pessoa (github, website, linkedin) -
avatar(opcional): URL para uma imagem
-
Exemplo: next/blog/como-a-disparidade-salarial-por-genero-e-raca-evoluiu-ao-longo-dos-anos.md
---
title: Como a disparidade salarial por gênero e raça evoluiu ao longo dos anos?
description: >-
Analisando a disparidade salarial por gênero e raça com dados do CAGED e o
datalake público da BD
date:
created: '2024-02-29T18:18:06.419Z'
thumbnail: /blog/como-a-disparidade-salarial-por-genero-e-raca-evoluiu-ao-longo-dos-anos/image_0.png
categories: [analise]
authors:
- name: Thais Filipi
role: Análise e texto
social: https://www.linkedin.com/in/thaismdr/
avatar: https://media.licdn.com/dms/image/v2/C4E03AQFstxqWabAyUA/profile-displayphoto-shrink_200_200/profile-displayphoto-shrink_200_200/0/1584489568236?e=2147483647&v=beta&t=mol7Kc8PgxgJatgvNYRkyffL8opuIgFgRdiY7vXB1HA
- name: Giovane Caruso
role: Edição de texto
social: https://www.linkedin.com/in/giovanecaruso/
- name: José Félix
role: Edição gráfica
social: https://www.linkedin.com/in/jos%C3%A9-f%C3%A9lix-517b05210/
---
Não é novidade que a desigualdade de gênero e raça reflete na empregabilidade e na remuneração dentro do mercado de trabalho no Brasil. Apesar da legislação que proíbe a disparidade salarial entre indivíduos desempenhando a mesma função, a realidade é que tais disparidades persistem. Recentemente, o Governo Federal tomou medidas para enfrentar esse desafio ao publicar uma portaria que regulamenta a Lei nº 14.611/2023. Essa lei cria mecanismos para equalizar salários entre homens e mulheres ocupando o mesmo cargo em empresas com pelo menos 100 funcionários.
<Blockquote caption="Natália Leão, Diretora de pesquisa e projetos na Gênero e Número.">
Atualmente estamos vivendo um momento importante de mudanças culturais no que se refere ao modo de pensar do brasileiro, aos seus aspectos morais e de valores. Com isso temos conquistado muitos avanços no que tange às desigualdades de gênero e raça, e devemos sempre nos perguntar se essas desigualdades são permanentes ou se tivemos mudanças ao longo dos anos.
</Blockquote>
Nesta artigo, exploramos um pouco mais a fundo esse cenário, observando a disparidade salarial entre quatro grupos: homens brancos, mulheres brancas, homens negros e mulheres negras (segundo critérios do IBGE, a categoria das pessoas negras incluem aquelas declaradas como pretas e pardas). Para isso, analisamos os dados do **Cadastro Geral de Empregados e Desempregados (CAGED)** e criamos recortes por esses grupos, estados e por diferentes atividades econômicas.
Antes de partir para análise, vale ressaltar que são muitos os conjuntos de dados que contém informações sobre remuneração e mercado de trabalho, como a **Relação Anual de Informações Sociais (RAIS)**, a **Pesquisa Nacional por Amostra de Domicílios Contínua (PNAD-C)**, o **Censo Demográfico** e outros. Optamos pelo CAGED principalmente por conta de sua periodicidade (mensal) e por se tratar de um registro administrativo obrigatório para todas empresas que contratam ou demitem funcionários com carteira assinada. Apesar de ser um conjunto muito rico para análises sobre o mercado de trabalho no Brasil, é importante lembrar que o CAGED não contempla informações de profissionais autônomos ou informais, categorias que representam uma parcela importante da população brasileira. Deixamos para você, databaser, explorar essas outras bases e enriquecer ainda mais esse importante debate. Todas elas já estão tratadas e disponíveis no datalake público da BD.
## Análise
### Disparidade salarial entre 2020 e 2023
Ao analisarmos o salário médio por grupos, ficou evidente a vantagem que homens brancos mantêm em relação aos demais. Em 2023, o salário médio dos homens brancos foi de R$2.087, 25,6% maior do que o salário médio das mulheres negras, que foi de R$1.662. Uma forma de visualizar as diferenças é ver o salário médio de homens negros, mulheres negras e brancas enquanto porcentagem do salário médio de homens brancos, como você pode conferir no gráfico abaixo.
<Image src="/blog/como-a-disparidade-salarial-por-genero-e-raca-evoluiu-ao-longo-dos-anos/image_0.png" caption="Salário médio por grupos como percentual de salário médio de homens brancos, de 2020 até 2023"/>
Imagens
As imagens estão em next/public/blog/<slug>/. Next.js pode servir arquivos estáticos.
No início coloquei as imagens no storage, no bucket basedosdados-website em blog. O principal problema é o processo de contribuição, seria mais difícil uma pessoa externa contribuir com postagens no blog, requer permissões para fazer upload ou ela teria que passar a imagem para alguma pessoa da BD e subir no bucket.
Manter as imagens aqui facilita porque é só adicionar os arquivos na branch e comitar, elimina a necessidade de uma pessoa da BD para lidar com esse processo.
Algumas desvantagens de manter as imagens no repo:
- Aumenta o tamanho do repositório (clonagem por exemplo)
- Como os arquivos são binários não existe diff (delta) legível entre dois commits.
- Mudar uma imagem faz o
gitsalvar uma nova cópia, porque as imagens são binários e não text-based files, isso aumenta o tamanho do repo.- Isso deve ocorrer raramente, porque não vamos alterar imagens, a menos que tenha um erro na imagem.
Imagens em svg
Proposta para adotar em novas postagens.
A maioria das imagens são gráficos, podemos salvar elas no formato svg que são text-based files.
Tem algumas vantagens:
- Elimina os problemas citado acima porque são text-based files
- Imagens
svgpodem aumentar de tamanho (resolução) sem perder a qualidade - Tem algumas integrações interessantes com o front-end para explorar
GitHub Action para transferir as imagens
Ideia para explorar
Tentar adicionar uma action para enviar as imagens no PR para o bucket basedosdados-website a partir de algum evento (review aprovada, label adicionada)
Processo de contribuição
Atualmente o processo de contribuição é staging -> development -> prod. Só obtemos uma preview das alterações quando mesclado em staging. staging faz um deploy para https://development.basedosdados.org/, é uma forma de tornar as alterações pública para pessoas visualizarem. Quem fez um PR não consegue ter uma visualização de suas alterações até que a mesclagem seja feita.
Proposta: Mesclar diretamente na main
Ao abrir um PR será feito um deploy com as alterações. A cada commit um deploy é feito.
Esse é um recursos da vercel, atualmente é grátis.
Acho que é um recurso importante para pessoas terem uma visualização das suas postagens, sem esperar para mesclar em staging.
PS: Qualquer PR feito de um fork ou um push de uma branch aciona o deploy.
TODO
Prioritário
- [x] Importar posts do medium
- [x] Adaptar imagens, códigos e metadados (data de publicação, autores, thumbnail)
- [x] Atualizar URLs em posts apontando para o medium
- [x] Atualizar URLs inválidas para datasets, ex
https://basedosdados.org/dataset/br-ibge-censo-agropecuario?bdm_table=municipio
- [x] Componentes
- [x] Image
- [x] Video
- [x] Embed (iframes)
- [x] Blockquote
- [x] Suportar markdown link na legenda de Image, Video, Embed e Blockquote
- [x] Copiar código para clipboard
- [x] Adicionar label da linguagem
- [x] Adicionar link para editar arquivo no GitHub
- [x] Adicionar rehype-slug
- [x] Tabelas
- [x] Habilitar deploy preview da Vercel
- Feito no meu fork.
- [x] TOC (Tabela de conteúdo) menu
- [x] Categorias
- Adicionei categorias para alguns posts, mas tem posts sem categoria
categories: [analise, tutorial] - Post por categoria estarão em
/blog/category/[categoryname] - Um post pode ter mais de uma categoria?
- Adicionei categorias para alguns posts, mas tem posts sem categoria
- [x] Botões para compartilhar o artigo (twitter, facebook, etc...)
- Facebook, Linkedin e um geral. Em dispositivos sem suporte da API
navigator.sharea URL é copiada para o clipboard, em dispositivos com suporte um menu integrado com o sistema é aberto
- Facebook, Linkedin e um geral. Em dispositivos sem suporte da API
- [x] Adicionar campos para data de criação e atualização do post
- [x] Onde hospedar as imagens?
- No Storage?
- Verifiquei com o Lessa e ele sugeriu o Storage.
- No Storage dificulta uma pouco o processo de contribuição
- No GitHub?
- Testar em
public/. O Next.js pode servir arquivos estáticos
- Testar em
- No Storage?
- [ ] Escrever um guia de contribuição para o blog
- Como será o processo para adicionar posts?
- [ ] Adicionar posts do medium que estão vinculados a conta pessoal que foram publicados em parceira com a Base dos Dados
- https://medium.com/basedosdados/analisando-a-frota-brasileira-com-a-bd-f073c0c15ef
- https://medium.com/basedosdados/o-soberano-m%C3%ADtico-processo-de-limpeza-dos-dados-do-siconfi-a730007e2852
- https://medium.com/basedosdados/qual-foi-a-magnitude-das-chuvas-extremas-que-atingiram-porto-alegre-este-ano-e-qual-a-rela%C3%A7%C3%A3o-675265bce50e
- https://medium.com/basedosdados/como-come%C3%A7ar-sua-an%C3%A1lise-com-dados-p%C3%BAblicos-6918e9b888af
- https://medium.com/basedosdados/an%C3%A1lise-da-atividade-econ%C3%B4mica-do-estado-do-rio-de-janeiro-e-da-influ%C3%AAncia-da-capital-95ed6b5910b5
- https://medium.com/basedosdados/analisando-dados-textuais-da-cpi-da-pandemia-com-a-bd-d178b344a6eb
- https://medium.com/basedosdados/qual-a-rela%C3%A7%C3%A3o-entre-o-idhm-e-a-vota%C3%A7%C3%A3o-presidencial-de-2018-em-sp-aa9f1305586f
- https://medium.com/basedosdados/perigo-no-mercado-de-trabalho-6b50c825bee1
- https://medium.com/basedosdados/relembrando-o-datathon-bd-2021-ee46fe00ccc0
- https://medium.com/basedosdados/analisando-dados-de-vacina%C3%A7%C3%A3o-contra-covid-19-com-a-bd-49fe3db8c7f4
- https://medium.com/basedosdados/como-acessar-dados-da-bd-no-power-bi-aeeea9a9bdc0
Baixa prioridade
Essas atividade podem ser feitas depois.
- [ ] Adicionar button para postagem no medium (campo
medium_slugnos metadados) - [ ] Botão
<- Voltar ao blog - [ ] Adicionar banner para doação, comunidade, etc...
- [ ] Adicionar um arquivo
yamlpara armazenar inforamções de alguns usuários no blog (image, social, url, etc...) - [ ] Tempo médio de leitura
- [ ] Posts relacionados
- [ ] Mecanismo de busca
- [ ] Botão para avaliar a postagem (clap, like)
- Talvez pensar em integrar com o backend e login no website
- [ ] Comentários
- Uma possibilidade: https://giscus.app/pt
- [ ] Componentes
Info,Warning
Equipe Design/Comunicação
- [ ] Thumbnail para pagina
/blog - [ ] Cor do texto
- Uma cor muito escura cansa os olhos, senti isso ao ler um artigo
- [ ] Qual deve ser o espaçamento entre os parágrafos
- [ ] Usar um tema claro para os blocos de código?
- Testei
lightfair, parece uma boa alternativa
- Testei
- [ ] Alguns posts do medium estavam como draft, vamos manter?
- [ ] Preencher metadados de alguns posts
- Autor
- Data
- Categoria