subvenciones
subvenciones copied to clipboard
Encabezados de los archivos
Buenas, abro issue para hacer seguimiento de los encabezados de los archivos (relacionado con #5). Según lo que se ha compartido en Discord parece ser que se pueden definir como:
Encabezados del fichero convocatorias.csv
nombres_columnas = [
"IDConv", #0
"id", #1
"mrr", #2
"convocanteN1", #3
"convocanteN2", #4
"convocanteN3", #5
"fechareg", #6
"titulo", #7
"bbreguladoras", #8 - nombre tomado de los ficheros de jurídicas
"tituloleng", #9
"verConcesiones", #10 - valores nulos
"dummy1", #11 - valor 350078 fijo
"dummy2" #12 - valor igual a IDConv +1
]
etiquetas_columnas = [
"IDConv",
"Código BDNS",
"MRR",
"Administración",
"Departamento",
"Órgano",
"Fecha de registro",
"Título de la convocatoria",
"URL de las BBRR",
"Título cooficial",
"Ver concesiones",
"dummy1",
"dummy2",
]
# Eliminamos los tres últimos elementos de la lista de nombres_columnas
# Son columnas vacias o con datos que no aportan nada
columnas_utiles = nombres_columnas[: -3]
Encabezados de los ficheros jurídicas_1.csv y juridicas_2.csv
nombres_columnas = [
"ID", #0
"IDConv", #1
"convocanteN1", #2
"convocanteN2", #3
"convocanteN3", #4
"convocatoria", #5
"bbreguladoras", #6
"programa", #7
"fechaconc", #8
"beneficiario", #9
"importe", #10
"instrumento", #11
"ayudaequiv", #12
"detalles", #13
"proyecto", #14
"sancion", #15
"numcov" #16
]
etiquetas_columnas = [
"ID",
"IDConvocatoria",
"Administración",
"Departamento",
"Órgano",
"Convocatoria",
"URL de las BBRR",
"Aplicación presupuestaria",
"Fecha de concesión",
"Beneficiario",
"Importe",
"Instrumento",
"Ayuda Equivalente",
"Detalles",
"proyecto",
"sancion",
"numcov"
]
Comentábamos en Discord, que sería interesante unificar la forma en la que nos referimos a las columnas. La página de la BDNS ofrece para cada campo un nombre y una etiqueta descriptiva.
Ejemplo: convocanteN1 tiene como etiqueta descriptiva "Administración". convocanteN2 tiene como etiqueta "Departamento".
Estaría bien ponernos de acuerdo respecto a si usamos los nombres de columnas o sus etiquetas descriptivas. Por mi parte, me convence más usar los nombres para no andar con espacios, acentos, etc.