paquete-apertura-datos
paquete-apertura-datos copied to clipboard
Fragmentación de archivos según códigos cartográficos de INDEC en lugar de nombres?
Actualmente los ejemplos que ponemos para nomenclatura de archivos para el caso de datos que se dividen en varias distribuciones separando por provincia (por ejemplo) promueven la creación de archivos nombrados sin ningún estándar:
acceso-informacion-publica-caba.csv
acceso-informacion-publica-jujuy-20130208.csv
Esto puede tener los siguientes problemas:
- Los nombres de los archivos podrían cambiar, si los criterios del área para estos "nombres cortos" de provincias cambian. No tendríamos una URI muy estable de esta forma.
- Las distribuciones divididas por provincia no se nombrarían homogéneamente entre distintos datasets, catálogos u organismos del estado (algunos van a poner caba y otros ciudad-de-buenos-aires, buenos-aires o ciudad-autonoma-buenos-aires)
- Es más difícil programar una rutina desatendida sobre un nombre desestandarizado que puede tener varias palabras (ciudad-autonoma-buenos-aires) que sobre alguna convención que tenga una sola palabra (ej.: si usáramos los códigos de INDEC de provincias tendríamos
acceso-informacion-publica-02.csv
,acceso-informacion-publica-06.csv
,acceso-informacion-publica-94.csv
, etc)
Posibles soluciones:
- Recomendar la adopción de los códigos de la cartografía censal de INDEC para estos casos (similar al tratamiento de una entidad interoperable )
acceso-informacion-publica-02.csv
acceso-informacion-publica-06.csv
acceso-informacion-publica-94.csv
- Definir "nombres cortos" para provincias (y tal vez departamentos?) que se recomienden siempre para nombrar archivos.
acceso-informacion-publica-caba.csv
acceso-informacion-publica-pba.csv
acceso-informacion-publica-tierrafuego.csv # difícil este caso...
@abenassi coincido con la problemática. Pensando en tu propuesta entiendo que la solución más adecuada es la "1", ejemplo: acceso-informacion-publica-02.csv. Ahora bien, podemos pensar alguna forma de que "02" sea inequivocamente una entidad interoperable geográfica? Ejemplo: acceso-informacion-publica-geo02.csv