paquete-apertura-datos icon indicating copy to clipboard operation
paquete-apertura-datos copied to clipboard

Fragmentación de archivos según códigos cartográficos de INDEC en lugar de nombres?

Open abenassi opened this issue 7 years ago • 1 comments

Actualmente los ejemplos que ponemos para nomenclatura de archivos para el caso de datos que se dividen en varias distribuciones separando por provincia (por ejemplo) promueven la creación de archivos nombrados sin ningún estándar:

acceso-informacion-publica-caba.csv
acceso-informacion-publica-jujuy-20130208.csv

Esto puede tener los siguientes problemas:

  • Los nombres de los archivos podrían cambiar, si los criterios del área para estos "nombres cortos" de provincias cambian. No tendríamos una URI muy estable de esta forma.
  • Las distribuciones divididas por provincia no se nombrarían homogéneamente entre distintos datasets, catálogos u organismos del estado (algunos van a poner caba y otros ciudad-de-buenos-aires, buenos-aires o ciudad-autonoma-buenos-aires)
  • Es más difícil programar una rutina desatendida sobre un nombre desestandarizado que puede tener varias palabras (ciudad-autonoma-buenos-aires) que sobre alguna convención que tenga una sola palabra (ej.: si usáramos los códigos de INDEC de provincias tendríamos acceso-informacion-publica-02.csv, acceso-informacion-publica-06.csv, acceso-informacion-publica-94.csv, etc)

Posibles soluciones:

  • Recomendar la adopción de los códigos de la cartografía censal de INDEC para estos casos (similar al tratamiento de una entidad interoperable )
acceso-informacion-publica-02.csv
acceso-informacion-publica-06.csv
acceso-informacion-publica-94.csv
  • Definir "nombres cortos" para provincias (y tal vez departamentos?) que se recomienden siempre para nombrar archivos.
acceso-informacion-publica-caba.csv
acceso-informacion-publica-pba.csv
acceso-informacion-publica-tierrafuego.csv  # difícil este caso...

abenassi avatar May 30 '17 17:05 abenassi

@abenassi coincido con la problemática. Pensando en tu propuesta entiendo que la solución más adecuada es la "1", ejemplo: acceso-informacion-publica-02.csv. Ahora bien, podemos pensar alguna forma de que "02" sea inequivocamente una entidad interoperable geográfica? Ejemplo: acceso-informacion-publica-geo02.csv

fpetrone avatar May 30 '17 17:05 fpetrone