Transformación de ficheros a CSV (con Open Office)


No hace mucho me he encontrado en la tesitura de tener que cargar un fichero CSV en Ckan ( la plataforma de datos abiertos) y pasé un pequeño apuro ya que hay que ser un poco cuidadoso con los formatos. Os comento los requisitos que tuve que cumplir y como lo resolví.
Los ficheros CSV (del inglés comma-separated values) son un tipo de fichero en formato abierto sencillo que sirve para representar datos en forma de tabla, en ellos las columnas se separan por comas (o punto y coma en donde la coma es el separador decimal: España, Francia, Italia…) y las filas por saltos de línea. Los campos que contengan una coma, un salto de línea o una comilla doble deben ser encerrados entre comillas dobles. Si usamos interpretes de formatos como es mi caso nos encontraremos ademas que las columnas con valores entrecomillados se considerarán caracteres y los que no estén entrecomillados se considerarán numéricos.
Los requisitos que tenía que cumplir son:
  • El separador debía ser la coma (,)
  • El separador de decimales debía ser el punto (.)
  • La cadenas de caracteres debían ir entre comillas (“), aunque después vi que no era tan importante.
  • La codificación debía ser UTF-8

Como regla general ademas había que tener cuidado con que las columnas numéricas no estuviesen vacías, ya que se interpretan con ceros, y que las comas (,) estuviesen entre comillas (“) para que no se interpretasen como un salto de columna y se destrozase el formato.
La solución Open Office. Es una buena herramienta de transformación de formatos para tablas, no tiene el problema de excell de estar muy ligado a la configuración de Windows y es multiplataforma.
¿Como lo hice?

  • Descargar Open Office portable (no requiere instalación)
  • Instalar en un directorio a nuestra elección (yo en Temp) 
  • Cargamos el fichero a exportar a CSV 
  • Cambiamos el carácter decimal de (,) a (.): Primero seleccionamos el formato con el botón derecho  y después modificamos el formato para que el separador sea un (.) seleccionando el idioma Español (México) como idioma del formato. También se puede hacer en la configuración general 

  • Exportamos como CSV teniendo en cuenta: Separador: (,), El texto irá entre comillas: (“) , Codificación: UTF-8 

  • Comprobamos el fichero con otro editor de texto (pj. Notepad ++)
Compartir
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *