Convertidor Delimitadores

Convertir entre delimitadores de texto

arrow_forward
Texto origen
Texto convertido
Entendiendo Delimitadores de texto
TL;DR

La conversión de delimitadores transforma texto entre separadores: comas, tabulaciones, pipes, punto y coma, saltos de línea. El puente entre CSV, TSV y otros formatos.

¿Qué es un delimitador?

Un delimitador es un carácter (o secuencia de caracteres) usado para separar valores distintos dentro de una cadena de texto o archivo. Los delimitadores son la estructura invisible de los datos de texto estructurado: le indican a los analizadores dónde termina un valor y comienza el siguiente.

Los delimitadores más comunes son la coma (,), la tabulación (\t), el pipe (|), el punto y coma (;) y el salto de línea (\n). Cada uno tiene fortalezas y debilidades dependiendo de los datos que se separan y los sistemas que los consumen.

La conversión de delimitadores transforma texto de un separador a otro, por ejemplo, convertir valores separados por comas a valores separados por tabulaciones, o reemplazar pipes con saltos de línea. Esta es una operación simple pero esencial al mover datos entre sistemas que esperan diferentes formatos.

Delimitadores comunes

DelimitadorCarácterNombre del formatoMejor para
Coma,CSVIntercambio general de datos, hojas de cálculo
Tabulación\tTSVPegado en hojas de cálculo, datos con comas en valores
Pipe|PSVDatos que contienen comas y tabulaciones
Punto y coma;CSV (europeo)Configuraciones regionales europeas donde coma = decimal
Salto de línea\nUno por líneaListas, entradas de log, valores de configuración
Espacio(space)Separado por espaciosListas simples de palabras, argumentos de comandos

¿Por qué tantos?

La proliferación de delimitadores existe porque ningún carácter único es universalmente seguro. Las comas aparecen en direcciones (“Nueva York, NY”), nombres (“Smith, John”) y números en configuraciones regionales europeas (“1.234,56”). Las tabulaciones son invisibles y pueden confundirse con espacios. Los pipes son raros en texto natural, lo que los hace más seguros para datos, pero menos legibles para humanos.

La elección del delimitador depende del contenido de sus datos y del sistema de destino. En caso de duda, las tabulaciones suelen ser la opción más segura porque raramente aparecen en texto natural.

La trampa del CSV en Francia

Uno de los dolores de cabeza más comunes en el intercambio de datos involucra el comportamiento del CSV dependiente de la configuración regional:

  • En EE. UU. y el Reino Unido, el separador decimal es un punto: 3.14
  • En Francia, Alemania y la mayor parte de Europa, el separador decimal es una coma: 3,14

Dado que CSV usa la coma como separador de campos, esto crea un conflicto. Las versiones europeas de Excel lo resuelven usando el punto y coma como delimitador CSV. Un archivo CSV perfectamente válido de EE. UU. aparecerá como una sola columna en Excel en francés porque Excel interpreta las comas como separadores decimales, no como separadores de campos.

Lo inverso también es cierto: un archivo separado por punto y coma de un sistema europeo se cargará incorrectamente en Excel de EE. UU.

Soluciones:

  • Especificación explícita: Use la línea de encabezado sep=, o sep=; que Excel reconoce
  • TSV en su lugar: Los archivos separados por tabulaciones evitan la ambigüedad coma/punto y coma por completo
  • Asistente de importación: Use el asistente de importación de datos de Excel para especificar manualmente el delimitador en lugar de hacer doble clic en el archivo

Escape y entrecomillado

Cuando un valor contiene el carácter delimitador en sí mismo, necesita una estrategia de escape:

Entrecomillado: Envuelva el valor completo en comillas dobles. El delimitador dentro de las comillas se trata como texto literal, no como separador:

"Smith, John",42,"New York, NY"

Doble entrecomillado: Si un valor entre comillas contiene una comilla doble, se escapa duplicándola:

"He said ""hello""",42

Escape con barra invertida: Algunos formatos usan \, para representar una coma literal. Esto es menos común que el entrecomillado pero se usa en algunos formatos de archivos de configuración.

El estándar RFC 4180 para CSV especifica el entrecomillado como el mecanismo de escape estándar. Los valores que contienen comas, comillas dobles o saltos de línea deben estar encerrados entre comillas dobles.

Casos de uso comunes

  • Intercambio de datos en hojas de cálculo: Convertir entre formatos CSV y TSV para compatibilidad con diferentes aplicaciones de hojas de cálculo y configuraciones regionales
  • Importación/exportación de base de datos: Transformar datos delimitados para que coincidan con el formato esperado por las herramientas de importación de base de datos (COPY, LOAD DATA INFILE)
  • Procesamiento de logs: Convertir campos de log separados por espacios o pipes a formato separado por comas para importación en herramientas de análisis
  • Formato de respuestas API: Convertir salida de API (frecuentemente arrays JSON) en texto delimitado para consumo por scripts y hojas de cálculo
  • Operaciones de portapapeles: Convertir listas separadas por saltos de línea a formato separado por comas para uso en cláusulas SQL IN, campos de correo electrónico o argumentos de funciones

Prueba estos ejemplos

Conversión de coma a tabulación Válido

Cada coma se reemplaza por un carácter de tabulación. El resultado es formato TSV (valores separados por tabulaciones), que se puede pegar directamente en Excel o Google Sheets con cada valor en una columna separada.

Alice,Bob,Charlie,Diana
Texto con comas incrustadas Válido

Cuando los valores contienen el carácter delimitador, deben estar entre comillas. Convertir a tabulaciones elimina la ambigüedad: las comas dentro de valores entre comillas se preservan como caracteres literales, no se tratan como separadores.

"Smith, John",42,"New York, NY"