Corregir un texto (I): las expresiones regulares

Si recuerdan, hace unos días estuvimos viendo las reglas básicas de las acotaciones en los diálogos, cuyo conocimiento es imprescindible (pero no suficiente, claro está) para que alguien enfrente nuestro texto con seriedad. Les comentaba que aunque algunas de las reglas eran sencillas de buscar con Word, otras no lo eran tanto. Ahí es donde entran las expresiones regulares, que a lo largo de esta serie de entradas verán que son de gran ayuda para detectar esos errores que dejan el texto en evidencia.

Una expresión regular es, según la Wikipedia, una secuencia de caracteres que forma un patrón de búsqueda. No sé si eso les dice algo, pero lo entenderán enseguida. Pero primero vamos a organizar un poco la mesa de trabajo. 

Ingredientes

  1. Aunque no es necesario que sean unos maestros de la informática, sí que es necesario que tengan un mínimo de soltura. Y es un mínimo muy bajo.

  2. Necesitaremos el texto a corregir, en versión borrador final. Esto es importante porque lo que vamos a hacer es buscar los errores que no hemos detectado tras muchas lecturas, esos que no aparecen aunque lo leas mil veces. Una vez encontrados, los corregiremos manualmente en el borrador. Si nos ponemos a buscar errores en un primer borrador, saldrán tantos que no será útil.

  3. Necesitamos que el texto no esté en un PDF, sino en Word, txt, rtf, html, lo que quieran, pero no PDF. Enseguida verán por qué.

  4. Por último, necesitamos un editor que soporte las expresiones regulares. Aunque Word sí tiene la opción de utilizar caracteres comodín, lo hace un poco por libre y creo que limita algunas de las búsquedas. En mi caso, utilizo Notepad++, aunque otros como Sublime Text o EditPadPro también lo hacen. Escojan el que escojan, lo descargan y lo instalan.

Preparando el editor

Vamos allá.

Lo primero es abrir nuestro borrador, copiar el texto y pegarlo en el editor que vayamos a utilizar. Al hacerlo, vamos a perder cualquier estilo que hayamos aplicado, como la cursiva, que es la razón de que no podamos corregir sobre el texto. Por tanto, lo que vamos a hacer es buscar errores y luego iremos al borrador a corregirlos.

También necesitamos que el texto que copiamos esté en un formato editable, si no sucede lo siguiente:

El problema es que al copiar el texto en PDF, se copia exactamente igual que aparece en pantalla, por lo que las palabras que están divididas en guiones, se quedan divididas y por tanto, si buscamos una palabra que está dividida en dos líneas por un guion, no la encontraremos.

Lo siguiente es activar el ajuste de línea. ¿Por qué? Porque un párrafo de texto es en realidad una misma línea que continúa hasta que hay un salto de línea, aunque los editores como el Word lo presenten como varias líneas. Debajo, un ejemplo:

Bien, está claro. Activamos el ajuste de línea yendo al menú "Vista" y marcando la opción "Ajuste de línea". No tiene mucho secreto, pero por si acaso, una imagen:

Ajuste de línea.JPG

A partir de aquí estamos listos. Ahora vamos al menú "Buscar", y pinchamos en la primera opción, "Buscar" (también vale CTRL+F). En esa ventana vamos a ir a la pestaña "Mark", y marcamos lo que se muestra en la imagen: 

  • Coincidir MAYÚSCULAS/minúsculas.

  • Buscar en todo el documento.

  • Expresión regular.

La diferencia entre "Buscar" y "Mark" es que con "Mark" nos coloreará las coincidencias que haya encontrado, y una vez comprobado que hemos buscado lo que queríamos, podremos ir a "Buscar" e ir una por una.

pantalla2.png

Las expresiones regulares

Aunque las imágenes parezca que hemos hecho mucho, en realidad todo lo anterior es bastante rápido y solo es necesario hacerlo una única vez. Ahora es cuando viene lo interesante. 

Podemos decir que una expresión regular es una cadena de "comodines" que el editor utiliza para buscar patrones. Aunque más adelante veremos más, por hoy nos vamos a conformar con unos pocos:

  • [A-Z] coincide con cualquier letra mayúscula... menos las nuestras, que habrá que añadir, y por tanto quedará [A-ZÁÉÍÓÚÑ]. No obstante, si buscamos un conjunto de letras, serán solo esas las que incluyamos dentro de los corchetes.

  • En el caso de las minúsculas, lo mismo: [a-záéíóúñ].

  • Los números los encontramos con [0-9], aunque podemos especificar los que buscamos.

  • El carácter especial ^ representa el comienzo de una línea.

  • El carácter especial $ representa el final de una línea.

  • El carácter especial * representa 0 o más instancias del carácter anterior. Por ejemplo, si ponemos en la caja de búsqueda la expresión regular Ju*an, buscará Jan, Juan, Juuan, Juuuan, etc.

  • El carácter \s representa un espacio, aunque también podemos poner un espacio :)

Si queremos buscar alguno de los caracteres especiales, lo único que tenemos que hacer es añadirles una barra invertida delante: \^ o \$.

Según lo que hemos visto, por ejemplo, la expresión [A-ZÁÉÍÓÚÑ][a-záéíóúñ]$ buscará todas aquellas líneas que acaban con una mayúscula seguida de una minúscula.

Del mismo modo, la expresión ^[0-9][abc][45][ABC] buscará todas aquellas líneas que comienzan por un dígito, seguido de 'a', 'b' o 'c', seguida de '4' o '5' y por último seguida de 'A', 'B' o 'C'. Por ejemplo, encontrará una línea que comienza con la cadena "2a5A". No obstante, no la encontrará si no está al principio de la línea ni si es por ejemplo "2ab5A", porque entre los dos dígitos solo puede haber una letra.

Eso no nos ayuda mucho, pero vamos a buscar un par de ejemplos un poco más reales. 

Ejemplo 1

En este primer ejemplo, vamos a buscar todas las líneas (o párrafos, si lo quieren ver así) de nuestro texto que no empiezan con mayúscula. La expresión regular es sencilla: ^[a-záéíóúñ].

Líneas que no comienzan en mayúscula

Como vemos, nos colorea en rojo los "matches" o coincidencias, y nos indica cuántas ha encontrado. Si el texto fuese mayor, iríamos a la pestaña "Buscar" e iríamos una por una.

Ejemplo 2

El segundo ejemplo es igualmente sencillo. Vamos a buscar aquellas palabras que tras una coma, comienzan por mayúscula, con independencia de que tras la coma haya o no un espacio (eso lo veremos más adelante). La expresión sería: ,\s*[A-ZÁÉÍÓÚÑ].

Es decir, una coma, seguida de 0 o más espacios, y una letra mayúscula.

Mayúscula tras una coma, con independencia del número de espacios que haya tras la coma.

Mayúscula tras una coma, con independencia del número de espacios que haya tras la coma.

Como vemos, nos colorea todas aquellas coincidencias donde hay una coma, cero o más espacios, y una mayúscula.

En la siguiente entrada veremos otros "comodines" y empezaremos a buscar cosas un poco más serias. Permanezcan a la escucha y si tienen dudas o quieren proponer ideas, háganlo en los comentarios.

Consejos de escritura (I)

Aunque hace tan solo una semana que acabé Yunque, en el camino he aprendido varias cosas que pueden ser de utilidad a aquellas personas que estén en proceso de escribir un libro. Esta será la primera de varias entregas, sin orden ni concierto, que publicaré a medida que se me vayan ocurriendo cosas. Empezamos.

1. Termina el primer borrador.

Hay pocas cosas más importantes que esta. En realidad, si es tu primera novela, no hay ninguna. Si no terminas el borrador, el resto da igual. Desgraciadamente, acabarlo no es suficiente. Y vamos al siguiente punto.

2. El primer borrador no vale nada.

A no ser que seas un prodigio de la literatura (y ni por esas), incluso en el caso de que la trama esté perfilada a las mil maravillas, los personajes sean redondos, y todo sea fantástico y chachipiruli, el texto contendrá algún error ortográfico o gramatical, una palabra repetida, una oración sin frase al final, una mayúscula que no toca, una acotación mal puesta. Y lo más probable es que ese "algún" sea en realidad "muchos". Eso nos lleva al tercer punto.

3. Revisa, revisa y revisa.

Otra de esas reglas universales que aparecerán en cualquier lista de este tipo. Lo decía antes: no importa cómo de bien creas que está el primer borrador, te garantizo que será mejorable. Hay al menos tres revisiones finales que yo considero imprescindibles (soy partidario de revisar un aspecto cada vez):

  • Densidad de las palabras. Te sorprenderías de la cantidad de veces que repites una palabra en una misma frase o en la frase siguiente y al leerla no ves esa repetición aunque la busques. Para detectarlos, Javier Peñas ha elaborado una herramienta/procedimiento extremadamente útil. Extremadamente. En serio, no exagero. Una vez tienes la lista de repeticiones, utiliza el diccionario de sinónimos, está ahí para algo. Pero... tampoco te obsesiones con ello. La repetición de palabras en un diálogo es necesaria (aparte de Juan Manuel de Prada, nadie habla como si fuese el diccionario de la RAE), y muchas veces en el texto encontrarás que si cambias una palabra por otra, el significado cambia. También hay repeticiones que se utilizan para reforzar una idea. Y evita tener que recurrir al castellano antiguo, seguro que hay una forma mejor de expresar lo mismo (cambiar la frase es una opción, también).

  • Acotaciones en diálogos. Esto es importante. Aprende cuándo se pone un punto, cuándo la palabra de la acotación comienza en mayúsculas, cuando una frase acaba con un punto y cuando con una raya... Los recursos en Internet, tanto de pago como gratuitos, son muchos. Ten siempre a mano una chuleta y revisa a fondo que esté todo correcto.

  • Ortografía. Asumiendo que sabes distinguir el "Haber" del "A ver", porque si no el camino que tienes es mucho más largo, comprueba los acentos diacríticos, el uso de las mayúsculas en las oraciones interrogativas, el "deber / deber de", el "que / qué", "donde / dónde", "como / cómo", etc., los laísmos / leísmos / loísmos, si / sí, mi / mí, la concordancia de género y número, dequeísmo / queísmo, etc. Son detalles que aunque conozcas es fácil que se te escapen al escribir. Puedes utilizar el corrector de Microsoft, que te ayudará con las faltas más graves y te señalará palabras a las que les falta una letra, mayúsculas en mitad de una frase debido a haberla reestructurado, palabras repetidas, etc. No obstante, especialmente en la corrección gramatical, no te fíes de él y revisa una por una.

Pero no son las únicas. Hay otras cosas a las que hay que prestar atención, que pueden formar parte de una de las revisiones anteriores o de alguna adicional:

  • Coletillas y palabras demasiado habituales. Esto se deriva en parte de lo que decía de la densidad de las palabras. Si utilizas bastantes metáforas, el "como" se repetirá a menudo en el texto. También el "pero"; es casi imposible huir de él, aunque para empezar tienes el "aunque", "no obstante", "sin embargo". Busca alternativas o cambia el enfoque de la oración. 

  • Cárgate los determinantes posesivos (cuando proceda, claro). Esta es una regla que leí en algún sitio que francamente, no recuerdo. Si el narrador es en tercera persona, serán los "su" y "sus". Si es en primera persona, será el "mi" y "mis". A menudo podrás sustituirlos por un artículo. Dicho de otra forma, si la escena está centrada en Juan y este saca la mano del bolsillo, sabemos que es su mano, no hace falta decírselo al lector. Es decir: "Juan sacó la mano del bolsillo", no "Juan sacó su mano del bolsillo". 

  • Los adverbios-mente. Otra de esas reglas universales. No hace falta que te los cargues todos, pero limita estos adverbios. Revisa el texto buscándolos y cuando sea posible, elimínalos o sustitúyelos por alternativas. No te obsesiones. Utilizar alguno de vez en cuando no es ningún pecado.

  • Los determinantes y pronombres demostrativos (este/a, ese/a, aquel/la). Esto es habitual que pase si como yo, has cambiado de forma verbal algún capítulo. Si estás en presente, es "este", si estás en pretérito, es "aquel". Esta es una regla que tiene muchos matices (por ejemplo, si se utilizan para denotar distancia espacial y no temporal, la regla no aplica), pero es algo a revisar. Por cierto, la RAE recomienda no acentuar los pronombres demostrativos, al igual que en el caso de "solo". No te compliques la vida solo por nostalgia y cárgate esas tildes. Seguro que tienes muchas otras de las que preocuparte. 

  • Los adjetivos. Sin ser yo nadie para ir dando lecciones, otra de las cosas que más ensucia un texto es el abuso de adjetivos. Si puedes utilizar uno en lugar de dos, eso que te ahorras.

Pero en fin, por mucho que revises, siempre llegas al cuarto punto.

4. Nunca vas a terminar el manuscrito.

Habrás oído eso de que las obras no se terminan, se abandonan. Es totalmente cierto. Me atrevo a decir que he revisado todas y cada una de las frases del libro unas cinco veces, en el mejor de los casos, y diez o más en las partes más complejas. Aún así, una vez acabado me doy cuenta de detalles que podría haber añadido, subtramas que quizá son demasiado débiles o frases que podría alargar o reducir. Podría seguir revisándolo el resto de mi vida y siempre encontraría cosas que cambiar, porque lo que un día te parece una frase muy larga, al día siguiente te parece que son dos frases que podrías unir.  

El objetivo debe ser un texto libre de errores ortográficos, tipográficos y gramaticales; una historia sin errores de coherencia y personajes todo lo redondos que seas capaz de conseguir. Si has conseguido eso, va siendo hora de pasar al siguiente nivel. Y sin olvidar que cuanto más revises, más probable es que introduzcas errores ortográficos, gramaticales, erratas, repeticiones de palabras, etc.

Y eso es todo por ahora. En la siguiente entrega más consejos.