MÉTODOS PARA CONSTRUIR GLOSARIOS PARA SER USADOS EN BABYLON Y PROGRAMAS DE TRADUCCIÓN POR COMPUTADORA.

translation_articles_icon

ProZ.com Translation Article Knowledgebase

Articles about translation and interpreting
Article Categories
Search Articles


Advanced Search
About the Articles Knowledgebase
ProZ.com has created this section with the goals of:

Further enabling knowledge sharing among professionals
Providing resources for the education of clients and translators
Offering an additional channel for promotion of ProZ.com members (as authors)

We invite your participation and feedback concerning this new resource.

More info and discussion >

Article Options
Your Favorite Articles
Recommended Articles
  1. ProZ.com overview and action plan (#1 of 8): Sourcing (ie. jobs / directory)
  2. Getting the most out of ProZ.com: A guide for translators and interpreters
  3. Réalité de la traduction automatique en 2014
  4. Does Juliet's Rose, by Any Other Name, Smell as Sweet?
  5. The difference between editing and proofreading
No recommended articles found.

 »  Articles Overview  »  Art of Translation and Interpreting  »  Translation Techniques  »  MÉTODOS PARA CONSTRUIR GLOSARIOS PARA SER USADOS EN BABYLON Y PROGRAMAS DE TRADUCCIÓN POR COMPUTADORA.

MÉTODOS PARA CONSTRUIR GLOSARIOS PARA SER USADOS EN BABYLON Y PROGRAMAS DE TRADUCCIÓN POR COMPUTADORA.

By traductorchile | Published  07/23/2009 | Translation Techniques | Recommendation:RateSecARateSecARateSecARateSecARateSecI
Contact the author
Quicklink: http://www.proz.com/doc/2515
Author:
traductorchile
Chile
English to Spanish translator
 
View all articles by traductorchile

See this author's ProZ.com profile
MÉTODOS PARA CONSTRUIR GLOSARIOS PARA SER USADOS EN PROGRAMAS DE ADMINISTRACION DE GLOSARIOS Y DE TRADUCCIÓN POR COMPUTADORA.

Si Ud. encuentra en Internet un glosario con esta estructura:

Hello Hola
Rabbit Conejo
Truck Camión

Le será muy fácil copiarlo en Excel (copia y pega) para obtener una planilla en dos columnas donde cada término en un idioma corresponde al término en el otro idioma. Esta planilla Ud. puede subirla a Babylon usando el Babylon Builder y tendrá un glosario bilingüe para su uso personal de acceso inmediato (con un click como dice la propaganda de Babylon). También podrá guardarlo como un archivo de texto separado por tabuladores para usarlo como Glosario de algún programa de traducción por computadora (CAT tool).

Pero qué pasa cuando el glosario de internet que Ud. ha encontrado ha sido diseñado con un estilo poco amigable para la estructura de Excel. En esos casos Ud. tiene que realizar un trabajo de edición que puede ser desde fácil hasta extremadamente lento y cansador. Aquí les entregaré algunos atajos para facilitar el trabajo de edición de glosarios electrónicos para ser usados con Excel, archivos de texto y Babylon.

Cuando navegamos por internet nos podemos encontrar con numerosos glosarios, algunos muy buenos, y otros, aunque no tan buenos, nos pueden aportar ideas para dirigir nuestra investigación en determinada dirección. Estos glosarios han sido creados con múltiples fines, entre los cuales, generalmente, no está incluido facilitarles las cosas a los traductores, e incluso, algunos han sido creados para impedir su copia o extracción. Pero la tecnología está a nuestro favor, e incluso estos últimos (PDFs con texto no extraíble) pueden ser extraídos y editados con un OCR.

¿Pero qué hacer luego, una vez que tenemos nuestro archivo Word con el texto copiado de una página Web o de un PDF u otro tipo de archivo bajado de internet? Lo primero es tener claro que nuestro objetivo es crear un archivo formado por 2 o más columnas separadas por tabuladores y en cada columna deberán ir los distintos parámetros para cada término de nuestro glosario, por ejemplo:

Inglés Español Definición ENG Definición SPA etc.
Dog Perro Domestic mammal of the Canis lupus family Mamífero de la especie Canis lupus, usado generalmente como mascota Referencias, etc.

Por lo tanto debemos editar el texto que hemos obtenido para construir uno con la siguiente estructura:

Dog TAB Perro TAB Domestic mammal of the Canis lupus family TAB Mamífero de la especie Canis lupus, usado generalmente como mascota TAB Referencia, etc.

Si el texto en cuestión viene con el siguiente diseño, se nos complica un poco la cosa:

Dog
Perro
Domestic mammal of the Canis lupus family
Mamífero de la especie Canis lupus, usado generalmente como mascota
Referencias

Si pegamos esto en Excel obtenemos una lista de palabras que no tiene vínculo alguno entre ellas y por lo tanto no se pueden usar en Babylon o en glosarios de archivo de texto. Esto nos obligaría a arrastrar cada palabra vinculada (p.ej. Perro) con un backspace para ponerlo en la misma línea que la palabra de origen (p.ej. Dog) y poner un TAB entre ellos. Eso implica que en cada conjunto de palabras vínculadas (Dog-Perro) tenemos que hacer 2 acciones en el teclado (Backspace y TAB). Cuando un glosario está formado por cientos o miles de palabras la pega se pone pesada y puede demorarse semanas. Aparte del aburrimiento.
Pero hay un camino más fácil:

Seleccionamos INICIO en la barra de herramientas y REEMPLAZAR. La herramienta REEMPLAZAR nos presenta dos espacios: BUSCAR para poner el término que queremos borrar y REEMPLAZAR CON para poner el nuevo término que queremos incorporar. En este caso vamos a aprovechar esta herramienta para reemplazar un “salto de línea” por un “TAB”. Haga un click en el botón “Más >>” ubicado a la izquierda abajo. Esto hace que se expanda la herramienta reemplazar con otras opciones. Haga click con el ratón en el espacio BUSCAR, como si fuera a escribir algo, luego haga click en el botón “Especial” ubicado abajo a la izquierda. Con esto se abre una ventana con una serie de marcas de formato como, por ejemplo, el salto de línea que estamos buscando. En este caso corresponde al denominado “Marca de Párrafo”. Selecciónelo. Luego haga click con el ratón en el espacio REEMPLAZAR CON, como si fuera a escribir algo, haga click en el botón “Especial” y seleccione la marca “Marca de Tabulación”. Luego presione el botón “Reemplazar todos” y verá como todo el texto se transforma desde un listado inconexo a grupos de palabras vinculadas con un TAB. (Ver más abajo (Ejemplo 6) cómo separar los conjuntos de términos)

Este mismo procedimiento se puede realizar en una serie de casos donde una característica (Marca) de formato o un símbolo separa el término de origen del término en el otro idioma y de los otros parámetros de nuestro glosario. La idea es que todo lo que “sobra” entre un término y otro se puede reemplazar por un TAB. La mayoría de los símbolos usados para separar términos en distintos idiomas de un glosario se pueden escribir con el teclado y otros se pueden copiar y pegar. Por ejemplo, : ……… “ = - / . ( — » → etc. En realidad ni siquiera es necesario copiar y pegar, basta con resaltar el símbolo con el ratón, y al abrir la herramienta REEMPLAZAR aparece el símbolo en el espacio de BUSCAR. Otros, como � (un signo de interrogación dentro de un diamante: símbolo que reemplaza las palabras latinas como “ñ” y acentos) no se pueden copiar y pegar con Word. La única opción que he descubierto con estos símbolos es copiar los textos en Excel una vez que el glosario esté tabulado, reemplazar el símbolo (que Excel sí reconoce) con un espacio, volver a copiar en Word y editar con el corrector ortográfico palabra por palabra (si uno no quiere que el glosario esté lleno de signos �).

Esta es la base del sistema de creación de glosarios, pero sólo la base.
Para hacer cualquier edición de textos con estos atajos, hay que prepararse de antemano para lo peor: introducir, sin querer, más complicaciones a un texto de las que tiene. Esto implica, antes de hacer reemplazos, estudiar el diseño del glosario:
1) ¿Qué elementos podemos usar para introducir TABs?

2) ¿Qué elementos debemos eliminar junto con la colocación de TABs para que no queden antes de una palabra (como los espacios: una palabra que se inicia después de un espacio en una columna no es reconocida por Excel por su primera letra, sino por el espacio, incidiendo posteriormente en la ordenación alfabética; editar estos espacios 1 por 1 es muy tedioso)

Ejemplo: Dog. Perro
Después del punto hay un espacio: hay que reemplazar el punto y el espacio por un TAB, no sólo el punto.

3) ¿Cuáles elementos, que podemos usar para introducir TABs entre términos, aparecen en el resto de los textos y podrían poner TABs donde no queremos?

Ejemplo 1: Doggy: see: Dog
Si usamos : (dos puntos espacio) para poner TABs , vamos a separar “see” de Dog lo que podría no ser conveniente. En este caso, “see:” es un texto que se puede repetir muchas veces a lo largo del glosario y es breve. Primero se reemplaza “see:” por un símbolo comodín (por ej: *), para que, una vez introducidos los TABs, volver a reemplazar de vuelta el comodín (*) por su término “see:” , quedando así: Doggy TAB see: Dog

Ejemplo 2: paréntesis
Babylon es un programa muy específico en sus búsquedas. Si Ud. tiene un glosario con el término “Dog (Canis lupus)” y Ud. hace una busqueda por “Dog”, Babylon le va a decir que no encontró el término. Pero si Ud. busca por “Dog (Canis lupus)”, sí lo va a encontrar, además de todo lo que sea “Dog” sólo. Por lo tanto, para este programa de administración de glosarios es necesario hacer una de dos: 1) Tener como palabra fuente una sola palabra (p.ej. Dog), y en las columnas siguientes las distintas opciones relacionadas, o 2) Subdividir el término en todas sus posibles palabras fuente, por ejemplo:
Dog TAB (Canis lupus) Perro (Canis lupus)
Dog (Canis)TAB (Canis lupus) Perro (Canis lupus)
Dog (Canis lupus) TAB Perro (Canis lupus)
Este tipo de subdivisión no se puede hacer automáticamente con este sistema de reemplazos, se debe operar manualmente, discriminando entre cuales paréntesis reemplazar por un TAB y cuáles no. Esto significa usar el botón de “Buscar siguiente” para destacar cada uno de los paréntesis del texto y aplicar “Reemplazar” donde queramos poner un TAB y “Buscar siguiente” donde no queramos poner un TAB. En aquellos casos donde hay dos paréntesis juntos (p.ej.; “)(“ en el segundo ejemplo de arriba) podríamos usar “Reemplazar todos” siempre que en alguna parte del texto no aparezcan dos paréntesis juntos en un lugar donde no queremos TABs, sin embargo si estos son sólo unos pocos (“errores”) tal vez sea más conveniente corregirlos después considerando el ahorro de tiempo que podría significar usar el “Reemplazar todos”.

Ejemplo 3: Blue dog Perro azul

Este tipo de diseño de glosario es un caso complicado porque al usar “Reemplazar todos” vamos a dividir un término formado por dos palabras en dos términos no relacionados. Esto obligaría a hacer una edición posterior. En este caso hay que evaluar que es más demoroso: 1) re-unir los términos que se han separado después de introducir los TABs, o 2) Hacer el mismo ejercicio del ejemplo 2 (b) de “Buscar siguiente” y “Reemplazar” individualmente los espacios según sea necesario.

Ejemplo 4:

Blue dog:
A dog that has fallen in blue paint. Opposite: Crude dog

Français: Chien blue
Español: Perro azul



Blue cat:
A cat that has fallen in blue paint. Antónimo: Crude cat

Français: Chat blue
Español: Gato azul

Este es un caso típico donde el orden de los factores SI afecta el producto. Si aplicamos inicialmente el reemplazo de “:espacio” por TABs, separaremos el Opposite/Antónimo de su término, terminaremos con 7 TABs/columnas y trabajaremos demás. Primero reemplazamos “:espacioMarca de Párrafo” por un TAB, con lo cual la primera línea se une a la segunda con un TAB entremedio, sin afectar el Opposite/Antónimo. Luego reemplazamos “Marca de PárrafoMarca de PárrafoFrançais:espacio” por un TAB con lo cual obtenemos la palabra en francés en una columna propia del glosario o para eliminarla en Excel si no nos interesa ese idioma. Y finalmente, reemplazamos “Marca de PárrafoEspañol:” por un TAB para obtener la palabra en español en una columna aparte. Para reducir los espacios entre diferentes términos como entre “Perro azul” y “Blue cat” (en este ejemplo) podemos reemplazar “Marca de PárrafoMarca de PárrafoMarca de Párrafo” (según el número de líneas que haya entre cada conjunto) por nada, teniendo cuidado que no haya ningún conjunto separado con una línea menos que las reemplazadas o se nos pueden unir los términos (en este caso Perro azulBlue Cat).


Otros Casos Complicados

Ejemplo 5: Cuando Ud. copia un PDF en Word y aparecen los márgenes reducidos como sigue:

“Perro
Mamífero de la especie Canis lupus, usado
generalmente como mascota”

cada una de las líneas aparecerán en Excel como un término diferente. Para corregir esto hay que unir “Perro” con “Mamífero” y “usado” con “generalmente”. Pero, como no hay un espacio al final de cada línea no se puede reemplazar “Marca de Párrafo” por “espacio” porque eso transformaría todas las líneas en una sola línea interminable, o por “TAB” porque transformaría todo el texto en una serie interminable de columnas de una sola fila.
En este caso una opción puede ser colocar en los lugares donde debería ir un TAB un símbolo y donde debería ir una marca de párrafo otro símbolo (no presentes en el resto del texto), de manera que después de transformar las líneas en una sola, usar esos símbolos para separar los términos y los conjuntos bilingües. Harto trabajo.

Ejemplo 6: Listas de opciones dentro de una definición o traducción.

Dog
Perro
Animal que mueve la cola. Puede mover la cola hacia:
1) La izquierda con efectos desilusionantes
2) La derecha con efectos indeseables
3) hacia arriba y abajo con efectos indecisos
4) esta opción es sólo para adultos.

Si reemplazamos “Marca de Párrafo” por TABs, obtendremos un glosario de 7 columnas lo que no es muy conveniente por el tamaño del archivo. Por esto es preferible primero reemplazar la lista de opciones “Marca de Párrafo1)” por “espacio1)” y sucesivamente para cada número, letra o guión. Después reemplazar “.Marca de PárrafoMarca de Párrafo” por un símbolo no presente en el resto del texto, para evitar que se unan los conjuntos de términos. Reemplazar “Marca de Párrafo” por TABs. Finalmente hay que corregir la separación entre conjuntos de términos reemplazando el símbolo insertado previamente por una “Marca de Párrafo”.


Esto es el comienzo de mucho trabajo, pero cada nuevo glosario agregado a su administrador de glosarios o programa CAT es una ampliación de su horizonte, así que cada vez que termine un glosario sentirá que el esfuerzo ha sido recompenzado.


Copyright © ProZ.com, 1999-2024. All rights reserved.
Comments on this article

Knowledgebase Contributions Related to this Article
  • No contributions found.
     
Want to contribute to the article knowledgebase? Join ProZ.com.


Articles are copyright © ProZ.com, 1999-2024, except where otherwise indicated. All rights reserved.
Content may not be republished without the consent of ProZ.com.