DÉJÀ VU
Déjá Vu es un sistema de traducción asistida por ordenador que utiliza memorias de traducción, bases de datos terminológicas y lexicones de proyecto que aumentan la calidad de las traducciones que resultan de la alineación de los segmentos de los textos con los que trabaja el traductor.

Trabajar con Déjà Vu
Para comenzar a utilizar Déjà Vu se crea un proyecto, es decir, un archivo informático con una estructura que el programa visualiza y gestiona para facilitar la tarea del traductor. Este proyecto se puede crear con diferentes documentos de origen (archivos) que estén en los formatos admitidos por el programa.
En el proyecto se ven los textos de un trabajo de traducción, tanto el original como el traducido. Los fragmentos que componen estos textos se organizan en columnas alineadas por segmento origen y traducción. La relación de estos segmentos la realiza el traductor según su propio criterio basándose en las alineaciones que le propone el programa. Las filas de la tabla que se forma se pueden ver bien de manera individual o todas juntas, ya sea por orden alfabético o por el orden en el que aparecen los fragmentos en el texto original. La extensión que crea el programa para estos proyectos es .dvprj.
Las funciones de Déjà Vu
  • Función de búsqueda (Scan): con esta función se pueden encontrar traducciones de fragmentos (sintagmas u oraciones) antiguas que puedan ser útiles para un nuevo proyecto.  
  • Función de ensamblar (Assemble): esta función examina más a fondo las bases de datos asociadas, recoge los fragmentos pertinentes o con estructuras similares y estructura una traducción a partir del material que no se encontró con la función de búsqueda.
  • Función pretraducción (Pretranslate): con esta función sea ahorra tiempo, pues se traducen segmentos que se repiten constantemente en el texto de manera automática.
  • Función de propagación (Propagate): cada vez que se traduce un segmento, el programa verifica el esto del proyecto para encontrar las correspondencias que sean idénticas y así insertarlas automáticamente, de manera que no aparecen traducciones incongruentes en el proyecto. Si la traducción de un determinado fragmento es similar, el programa solicita la confirmación.
  • Función de autobúsqueda (Autosearch): esta función permite buscar oraciones, segmentos o términos con toda la información contextual necesaria y ordenada según su relevancia en las bases de datos terminológicas, las memorias de traducción y los lexicones.

Con Dájà Vu también se puede llevar a cabo la gestión de proyectos que facilita la tarea de los traductores encargados de una traducción. Entre las diferentes características de la gestión de proyectos destacan el análisis que realiza de un proyecto mediante el recuento de palabras y caracteres por archivo o por proyecto, la presentación de un panorama general de la repetición interna del proyecto y la búsqueda del número y el tipo de coincidencias que se dan en las diferentes memorias de traducción asociadas. Asimismo, con este programa se pueden realizar controles de calidad.
Mediante la creación de un lexicón, Déjà Vu analiza los proyectos y extrae automáticamente palabras y sintagmas cortos. Los ordena según la frecuencia para poder identificar con facilidad términos y expresiones importantes, así como para eliminar aquellos que no resulten relevantes. Los lexicones se pueden traducir automáticamente y generar así bases de datos basadas en proyectos ya existentes.









"A translation is no translation, he said, unless it will give you the music of a poem along with the words of it."
John Millington Synge
CREAR MÚSICA CON EL TRADUCTOR DE GOOGLE

Resulta que esta (ya famosa) herramienta de Google (a la que tanto tememos) no se limita a crear traducciones. ¡Ahora también crea ritmos en los que basar la música!

Un usuario que se hace llamar "Redditor harrichr" ha encontrado la fórmula para convertir el traductor de Google en una máquina de sonidos. 

Si lo quieres comprobar no tiene más que: 

1. Ir a Google Translator
2. Seleccionar alemán como lengua de origen y de destino
3. Copiar y traducir la siguiente secuencia:  pv zk pv pv zk pv zk kz zk pv pv pv zk pv zk zk pzk pzk pvzkpkzvpvzk kkkkkk bsch
4. Pulsar en escuchar y comprobar la locura.
Remito al artículo en el que he encontrado esta curiosidad para el que quiera saber algo más sobre el tema: Google Translator: base rítmica
 

GESTIÓN DE CORPUS MULTILINGÜES

La RAE define corpus como un «conjunto lo más extenso y ordenado posible de datos o textos científicos, literarios, etc., que pueden servir de base a una investigación.» 

Actualmente el número de recursos en formato electrónico ha aumentado considerablemente, por lo que un corpus se convierte en una recopilación de textos electrónicos de acuerdo con un tema o criterio determinado. Así, el traductor recoge una serie de textos representativos del trabajo o proyecto que vaya a realizar para formar su propio corpus.  Para los traductores, es interesante sobre todo crear un corpus paralelo en el que se incluyan los textos y la traducción de los mismos.  

Existen diferentes tipos de corpus. Los principales parámetros para su clasificación se centran en la modalidad de la lengua, en el número de lenguas en las que se presentan los textos, el tamaño o cantidad de los textos que conforman el corpus, entre otros.
Si nos centramos en el número de lenguas, un corpus puedes ser:
  • Monolingüe: corpus compuesto por textos en una sola lengua. Este tipo de corpus da cuenta de una lengua o de una variedad lingüística determinada.
  • Bilingüe o multilingüe: corpus formado por textos en dos (bilingüe) o más lenguas (multilingüe). Estos textos no tienen por qué ser traducciones unos de otros.
Para ayudar a la gestión de estos corpus, existen programas, como Déjà Vu o WinAlign, con los que se puede realizar la alineación de los textos que conforman un corpus. El proceso de alineación consiste en hacer coincidir los párrafos  o frases de los diferentes textos con sus traducciones correspondientes uniéndolos como si fueran unidades de traducción en sí. De esta manera el corpus paralelo sería la base de las memorias de traducción. 

Para realizar esta alineación, primero hay que comprobar que los textos con los que se va a trabajar están en el mismo formato de archivo. Después, habrá que especificar los idiomas para comenzar la alineación. El formato estándar para las memorias de traducción suele ser TMX. Con este formato se facilita el trabajo, ya que se pueden intercambiar MT sin problemas entre los diferentes programas.