Category Archives: Software libre

NLTK 3.0: Natural Language Toolkit

http://www.nltk.org/

NLTK es una plataforma para la creación de programaspara trabajar con datos del lenguaje humano en Python. Proporciona interfaces fáciles de usar para más de 50 recursos linguísticos, como WordNet, junto con un conjunto de bibliotecas de procesamiento de texto para la clasificación, tokenización, derivado, etiquetado, análisis y razonamiento semántico, y un activo foro de discusión

Suite Stanford CoreNLP : código abierto para el procesamiento de textos

Stanford CoreNLP

Acceder

La Suite Core PNL de la Universidad de Stanford  es un marco de herramientas bajo licencia GPL para el procesamiento de textos en Inglés, chino y español. Incluye herramientas para “tokenización” (división del texto en palabras), parte del discurso de marcado, análisis gramatical (identificar elementos como sustantivos y frases verbales), reconocimiento de entidades, frases y dependencias de palabras, indican que sustantivo se refieren a las mismas entidades, etc. Stanford CoreNLP es un marco integrado. Su objetivo es hacer que sea muy fácil de aplicar un montón de herramientas de análisis lingüístico a un texto. Está diseñado para ser altamente flexible y extensible. incluyendo un etiquetador del discurso (POS), reconocedor entidad (NER), analizador, sistema de resolución del discurso, análisis de los sentimientos, y patrón bootstrapped 

Antconc: software libre para análisis de corpus textuales

AntConc

Tutorial

Descargar programa

Windows (3.4.3)

Macintosh OS X 10.7-10.10 (3.4.3)

Macintosh OS X 10.6 (3.4.1)

Linux (3.4.3)

Older versions

El análisis de corpus es una forma de análisis de texto que le permite hacer comparaciones entre los objetos de texto a gran escala (llamada “lectura distante”). Lo que permite ver cosas que no vemos como lectores habituales. Si se dispone de una colección de documentos, es posible que se desee encontrar patrones de uso gramatical, o frases que se repiten con frecuencia en el corpus. Así como encontrar frases estadísticamente probables y / o improbables para un autor o tipo de texto en particular, determinados tipos de estructuras gramaticales o una gran cantidad de ejemplos de un concepto en particular en un número amplio de documentos en su contexto. Análisis Corpus es especialmente útil para triangulación de textos resultados de otros métodos digitales.

AntConc

AntConc es un paquete de software independiente para el análisis lingüístico de textos, libremente disponible para Windows , Mac OS y Linux que permite trabajarr en un PDF o un documento de Word.

Más herramientas de Software libre para Traducción

Guide to Localization of Open Source Software

Pustakalaya, M. P. [e-Book] Guide to Localization of Open Source Software Ottawa, Canada, International Development Research Center, 2010.

Texto completo

The release of NepaLinux 1.0 in December 2005, by Madan Puraskar Pustakalaya was a major breakthrough for software localization in Nepal. The open source nature and no licensing cost of NepaLinux provided a viable alternative to more costly proprietary software in Nepali. This localization work was based on existing open source distributions in Linux. While the open source movement has provided free, open and easy access to the source code, accelerating localization development, the need to document the processes involved has also become equally important to trigger further localization for under-resourced languages. This Linux localization guide is a compilation of the experiences of the Madan Puraskar Pustakalaya localization team while they worked on the localization of Debian and Morphix based GNU/Linux Distribution in Nepali. Special attention has been given in making the content useful to those undertaking the localization work for the first time for other languages in their respective languages. Illustrations in most cases are based on the works in the Nepali language. However, information about the basic steps and procedures for localization has been made as generic as possible, in order to ensure that any language may fit into the description provided. During the preparation of this guide, a large number of resources invaluable to both beginners and experts of localization have been consulted. References have been provided for further reading for these topics.

Monografico: Traducción y Software Libre

Monográfico
Traducción y Software Libre
InfoTrad 16 de noviembre  de 2011


Post en InfoTRAD

Herramientas de Software Libre para la Traducción

KBabel : herramienta de software libre de apoyo a la traducción

Bitext2tmx : Software Libre para traducción.

Stardict – Traductor de Software libre

Audacity: software libre para crear Podcasts

OmegaT : La herramienta de memoria de traducción libre (GPL)

Wikicionario: el diccionario libre

La Traducción en el mundo del Software

Podcasting, donde estés y a la hora que estés

Aplicaciones de código abierto para Traducción Asistida

OpenLogos : versión de código abierto del sistema de traducción Logos Machine

Matxin: motor de Traducción open source

Apertium: un motor de traducción de código abierto

Herramientas libres para la Traducción

Opentrad : sistema de traducción automática de código abierto para todas las lenguas del Estado

Social Translator una comunidad social para la traducción.

ForeignDesk – Un entorno de traducción integrado

Herramientas de Software Libre para la Traducción

MONOGRÁFICO

“Proyecto “OpenTrad: Traducción automática de código abierto para las lenguas del Estado español” : Descripción del sistema de traducción es-eu Matxin.” Sourceforge.netvol., n.:  pp.: http://matxin.svn.sourceforge.net/viewvc/matxin/trunk/doc/documentation-es.pdf

La presente documentación, redactada por el grupo Ixa, especifica la arquitectura general de la arquitectura Matxin y del sistema de traducción es-eu diseñados en el proyecto OpenTrad y la estructura y formato de cada uno de sus módulos. La estructura del sistema difiere sustancialmente de la arquitectura generada en el proyecto para las lenguas románicas (arquitectura Apertium), y es por ello que tiene una documentación, repositorio de software y nombre diferenciados. Por tanto, en este informe se denomina Matxin al sistema de traducción entre castellano y euskera y Apertium al sistema entre lenguas románicas. El conjunto del proyecto, por su parte recibe el nombre de OpenTrad. En cualquier caso, el sistema Matxin ha intentado reutilizar los módulos de Apertium en la medida de lo posible, y también FreeLing (sistema de código abierto para el análisis del castellano incorporado por la UPC).

(2012). [e-Book]  Open translation tools, flossmanuals.net. Texto completo:http://en.flossmanuals.net/_booki/open-translation-tools/open-translation-tools.pdf

The first wave of the internet revolution changed expectations about the availability of information a great deal. Information that was stored in libraries, locked in government vaults or available only to subscribers suddenly became accessible to anyone with an internet connection. A second wave has changed expectations about who creates information online. Tens of millions of people are contributing content to the modern internet, publishing photos, videos, and blog posts to a global audience. The globalization of the internet has brought connectivity to almost 1.6 billion people. The internet that results from globalization and user-authorship is profoundly polyglot. Wikipedia is now available in more than 210 languages, which implies that there are communities capable of authoring content in those tongues. Weblog search engine Technorati sees at least as many blog posts in Japanese as in English, and some scholars speculate that there may be as much Chinese content created on sites like Sina and QQ as on all English-language blogs combined.

Aranbarri, Garbiñe “Machine translation with free software for enterprises.” Eleka vol., n. (2010).  pp.: http://2010.rmll.info/IMG/pdf/MT_translation_with_free_software_en.pdf

Translation engines with free software. Apertiumhttp://sourceforge.net/projects/apertium/files/ – Matxinhttp://sourceforge.net/projects/matxin/files/ MT: speeds up translation process Free software continuous improvements flexibility for the adaptations

Bogucki, ukasz (2010). [e-Book]  Teaching Translation and Interpreting: Challenges and Practices. Cambridge, Cambridge Scholars Publishing. Texto completo: http://www.c-s-p.org/flyers/978-1-4438-2500-9-sample.pdf

Translator and interpreter training has recently received ample attention, manifested in numerous articles, books and conference papers. However, many central issues still appear controversial. Should translation and interpreting be taught within the curricula of language studies or independently? What is translator competence made up of? Which of its elements can be developed through practice and which require coaching? What kind of translators and interpreters, if any, are “born, not made”? In an attempt to address these and other questions as well as to exchange experience and expertise regarding translation curricula in Poland and abroad, the Department of Translation Theory and Practice, part of the Chair of English Language and Applied Linguistics at Lodz University, has organised two conferences under the title “Teaching Translation and Interpreting”; the first was held in April 2008, the second almost exactly a year later. The present volume is an outcome of these two events. It is meant as a response to the developments in translation didactics which result from the recognition of the role of the  translator/interpreter and the consolidating status of Translation Studies. The rationale behind the publication is manifold. First, there is evidently a need among translation scholars and translators to exchange information on the process of becoming a translator – issues like the optimum profile of a translation adept, the most efficient methods for guiding students who wish to pursue the career or balancing formal education with practical training. What is more, the volume hopes to offer an opportunity to discuss the design of translation and interpreting teaching tracks as they actually function in different institutions within Poland and across Europe. The contributions talk about the challenges and solutions in a translation and interpreting classroom by combining theory and practice, hence allowing for implementation of the different methods in real-life situations. As the authors come from a number of institutions and countries, the volume offers varied perspectives on analogous issues to arrive at a comprehensive up-to-date account but also to discuss outlooks for the future.

Bond, Francis , Stephan  Oepen, et al. “Deep Open-Source Machine Translation.” Machine Translation vol. 25, n. 2 (2011).  pp. 87–105.http://web.mysites.ntu.edu.sg/fcbond/open/pubs/2011-mt-deep-open.pdf

This paper summarizes ongoing efforts to provide software infrastructure (and methodology) for open-source machine translation that combines a deep semantic transfer approach with advanced stochastic models. The resulting infrastructure combines precise grammars for parsing and generation, a semantic-transfer based translation engine and stochastic controllers. We provide both a qualitative and quantitative experience report from instantiating our general architecture for Japanese–English MT using only open-source components, including HPSG-based grammars of English and Japanese.

Canovas, Marcos  and Richard  Samson “Open source software in translator training.”Tradumática vol. 9, n. (2011).  pp.: http://revistes.uab.cat/tradumatica/article/view/9/pdf

Translator training implies the use of procedures and tools that allow students to become familiar with professional contexts. Specialised open source software includes professional quality tools and procedures accessible to academic institutions and distance students working at home. Authentic projects using open source software and crowdsourcing procedures are indispensable resources in translator training.

Corbí-Bellot, Antonio M. , Mikel L.  Forcada, et al. “An Open-Source Shallow-Transfer Machine Translation Engine for the Romance Languages of Spain.” EAMT 2005 Conference Proceedings vol., n. (2005 ).  pp.:http://transducens.dlsi.ua.es/repositori/transducens/pubs/165/corbi05.pdf

We present the current status of development of an open-source shallow-transfer machine translation engine for the Romance languages of Spain (the main ones being Spanish, Catalan and Galician) as part of a larger government-funded project which includes non-Romance languages such as Basque and involving both universities and linguistic technology companies. The machine translation architecture uses finite-state transducers for lexical processing, hidden Markov models for part-of-speech tagging, and finite-state based chunking for structural transfer, and is largely based upon that of systems already developed by the Transducens group at the Universitat d’Alacant, such as interNOSTRUM (Spanish­Catalan) and Traductor Universia (Spanish­Portuguese). The possible scope of the project, however, is wider, since it will be possible to use the resulting machine translation system with new pairs of languages; to that end, the project also aims at proposing standard formats to encode the linguistic data needed. This paper briefly describes the machine translation engine, the formats it uses for linguistic data, and the compilers that convert these data into an efficient format used by the engine.

Cordeiro, Gonçalo “El software libre en la caja de herramientas del traductor.”Tradumática vol. 9, n. (2011).  pp. 101-107.http://ddd.uab.cat/pub/tradumatica/tradumatica_a2011n9/tradumatica_a2011n9p101.pdf

El objeto de este artículo es dar a conocer una serie de experiencias de traducción en un entorno profesional apoyado exclusivamente en el uso de software libre. Para ello, me referiré a las principales herramientas utilizadas, desde un punto de vista práctico.

Días Fouces, Oscar “Creación de un entorno de trabajo para la formación de profesionales de los servicios lingüísticos con GNU.” Hermeneus: Revista de la Facultad de Traducción e Interpretación de Soria vol., n. 9 (2007).  pp.:http://recyt.fecyt.es/index.php/HS/issue/view/596/showToc

Se describe, en todas sus fases, el procedimiento para desarrollar una distribución GNU/Linux orientada a la formación de profesionales de los servicios lingüísticos.

Diaz Fouces, Oscar “Software Libre en la formación de traductores: entre el pragmatismo y la utopía 1.” Congreso AIETI vol. 2, n. (2006).  pp.:

Parece legítimo relacionar el notable incremento de las actividades de traducción al que estamos asistiendo en los últimos cincuenta años, con el vertiginoso desarrollo experimentado en ese periodo por las tecnologías de la información y las (tele)comunicaciones. Este último fenómeno resulta indisociable, por otro lado, de la extensión masiva de la economía de mercado, después del desplome de la Unión Soviética. El proceso de globalización que determina esa red mundial de intereses comerciales y de aplastante homogeneidad ideológica depende, en lo más esencial, de unas poderosas redes de comunicación capaces de hacer llegar los productos, los servicios, la información y, en último extremo, el propio modelo político-económico a todos los rincones del planeta. Por supuesto, la traducción, entendida en su sentido más genuino de mediación interlingüística e intercultural, es una pieza fundamental de ese mecanismo.

Díaz Fouces, Oscar “Software libre en la formación de traductores:entre el pragmatismo y la utopía.” Actas del II Congreso Internacional de la Asociación Ibérica de Estudios de Traducción e Interpretación vol., n. (2005).  pp.:http://www.aieti.eu/pubs/actas/II/AIETI_2_ODF_Software.pdf

Parece legítimo relacionar el notable incremento de las actividades de traducción al que estamos asistiendo en los últimos cincuenta años, con el vertiginoso desarrollo experimentado en ese periodo por las tecnologías de la información y las (tele)comunicaciones. Este último fenómeno resulta indisociable, por otro lado, de la extensión masiva de la economía de mercado, después del desplome de la Unión Soviética. El proceso de globalización que determina esa red mundial de intereses comerciales y de aplastante homogeneidad ideológica depende, en lo más  sencial, de unas poderosas redes de comunicación capaces de hacer llegar los productos, los servicios, la información y, en último extremo, el propio modelo político-económico a todos los rincones del planeta. Por supuesto, la traducción, entendida en su sentido más genuino de mediación interlingüística e intercultural, es una pieza fundamental de ese mecanismo.

Díaz Fouces, Oscar “El programari lliure com a objectiu i com a instrument per a la traducció.” Tradumática vol. 9, n. (2011).  pp.:http://revistes.uab.cat/tradumatica/article/view/12/pdf

El programari lliure és present en una bona part dels nostres àmbits quotidians. Des del punt de vista de les persones que es dediquen professionalment a la provisió de serveis lingüístics i també d’aquelles que es dediquen a la formació dels primers i a la investigació en aquest àmbit, el programari lliure obre un munt d’oportunitats. En aquest treball es presenten les diverses aproximacions a la relació entre traducció i programari lliure que recull el volum 9 de la revista Tradumàtica.

Díaz Fouces, Óscar  and Marta García González (2008). [e-Book]  Traducir (con) software libre Granada, Comares. Texto completo: http://scans.hebis.de/21/23/66/21236666_toc.pdf(sumario)

Fernández García, Juan Rafael “La Traducción en el mundo del Software Libre: Análisis del estado de las herramientas lingüísticas, proyectos actuales y necesidades de la comunidad del software libre.” TLDP-ES vol., n. (2003).  pp.:

Analisis del estado de las herramientas lingüisticas proyectos actuales y necesidades de la comunidad del software libre. Este documento pese a ser muy completo no pretende ser mas que una instantanea del estado de las herramientas y proyectos en un determinado momento. El documento esta intimamente ligado al de Un paso adelante acerca de las especificaciones de requisitos de las herramientas lingüisticas de TLDP. Documento relacionado Un paso adelante

Fernández García, Juan Rafael (2003). [e-Book]  La Traducción en el mundo del Software Libre: Análisis del estado de las herramientas lingüísticas, proyectos actuales y necesidades de la comunidad del software libre. Texto completo:http://granada.sourceforge.net/jasl3/ponencias/ponencia9.pdf

Análisis de las herramientas lingüísticas de que dispone la comunidad de software libre, de los proyectos de traducción y de los desafíos que presenta el tratamiento informático de los lenguajes naturales.

Fernández García, Juan Rafael F. “La Traducción en el mundo del Software Libre: Análisis del estado de las herramientas lingüísticas,proyectos actuales y necesidades de la comunidad del software libre.” TLDP-ES vol. 34, n. (2003).  pp.:http://es.tldp.org/Articulos/0000otras/doc-traduccion-libre/doc-traduccion-libre.pdf

Este documento tiene su origen en el trabajo final de un curso de la UNED sobre traducción que debía presentarse por escrito. Gran parte de su estructura y algunas de sus limitaciones tienen ese origen: inicialmente estaba dirigido a traductores profesionales o estudiantes de traducción e iba a presentarse exclusivamente en papel. No obstante, está inspirado por el espíritu contributivo de la comunidad del software libre y mi compromiso es seguir desarrollándolo como una pequeña aportación al conocimiento de este mundo y como introducción al tema para aquellas personas que quieran colaborar y no sepan por dónde empezar. Modestamente, no pretende ser más una instantánea del estado de las herramientas y proyectos en un determinado momento.

Flórez, Silvia and Amparo Alcina “Catálogo de software libre para la traducción.”Tradumática vol. 9, n. (2011).  pp. 57-73.http://www.um.es/docencia/barzana/TEI/archivos/Tradumatica-catalogo-software-libre-traductores.pdf

En este artículo presentamos un catálogo de herramientas libres para la traducción. El objetivo es proporcionar a los traductores elementos que les faciliten la selección de herramientas. En la introducción exponemos ciertas características del software libre, como su marco ideológico y la importancia de la comunidad que respalda los proyectos.

Forcada, Mikel L. “Open-source machine translation: an opportunity for minor languages.” Grupo de investigación TRANSDUCENS vol., n. (2007).  pp.:http://transducens.dlsi.ua.es/repositori/transducens/pubs/219/forcada06p2.pdf

In this paper I explore the opportunities offered by open-source machine translation to what will be referred to as minor languages, and examine the challenges ahead. To begin with, the concepts which make up the paper’s title will be briefly reviewed in this introduction. The rest of the paper is organized as follows: section 2 discusses the effects of the availability of machine translation on minor languages; section 3 describes some of the limitations of commercial machine translation in this respect; section 4 focuses on the specific opportunities offered by open-source machine translation; section 5  examines the challenges faced, and section 6 illustrates some of the issues with a case study. Closing remarks are found in section

García Fernández, Juan Rafael “Algunas reflexiones sobre la localización comunitaria de software libre.” Tradumática vol. 9, n. (2011).  pp.:http://revistes.uab.cat/tradumatica/article/view/8/pdf

El artículo presenta los resultados de una investigación sobre las herramientas libres de apoyo a la calidad en la traducción aparecidas en los últimos años y el estado actual de conocimiento y uso de dichas herramientas tanto en el mundo del software libre como en el sector profesional. Se intenta responder las siguientes preguntas: ¿Han seguido evolucionando las aplicaciones libres disponibles o se han estancado? ¿Los grupos de traductores explotan suficientemente los recursos tecnológicos disponibles y mantienen criterios de calidad y integridad del flujo de la traducción? ¿Se avanza hacia la traducción social? Para tener elementos de juicio, pondremos a prueba el estado de las herramientas para, primero, en el uso clásico, traducir los mensajes y la interfaz de usuario de un programa elegido al azar (el fichero en formato PO de la aplicación de uso creciente en educación ExeLearning) y, en segundo lugar, ver cómo se vertería un documento creado con un editor de textos convencional descargado de la red.

Ginestí-Rosell, Mireia, Gema Ramírez-Sánchez, et al. “Desarrollo de un sistema libre de traducción automática del euskera al castellano.” Development of a free Basque to Spanish machine translation system vol., n. 43 (2009).  pp. 187-195.http://www.sepln.org/revistaSEPLN/revista/43/articulos/art21.pdf

Este artículo presenta un sistema de traducción autom?atica libre (de código abierto) basado en reglas entre euskera y castellano, construido sobre la plataforma de traducción automática Apertium y pensado para la asimilación, es decir, como ayuda a la comprensión de textos escritos en euskera. Se describe el desarrollo y la situación actual y se muestra una evaluación de la calidad de las traducciones. (A)

Ginestí-Rosell, Mireia, Gema Ramírez-Sánchez, et al. “Desarrollo de un sistema libre de traducción automática del euskera al castellano.” Development of a free Basque to Spanish machine translation system vol., n. 43 (2009).  pp. 187-195.http://www.sepln.org/revistaSEPLN/revista/43/articulos/art21.pdf

Este artículo presenta un sistema de traducción autom?atica libre (de código abierto) basado en reglas entre euskera y castellano, construido sobre la plataforma de traducción automática Apertium y pensado para la asimilación, es decir, como ayuda a la comprensión de textos escritos en euskera. Se describe el desarrollo y la situación actual y se muestra una evaluación de la calidad de las traducciones.

Gomes De Oliveira, Rodrigo  and Dimitra  Anastasiou “Comparison of SYSTRAN and Google Translate for English Portuguese.” Tradumática vol. 9, n. (2011).  pp.:http://revistes.uab.cat/tradumatica/article/view/14/pdf

Two machine translation (MT) systems, a statistical MT (SMT) system and a hybrid system (rule-based and SMT) were tested in order to compare various MT performances. The source language was English (EN) and the target language Portuguese (PT). The SMT tool gave much fewer errors than the hybrid system. Major problem areas of both systems concerned the transfer of verb systems from source to target language, and of the hybrid system the word-to-word translation, since its resources are mainly dictionaries and not corpora.

Gomez Gómez, Carmen (2011). [e-Book]  Traduciendo en Comunidades de Software Libre. San Francisco, California, Sol OpenSystems. Texto completo:http://www.nibbler.es/cms/documentos/articulos/pdf/traduciendo-en-comunidades-de-software-libre

Este documento viene a complementar las principales ideas expuestas en la ponencia que presenté, con motivo de las “VI Jornadas de Software Libre 2011”1, bajo el título “Traduciendo en comunidades de software libre”. Su propósito es el de orientar, de una manera práctica, la forma de colaborar con una comunidad de software libre, tratando de esclarecer algunos de sus entresijos. Se usará la Traducción como una de las formas de colaboración posible, sin que sea necesario tener que ser un programador o experto en software. Al mismo tiempo, se plantea y trata de responder algunas cuestiones importantes: ¿Cómo funciona una comunidad de software libre?; ¿Qué caracteriza la traducción de software?; ¿Cuál es la motivación de las comunidades?. En definitiva, su fin último persigue impulsar una nueva andadura en las formas colaborativas.

Gomis Parada, Cristina “La localización de aplicaciones de software libre en el ámbito de la empresa.” Tradumática vol. 9, n. (2011).  pp.:http://revistes.uab.cat/tradumatica/article/view/11/pdf

La localización de aplicaciones de software libre es una tarea a la que nos tenemos que enfrentar algunas empresas de traducción. La planificación de un proyecto de localización tendrá en cuenta numerosas variables, como las elecciones tecnológicas, formatos, relaciones con la comunidad, perfiles profesionales y viabilidad de los proyectos

González, Mikel “Traducción de Software Libre.” Mikel González vol., n. (2006).  pp.:http://www.asturlinux.org/archivos/jornadas2006/ponencias/traduccion-mikel/traduccion.pdf

Siempre que se detallan las incontables bondades del software libre respecto del privativo, normalmente suele quedar en un segundo plano una de las ventajas que supone para la localización de software el hecho de que este sea abierto: la traducción en múltiples lenguas. Se trata de un aspecto que entronca con cuestiones fundamentales para la difusión del uso de las herramientas de software y con cuestiones de gran calado cultural. En una vertiente más centrada en el potencial de rentabilidad de la traducción libre, se puede hablar de las posibilidades que esa libertad tiene, por ejemplo, para una mejora constante y en tiempo real del propio programa informático. En caso necesario se puede recurrir a frases o vocablos que faciliten el carácter “intuitivo” del software, siendo posible incluso la “personalización” del programa para ser destinado a colectivos concretos o para que responda a las necesidades específicas de una empresa. Así por ejemplo, una determinada traducción, con vocablos y frases específicamente enfocados hacia usuarios con problemas cognitivos, puede facilitar el acceso de esas personas a herramientas informáticas.

González-Barahona, Jesús María “El concepto de software libre.” Tradumática vol. 9, n. (2011).  pp.: http://revistes.uab.cat/tradumatica/article/view/10/pdf

El software libre es cada vez más habitual en casi cualquier entorno informático. Sin embargo, es también un gran desconocido. En este artículo se exponen las condiciones que tiene que cumplir un programa para ser considerado como software libre, compiladas en varias definiciones. A partir de ellas se repasa brevemente su historia y se exploran algunas de sus características y consecuencias. También se comentan algunos aspectos relacionados con las licencias de software libre que son tan fundamentales para su existencia.

Gonzalez-Barahona, Jesús M. and Javier Fernández-Sanguino Peña “¿Cómo Debian GNU/Linux es traducido al español?” How Debian GNU/Linux is translated into Spanish vol., n. 6 (2008).  pp.: http://www.fti.uab.es/tradumatica/revista/num6/articles/07/07art.htm

La Debian GNU/Linux es uno de los paquetes de software para Linux que cuenta con una mayor distribución. Incluye miles de paquetes de software libre (free, open source) que provienen de muchas Fuentes diferentes. Una de las peculiaridades del proyecto Debian radical en el hecho de que funciona gracias a un grupo de voluntarios seleccionados por ellos mismos. En concreto, esto quiere decir que las tareas de localización (incluida la traducción) a muchas de las lenguas previstas se llevan a cabo a partir del esfuerzo de voluntarios. Este artículo describe cómo se localiza el Debian al castellano como ejemplo de los esfuerzos que es están realizando en el mundo del software libre. (A.)

Gonzalez-Barahona, Jesús M. and Javier Fernández-Sanguino Peña “¿Cómo Debian GNU/Linux es traducido al español?” How Debian GNU/Linux is translated into Spanish vol., n. 6 (2008).  pp.: http://www.fti.uab.es/tradumatica/revista/num6/articles/07/07art.htm

La Debian GNU/Linux es uno de los paquetes de software para Linux que cuenta con una mayor distribución. Incluye miles de paquetes de software libre (free, open source) que provienen de muchas Fuentes diferentes. Una de las peculiaridades del proyecto Debian radical en el hecho de que funciona gracias a un grupo de voluntarios seleccionados por ellos mismos. En concreto, esto quiere decir que las tareas de localización (incluida la traducción) a muchas de las lenguas previstas se llevan a cabo a partir del esfuerzo de voluntarios. Este artículo describe cómo se localiza el Debian al castellano como ejemplo de los esfuerzos que es están realizando en el mundo del software libre. (A.)

Gunn, Allen (2008). [e-Book]  Open Translation Tools:Disruptive Potential to Broaden Access to Knowledge, Open Society Institute. Texto completo:http://www.aspirationtech.org/files/AspirationOpenTranslationTools.pdf

Open Translation Tools was co-organized by Aspiration and Multimedia Institute (MI2), and was supported by the generosity of the Open Society Institute, with additional support for participant travel provided by TechSoup. The OTT07 agenda was collaboratively developed by participants and event organizers in the time leading up to and during the gathering, and the proceedings were directed using Aspiration’s collaborative approach to event facilitation.

Heafield, Kenneth  and Alon Lavie “Combining Machine Translation Output with Open Source: The Carnegie Mellon Multi-Engine Machine Translation Scheme.” The Prague Bulletin of Mathematical Linguistics vol., n. (2010).  pp.: http://ufal.mff.cuni.cz/pbml/93/art-heafield-lavie.pdf

The Carnegie Mellon multi-engine machine translation software merges output from several machine translation systems into a single improved translation. This improvement is significant: in the recent NIST MT09 evaluation, the combined Arabic-English output scored 5.22 BLEU points higher than the best individual system. Concurrent with this paper, we release the source code behind this result consisting of a recombining beam search decoder, the combination search space and features, and several accessories. Here we describe how the released software works and its use.

Koehn, Philipp, Marcello Federico, et al. (2007). [e-Book]  Open Source Toolkit for Statistical Machine Translation: Factored Translation Models and Confusion Network Decoding, Johns Hopkins University. Texto completo: http://www.cs.jhu.edu/~ccb/publications/open-source-toolkit-for-statistical-machine-translation.pdf

The 2006 Language Engineering Workshop Open Source Toolkit for Statistical Machine Translation had the objective to advance the current state-of-the-art in statistical machine translation through richer input and richer annotation of the training data. The workshop focused on three topics: factored translation models, confusion network decoding, and the development of an open source toolkit that incorporates this advancements. This report describes the scientific goals, the novel methods, and experimental results of the workshop. It also documents details of the implementation of the open source toolkit.

Koehn, Philipp  and Hieu  Hoang “Machine Translation with Open Source Software.”Moses vol., n. (2012).  pp.: http://amta2012.amtaweb.org/AMTA2012Files/papers/tut-koe-01.pdf

Moses – Machine Translation with Open Source Software by Philipp Koehn and Hieu Hoang 1 November 2012

López Ciruelos, Andrés “La traducción globalizada: herramientas de intercambio y comunicación.” Panacea vol. 10, n. 29 (2009).  pp.:http://www.tremedica.org/panacea/IndiceGeneral/n29_tribuna-Ciruelos.pdf

El trabajo del traductor está dejando de ser una actividad más o menos artesana centrada en el idioma para alinearse en una cadena de producción en la que el acto de la traducción ocupa un espacio cada vez más reducido. Los recursos tecnológicos se desarrollan deprisa y es imprescindible que el traductor los conozca y sepa hacer uso de ellos. Uno de los temas que más investigan las grandes empresas de software es el intercambio de la información. En este artículo se comentan dos niveles de intercambio y comunicación de datos con los que el traductor debería estar familiarizado, y se presentan las herramientas más representativas de cada uno: las plataformas de gestión y los archivos TMX.

Mayor, Aingeru, Iñaki Alegria, et al. “Matxin, an open-source rule-based machine translation system for Basque.” Machine Translation vol. 25, n. 1 (2011).  pp. 53-82.http://download.springer.com/static/pdf/418/art%253A10.1007%252Fs10590-011-9092-y.pdf?auth66=1353066632_3b4b5afaa34f354a3d82c9e47bcbaa34&ext=.pdf

We present the first publicly available machine translation (MT) system for Basque. The fact that Basque is both a morphologically rich and less-resourced language makes the use of statistical approaches difficult, and raises the need to develop a rule-based architecture which can be combined in the future with statistical techniques. The MT architecture proposed reuses several open-source tools and is based on a unique XML format to facilitate the flow between the different modules, which eases the interaction among different developers of tools and resources. The result is the rule-based Matxin MT system, an open-source toolkit, whose first implementation translates from Spanish to Basque. We have performed innovative work on the following tasks: construction of a dependency analyser for Spanish, use of rich linguistic information to translate prepositions and syntactic functions (such as subject and object markers), construction of an efficient module for verbal chunk transfer, and design and implementation of modules for ordering words and phrases, independently of the source language.

Mckay, Corinne “Software libre y software de código abierto para traductores.”Abroadlink vol., n. (2005).  pp.:http://www.abroadlink.com/es/Articulos/Software%20de%20codigo%20abierto%20y%20software%20libre%20para%20traductores.pdf

Cuando hablamos de software de código abierto (OSS, según sus siglas en inglés) o de software libre (FS, también según sus siglas en inglés) nos referimos a un software cuyo código es de acceso público. Además, normalmente, estos programas son gratuitos. Es importante entender que, más que una cuestión de precio, lo que sustenta la idea del software libre o de código abierto es la idea de libertad intelectual. Por eso es importante diferenciar entre el OSS y el FS cuyo código es público, independientemente de que haya que pagar por él o no, y el software cuyo código no es público, aunque sea completamente gratuito.

Mckay, Corinne “Free and Open Source Software for translators.” Panacea vol. 7, n. 23 (2006).  pp. 95-98.: http://www.medtrad.org/panacea/IndiceGeneral/n23_tribuna_McKay.pdf

Free and open source software (FOSS) is gaining popularity in the translation industry, due to its low cost, flexibility, reliability, security and freedom from licensing hassles. With a range of free and open source translation memory suites, web browsers and office software to choose from, FOSS is an attractive option for freelancers and agencies alike. The past year has seen many new developments in the world of FOSS for translators. This article will address three main topics: what is FOSS; why is FOSS important to translators; and how can translators get started with FOSS?

Mckay, Corinne “Free and open source software for translators.” Thoughts On Translationvol., n. (2008).  pp.: http://www.translatewrite.com/foss/atapaper05.pdf

Free and open source software (FOSS) is gaining popularity in the translation industry, due to its low cost, flexibility, reliability, security and freedom from licensing hassles. With a range of free and open source translation memory suites, web browsers and office software to choose from, FOSS is an attractive option for freelancers and agencies alike. The past year has seen many new developments in the world of FOSS for translators.

Mckay, Corinne “Links-Free and Open Source Software for Translators.”translatewrite.com vol., n. (2010).  pp.: http://www.translatewrite.com/foss/atahandout.pdf

Links-Free and Open Source Software for Translators Presented by Corinne McKay

Morado, Lucía  and Friedel  Wolff “Bringing industry standards to Open Source localisers: a case study of Virtaal.” Tradumática vol. 9, n. (2011).  pp.:http://revistes.uab.cat/tradumatica/article/view/4/pdf

The XML Localisation Interchange File Format (XLIFF) is an open standard promising interoperability and tool independence. It might be thought of as a natural fit for Open Source localisation, yet the Gettext PO format remains the de facto standard in Open Source localisation. We present a case study of the XLIFF implementation in Virtaal – an Open Source localisation tool supporting multiple formats. The primary target user group of Virtaal is made up of localisers of Open Source software – often volunteers. We study the implementation choices adopted by the developers with specific focus on the workflow metadata in XLIFF. In this regard we propose recommendations for simplification that hopefully improve XLIFF for use by a wider audience in future.

Muñoz Muñoz, José Manuel and Mercedes Vella Ramírez “Gestores de memorias de traducción de software libre.” Sendebar: Revista de la Facultad de Traducción e Interpretación vol., n. 21 (2010).  pp. 231-250.

Muñoz Muñoz, José Manuel and Mercedes Vella Ramírez “Gestores de memorias de traducción de software libre.” Sendebar: Revista de la Facultad de Traducción e Interpretación vol., n. 21 (2010).  pp. 231-250. http://dialnet.unirioja.es/servlet/extart?codigo=3610525

Perea, José Ignacio “La revisión de las traducciones del software libre.” Tradumática vol. 9, n. (2011).  pp.: http://revistes.uab.cat/tradumatica/article/view/2/pdf

Pese a haber recibido escasa atención hasta hace muy poco, en los últimos tiempos la revisión de traducciones está siendo objeto de un interés cada vez mayor. En el caso concreto de la traducción de software libre, ciertas peculiaridades, como por ejemplo la participación de traductores voluntarios y los plazos de tiempo disponibles, hacen de la revisión un aspecto crucial. Con el fin de simplificar este tipo de tareas, están disponibles varias herramientas que permiten al revisor localizar rápidamente determinados tipos de errores. Una de ellas es petraREV, una herramienta capaz de trabajar por igual con los formatos habituales en el software libre y en el sector profesional.

Scannell, Kevin P. “Free Software for Indigenous Languages.” Department of Mathematics and Computer Science Saint Louis University Saint Louis, Missouri, USA vol., n. (2008).  pp.:http://borel.slu.edu/pub/ili.pdf

The dynamics of the ongoing shift to English are probably familiar to all speakers of indigenous languages: English is viewed as the language of commerce, technology, higher education, and social mobility. It is the language of the Anglo-American television programs, movies, and music that young people find most attractive. Irish, on the other hand, is associated with Ireland’s rural, impoverished past, with “old-fashioned” culture, and is generally viewed as “useless” in the global economy of the 21st century.  This work to help reverse this language shift has focused on the domains of software and computing. Up until about seven years ago, there was virtually no software available in Irish, and this meant that when children were introduced to computers in school, it was necessarily in an English-only context. Similarly, in the business world, the lack of Irish  software made it extremely difficult to maintain Irish as the language of the workplace

Scott, Bernard and Anabela  Barreiro “OpenLogos MT and the SAL Representation Language.” Proceedings of the First International Workshop on Free/Open-Source Rule-Based Machine Translation vol., n. (2009).  pp.:http://193.145.233.67/dspace/bitstream/10045/12023/6/paper3.pdf

This paper describes OpenLogos, a rule-driven machine translation system, and the syntactic-semantic taxonomy SAL that underlies this system. We illustrate how SAL addresses typical problems relating to source language analysis and target language synthesis. The adaptation of Open-Logos resources to a specific application concerning paraphrasing in Portuguese is also described here. References are provided for access to OpenLogos and to SAL.

Tsygany, Oleg “Anapraseus: translators’ workhorse.” Panacea vol. 10, n. 29 (2009).  pp.:http://www.tremedica.org/panacea/IndiceGeneral/n29_tribuna-Tsygany.pdf

Article about a new open source Computer Aided Translation tool for the creation, use and management of bilingual translation memories in any language, designed as an extension of OpenOffice.org. Features: text segmentation, fuzzy search in the translation memory, terminology recognition, import/export in TMX format, user interface similar to Wordfast’s.

Vilar, David , Daniel  Stein, et al. “Jane: Open Source Hierarchical Translation, Extended with Reordering and Lexicon Models.” Bibliometrics Data Bibliometrics vol., n. (2010).  pp.:http://quaero.org/media/files/bibliographie/vilar-1.pdf

We present Jane, RWTH’s hierarchical phrase-based translation system, which has been open sourced for the scientific community. This system has been in development at RWTH for the last two years and has been successfully applied in different machine translation evaluations. It includes extensions to the hierarchical approach developed by RWTH as well as other research institutions. In this paper we give an overview of its main features. We also introduce a novel reordering model for the hierarchical phrase-based approach which further enhances translation performance, and analyze the effect some recent extended lexicon models have on the performance of the system.

Wasala, Asanka , Ian  O’keeffe, et al. “Towards an Open Source Localisation Orchestration Framework.” Tradumática vol. 9, n. (2011).  pp.:http://revistes.uab.cat/tradumatica/article/view/6/pdf

This paper describes the design and implementation of a novel environment for the inter-connectivity of distributed localisation components – both open source and proprietary – in response to the scarcity of relevant research in this area, as we view interoperability as being the key to the seamless integration of different entities. The proposed solution promotes interoperability through the adoption of a Service Oriented Architecture (SOA) framework based on established localisation standards. We describe a generic use scenario and the architecture of the environment that allows us to study interoperability issues in localisation processes. This environment was successfully demonstrated at the CNGL Public Showcase in Microsoft, Ireland, November 2010.

OpenLogos : versión de código abierto del sistema de traducción Logos Machine

 

OpenLogos es la versión de código abierto del sistema de traducción Logos Machine, una de las primeras marcas que desarrollaron productos comerciales de traducción automática en el mundo. Fue desarrollado por Logos Corporation en los Estados Unidos, con los equipos de desarrollo adicionales en Alemania e Italia. Al igual que el sistema de Logos, OpenLogos admite diferentes formatos de documentos y mantiene el formato del documento original en la traducción. OpenLogos no pretende sustituir a los traductores humanos, sino que tiene como objetivo mejorar el entorno de trabajo de traductor profesional.
OpenLogos sólo traduce del alemán e Inglés a las principales lenguas europeas (francés, italiano, español y portugués). El objetivo principal es proporcionar un servicio de traducción.

Matxin: motor de Traducción open source

Descargar

Matxin es uno de los dos motores de traducción de código abierto se desarrollan en el interior del proyecto OpenTrad; Matxin está diseñado para traducir entre diferentes tipos de lenguajes. El consorcio está liderado por OpenTrad Eleka Ingeniaritza Linguistikoa.

El proyecto (“Fuentes abiertas para la traducción de las lenguas románicas de España”) es financiado por el Ministerio de Industria, Turismo y Comercio de España a través de una subvención PROFIT

La arquitectura Matxin está siendo desarrollado por el grupo de investigación IXA de la Universidad del País Vasco. Datos lingüísticos para la traducción del español al euskera Matxin uso están siendo desarrollados por Ixa y Elhuyar I + D.

Apertium: un motor de traducción de código abierto

 

Apertium es una plataforma de traducción automática libre/de código fuente abierto, inicialmente pensada para pares de lenguas emparentadas, pero que ha sido recientemente ampliada para poder tratar con pares de lenguas más divergentes (como por ejemplo inglés–catalán). La plataforma proporciona

  1. un ingenio de traducción independiente de las lenguas
  2. herramientas para gestionar los datos lingüísticos necesarios para construir un sistema de traducción automática para un par de lenguas dado
  3. datos lingüísticos para un número creciente de pares de lenguas.

Apertium usa un motor de traducción de transferencia superficial que procesa el texto de entrada en etapas, como en una cadena de montaje: desformateo, análisis morfológico, desambiguación categorial, transferencia estructural superficial, transferencia léxica, generación morfológica y reformateo.

Apertium usa transductores de estados finitos para las operaciones de procesamiento léxico (análisis y generación morfológica, transferencia léxica), modelos ocultos de Markov para la desambiguación categorial y chunking multietapa basado en estados finitos para la transferencia superficial.

Es possible usar Apertium para construir sistemas de traducción automática para una gran variedad de pares de lenguas; para ello, Apertium usa formatos sencillos basados en XML para codificar los datos lingüísticos necesarios (hechos a mano o por conversión de datos existentes) que se compilan, con las herramientas que se proveen, en formatos de gran velocidad usados por el motor.

Aplicaciones de código abierto para Traducción Asistida

 

Traducción asistida y traductores autónomos: alternativas y avances

1.   Aplicaciones de código abierto

Las aplicaciones de código abierto especializadas en traducción son numerosas. En este apéndice señalamos las que consideramos más importantes o funcionales para determinadas modalidades de trabajo, conjuntamente con una serie de comentarios ilustrativos que podrían servir de orientación:

ANAPHRASEUS  
Sistema Operativo Windows, GNU Linux, MacOS X
Requisitos OpenOffice 2 y posterior/JRE
Formatos txt, odt, sxw, doc, rtf, sdw, HTML, xml, uot, docx
Última versión 2.02 beta
Licencia GNU General Public License
Web de descarga http://sourceforge.net/projects/anaphraseus/files/
Anaphraseus%20OOo%20Extension
Documentación http://baldwinsoftware.com/AnaphraseusManual_1.23b.html
Comentarios Se trata de una extensión de OpenOffice, por lo que se requiere este paquete de ofimática para su funcionamiento. También funciona con LibreOffice. Esta extensión parece ser un desarrollo de la versión inicial del programa comercial Wordfast, por lo que para los usuarios de este sistema será especialmente sencillo. También conviene señalar que, aunque funciona bien en Windows, Mac OS y Linux, es en Mac OS donde su interfaz aparece más clara.
OMEGAT  
Sistema Operativo Windows, GNU Linux, MacOS X 
Requisitos JRE 1.5 o posterior
Formatos xhtml, HTML, docx, xml, odt, xliff, txt
Última versión  2.2 beta (19.3.2011)
Licencia GNU General Public License
Web de descarga http://www.omegat.org
Documentación http://www.textnart.de/OmegaT
Comentarios Es el programa TAO libre más extendido y mejor considerado entre los traductores por su versatilidad y la variedad de formatos que soporta. También sirve para localización. Sus memorias se pueden ver en otros programas de código abierto compatibles, como Virtaal. Su interfaz quizá sea demasiado espartana, pero su funcionamiento es especialmente intuitivo.
OMEGAT+  
Sistema Operativo Windows, GNU Linux, MacOS X
Requisitos JRE
Formatos txt, tmx, odf, xml, HTML, po, docx
Última versión 1.0M3
Licencia GNU General Public License
Web de descarga http://omegatplus.sourceforge.net
Documentación  
Comentarios Es una bifurcación de OmegaT. Soporta menos formatos, pero tiene una interfaz más desarrollada e intuitiva que el programa original. Especialmente recomendable para quien trabaje mayormente con documentos de texto.
AUTSHUMATO ITE  
Sistema Operativo Windows, GNU Linux, MacOS X
Requisitos JRE
Formatos tmx, doc, xls, ppt, docx, xlsx, pptx, odt, ods, odp, txt, HTML, xml
Última versión 1.1 (29.11.2010)
Licencia GNU General Public License
Web de descarga http://sourceforge.net/projects/autshumatoite/files/
autshumatoite/Releases/Autshumato.ITE.1.1.0.Setup.exe
/download?use_mirror=tenet
Documentación http://autshumatoite.sourceforge.net
Comentarios Precisa documentos OpenOffice/LibreOffice. Puede descargarse solo o con este paquete de ofimática y JRE incorporados. Su alineador es CText, que también funciona de forma independiente.
OPEN TM2  
Sistema Operativo Windows (NT/2000/XP/7)
Requisitos  
Formatos  
Última versión 0.9.1 (18.1.11)
Licencia Eclipse Public License
Web de descarga http://www.opentm2.org/download
Documentación  
Comentarios Este sistema resultará familiar a los que llevamos tiempo traduciendo, ya que es la versión en código abierto del antiguo sistema de IBM TranslationManager (de hecho, IBM es uno de los principales valedores de este proyecto)
OLIFANT  
Sistema Operativo Windows
Requisitos NET framework
Formatos  
Última versión 3.0.8 (30.4.2009)
Licencia GNU Lesser General Public License
Web de descarga http://sourceforge.net/projects/okapi/files/Olifant%20%28stable%2a/
Documentación http://okapi.sourceforge.net/Release/Olifant/Help
Comentarios Pertenece a la familia de programas OKAPI, que también incluye herramientas de localización (Tikal) y gestión de proyectos (Rainbow)
VIRTAAL  
Sistema Operativo Windows, GNU Linux, MacOS X
Requisitos  
Formatos xliff, tmx, tbx
Última versión 0.6.1. (2.6.2010)
Licencia GNU General Public License
Web de descarga http://sourceforge.net/projects/translate/files/Virtaal
Documentación http://translate.sourceforge.net/wiki/virtaal/using_virtaal
Comentarios Principalmente es una herramienta de localización; puede trabajar con memorias TMX de OmegaT
POEDIT  
Sistema Operativo Windows, GNU Linux, MacOS X
Requisitos  
Formatos Po, mo, rpm
Última versión 1.4.6.
Licencia MIT License
Web de descarga http://www.poedit.net/download.php
Documentación  
Comentarios Localización
TIKAL  
Sistema Operativo Windows, GNU Linux, MacOS X
Requisitos  
Formatos xliff, HTML, odt, docx, po, tmx, xml
Última versión 2.0.11 (2.4.2011)
Licencia GNU Lesser General Public License
Web de descarga http://code.google.com/p/okapi/downloads/list
Documentación http://www.opentag.com/okapi/wiki/index.php?title=Tikal
Comentarios Localización

Y en alineación, además del independiente CTexT (que trabaja con Autshumato ITE), Aligner y Blinger son herramientas de OmegaT (están disponibles en su misma página).

2.   Aplicaciones para tabletas

Estas son las apps más interesantes que he encontrado hasta el momento. Las de ofimática (*) son más funcionales. Las demás no pasan de ser herramientas de consulta instantánea con resultados más o menos fiables.

APP

SISTEMA OPERATIVO

NECESITA INTERNET

GRATUITA

OFFICE2 HD (*)

DOCUMENTS TO GO (*)

PAGES (*)

QUICK OFFICE (*)

iRAE

TRANSLATOR

FREE TRANSLATOR

WORD LENS

ILANGUAGETRANSLATOR

iOS

iOS/Android

iOS

iOS/Android

iOS/Android

iOS/Android

iOS

iOS

iOS

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 Fuente:Ortiz Jiménez, María Traducción asistida y traductores autónomos: alternativas y avances.” puntoycoma vol., n. 123 (2011).

Herramientas libres para la Traducción

Open Translation Tools

FLOSS, 2009

Descargar en PDF

Descargar en ePuB

Este manual ha sido diseñado en colaboración y escrito por una comunidad de innovadores de Traducción Abierta de la plataforma FLOSS Manuals en colaboración con un conjunto de las organizaciones asociadas. Y forma parte del segundo evento Open Translation Tools OTT09 que se celebró en Amsterdam en junio de 2009, y fue coorganizado por Aspiración FLOSS, (www.flossmanuals.net), y Translate.org.za. OTT09 y apoyado de nuevo por el Open Society Institute