Calidad de los sistemas de traducción automática

traducciónRecientemente hemos tenido una serie de consultas sobre la calidad de los servicios de traducción automática de textos científicos. Para entendernos, nuestros usuarios han querido saber si pueden “fiarse” de lo que leen bajo el tamiz del traductor de Google.

Es una pregunta peliaguda, pues siempre habíamos opinado que las herramientas automáticas de traducción debían utilizarse como una ayuda o para una aproximación inicial, pero no para tomar al pie de la letra sus resultados. Es decir, si bien pueden ayudarnos a comprender el contenido general de un texto en el idioma extranjero, los sistemas de traducción automática, no siempre entregan traducciones precisas.

Como sabréis, aunque puede ser una sorpresa, el traductor de Google no utiliza reglas gramaticales. Sus algoritmos son estadísticos. Es decir, no se basan en el análisis de las normas gramáticas sino en un método llamado “traducción automática estadística”.

Dicho de otro modo, cuando el traductor de Google se pone en marcha, busca patrones en millones de documentos para decidir cuál es la mejor traducción. Así, mediante la detección de patrones en documentos traducidos “por humanos”, el sistema decide, mediante un sistema de inteligencia artificial, qué traducción es la más adecuada.

“Científicamente” hablando, hay diversos estudios que intentan ayudarnos a determinar si podemos utilizar servicios de traducción automática con plena confianza. Uno de ellos, al que podéis acceder en abierto, pretende determinar si la extracción (y traducción automática) de datos de ensayos clínicos puede ser fiable (en este caso para confeccionar una revisión sistemática). El artículo se titula: «Assessing the Accuracy of Google Translate to Allow Data Extraction From Trials Published in Non-English Languages«

La conclusión a la que llegan los autores del estudio es que la extracción de datos de todos aquellos artículos escritos en lengua no inglesa fue menos precisa. Aunque cabe decir que, en nuestro caso, se determinó que la extracción/traducción de datos “en español” era de las de mejor calidad de todo el estudio.

Aun así, aunque los autores siguen indicando que aunque el traductor de Google tiene potencial para reducir el sesgo científico, recomiendan a los lectores el ser cautelosos con la utilización de los datos extraídos/traducidos por este sistema de traducción automática.

Finalmente, y por si resulta de interés, recomendar una herramienta de reciente creación que ha obtenido cierta resonancia en medios generalistas: DeepL.

Por todo lo dicho, des de la Biblioteca refrendamos nuestra opinión de que, por el momento, los servicios de traducción automática pueden ayudarnos a comprender generalidades del texto traducido, pero si queremos aplicar el conocimiento adquirido debemos tener cuidado con tomar al pie de la letra sus resultados.

He enviado un original a una revista… ¿por qué rechazan su publicación?

rechazadoAntes que nada, comentar que el ser rechazado es lo más habitual en la publicación académica. Incluso muchos de los investigadores top en su campo han experimentado el rechazo en algún momento. El hecho de que ahora hay más científicos que nunca en el “mercado” ha llevado a un progresivo aumento del número de artículos recibidos para su evaluación por parte de las revistas.

El porqué de ese rechazo puede deberse a múltiples motivos. Vamos a enumerar los más habituales:

1. Falta de originalidad

Los editores suelen preferir publicar resultados de investigación novedosos. Aunque muchos autores tendemos a argumentar “estos nunca se ha estudiado antes” para explicar por qué nuestro trabajo es significativo, esto no es suficiente. Los resultados de investigación que enviemos deben ubicarse suficientemente en su contexto, y debemos dar razones específicas que argumenten porqué nuestro trabajo es importante (por ejemplo: una mejora en la praxis de intervención habitual, un cambio de teoría, etc.).

2. Falta de coincidencia con el alcance de la revista

Sin comentarios. Debemos estar seguros de qué enviamos nuestro trabajo a la revista temáticamente indicada. Los manuscritos serán rechazados directamente por el editor, incluso antes de someterse a una revisión por pares, si no es apropiado para los lectores de la revista o no se ajusta a los objetivos y alcance de la misma.

3. Defectos en el diseño del estudio

Un documento bien redactado no servirá para ocultar fallos en el diseño del estudio. Estos fallos deben resolverse en las etapas iniciales, mientras se conceptualiza. No podemos utilizar nuestro original para disimular a posteriori esas carencias.

  • Por ejemplo: la hipótesis debe estar bien expuesta; nuestros resultados deben basarse en una muestra suficiente, tratada adecuadamente; el análisis estadístico debe ser apropiado en función de lo que queramos exponer; las conclusiones deben basarse en lo expuesto y no en suposiciones; etc.

4. Mala escritura y organización

Es muy importante que los autores presentemos argumentos en los trabajos. Debemos convencer a los lectores (y a los editores y revisores) de que nuestra investigación es sólida e importante.

5. Preparación inadecuada del manuscrito

Los autores que no tenemos el inglés como primera lengua, a menudo, nos enfrentamos a un problema adicional. Nuestra redacción en inglés debe ser lo suficientemente buena como para no desmerecer la calidad de nuestras investigaciones. Por otra parte, evidentemente, debemos seguir las normas de publicación marcadas (a nivel de referencias bibliográficas, inclusión de figuras, extensión, etc.). El editor no va a hacer eso por nosotros.

6. No disponer de la aprobación del CEIC institucional

Esto es imprescindible.

 

De todas formas, puede ser que un artículo rechazado no sea un mal artículo, sino simplemente un artículo al que no se le ha otorgado suficiente prioridad de publicación por parte de una revista. Que un artículo sea rechazado no constituye ningún demérito para la mayoría de ellos, simplemente significa que los editores no pueden publicar todos los (buenos) artículos que les llegan.

Así, dado que muchos científicos queremos amortizar el trabajo dedicado a escribir un artículo publicándolo sea como sea, una buena recomendación puede ser enviar el original rechazado a otra revista, incluyendo los cambios sugeridos por los revisores, que a buen seguro aumentaran la calidad del mismo.

Polyglot como herramienta de “traducción” de estrategias de búsqueda

PolyglotPolyglot es un recurso que permite convertir automáticamente estrategias de búsqueda en PubMed a otras sintaxis de bases de datos (por ejemplo: Embase, CINAHL, PsychINFO, Biblioteca Cochrane, etc.).

Como parte del conjunto de herramientas de soporte que está desarrollando el Bond University Centre for Research in Evidence-Based Practice (http://www.crebp.net.au) para el campo de las revisiones sistemáticas.

Si nosotros introducimos una estrategia de búsqueda, por ejemplo en PubMed:

«Primary Health Care»[Mesh] OR Primary care OR Primary healthcare OR Family practice OR General practice AND «Treatment Failure»[Mesh] OR Treatment failure OR Treatment failures AND “Bacterial Infections»[Mesh] OR Bacteria OR Bacterial AND «Anti-Bacterial Agents»[Mesh] OR Antibacterial Agents OR Antibacterial Agent OR Antibiotics OR Antibiotic

Nos da como respuesta para:

«ovid»: «(exp Primary Health Care/ OR Primary care OR Primary healthcare OR Family practice OR General practice) AND (exp Treatment Failure/ OR Treatment failure OR Treatment failures) AND (exp Bacterial Infections/ OR Bacteria OR Bacterial) AND (exp Anti-Bacterial Agents/ OR Antibacterial Agents OR Antibacterial Agent OR Antibiotics OR Antibiotic)»,

«cochrane»: «([mh \»Primary Health Care\»] OR Primary care OR Primary healthcare OR Family practice OR General practice) AND ([mh \»Treatment Failure\»] OR Treatment failure OR Treatment failures) AND ([mh \»Bacterial Infections\»] OR Bacteria OR Bacterial) AND ([mh \»Anti-Bacterial Agents\»] OR Antibacterial Agents OR Antibacterial Agent OR Antibiotics OR Antibiotic)»

«embase»: «(‘Primary Health Care’/exp OR Primary care OR Primary healthcare OR Family practice OR General practice) AND (‘Treatment Failure’/exp OR Treatment failure OR Treatment failures) AND (‘Bacterial Infections’/exp OR Bacteria OR Bacterial) AND (‘Anti-Bacterial Agents’/exp OR Antibacterial Agents OR Antibacterial Agent OR Antibiotics OR Antibiotic)»,

«webofscience»: «(Primary care OR Primary healthcare OR Family practice OR General practice) AND (Treatment failure OR Treatment failures) AND (Bacteria OR Bacterial) AND (Antibacterial Agents OR Antibacterial Agent OR Antibiotics OR Antibiotic)»,

«cinahl»: «((MH \»Primary Health Care+\») OR Primary care OR Primary healthcare OR Family practice OR General practice) AND ((MH \»Treatment Failure+\») OR Treatment failure OR Treatment failures) AND ((MH \»Bacterial Infections+\») OR Bacteria OR Bacterial) AND ((MH \»Anti-Bacterial Agents+\») OR Antibacterial Agents OR Antibacterial Agent OR Antibiotics OR Antibiotic)»

Criterios para seleccionar donde enviar un artículo para ser publicado

artículoA menudo, los usuarios de la biblioteca de SJD nos preguntan: “¿Cuál es la mejor revista para enviar mi artículo para que lo publiquen?”.

Tenemos la impresión que, cuando nos preguntan esto, directamente nos están pidiendo cual de la revistas de un área concreta tiene mayor factor de impacto.

Y es cierto que los indicadores bibliométricos son interesantes para determinar a qué revista enviar nuestro original, pero no son, en absoluto, los únicos factores que deberíamos considerar.

Veamos algunos de los ya apuntados por Stefanie Haustein en su libro Multidimensional Journal Evaluation y recogidos en esta entrada en Medium:

  • Regularidad de la publicación. Es decir, tanto seleccionar aquellas revistas que aparecen regularmente y no son flor de un día, como descartar aquellas con claros números “de relleno”, lo que da a entender de su dificultad de atracción de buen contenido.
  • Editorial y composición del comité científico.
  • Alcance. Factor de decisión muy importante. Es decir, por temática… ¿dónde debería publicar mi artículo? ¿Es necesario acudir a una revista “ómnibus”? Es necesario estudiar también la temática de cada uno de los artículos recientemente publicados, que nos dará más información sobre las líneas de interés actuales de la publicación más allá de lo que pueda reflejar su declaración de alcance.
  • Audiencia. También es un factor de decisión importante. ¿A quién se dirige la revista? ¿A facultativos? ¿A investigadores? A veces, no es lo mismo.
  • Revisión por pares. Es un factor de decisión imprescindible. No recomendamos publicar en revistas que no realicen un buen proceso de revisión por pares.
  • Tiempos ¿cuántos días/semanas/meses pueden pasar desde que se envía el artículo a saber la decisión sobre si se publica o no? ¿Y cuánto pasa en publicarse realmente?
  • Ratio de rechazo. Una revista con un ratio de rechazo alto puede hacer que perdamos el tiempo intentando publicar en ella, pero una con un ratio muy bajo puede ser que acepte contenidos de baja calidad.
  • Acceso abierto. La Biblioteca San Juan de Dios apoya la publicación en acceso abierto, pues representa más ventajas, ya que si el autor cede en exclusiva a una editorial de revistas de suscripción, los derechos de explotación de su obra, pierde el control sobre la publicación, difusión y reutilización de su propio trabajo. El Acceso Abierto permite: mayor visibilidad, uso e impacto, inmediatez, mayor garantía de preservación, servicios de valor añadido, acelera el proceso de investigación y la ciencia.
  • Idioma.
  • Indicadores altmétricos: número de descargas de artículos, menciones en redes sociales, etc. Y, finalmente…
  • Indicadores bibliométricos: factor de impacto, cuartil, índice h (de la revista), etc.

Todas estas consideraciones las tiene en cuenta el equipo de biblioteca cuando recomienda intentar la publicación de un original en una revista determinada. Es por eso por lo que, a veces, no os recomendamos la revista con necesariamente mayor factor de impacto.