Por qué las máquinas no hablan bien español y por qué deberían hacerlo

(Por Elena González-Blanco, IE University) Cada día se habla con mayor naturalidad de inteligencia artificial (IA). Nos vamos acostumbrando a que esta etiqueta –con un significado para muchos aún rodeado de un halo enigmático– penetre con mayor frecuencia en nuestra rutina.

Sin ser apenas conscientes, sonreímos para desbloquear el teléfono móvil sin saber que tras ese segundo delante de la cámara, miles de píxeles convertidos en datos alimentan a gran velocidad algoritmos de deep learning. Estos son hoy día capaces de automatizar el reconocimiento facial en unos porcentajes superiores al 98 % de exactitud.

La eclosión ha sido estelar. Podemos considerar como punto esencial la victoria de DeepMind frente al primer jugador mundial de Go en 2016. En apenas 5 años, la afortunada combinación del volumen exponencial de datos generados, la creación de sistemas de procesamiento suficientemente potentes (unidades de procesamiento gráfico o GPU) y la madurez y liberación de los algoritmos de redes neuronales (como Tensorflow), han hecho realidad programable toda la teoría matemática que sienta sus bases en los años 50 del siglo XX, con las primeras teorías de Marvin Minsky o John McCarthy sobre el aprendizaje automático.

¿Robots que hablan? No es tan sencillo

Debajo de esa magia, que hace que la informática trate de comportarse como el cerebro humano, hay una combinación de distintas tecnologías y tipos de datos que no funciona con el mismo éxito ni de la misma forma para resolver todos los problemas.

La paradoja está servida: nos atemoriza un mundo en el que los robots amenazan con suplantar nuestras funciones laborales, pero a día de hoy, asistentes como Siri, Alexa y Google Home son todavía incapaces de mantener una conversación de más de unos minutos, más allá de solicitar una serie de datos, dar órdenes sencillas o establecer rutinas concretas.

Hacer hablar –y escribir– a las máquinas es una de las labores más complejas a las que se ha enfrentado jamás la computación. Ya en 1951 Alan Turing planteó el reto del juego de la imitación, en el que ser humano y máquina podrían confundirse a través del lenguaje, realidad aún muy lejana hoy.

El lenguaje humano es altamente complejo y variado. Es un sistema vivo sobre el cual los algoritmos que tejen estas neuronas digitales que constituyen la inteligencia artificial van aprendiendo con los datos de los que se nutren. Así, estas células informáticas van adquiriendo vocabulario y mejorando sus estructuras lingüísticas gracias a su exposición constante a los datos conversacionales.

Mejor en inglés que en español

La realidad nos demuestra que, a día de hoy, la competencia de esta tecnología es muy superior en inglés que en el resto de las lenguas. Esto se debe a que tanto los principales desarrollos científicos como las grandes empresas que los han explotado comercialmente se han creado en países angloparlantes y entrenado con datos en inglés.

La realidad lingüística es muy distinta de la tecnológica: el español es el segundo idioma del mundo y cuenta con más de 585 millones de hablantes y un crecimiento del 7,5 % anual. Aun así, no existe una inteligencia artificial hoy que sea capaz de procesar con calidad sus numerosas variantes (debidas a diferentes circunstancias geográficas, sociales o contextuales).

La razón de este retraso con respecto al inglés se debe a la fragmentación de las empresas de tecnología lingüística hispanas. En general, son pequeñas y están orientadas a funciones específicas y muy concretas, con un histórico fuertemente vinculado a la traducción y a la variedad lingüística peninsular.

Además, a pesar de la gran cantidad de datos que poseemos en nuestra lengua, estos no se encuentran disponibles para su explotación, pues muchos son privados. Incluso aquellos que están en manos de las instituciones públicas y culturales se encuentran en silos no preparados para su consumo abierto.

Por estos motivos, en muchas ocasiones, las empresas y los grandes clientes eligen soluciones que no se han fabricado en nuestra lengua ni entrenado con nuestros datos, sino mediante la traducción posterior. Esto hace que su nivel de éxito sea mucho menor.

He aquí algunos ejemplos: para poder entrenar a un robot en el ámbito legal español, es necesario contar con abundantes textos legales en nuestra lengua, pero también de un conocimiento del Derecho Romano y del funcionamiento de la jurisprudencia en España.

Para poder discernir las diferentes variedades del español en Latinoamérica, es imprescindible conocer no solamente las variantes de léxico, sino también la fonética, e incluso el funcionamiento situacional (pragmática) de algunas expresiones en determinados contextos. Todos estos matices se pierden en la traducción.

Una oportunidad para el avance

A pesar de todo, nos encontramos hoy en un momento de interés creciente por el desarrollo de la inteligencia artificial aplicada al lenguaje. Ha habido un incremento del 34,5 % de papers científicos sobre procesamiento del lenguaje natural e IA aplicado a lenguaje entre 2019 y 2020, que hace patente la creciente madurez de la tecnología.

Además, el interés por su desarrollo se ha convertido en clave para el desarrollo económico. Actualmente, China lidera con fuerza la revolución tecnológica, seguida por Estados Unidos. Mientras, Europa lucha por no quedar más rezagada buscando nichos para brillar ligados a nuevas oportunidades y a la propia realidad cultural, económica e histórica del viejo continente. La lengua es, sin lugar a dudas, una de ellas, pues los activos que sirven de punto de partida, los datos, están aquí y prácticamente no se han aprovechado aún.

Dentro de esta carrera por el desarrollo de la inteligencia artificial, la importancia del español como lengua nativa de IA, ligada al potencial de mercado y a la riqueza y variedad de sus datos, es una mina de oro que apenas se ha comenzado a explotar.

No es necesario reinventar la pólvora, tan solo proporcionar datos abiertos y disponibles para poder entrenar los algoritmos existentes y alinear el tejido empresarial hacia una misma dirección.

El objetivo es crear una inteligencia artificial tan poderosa como el número de hablantes de español, que allanaría el camino no solo para crear nuevas empresas y mejores algoritmos, sino también para la digitalización y preservación digital de un acervo cultural, lingüístico e histórico que merece un espacio privilegiado dentro del futuro de la transformación digital internacional. El momento es ahora, y los responsables, nosotros.

Elena González-Blanco, Directora de investigación en el Center for the Governance of Change, IE University

Este artículo fue publicado originalmente en The Conversation. Lea el original.

Un refugio de paz en Areguá: Cabaña el Bosque apuesta por la privacidad, la naturaleza y el descanso

En plena pandemia, cuando el mundo buscaba nuevas formas de vivir y descansar, Rossana González dio el primer paso para concretar un proyecto que hoy se consolida como un refugio de calma en Areguá. Así nació Cabaña El Bosque, en 2020, impulsada más por la intuición y las ganas de emprender que por una experiencia previa en el rubro hotelero. La idea surgió al detectar una necesidad clara: crear un espacio pensado exclusivamente para el descanso y la desconexión.

Paraguay da sus primeros pasos en minería con foco en la cadena de valor y la transición energética

(Por TA) Paraguay se encuentra en una etapa inicial dentro del desarrollo de proyectos mineros, un punto que define el momento actual del sector sin invalidar su potencial. “Cuando hablamos de proyectos mineros tenemos que mencionar que hay etapas: hay etapas iniciales, early stage, y hay etapas avanzadas u operacionales”, explicó Mateo Da Costa, senior project manager de IN-VR y consultor energético, al contextualizar la situación local.

¿Te perdiste de leer esto? Las 10 notas más leídas que todo ejecutivo, inversionista y trendsetter se devoró en 2025

(Por J. Romanazzi y M. Maurizio) En 2025, en el corazón del ecosistema de negocios más dinámico de las Américas, estas diez notas de InfoNegocios Miami no solo generaron miles de lecturas; se convirtieron en artefactos culturales, en puntos de referencia en las conversaciones de alto nivel, desde los boardrooms de Brickell hasta las terrazas de Wynwood, desde Madrid, hasta Buenos Aires.  Estas notas cambiaron la visión porque tienen algo más que solo “la noticia”.

(Artículo de alto contenido estratégico: Lectura 3 minutos)

Carlos Giménez: “Dentro de una empresa familiar, hay algo fundamental: El verdadero valor son las personas que trabajan en ella”

Con 70 años de historia, Alberdin es uno de esos nombres que forman parte de la memoria gastronómica de Asunción. Fundada en 1955 por doña Rosa Cárdenas y don Carlos Martínez como un almacén de ramos generales donde los domingos se elaboraban pastas y pastelitos caseros, la empresa fue creciendo de manera sostenida hasta convertirse en una marca reconocida por su sabor tradicional y su fuerte vínculo con la gente. Hoy, esa tradición convive con una mirada moderna impulsada por Carlos Giménez, gerente general y nieto de los fundadores, quien se incorporó a la empresa a fines de los años 90.

Más allá del crédito: Titulación y gestión, las claves para transformar al pequeño productor

(Por SR) El debate sobre el futuro de la agricultura familiar en Paraguay volvió a cobrar fuerza al cierre de 2025, en un contexto marcado por mayores volúmenes de financiamiento público y un discurso oficial que apunta a dejar atrás el asistencialismo. Para Héctor Cristaldo, presidente de la Unión de Gremios de la Producción (UGP), el verdadero cambio no pasa solo por ampliar el crédito, sino por resolver dos cuestiones estructurales: la titulación de tierras y la integración real del pequeño productor a la cadena de valor.

Cape San Blas: el “lujo sin cartel” del Panhandle que está redibujando el mapa turístico de Florida (y que Miami aún no explota)

(Por Vera - Maqueda) Mientras el algoritmo global insiste en los mismos nombres —Miami Beach, Key West, Orlando, incluso el corredor 30A—, en el noroeste de Florida sucede algo más sofisticado: Cape San Blas (Gulf County, cerca de Port St. Joe) se consolida como uno de los destinos más codiciados por quienes buscan belleza radical, privacidad real y naturaleza con estándares casi científicos. 

(Tiempo de lectura: 4 minutos para enamorarse)

North Captiva Island: la isla “solo por agua” que redefine el lujo en Florida (sin autos, sin ruido, sin pose)

(Por Vera-Maurizio) Florida tiene destinos que se exhiben y destinos que se protegen. North Captiva Island pertenece a la segunda categoría: una franja de arena y vegetación en la Costa del Golfo, frente a Fort Myers y muy cerca del eje Sanibel–Captiva, a la que se llega únicamente en barco o avioneta. No hay puente. 

(Tiempo de lectura: 4 minutos para enamorarse)

Adiós a la era del excedente: Nueva ley renueva la matriz energética para evitar importar electricidad en 5 años

(Por NL) La reciente promulgación de la Ley 7.599 de Energías Renovables marcó un punto importante en el debate energético paraguayo, ya que, para Massimiliano Corsi, presidente de la Cámara Paraguaya de Biocombustibles y Energías Renovables (Biocap), la norma no solo abre el juego a nuevas fuentes de energía, sino que también implica un reconocimiento explícito de que el histórico modelo hidroeléctrico del país empieza a mostrar sus límites.

Entre sabores y recuerdos: cómo la mesa paraguaya celebra el Año Nuevo

(Por LA) Cuando diciembre llega a su fin, las casas paraguayas comienzan a transformarse en templos de aromas, colores y sabores que evocan historia, memoria y unión familiar. En la previa de las celebraciones de fin de año, dos miradas profesionales se encuentran para analizar qué sigue marcando la tradición en las mesas paraguayas.