Investigadores simulan una empresa operada 100% por inteligencia artificial y los agentes solo completaron el 24% de las tareas

Un equipo de investigadores de la Universidad Carnegie Mellon (CMU) llevó adelante un experimento nunca antes practicado, montar una empresa simulada completamente dirigida y operada por agentes de inteligencia artificial. Sin humanos en ninguna etapa del proceso, donde buscaban comprobar que tan eficientes pueden ser los sistemas actuales cuando trabajan de forma autónoma en contextos laborales reales.  

La compañía ficticia, denominada The Agent Company, fue diseñada para imitar la dinámica de una oficina real. Se incluyeron roles específicos que requiere una empresa como desarrolladores de software, analistas de datos, responsables de recursos humanos, hasta personal administrativo, todos representados por modelos de lenguaje avanzados como GPT-4o, Claude Sonnet 3.5 y Gemini 2.0.

La infraestructura que utilizaron incluyó navegadores, herramientas de documentación y un entorno de simulación laboral llamado OpenHands y durante el desarrollo del experimento, se asignaron más de 100 tareas a los distintos agentes. Algunas eran sencillas (como redactar documentos o buscar información online) y otras más complejas, como depurar errores en código, coordinar tareas grupales o manejar flujos de decisiones a largo plazo. Sin embargo, el desempeño de los agentes dejó mucho que desear porque el mejor de ellos apenas logró completar el 24% de las tareas asignadas.

Un aspecto bastante llamativo fue la falta de sentido común en tareas cotidianas como, por ejemplo, cuando se pidió guardar un archivo como “answer.docx”, el agente interpretó la orden literalmente y guardó el texto como archivo plano, sin utilizar una herramienta compatible, básicamente una falta de sentido común. En otro caso, un agente debía escalar una situación al CTO si no recibía respuesta en 10 minutos, pero actuó sin que ese tiempo hubiera transcurrido, demostrando fallas al interpretar contextos temporales.

Según los investigadores, estos errores muestran que los agentes actuales aún no manejan bien instrucciones condicionales ni colaboraciones sociales básicas. Boxuan Li, uno de los autores del estudio, explicó al medio Infobae que “los modelos de lenguaje pueden resolver problemas complejos, pero fallan en tareas que un pasante resolvería en segundos”.

Además, se detectaron dificultades técnicas al momento de interpretar interfaces gráficas o leer páginas web mediante el “árbol de accesibilidad”. Como OpenHands no cuenta con procesamiento de imágenes, los agentes no pueden interactuar con estructuras visuales como lo haría un humano, limitando gravemente su capacidad para operar sistemas empresariales.

Pero no todo fue fracaso, pues en un caso puntual, un agente logró completar un complejo proyecto universitario en apenas ocho minutos y por un costo estimado de US$ 2,41. El sistema configuró entornos locales, modificó código, compiló y testeo exitosamente. Sin embargo, estos logros siguen siendo la excepción, y una minoría en todo lo que se vivió durante el experimento.

En opinión de los expertos, el mayor aprendizaje no está en lo que los agentes lograron hacer, sino en lo que no pudieron. La inteligencia artificial aún no puede reemplazar a un trabajador humano de forma integral, pero sí puede convertirse en un colaborador útil, siempre bajo supervisión. “Los humanos seguirán siendo necesarios como jefes, auditores o diseñadores de procesos”, explicó Yufan Song, coautor del estudio.

TIS2025 reunirá a los Consejeros de Turismo de Andalucía, Baleares, Canarias y Valencia para trazar el futuro del turismo en España

Por segundo año consecutivo, la cifra de turistas sigue al alza, pues según los últimos datos del INE, más de 44,5 millones de visitantes extranjeros han escogido España a lo largo del primer semestre del año como destino. Ante esta situación, las Comunidades Autónomas afrontan el desafío de implementar enfoques innovadores que les permitan conservar su prestigio como lugares atractivos para el turismo, al tiempo que abogan por la sostenibilidad de los destinos, la protección de las poblaciones locales y su patrimonio cultural.

Vuelve la #MareaROSA de Carrefour España y Ausonia a favor de la investigación

Con motivo del Día Mundial Contra el Cáncerde Mama, vuelve la #MareaROSA de Carrefour España y Ausonia a favorde la Asociación Española contra el Cáncer en beneficio de las personasafectadas. Una #MareaROSA a la que dan vida cada año miles de colaboradoresy colaboradoras de Carrefour España y que en esta edición se moviliza bajo ellema #NosLoTomamosAPecho (promovido por la Asociación Española Contra elCáncer). 

Brickell: el distrito financiero que se convirtió en destino residencial global (la razón de que Melía invierta en Miami)

(Por Taylor - Maqueda- Maurizio) La elección de Brickell como ubicación para este proyecto fundacional no es accidental; es estratégicamente brillante. Según datos de la Miami Downtown Development Authority, Brickell registró en 2024 ventas de propiedades residenciales superiores a los USD 4.800 millones de dólares.

(Lectura de valor estratégico: 3 minutos)

El Black Friday dispara el volumen de pagos online realizados en noviembre hasta un 130%

Tras la temporada de verano y con noviembre a la vuelta de la esquina, los comercios online se preparan para algunos de los días de compras más intensos del año. Fechas como el 11.11, el Black Friday y el Cyber Monday han convertido las campañas de rebajas de noviembre en auténticos motores de ingresos, en un contexto donde cada vez más consumidores (34%) adelantan las compras navideñas para aprovechar las mejores ofertas y distribuir sus gastos en varios meses.

Azucarera Paraguaya exporta 30.000 toneladas de azúcar orgánica a Estados Unidos y proyecta ampliar su capacidad industrial

Azucarera Paraguaya SA (AZPA) afianza su liderazgo en el sector azucarero nacional con un nuevo hito: la exportación de 30.000 toneladas de azúcar orgánica a los Estados Unidos, un mercado estratégico que consolida la proyección internacional de la compañía. Este envío forma parte de un plan más amplio de expansión comercial que busca duplicar los volúmenes de exportación y posicionar al producto paraguayo como un referente de calidad premium en el exterior. Con más de un siglo de trayectoria y bajo la gestión de Nigel López, gerente comercial y de operaciones, AZPA combina innovación, sostenibilidad y una sólida red de productores locales para sostener su crecimiento dentro y fuera del país.

Con más de 200 unidades vendidas, Marena avanza como un ícono del desarrollo urbano en Luque

El proyecto Marena, desarrollado por Eydisa, avanza con paso firme en su segundo año de ejecución y se consolida como uno de los desarrollos inmobiliarios más ambiciosos de Paraguay. Con más de 200 unidades vendidas entre las tres torres actualmente en comercialización, el emprendimiento demuestra la confianza del mercado y el atractivo del modelo “Best in Class”, que combina rentabilidad, sostenibilidad y una experiencia residencial de alto nivel.