Investigadores simulan una empresa operada 100% por inteligencia artificial y los agentes solo completaron el 24% de las tareas

Un equipo de investigadores de la Universidad Carnegie Mellon (CMU) llevó adelante un experimento nunca antes practicado, montar una empresa simulada completamente dirigida y operada por agentes de inteligencia artificial. Sin humanos en ninguna etapa del proceso, donde buscaban comprobar que tan eficientes pueden ser los sistemas actuales cuando trabajan de forma autónoma en contextos laborales reales.  

Image description

La compañía ficticia, denominada The Agent Company, fue diseñada para imitar la dinámica de una oficina real. Se incluyeron roles específicos que requiere una empresa como desarrolladores de software, analistas de datos, responsables de recursos humanos, hasta personal administrativo, todos representados por modelos de lenguaje avanzados como GPT-4o, Claude Sonnet 3.5 y Gemini 2.0.

La infraestructura que utilizaron incluyó navegadores, herramientas de documentación y un entorno de simulación laboral llamado OpenHands y durante el desarrollo del experimento, se asignaron más de 100 tareas a los distintos agentes. Algunas eran sencillas (como redactar documentos o buscar información online) y otras más complejas, como depurar errores en código, coordinar tareas grupales o manejar flujos de decisiones a largo plazo. Sin embargo, el desempeño de los agentes dejó mucho que desear porque el mejor de ellos apenas logró completar el 24% de las tareas asignadas.

Un aspecto bastante llamativo fue la falta de sentido común en tareas cotidianas como, por ejemplo, cuando se pidió guardar un archivo como “answer.docx”, el agente interpretó la orden literalmente y guardó el texto como archivo plano, sin utilizar una herramienta compatible, básicamente una falta de sentido común. En otro caso, un agente debía escalar una situación al CTO si no recibía respuesta en 10 minutos, pero actuó sin que ese tiempo hubiera transcurrido, demostrando fallas al interpretar contextos temporales.

Según los investigadores, estos errores muestran que los agentes actuales aún no manejan bien instrucciones condicionales ni colaboraciones sociales básicas. Boxuan Li, uno de los autores del estudio, explicó al medio Infobae que “los modelos de lenguaje pueden resolver problemas complejos, pero fallan en tareas que un pasante resolvería en segundos”.

Además, se detectaron dificultades técnicas al momento de interpretar interfaces gráficas o leer páginas web mediante el “árbol de accesibilidad”. Como OpenHands no cuenta con procesamiento de imágenes, los agentes no pueden interactuar con estructuras visuales como lo haría un humano, limitando gravemente su capacidad para operar sistemas empresariales.

Pero no todo fue fracaso, pues en un caso puntual, un agente logró completar un complejo proyecto universitario en apenas ocho minutos y por un costo estimado de US$ 2,41. El sistema configuró entornos locales, modificó código, compiló y testeo exitosamente. Sin embargo, estos logros siguen siendo la excepción, y una minoría en todo lo que se vivió durante el experimento.

En opinión de los expertos, el mayor aprendizaje no está en lo que los agentes lograron hacer, sino en lo que no pudieron. La inteligencia artificial aún no puede reemplazar a un trabajador humano de forma integral, pero sí puede convertirse en un colaborador útil, siempre bajo supervisión. “Los humanos seguirán siendo necesarios como jefes, auditores o diseñadores de procesos”, explicó Yufan Song, coautor del estudio.

Tu opinión enriquece este artículo:

¿Qué son los agentes de IA? ¿Por qué son tan importantes en la eficiencia de la empresa hoy?

Por Alberto Schuster ( Una creación en colaboaricon con Beyond) En el marco de la transformación digital impulsada por la Inteligencia Artificial (IA), los agentes de IA se han consolidado como una de las aplicaciones más versátiles y valiosas para mejorar el rendimientooperativodelasempresas.Adiferencia de los sistemas tradicionales de automatización, estos agentes actúan de manera autónoma, adaptativa y colaborativa, ejecutando tareas específicas y resolviendo problemas complejos en múltiples áreas funcionales.

Contenido estratégico. Nota (Paper) 3 minutos de lectura

Juan Valdez conquista Dubai Mall: claves de su expansión global y estrategias para triunfar en mercados élite

(Por Maximiliano Mauvecin junto a Marcelo Maurizio) Café Colombiano en el Epicentro del Lujo. En un mundo donde el retail compite por captar la atención de consumidores exigentes, Juan Valdez acaba de marcar un hito: la apertura de su tercera tienda en Dubai Mall, el centro comercial más visitado del planeta (100+ millones de visitantes anuales). La importancia del crossing marketing, la phygitialidad y la experiencia temática conceptual.

(4 minutos de lectura)

Ciencia y emprendimiento: investigadoras paraguayas revelan el potencial productivo de los hongos para la industria nacional

(Por SR) La creciente demanda de productos naturales, saludables y sostenibles abrió en nuestro país una oportunidad inesperada pero prometedora: la producción de hongos comestibles y medicinales. Este fenómeno no solo atrae la atención de consumidores locales cada vez más interesados en opciones alimenticias alternativas, sino también de mercados internacionales que reconocen el valor nutricional y terapéutico de estos organismos. Con el lanzamiento reciente del libro Hongos comestibles y medicinales del Paraguay, las investigadoras del Conacyt Michelle Campi y Brenda Veloso ofrecen un mapeo sin precedentes sobre el potencial económico y agroindustrial que encierran estas especies.

Inversión productiva al alza: importaciones de bienes de capital crecieron al cierre de abril (estos sectores impulsaron la demanda)

(Por MV) Las importaciones de bienes de capital para uso interno crecieron 24,6% al cierre de abril de 2025, reflejando un fuerte dinamismo en la inversión productiva. Este repunte se concentra principalmente en empresas instaladas, especialmente en los sectores de alimentos, medicamentos y metalúrgica. Mientras tanto, el régimen de maquila sigue en expansión y la importación de maquinaria proyecta una recuperación este año.

Barcelona alcanza récords en el precio de la vivienda y los expertos tranquilizan a los inversores: “La rentabilidad puede llegar al 8%”

Iñaki Unsain, Personal Shopper Inmobiliario (PSI) de referencia en Cataluña y director general de ACV Gestión Inmobiliaria afirma que, pese a una limitación inicial de la rentabilidad media debido a las restricciones, “las leyes actuales pueden cambiar, como han cambiado otras en el pasado, por eso no hay que basar una decisión de inversión en el miedo, sino en la tendencia y el largo plazo”.

En vivo desde Imola: el regreso esperado por fans de todo el mundo de Colapinto (lo que nadie te dice: ¿el caos le juega a favor?)

(Por Taylor en colaboración con XDXT) La Fórmula 1 como Campo de Batalla Estratégica. En el vertiginoso ecosistema de la Fórmula 1, donde cada curva representa una decisión crítica y cada temporada un capítulo de reinvención, el regreso de Franco Colapinto a la parrilla no es solo una noticia deportiva; es una lección magistral de resiliencia y estrategia en tiempos turbulentos, y aunque muchos se enojen de Marketing.

Información de valor: Micro Nota 3 Minutos de lectura.