Investigadores simulan una empresa operada 100% por inteligencia artificial y los agentes solo completaron el 24% de las tareas

Un equipo de investigadores de la Universidad Carnegie Mellon (CMU) llevó adelante un experimento nunca antes practicado, montar una empresa simulada completamente dirigida y operada por agentes de inteligencia artificial. Sin humanos en ninguna etapa del proceso, donde buscaban comprobar que tan eficientes pueden ser los sistemas actuales cuando trabajan de forma autónoma en contextos laborales reales.  

La compañía ficticia, denominada The Agent Company, fue diseñada para imitar la dinámica de una oficina real. Se incluyeron roles específicos que requiere una empresa como desarrolladores de software, analistas de datos, responsables de recursos humanos, hasta personal administrativo, todos representados por modelos de lenguaje avanzados como GPT-4o, Claude Sonnet 3.5 y Gemini 2.0.

La infraestructura que utilizaron incluyó navegadores, herramientas de documentación y un entorno de simulación laboral llamado OpenHands y durante el desarrollo del experimento, se asignaron más de 100 tareas a los distintos agentes. Algunas eran sencillas (como redactar documentos o buscar información online) y otras más complejas, como depurar errores en código, coordinar tareas grupales o manejar flujos de decisiones a largo plazo. Sin embargo, el desempeño de los agentes dejó mucho que desear porque el mejor de ellos apenas logró completar el 24% de las tareas asignadas.

Un aspecto bastante llamativo fue la falta de sentido común en tareas cotidianas como, por ejemplo, cuando se pidió guardar un archivo como “answer.docx”, el agente interpretó la orden literalmente y guardó el texto como archivo plano, sin utilizar una herramienta compatible, básicamente una falta de sentido común. En otro caso, un agente debía escalar una situación al CTO si no recibía respuesta en 10 minutos, pero actuó sin que ese tiempo hubiera transcurrido, demostrando fallas al interpretar contextos temporales.

Según los investigadores, estos errores muestran que los agentes actuales aún no manejan bien instrucciones condicionales ni colaboraciones sociales básicas. Boxuan Li, uno de los autores del estudio, explicó al medio Infobae que “los modelos de lenguaje pueden resolver problemas complejos, pero fallan en tareas que un pasante resolvería en segundos”.

Además, se detectaron dificultades técnicas al momento de interpretar interfaces gráficas o leer páginas web mediante el “árbol de accesibilidad”. Como OpenHands no cuenta con procesamiento de imágenes, los agentes no pueden interactuar con estructuras visuales como lo haría un humano, limitando gravemente su capacidad para operar sistemas empresariales.

Pero no todo fue fracaso, pues en un caso puntual, un agente logró completar un complejo proyecto universitario en apenas ocho minutos y por un costo estimado de US$ 2,41. El sistema configuró entornos locales, modificó código, compiló y testeo exitosamente. Sin embargo, estos logros siguen siendo la excepción, y una minoría en todo lo que se vivió durante el experimento.

En opinión de los expertos, el mayor aprendizaje no está en lo que los agentes lograron hacer, sino en lo que no pudieron. La inteligencia artificial aún no puede reemplazar a un trabajador humano de forma integral, pero sí puede convertirse en un colaborador útil, siempre bajo supervisión. “Los humanos seguirán siendo necesarios como jefes, auditores o diseñadores de procesos”, explicó Yufan Song, coautor del estudio.

Tu opinión enriquece este artículo:

Escobar se abre al turismo de naturaleza con Cabaña Don Benjamín, una posada nacida del arraigo y la visión de futuro

La Cabaña Don Benjamín, posada turística ubicada en la ciudad de Escobar, surgió a partir de una oportunidad de inversión poco común y se transformó en un proyecto que apuesta fuerte por el turismo de naturaleza y aventura en Paraguay. Así lo explicó Benjamín Fornerón, propietario del emprendimiento, quien sostuvo que Escobar “los encontró” y los motivó a trabajar para convertirlo en uno de los destinos emergentes más atractivos del país.

Pastelería alemana hecha en casa: Café del Almacén y su propuesta que combina tradición y experiencia

(Por BR) Lo que hoy se conoce como Café del Almacén es, en realidad, el resultado de mucho trabajo silencioso, recetas heredadas y una fuerte conexión con la producción casera. Vanessa Rempel, propietaria del Café, compartió con InfoNegocios que el nombre surge mediante otro emprendimiento que tiene con su familia llamado Almacén Casero, es un negocio que funciona hace más de 13 años y que fue el punto de partida de esta propuesta gastronómica con identidad alemana y menonita.

Los Cayos de Florida 2026, el archipiélago secreto, donde millonarios y famosos se reúnen para disfrutar de un paraíso único

(Por Vera con Maurizio) Imagine un lugar donde el dólar no se gasta, se invierte en experiencia pura. Una cadena de islas donde el agua no es un recurso, es el activo principal, y la arena no es solo sílice, es el suelo sobre el que se construyen imperios de ocio y negocios discretos. Bienvenido a los Cayos de Florida, el archipiélago estratégico más subestimado del hemisferio occidental.

Del hallazgo histórico al megaproyecto: apuntan a liderar el mercado del titanio en 2030

(Por SR) Paraguay vuelve a colocarse en el radar minero internacional con un proyecto que podría redefinir su perfil productivo y exportador en la próxima década. Lo que hace más de 15 años fue presentado como un hallazgo geológico de escala mundial hoy empieza a tomar forma como un megaproyecto industrial, con potencial para convertir al país en el mayor explotador de titanio del mundo hacia 2030.

El código oculto del crecimiento gastronómico de Miami (Cuando la comida no es solo diversión o turismo, sino la mesa donde se construyen imperios)

(Por Maurizio y Vera) Miami, 2026 (Pero esta nota aplica a todo LatAm) ¿Cómo hacer que tu restaurante sea un lugar tan importante que el poder elija hacer las mejores reuniones allí? En una sala especial de un gran restaurante famoso del Brickell Financial District, no se discuten cifras: se degusta un ceviche de lionfish con leche de tigre infusionada con cítricos de los Cayos.