Investigadores simulan una empresa operada 100% por inteligencia artificial y los agentes solo completaron el 24% de las tareas

Un equipo de investigadores de la Universidad Carnegie Mellon (CMU) llevó adelante un experimento nunca antes practicado, montar una empresa simulada completamente dirigida y operada por agentes de inteligencia artificial. Sin humanos en ninguna etapa del proceso, donde buscaban comprobar que tan eficientes pueden ser los sistemas actuales cuando trabajan de forma autónoma en contextos laborales reales.  

La compañía ficticia, denominada The Agent Company, fue diseñada para imitar la dinámica de una oficina real. Se incluyeron roles específicos que requiere una empresa como desarrolladores de software, analistas de datos, responsables de recursos humanos, hasta personal administrativo, todos representados por modelos de lenguaje avanzados como GPT-4o, Claude Sonnet 3.5 y Gemini 2.0.

La infraestructura que utilizaron incluyó navegadores, herramientas de documentación y un entorno de simulación laboral llamado OpenHands y durante el desarrollo del experimento, se asignaron más de 100 tareas a los distintos agentes. Algunas eran sencillas (como redactar documentos o buscar información online) y otras más complejas, como depurar errores en código, coordinar tareas grupales o manejar flujos de decisiones a largo plazo. Sin embargo, el desempeño de los agentes dejó mucho que desear porque el mejor de ellos apenas logró completar el 24% de las tareas asignadas.

Un aspecto bastante llamativo fue la falta de sentido común en tareas cotidianas como, por ejemplo, cuando se pidió guardar un archivo como “answer.docx”, el agente interpretó la orden literalmente y guardó el texto como archivo plano, sin utilizar una herramienta compatible, básicamente una falta de sentido común. En otro caso, un agente debía escalar una situación al CTO si no recibía respuesta en 10 minutos, pero actuó sin que ese tiempo hubiera transcurrido, demostrando fallas al interpretar contextos temporales.

Según los investigadores, estos errores muestran que los agentes actuales aún no manejan bien instrucciones condicionales ni colaboraciones sociales básicas. Boxuan Li, uno de los autores del estudio, explicó al medio Infobae que “los modelos de lenguaje pueden resolver problemas complejos, pero fallan en tareas que un pasante resolvería en segundos”.

Además, se detectaron dificultades técnicas al momento de interpretar interfaces gráficas o leer páginas web mediante el “árbol de accesibilidad”. Como OpenHands no cuenta con procesamiento de imágenes, los agentes no pueden interactuar con estructuras visuales como lo haría un humano, limitando gravemente su capacidad para operar sistemas empresariales.

Pero no todo fue fracaso, pues en un caso puntual, un agente logró completar un complejo proyecto universitario en apenas ocho minutos y por un costo estimado de US$ 2,41. El sistema configuró entornos locales, modificó código, compiló y testeo exitosamente. Sin embargo, estos logros siguen siendo la excepción, y una minoría en todo lo que se vivió durante el experimento.

En opinión de los expertos, el mayor aprendizaje no está en lo que los agentes lograron hacer, sino en lo que no pudieron. La inteligencia artificial aún no puede reemplazar a un trabajador humano de forma integral, pero sí puede convertirse en un colaborador útil, siempre bajo supervisión. “Los humanos seguirán siendo necesarios como jefes, auditores o diseñadores de procesos”, explicó Yufan Song, coautor del estudio.

Apolo Import adquiere Los Jardines: Box Mayorista quiere expandirse en el mercado del retail local

La firma Apolo Import, que opera bajo el nombre comercial Box Mayorista, confirmó la adquisición del tradicional supermercado Los Jardines, reconocido por sus amplias sucursales, especialmente en Luque. La noticia fue ratificada a InfoNegocios Paraguay por Gustavo Lezcano, presidente de la Cámara Paraguaya de Supermercados (Capasu), gremio que agrupa a las principales empresas del sector retail.

Paraguay enfrentó 551 millones de intentos de ciberataques: “El sector más propenso a recibir ataques es el sector gubernamental”

El primer semestre de 2025 dejó en evidencia la creciente vulnerabilidad de Paraguay ante las ciberamenazas, con 551 millones de intentos de ataques detectados, de acuerdo con el Reporte Global de Fortinet. El doctor en ciberseguridad Ariel Pedrozo advirtió que la cifra general sería mucho mayor, pudiendo rondar hasta 30 millones de intentos mensuales, y destacó la urgencia de que las empresas adopten medidas de prevención.

Bliss, el nuevo café & food bar funcional que convierte el bienestar en un ritual delicioso en el barrio Mburucuyá

(Por LA) En Dr. Heisecke 186, en Asunción, se encuentra un espacio que combina la calidez de un hogar con la propuesta innovadora de un restaurante: Bliss Café & Food Bar Funcional. Detrás de este proyecto está Monica Olmedo, su creadora y propietaria, quien transformó su pasión por la alimentación consciente y el bienestar en una experiencia gastronómica integral.

Cordero con valor agregado: la propuesta de Lambrosía que busca conquistar a los comensales asuncenos

(Por SR) En Paraguay, el consumo de carne ovina todavía se encuentra en etapa de crecimiento, pero cada vez gana más protagonismo gracias a productores que innovan con propuestas atractivas. Ese es el caso de Lambrosía, una granja familiar que combina tradición ganadera con valor agregado en gastronomía, conquistando a los consumidores con productos derivados del cordero como empanadas, ravioles y cortes desmechados listos para cocinar.

Cabañas Alpina Hũ: donde el diseño se encuentra con la naturaleza y la calma de Paraguarí

(Por TA) En Paraguarí, una de las zonas más pintorescas del país, Diego Ginzo decidió apostar por un concepto que mezcla naturaleza, diseño y descanso. Así nació Cabañas Alpina Hũ, un emprendimiento que tomó inspiración de las construcciones alpinas que ya se habían instalado en el barrio. “Me gustaba cómo se integraban con la belleza de la zona. Era muy pintoresco”, explicó Ginzo, al recordar el punto de partida de su proyecto.