Investigadores simulan una empresa operada 100% por inteligencia artificial y los agentes solo completaron el 24% de las tareas

Un equipo de investigadores de la Universidad Carnegie Mellon (CMU) llevó adelante un experimento nunca antes practicado, montar una empresa simulada completamente dirigida y operada por agentes de inteligencia artificial. Sin humanos en ninguna etapa del proceso, donde buscaban comprobar que tan eficientes pueden ser los sistemas actuales cuando trabajan de forma autónoma en contextos laborales reales.  

La compañía ficticia, denominada The Agent Company, fue diseñada para imitar la dinámica de una oficina real. Se incluyeron roles específicos que requiere una empresa como desarrolladores de software, analistas de datos, responsables de recursos humanos, hasta personal administrativo, todos representados por modelos de lenguaje avanzados como GPT-4o, Claude Sonnet 3.5 y Gemini 2.0.

La infraestructura que utilizaron incluyó navegadores, herramientas de documentación y un entorno de simulación laboral llamado OpenHands y durante el desarrollo del experimento, se asignaron más de 100 tareas a los distintos agentes. Algunas eran sencillas (como redactar documentos o buscar información online) y otras más complejas, como depurar errores en código, coordinar tareas grupales o manejar flujos de decisiones a largo plazo. Sin embargo, el desempeño de los agentes dejó mucho que desear porque el mejor de ellos apenas logró completar el 24% de las tareas asignadas.

Un aspecto bastante llamativo fue la falta de sentido común en tareas cotidianas como, por ejemplo, cuando se pidió guardar un archivo como “answer.docx”, el agente interpretó la orden literalmente y guardó el texto como archivo plano, sin utilizar una herramienta compatible, básicamente una falta de sentido común. En otro caso, un agente debía escalar una situación al CTO si no recibía respuesta en 10 minutos, pero actuó sin que ese tiempo hubiera transcurrido, demostrando fallas al interpretar contextos temporales.

Según los investigadores, estos errores muestran que los agentes actuales aún no manejan bien instrucciones condicionales ni colaboraciones sociales básicas. Boxuan Li, uno de los autores del estudio, explicó al medio Infobae que “los modelos de lenguaje pueden resolver problemas complejos, pero fallan en tareas que un pasante resolvería en segundos”.

Además, se detectaron dificultades técnicas al momento de interpretar interfaces gráficas o leer páginas web mediante el “árbol de accesibilidad”. Como OpenHands no cuenta con procesamiento de imágenes, los agentes no pueden interactuar con estructuras visuales como lo haría un humano, limitando gravemente su capacidad para operar sistemas empresariales.

Pero no todo fue fracaso, pues en un caso puntual, un agente logró completar un complejo proyecto universitario en apenas ocho minutos y por un costo estimado de US$ 2,41. El sistema configuró entornos locales, modificó código, compiló y testeo exitosamente. Sin embargo, estos logros siguen siendo la excepción, y una minoría en todo lo que se vivió durante el experimento.

En opinión de los expertos, el mayor aprendizaje no está en lo que los agentes lograron hacer, sino en lo que no pudieron. La inteligencia artificial aún no puede reemplazar a un trabajador humano de forma integral, pero sí puede convertirse en un colaborador útil, siempre bajo supervisión. “Los humanos seguirán siendo necesarios como jefes, auditores o diseñadores de procesos”, explicó Yufan Song, coautor del estudio.

Tu opinión enriquece este artículo:

RideFreebee + Volkswagen ID. Buzz: Miami reinventa el futuro del transporte urbano gratuito

(Por Taylor y Maqueda, colaboración Maurizio) Hay ciudades que resuelven el transporte. Y hay ciudades que lo reinventan con estilo Miami acaba de hacer lo segundo. "Las ciudades más inteligentes del futuro no serán las que tengan más autos. Serán las que necesiten menos." — Adaptación de "The Death and Life of Great American Cities", Jane Jacobs.

(Lectura ideal para compartir y guardar, 3 minutos)

DNIT exige mayor detalle en Notas de Estados Financieros: expertos alertan sobre plazos y retroactividad

(Por NL) Los contribuyentes del Impuesto a la Renta Empresarial (IRE) deberán incluir información más detallada en las Notas de sus Estados Financieros, según la Resolución General N° 49/2026 de la Dirección Nacional de Ingresos Tributarios (DNIT). La medida alcanza a los estados cerrados desde el 31 de diciembre de 2025 y apunta a fortalecer la transparencia y el control sobre la distribución de utilidades y reservas.

Coronel Oviedo suma industria maquiladora: gigante textil instalará su primera planta productiva fuera de Brasil

(Por SR) Paraguay continúa sumando inversiones industriales y el sector textil vuelve a posicionarse como uno de los más dinámicos dentro del régimen de maquila. La empresa brasileña Döhler SA confirmó su desembarco en el país con la instalación de una planta productiva en Coronel Oviedo, que operará con foco en exportación y marcará la primera unidad industrial de la compañía fuera de Brasil. El proyecto refuerza el posicionamiento de Paraguay como plataforma manufacturera regional y consolida el interés de firmas internacionales por instalarse en el interior del país.

¿Por qué la regulación de utilidades en reserva divide al Gobierno y expertos tributarios?

El Poder Ejecutivo prepara un proyecto de ley que busca regular el uso de las utilidades en reserva, una práctica que, según las autoridades tributarias, estaría siendo utilizada por algunas empresas para postergar indefinidamente el pago de impuestos y eludir obligaciones fiscales. Así lo adelantó el director de Ingresos Tributarios, Óscar Orué, quien aseguró que existe un vacío legal que permite a las firmas acumular ganancias sin destino claro, en lugar de distribuirlas o capitalizarlas, generando así una distorsión en la recaudación.

Marcelo González: “La competitividad de una marca depende de qué tan única es, qué tan diferenciada está y cuánto valora el mercado”

La diferencia ya no pasa por “hacer ruido”, sino por generar impacto real. Es así que Marcelo González, gerente de marketing de Financiera Paraguayo Japonesa, propone una mirada más consistente, sistemática y profundamente humana de la disciplina, en la que cada acción debe responder a un propósito claro y medible. En entrevista con InfoNegocios, aborda los desafíos de construir marcas relevantes en Paraguay, el rol de la inteligencia artificial, la importancia del criterio por sobre la ejecución y la necesidad de conectar el marketing con resultados concretos que trasciendan lo comunicacional.