ITBench-AA: Modelele Frontier obțin un scor sub 50% la primul benchmark pentru sarcinile IT agentice de întreprindere - de Artificial Analysis și IBM | Sudofeed