NVIDIA dezvăluie o metodă de antrenare a agenților AI folosind date sintetice și GRPO | Sudofeed