Opinions de ChainSummer(@Square-Creator-062342994b3bb)

📰 Actu crypto du marché

1. Nvidia Blackwell redéfinit les benchmarks d'efficacité énergétique du hardware pour agents
Les derniers benchmarks aa-agentperf montrent que Nvidia Blackwell surpasse nettement ses concurrents dans les scénarios de charge pour agents. Les tests, basés sur des trajectoires de programmation réelles, montrent que le GB300 NVL72 peut supporter environ 61 400 agents concurrents avec une puissance électrique équivalente, soit plus de 20 fois l'H200, et la capacité concurrentielle par carte a également été considérablement améliorée. Cela signifie que le coût des infrastructures pour les agents AI, la programmation automatique, le service client, et autres scénarios à haute concurrence pourrait continuer à baisser, la compétition en efficacité de calcul s'accélérant.

2. La compétition dans l'infrastructure AI s'intensifie, AMD fait face à une pression de performance accrue
D'après les résultats de ce test de hardware pour agents, l'attention du marché s'est déplacée de la simple performance d'entraînement vers l'efficacité d'inférence, la capacité de charge concurrentielle et la production par unité d'énergie consommée. Nvidia Blackwell, avec son système de refroidissement liquide et sa capacité de déploiement à haute densité, a établi un avantage plus fort dans les scénarios d'application pour agents, exerçant également une pression sur des concurrents comme AMD. Pour le marché crypto, la montée en température de la chaîne de valeur de la puissance AI pourrait continuer d'affecter le pricing émotionnel des GPU, des centres de données, des ressources électriques et des actifs conceptuels AI, les fonds se concentrant davantage sur le nouveau récit de 'l'inférence efficace'.

3. OpenRouter teste l'outil subagent, favorisant la collaboration multi-modèle
OpenRouter a récemment lancé l'outil d'agent serveur openrouter:subagent, permettant au modèle principal de déléguer des sous-tâches spécifiques à des modèles plus petits et moins coûteux pendant le processus de génération, puis de renvoyer les résultats. Ce mécanisme aide à réduire les coûts d'appel tout en garantissant l'efficacité globale et en améliorant la flexibilité d'exécution des tâches complexes. Si le modèle de travail intègre des outils de recherche et de récupération, il peut d'abord effectuer des recherches et des inférences en plusieurs étapes, puis les renvoyer au modèle principal, illustrant la transition des applications AI d'une 'réponse à modèle unique' vers 'la collaboration multi-agent'.

4. L'architecture des sous-agents renforce la praticité, mais la gestion du contexte reste clé
Il est important de noter que le schéma subagent n'est pas entièrement automatisé. Le modèle de travail ne peut pas directement lire le contexte du modèle principal, donc le modèle principal doit fournir un contexte complet dans la description de la tâche, sinon cela peut affecter la qualité d'exécution. Pour éviter la récursion infinie et le désordre des ressources, OpenRouter a intégré des protections telles que l'interdiction d'auto-référence, la limitation de la profondeur d'imbrication et un plafond sur le nombre total de tâches. Dans l'ensemble, ces outils sont plus adaptés aux flux de travail des développeurs et des entreprises, et pourraient accélérer le déploiement de produits d'agent AI à faible coût, tout en augmentant l'attention du marché sur le secteur des agents.

#AI #Agent #Nvidia