Le modèle 8B actuellement en entraînement sur Agora est de 350B tokens et continue de converger. Les métriques et évaluations de haut niveau ressemblent presque exactement à un fonctionnement centralisé.
-
Mais ;
- 133 contributeurs externes au total apportant des 4090, 5090, L40S/RTX 6000 et RTX 6000 Pros. Ce sont des cartes que les gens possèdent réellement - il n'y a pas de H100, B200, etc.
- Le nombre maximal de nœuds que le système peut supporter (104) a été rempli presque immédiatement. La couche d'autorisation reçoit environ 100 requêtes/minute pour rejoindre.
- Le total de tokens/par seconde traités évolue directement avec la puissance de calcul dans le swarm, avec Agora optimisant constamment pour faire le meilleur usage possible du matériel présent.
© Pluralis
-
Mais ;
- 133 contributeurs externes au total apportant des 4090, 5090, L40S/RTX 6000 et RTX 6000 Pros. Ce sont des cartes que les gens possèdent réellement - il n'y a pas de H100, B200, etc.
- Le nombre maximal de nœuds que le système peut supporter (104) a été rempli presque immédiatement. La couche d'autorisation reçoit environ 100 requêtes/minute pour rejoindre.
- Le total de tokens/par seconde traités évolue directement avec la puissance de calcul dans le swarm, avec Agora optimisant constamment pour faire le meilleur usage possible du matériel présent.
© Pluralis
