Comment fonctionne Agent Rank
Nous évaluons chaque agent de notre catalogue sur six dimensions, additionnons en un score agrégé de 0 à 100 et classons par tiers. La formule est publique, déterministe et réévaluée à chaque déploiement.
Les six dimensions
Autonomy fit
Comment nous le calculons : Dérivé du niveau d'autonomie de l'agent : Assistant → 7, Semi-autonome → 8, Autonome → 9.
Pourquoi : Une autonomie plus élevée n'est pas toujours meilleure, mais c'est ce que les acheteurs demandent. L'écart de +2 points capture cette distinction sans la surpondérer.
Capabilities
Comment nous le calculons : Deux points par capacité native (tool use, exécution de code, RAG, mémoire, vision, voix, browser use, multi-agent). Cinq capacités ou plus plafonnent la dimension à 10.
Pourquoi : L'étendue à travers les types de capacités prédit mieux l'adéquation que la profondeur dans un seul type.
Integrations
Comment nous le calculons : Deux points par catégorie d'intégration distincte (IDE, CRM, ticketing, messagerie, stockage, etc.). Cinq catégories ou plus plafonnent à 10.
Pourquoi : Un agent avec 10 intégrations uniquement sales est moins largement utile qu'un avec cinq intégrations sur trois catégories. Nous récompensons l'étendue des catégories, pas le décompte brut.
Pricing value
Comment nous le calculons : Open source : 10. Gratuit : 9. Moins de 25 $/mois : 8. Moins de 50 $/mois : 7. Moins de 100 $/mois : 6. Moins de 200 $/mois : 5. Plus haut ou contact-sales : 3-4.
Pourquoi : La valeur du pricing n'est pas « le moins cher gagne ». C'est « est-ce que j'obtiens une puissance équitable pour ce que je paie ». L'open source obtient le score le plus élevé parce que la licence est le tier illimité.
Polish & maturity
Comment nous le calculons : Base de 4, plus 1 chacun pour : un numéro de version publié, statut featured, ≥50K vues, ≥150K vues, image ou vidéo d'aperçu produit, plusieurs tiers de pricing. Plafonné à 10.
Pourquoi : Les agents matures et bien connus, avec une surface produit réfléchie, obtiennent de meilleurs scores. Ce sont les signaux qu'une vraie équipe d'ingénierie se trouve derrière le produit.
Verifiability
Comment nous le calculons : Base de 3, plus 4 pour notre badge Vérifié, 2 pour des tiers de pricing rédigés, 1 pour des pros/cons rédigés. Plafonné à 10.
Pourquoi : La vérifiabilité capture la quantité de travail éditorial que nous avons effectué sur la fiche. Un agent que nous avons personnellement examiné, avec un pricing structuré et des pros/cons, bat une fiche placeholder.
Score agrégé
Les six scores par dimension (chacun 1-10) sont additionnés, divisés par 60, multipliés par 100 et arrondis. Le résultat est le score Agent Rank de l'agent.
Classification par tier :
- Tier S : 85 ou plus — tête de catégorie, équilibré sur les six dimensions
- Tier A : 72-84 — solide, avec au plus une dimension faible
- Tier B : 58-71 — correct, avec plusieurs compromis à considérer
- Tier C : moins de 58 — niche ou stade précoce ; examinez le breakdown attentivement
Ce que le score n'est pas
Agent Rank mesure l'adéquation sur nos six dimensions — il ne mesure pas votre adéquation. Un agent tier C peut être parfait pour un workflow spécifique qui valorise une dimension que nous sous-pondérons. Le score est un point de départ ; le tableau breakdown sur chaque page d'agent est là où vit la vraie décision.
Overrides éditoriaux
Pour les agents où le score automatisé diverge visiblement de l'expérience pratique, l'équipe éditoriale peut surcharger une dimension. Tous les overrides sont publics — ils apparaissent dans le tableau par dimension sur la page de l'agent avec une petite note.
Cadence de rafraîchissement
Le score est recalculé à chaque déploiement de ce site. Quand nous ajoutons un tier de pricing, livrons un nouveau bloc pros/cons ou mettons à jour une liste de capacités, le score bouge au prochain déploiement. Les mises à jour majeures du catalogue sont livrées hebdomadairement ; les changements structurels de la formule sont versionnés et annoncés dans notre newsletter.
Les avis utilisateurs sont séparés
Agent Rank est le score éditorial. Les avis utilisateurs de la communauté apparaissent séparément sur chaque page d'agent avec leur propre agrégat. Nous ne les mélangeons pas — ils répondent à des questions différentes (« cet agent est-il bien construit » vs. « les vrais utilisateurs l'ont-ils aimé »).