aiagentrank.io
20 agents · capability hub

AI agents with vision2026

Agents qui voient — lisent des captures d'écran, parsent des graphiques, comprennent des layouts UI, interprètent des diagrammes. Requis pour tout agent qui interagit avec des logiciels conçus pour humains.

Want the technical definition? Read the vision glossary entry →

The 20 agents that ship vision

  • Anthropic Computer UseClaude 3.5 SonnetB70

    Claude doté de la capacité d'utilisation de l'ordinateur — il perçoit l'écran, déplace le curseur, saisit du texte et navigue dans les applications de façon autonome.

    ⚙️OpsAutonomeFreemium · à partir de 20 $
    Browser UseTool UseVisionMemory
    216k22 oct. 2024anthropic.com
    Demo · hover to play
  • L'agent d'interface générative de Vercel — concevez et déployez des composants React en langage naturel.

    💻CodeSemi-autonomeFreemium · à partir de 20 $
    Exécution de codeTool UseVision
    199k4 mars 2025v0.dev
    Demo · hover to play
  • Avatars vidéo IA — transformez du texte ou de l'audio en clips parlants avec des présentateurs photoréalistes.

    📣MarketingAssistantAbonnement · à partir de 6 $
    VisionVoixTool Use
    135k10 juin 2024d-id.com
    Demo · hover to play
  • Constructeur vibe-coding pour non-développeurs — créez une application full-stack par simple instruction et déployez-la sur une URL live en quelques minutes.

    💻CodeAutonomeFreemium · à partir de 20 $
    Exécution de codeTool UseVision
    125k10 avr. 2025lovable.dev
    Demo · hover to play
  • Le constructeur IA dans le navigateur de StackBlitz — génère et déploie de vraies applications Node.js à partir d'une seule instruction.

    💻CodeSemi-autonomeFreemium · à partir de 20 $
    Exécution de codeTool UseVision
    98k20 mars 2025bolt.new
    Demo · hover to play
  • Agent IA personnel qui navigue sur le web à votre place — réserve des vols, remplit des formulaires, exécute des tâches de façon autonome.

    ⚙️OpsAutonomeFreemium · à partir de 20 $
    Browser UseTool UseVisionMemory
    27k20 mars 2025multion.ai
    Demo · hover to play
  • Vidéo IA personnalisée à grande échelle — clone une vidéo en milliers de versions adaptées à chaque spectateur.

    📣MarketingAutonomeAbonnement · à partir de 99 $
    VisionVoixTool Use
    23k19 févr. 2025tavus.io
    Demo · hover to play
  • Comptable fournisseurs autonome — lit les factures, code les comptes du grand livre, route les approbations et les enregistre dans votre ERP.

    ⚙️OpsAutonomeAbonnement
    VisionTool UseMemory
    19k14 janv. 2025vic.ai
    Demo · hover to play
  • Agent IA piloté par navigateur — exécute des workflows multi-étapes sur de vraies applications web comme le ferait un humain.

    ⚙️OpsAutonomeAbonnement
    Browser UseTool UseMemoryVision
    15k4 avr. 2025adept.ai

Frequently asked

What is vision in AI agents?+

La capacité d'un agent à comprendre et raisonner sur des images, captures d'écran, diagrammes et layouts UI.

Which AI agents support vision?+

20 agents in our index ship vision. The list above is sorted by community interest; OpenAI Operator, Microsoft Copilot, Anthropic Computer Use are the most-researched in 2026.

How do I evaluate vision in an AI agent?+

Look for: (1) reliability across edge cases, not just demo videos; (2) how the agent recovers when vision fails mid-task; (3) whether vision is the default mode or an opt-in feature. Production-ready agents publish vision benchmarks; demos and screenshots aren't enough.

Explore other capabilities
AI agents with vision in 2026: 20 compared · AI Agent Rank