NOONIC
Guide 5 min lettura

Computer Use: cosa è, come funziona e quando ha senso negli agenti AI

Gli agenti AI di nuova generazione possono vedere lo schermo, muovere il mouse, cliccare e scrivere come una persona. Significa automazione su qualsiasi software — anche legacy senza API. Cosa è il 'computer use', i provider, 3 use case PMI e quando ha senso (e quando no).

Computer Use negli agenti AI — back-office automatizzato senza API

C'è un problema classico di automazione aziendale: hai un gestionale degli anni '90 (o un portale fornitori senza API, o un'applicazione legacy custom) e devi inserirci dati a mano. Ogni giorno. Per ore.

Le RPA tradizionali (UiPath, BluePrism, Automation Anywhere) funzionano, ma sono fragili: cambia un pixel del bottone, lo script si rompe.

Una nuova generazione di agenti AI risolve il problema in modo radicalmente diverso. Si chiama computer use.

Cosa è il "computer use"

Computer use è la capacità di un agente AI di interagire con un computer come farebbe un umano:

  1. Vede lo schermo via screenshot
  2. Decide cosa fare ("apri questo menu, clicca lì, inserisci questo testo")
  3. Agisce muovendo mouse e tastiera

Nessuna API, nessun selettore CSS fragile, nessuna registrazione step-by-step. L'agente guarda l'interfaccia e lavora come una persona che ha appena imparato a usare quel software.

I provider principali

Negli ultimi 18 mesi diversi vendor hanno rilasciato implementazioni di computer use:

  • Anthropic — Computer Use API (Claude): la prima implementazione mainstream (ottobre 2024). Maturità maggiore in ambienti general-purpose.
  • OpenAI — Operator: agente browser dedicato per task web (gennaio 2025).
  • Google — Gemini con tool use visuale: capacità simili integrate nei modelli Gemini.
  • Soluzioni specializzate: Browserbase, Skyvern, Adept, Multi-on — focalizzate su web automation.

I provider differiscono per:

  • Scope: solo browser (Operator, Skyvern) vs intero OS (Claude Computer Use)
  • Affidabilità su task complessi: ancora variabile, ma in rapido miglioramento
  • Pricing: pay-per-action vs subscription

Per use case PMI italiani, le scelte più mature al momento sono Claude Computer Use (per task desktop/OS-level) e Browserbase (per task web-only ad alto volume).

Perché è diverso da una RPA classica

Le RPA classiche fanno registrazione step-by-step: clicca X, Y, Z. Sono rigide.

Computer use ragiona: "Devo creare un ordine cliente. Vedo il menu File. Clicco Nuovo Ordine. Compilo i campi che vedo. Se manca un dato lo chiedo, se c'è un errore lo gestisco".

Tre differenze chiave:

Aspetto RPA classica Computer Use AI
Setup Settimane di "registrazione" Istruzioni in linguaggio naturale
Robustezza Si rompe se cambia UI Si adatta a piccole variazioni
Decisioni Solo flussi pre-definiti Può gestire eccezioni
Costo Licenze enterprise + sviluppatori RPA API agente + infrastruttura

3 use case PMI concreti

1. Inserimento ordini da PDF/email a gestionale legacy

Una PMI riceve 150 ordini al giorno via PDF/email dai clienti. Ognuno va inserito a mano in un gestionale custom degli anni 2000 senza API.

Computer use: legge il PDF, apre il gestionale, naviga al modulo ordini, inserisce dati, salva. Tutto autonomamente. Se incontra un'ambiguità (es. codice articolo non trovato), sospende e chiede a un operatore via Slack.

Saving tipico: 2-3 FTE liberati per attività a valore aggiunto.

2. Riconciliazione fatture passive con DDT

Reparto amministrazione: deve confrontare ogni fattura passiva con il DDT corrispondente nel gestionale. Ricerca manuale, click, click, click.

L'agente apre la fattura, apre il gestionale, cerca il DDT, confronta importi e quantità, segnala discrepanze. Lavora di notte, riempie un Excel di anomalie pronte per il revisore la mattina.

Tempo dimezzato: il revisore controlla solo le anomalie, non l'intero ciclo.

3. Aggiornamento listino su portale fornitore

Hai un fornitore che pubblica i suoi prezzi su un portale web senza export. Vai sul portale, scorri 200 articoli, copi i prezzi, aggiorni il tuo gestionale.

L'agente accede al portale, scorre, estrae, aggiorna il tuo sistema. Setup in mezza giornata, parte schedulato ogni notte.

Quando ha senso (e quando no)

Ha senso quando:

  • Il software è legacy e non ha API
  • Il volume di task è alto (>50/giorno)
  • Le variabili sono limitate (eccezioni gestibili con escalation umana)
  • Una RPA tradizionale costerebbe più di una soluzione AI

Non ha senso quando:

  • Il software HA un'API: meglio usare quella (più veloce, più affidabile, più economica)
  • Il task richiede creatività o giudizio business (es: prezzi negoziati)
  • I dati sono sensibili e non possono essere visti da un modello cloud (anche se alcuni provider offrono deployment on-prem)
  • Hai meno di 20 task/giorno: il payback non c'è

Sicurezza e governance

Tre considerazioni serie per chiunque metta computer use in produzione:

  1. Sandbox: l'agente deve girare su una VM isolata, mai sulla macchina del CFO o sull'host di produzione.
  2. Audit log: ogni azione tracciata (timestamp, screenshot, intent, output). Per debug e compliance.
  3. Allowlist: limitare quali applicazioni l'agente può aprire/usare. Niente browser libero, niente accesso al filesystem.

Se vuoi mettere computer use in produzione su un processo critico, investi una settimana in queste safety net prima di scalare.

Costi e ROI tipico

  • Setup: €4-10k per processo (definizione, prompting, safety net, deploy)
  • Operativo: €0.5-2/transazione (token modello + infrastruttura)
  • ROI: tipicamente 4-8 mesi vs un FTE addetto allo stesso task

Sotto le 50 transazioni/giorno il payback è più lento. Sopra le 200, è quasi immediato.

Come iniziare

  1. Mappa un processo ripetitivo che assorbe almeno 4 ore/giorno di tempo umano.
  2. Verifica che non abbia un'API più semplice (a volte si scopre che sì, e va usata).
  3. Scegli il provider in base al tipo di task:
    • Browser-only ad alto volume → Browserbase, Skyvern
    • Desktop/OS-level → Claude Computer Use
    • Workflow misti → valutazione tecnica
  4. Pilot: implementa il flusso con escalation umana attiva (l'agente sospende sempre prima di salvare).
  5. Monitor 2-4 settimane: misura tasso di successo, tipologia errori.
  6. Scala: progressivamente riduci l'escalation manuale per i casi più stabili.

La nostra opinione

Computer use non sostituisce le API dove le API esistono. Ma è la prima tecnologia che rende economicamente sensato automatizzare software legacy e portali web senza esposizione tecnica.

Per una PMI italiana con processi back-office su gestionali datati, è probabilmente la singola opportunità AI con ROI più immediato disponibile oggi.


Hai un processo che gira su software legacy e ti chiedi se computer use lo automatizza? Parla con noi, ti diciamo subito se ha senso o no.