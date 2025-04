Microsoft sta potenziando la sua piattaforma Copilot Studio con una nuova funzionalità chiamata “computer use”, che conferirà agli agenti IA la capacità di interagire autonomamente con siti web e applicazioni desktop, senza necessità di intervento umano.

Questo aggiornamento permetterà all’intelligenza artificiale di cliccare pulsanti, navigare tra i menu e digitare nei campi di testo, agendo come un vero e proprio utente digitale. In pratica, le aziende potranno sviluppare agenti IA in grado di comprendere e usare qualsiasi interfaccia grafica, trattandola come uno strumento da utilizzare in autonomia.

Il risultato? Un salto di qualità nell’automazione dei processi, con una maggiore efficienza nell’interazione con software legacy, piattaforme gestionali e applicativi web, riducendo drasticamente la necessità di script complessi o di input manuale.

“Uso del computer”

Microsoft sta rendendo la sua piattaforma di intelligenza artificiale Copilot Studio ancora più autonoma, introducendo una nuova funzione chiamata "computer use" che consente agli agenti IA di interagire direttamente con applicazioni desktop e siti web, senza alcun intervento umano. La novità permette alla piattaforma di cliccare pulsanti, selezionare menu e digitare nei campi visibili sullo schermo, simulando l’utilizzo manuale dei software.

Secondo quanto dichiarato da Charles Lamanna, vicepresidente per la divisione Business & Industry Copilot di Microsoft, l’obiettivo è fornire agli utenti aziendali strumenti più intelligenti e versatili per raggiungere i propri obiettivi operativi e legati all’IA. “Copilot Studio è la piattaforma end-to-end per agenti, pensata per aiutare le organizzazioni a raggiungere i propri obiettivi operativi e legati all'IA. Vogliamo permettere agli utenti di ottimizzare i processi, migliorare la produttività e alimentare l'innovazione,” ha scritto Lamanna in un post sul blog ufficiale.

La funzione “computer use” sarà utile soprattutto nei casi in cui non esistano API ufficiali per connettersi ai software. In questi scenari, l’agente IA potrà comunque operare sui sistemi come farebbe un utente umano, riconoscendo automaticamente eventuali modifiche all’interfaccia dell’applicazione o del sito web. Il supporto è già garantito per i principali browser, inclusi Edge, Chrome e Firefox, e la funzione può essere impiegata sia con app desktop sia con soluzioni web-based.

Il sistema funziona in tempo reale grazie a strumenti di ragionamento integrati che permettono agli agenti di prendere decisioni in autonomia, consentendo agli sviluppatori di continuare a lavorare senza interruzioni. Lamanna ha indicato alcuni possibili ambiti di applicazione, come l’inserimento automatico di grandi volumi di dati da fonti diverse in un sistema unico, la raccolta di informazioni da più fonti online per ricerche di mercato, o l’elaborazione più rapida e accurata delle fatture.

Poiché l’infrastruttura è completamente gestita da Microsoft, non è richiesto alcun server aggiuntivo da parte dell’utente, e sono già incluse le misure di sicurezza e conformità previste da Copilot Studio. Il debutto ufficiale della funzione è previsto durante la conferenza Microsoft Build di maggio 2025. L’annuncio segue l’introduzione di “Actions” nella versione commerciale di Copilot, una funzione che consente di portare a termine automaticamente operazioni come prenotazioni di ristoranti, acquisti online o prenotazioni di eventi.