Cos'è
Browser Use è una libreria open-source, scritta principalmente in Python, che permette a modelli di linguaggio (LLM) di controllare un browser reale per svolgere attività sul web. Il progetto è ospitato su GitHub all'indirizzo browser-use/browser-use ed è rilasciato sotto licenza MIT. È stato creato da Magnus Müller e Gregor Žunič, due studenti di data science dell'ETH di Zurigo, all'interno dell'acceleratore Student Project House, con un primo prototipo realizzato tra la fine del 2024 e l'inizio del 2025.
L'obiettivo dichiarato è rendere i siti web "accessibili" agli agenti artificiali: invece di richiedere script dettagliati che interagiscono con selettori DOM specifici, Browser Use permette di descrivere un compito in linguaggio naturale e lascia che sia il modello a decidere le azioni successive, come cliccare un pulsante, compilare un modulo o estrarre dati. Il progetto ha ottenuto una notevole visibilità nella comunità degli sviluppatori AI ed è parte del batch invernale 2025 di Y Combinator.
Il problema che risolve
L'automazione tradizionale del browser si basa su strumenti come Selenium, Puppeteer o Playwright, che richiedono di scrivere codice imperativo con selettori precisi per ogni elemento con cui interagire. Questo approccio funziona, ma è fragile: un aggiornamento del layout, una modifica agli ID o una nuova struttura della pagina possono interrompere gli script e imporre costose attività di manutenzione. Inoltre, la gestione di flussi multi-step, autenticazioni, stati di sessione e contenuti dinamici rende la scalabilità dell'automazione complessa.
Browser Use affronta questo problema spostando la logica decisionale sul modello di linguaggio. L'utente definisce l'obiettivo in forma dichiarativa, mentre il sistema si occupa di interpretare lo stato della pagina, pianificare le azioni ed eseguirle. Questo riduce la dipendenza da selettori statici e rende l'automazione più adattabile a siti che cambiano frequentemente, pur richiedendo supervisione e valutazione dei risultati.
