Zum Beispiel kann es Tastenanschläge, Mausklicks und die Bewegung des Cursors über den Bildschirm simulieren.
Anthropic hat die "Computer Usage" API veröffentlicht, die laut TechCrunch für offene Beta-Tests verfügbar ist. Mit dieser API kann das Modell mit einem Computer "wie ein Mensch" interagieren: Es kann den Bildschirm "sehen", den Cursor bewegen, Tasten "drücken" und die Maustaste "klicken". Sonnet 3.5 kann jede Anwendung und Daten auf dem Computer nutzen. Um das Modell eine Aufgabe ausführen zu lassen, muss man ihm einfach einen Befehl geben, wie zum Beispiel das Ausfüllen eines Formulars durch Zugriff auf Dateien auf dem Computer. Alle Aktionen werden in einem speziellen Fenster sichtbar sein.
TechCrunch merkt an, dass das Modell derzeit Schwierigkeiten mit komplexen Aufgaben hat: Zum Beispiel gelang es ihm in weniger als 50% der Fälle, eine Ticketreservierung zu ändern. Und bei der Aufgabe, eine Reservierung zu stornieren, scheiterte es etwa ein Drittel der Zeit. Anthropic weist darauf hin, dass das Modell auch andere Probleme hat: Es funktioniert schlecht beim "Scrollen" und Zoomen und überspringt manchmal Aufgaben. Das Unternehmen warnt Entwickler, dass das Modell langsam ist und seine Nutzung zu Fehlern führen kann, daher empfehlen sie, mit risikoarmen Aufgaben zu beginnen.