ΗOpenAI παρουσίασε ένα νέο εργαλείο με την ονομασίαOperator, το οποίο βασίζεται σε έναν Computer-Using Agent – CUA. Σύμφωνα με την εταιρεία, ο CUA είναι εκπαιδευμένος να αλληλεπιδρά με γραφικές διεπαφές χρήστη (GUIs), όπως κουμπιά, μενού και πεδία κειμένου, με τον ίδιο τρόπο που το κάνουν οι άνθρωποι. Αυτό επιτρέπει στο εργαλείο να εκτελεί ψηφιακές εργασίες χωρίς να βασίζεται σε APIs συγκεκριμένων λειτουργικών συστημάτων ή ιστοσελίδων.
Η πρώτη έκδοση του Operator βασίζεται στο μοντέλο GPT-4o, συνδυάζοντας οπτικές δυνατότητες με «προηγμένη λογική» που έχει αναπτυχθεί μέσω ενισχυτικής μάθησης. Το Operator μπορεί να «διασπά σύνθετα καθήκοντα σε πολυβήματα σχέδια» και να αυτοδιορθώνεται όταν αντιμετωπίζει προκλήσεις, γεγονός που σηματοδοτεί ένα σημαντικό βήμα στην εξέλιξη της τεχνητής νοημοσύνης.
Παρά την πρόοδο, το Operator παραμένει σε πρώιμο στάδιο και δεν είναι ακόμη αξιόπιστο σε όλες τις περιπτώσεις. Για καλύτερα αποτελέσματα, η OpenAI προτείνει στους χρήστες να παρέχουν λεπτομερείς οδηγίες. Αν το εργαλείο «κολλήσει» σε μια εργασία ή αν ζητηθούν ευαίσθητες πληροφορίες, όπως διαπιστευτήρια σύνδεσης, θα παραδίδει τον έλεγχο στον χρήστη. Επίσης, έχει σχεδιαστεί ώστε να απορρίπτει επιβλαβή αιτήματα και να αποκλείει μη επιτρεπόμενο περιεχόμενο.
Το Operator είναι διαθέσιμο σε χρήστες της συνδρομής ChatGPT Pro, που κοστίζει $200 τον μήνα, ενώ συνεργάζεται και με εταιρείες όπως η Instacart για την ενσωμάτωση της υπηρεσίας. Στην ίδια κατηγορία εργαλείων ανήκουν και άλλα συστήματα, όπως το Claude 3.5 Sonnet της Anthropic και το Gemini 2.0 της Google.