OpenAI, en tungviktare inom generativ artificiell intelligens, förhandsvisade på torsdagen en AI-agent som kan utföra uppgifter på webben åt användare, i ett försök att förbättra sin chatbot i den allt hårdare konkurrensen.

Verktyget, som kallas Operator, drivs av en modell som gör det möjligt för den att interagera med skärmknappar, menyer och textfält.

"Denna förmåga markerar nästa steg i AI-utvecklingen, vilket gör det möjligt för modeller att använda samma verktyg som människor förlitar sig på dagligen och öppnar dörren till ett stort antal nya applikationer", säger företaget i ett blogginlägg.

Operator kan utföra en mängd olika uppgifter, som att skapa att-göra-listor eller hjälpa till med semesterplanering. Den tar också emot användarens input när den anser att en uppgift är slutförd och söker bekräftelse för vissa uppgifter, t.ex. att ange inloggningsuppgifter på en webbplats.

Verktyget är för närvarande tillgängligt för Pro-användare i USA som en förhandsgranskning av forskning, säger den Microsoft-stödda startupen.

Agenter, som är system som kan utföra åtgärder som att göra inköp och schemalägga möten utan direkt mänsklig inblandning, ligger nu i framkant på företagens AI-agenda.

OpenAI-konkurrenten Perplexity lanserade en agentbaserad assistent för Android-enheter tidigare på torsdagen. Denna assistent kan bland annat boka middagsbiljetter, hämta skjuts i appar och ställa in påminnelser.

Förra året införlivade Apple Apple Intelligence i sin röstassistent Siri, och - i ett partnerskap med OpenAI - introducerade iPhone-tillverkaren också användningen av ChatGPT, med användarens tillstånd.

Även om sådana agenter länge har varit svårfångade för forskare, kan framväxten av steg-för-steg-resonemang som de som används i OpenAI:s o1-modell göra sådana uppgifter möjliga, sa företagsledare till Reuters i december.