OpenAI debutta con GPT-5.2 nel tentativo di mettere a tacere le preoccupazioni che stia rimanendo indietro rispetto ai suoi rivali

OpenAI debutta con GPT-5.2 nel tentativo di mettere a tacere le preoccupazioni che stia rimanendo indietro rispetto ai suoi rivali



OpenAI, sotto la crescente pressione competitiva di Google e Anthropic, ha lanciato un nuovo modello di intelligenza artificiale, GPT-5.2, che, a quanto pare, batte tutti i modelli esistenti con un margine sostanziale in un’ampia gamma di attività.

Il nuovo modello, che verrà rilasciato meno di un mese dopo il debutto di OpenAI con il suo predecessore, GPT-5.1, ha funzionato particolarmente bene su un benchmark di compiti professionali complicati in una vasta gamma di “lavori di conoscenza” – dalla legge alla contabilità alla finanza – nonché su valutazioni che coinvolgono codifica e ragionamento matematico, secondo i dati rilasciati da OpenAI.

Riscatto Simol’ex CEO di InstaCart che ora ricopre il ruolo di CEO delle applicazioni di OpenAI, ha detto ai giornalisti che il modello non dovrebbe essere visto come una risposta diretta al modello Gemini 3 Pro AI di Google, rilasciato il mese scorso. Quella versione ha spinto il CEO di OpenAI Sam Altman a farlo emettere un “codice rosso” ritardando l’implementazione di diverse iniziative al fine di concentrare più personale e risorse informatiche sul miglioramento del suo prodotto principale, ChatGPT.

“Direi che (il Code Red) aiuta con il rilascio di questo modello, ma non è questo il motivo per cui uscirà questa settimana in particolare, è in lavorazione da un po’,” ha detto.

Ha detto che la società stava costruendo GPT-5.2 “da molti mesi”. “Non cambiamo questi modelli in una sola settimana. È il risultato di molto lavoro”, ha detto. Il modello era conosciuto internamente con il nome in codice “Garlic”, secondo una storia nell’informazione. Il giorno prima dell’uscita del modello, Altman ne aveva anticipato l’imminente lancio pubblicando sui social media un video in cui cucinava un piatto con una grande quantità di aglio.

I dirigenti di OpenAI hanno affermato che il modello è stato nelle mani di “clienti Alpha” che aiutano a testarne le prestazioni per “diverse settimane”, un periodo di tempo che significherebbe che il modello è stato completato prima della dichiarazione di “codice rosso” di Altman.

Tra questi tester c’erano la startup legale di intelligenza artificiale Harvey, l’app per prendere appunti Notion e la società di software di gestione dei file Scatolacosì come Shopify E Zoom.

OpenAI ha affermato che questi clienti hanno riscontrato che GPT-5.2 ha dimostrato una capacità “all’avanguardia” di utilizzare altri strumenti software per completare le attività, oltre ad eccellere nella scrittura e nel debug del codice.

La codifica è diventata uno dei casi d’uso più competitivi per l’implementazione del modello di intelligenza artificiale all’interno delle aziende. Sebbene OpenAI abbia avuto un vantaggio iniziale in questo spazio, il modello Claude di Anthropic si è rivelato particolarmente popolare tra le imprese, superando, secondo alcuni dati, la quota di mercato di OpenAI. OpenAI spera senza dubbio di convincere i clienti a tornare ai suoi modelli per la codifica con GPT-5.2.

Simo ha affermato che il “Code Red” sta aiutando OpenAI a concentrarsi sul miglioramento di ChatGPT. “Code Red è davvero un segnale per l’azienda che vogliamo concentrare le risorse in un’area particolare, e questo è un modo per definire realmente le priorità e definire le cose a cui può essere deprioritizzata”, ha affermato. “Quindi abbiamo avuto un aumento delle risorse focalizzate su ChatGPT in generale.”

L’azienda ha anche affermato che il suo nuovo modello è migliore di quelli precedenti nel fornire “completamenti sicuri”, che definisce come fornire agli utenti risposte utili senza dire cose che potrebbero contribuire o peggiorare le crisi di salute mentale.

“Dal punto di vista della sicurezza, come avete visto attraverso i parametri di riferimento, stiamo migliorando praticamente ogni aspetto della sicurezza, sia che si tratti di autolesionismo, sia che si tratti di diversi tipi di salute mentale, sia che si tratti di dipendenza emotiva”, ha detto Simo. “Siamo molto orgogliosi del lavoro che stiamo svolgendo qui. È una priorità assoluta per noi e rilasciamo modelli solo quando siamo sicuri che i protocolli di sicurezza siano stati seguiti e ci sentiamo orgogliosi del nostro lavoro.”

Il rilascio del nuovo modello è avvenuto lo stesso giorno una nuova causa è stato presentato contro la società sostenendo che le interazioni di ChatGPT con un utente psicologicamente disturbato avevano contribuito a un omicidio-suicidio nel Connecticut. La società deve affrontare anche diverse altre cause legali secondo cui ChatGPT avrebbe contribuito ai suicidi di persone. La società ha definito l’omicidio-suicidio del Connecticut “incredibilmente straziante” e ha affermato che sta continuando a migliorare “la formazione di ChatGPT per riconoscere e rispondere ai segnali di disagio mentale o emotivo, attenuare le conversazioni e guidare le persone verso il supporto nel mondo reale”.

GPT-5.2 ha mostrato un notevole salto di prestazioni in diversi test benchmark di interesse per i clienti aziendali. Ha raggiunto o superato le prestazioni di esperti umani in un’ampia gamma di compiti professionali difficili, misurati da OpenAI PILval benchmark, il 70,9% delle volte. Ciò rispetto a solo il 38,8% delle volte per GPT-5, un modello rilasciato da OpenAI ad agosto; 59,6% per Claude Opus 4.5 di Anthropic; e 53,3% per Gemini 3 Pro di Google.

Nel benchmark di sviluppo software, SWE-Bench Pro, GPT-5.2 ha ottenuto il 55,6%, quasi 5 punti percentuali in più rispetto al suo predecessore, GPT-5.1, e oltre il 12% in più rispetto a Gemini 3 Pro.

Aidan Clark di OpenAI, vicepresidente della ricerca (formazione), ha rifiutato di rispondere a domande su quali metodi di formazione fossero stati utilizzati per aggiornare le prestazioni di GPT-5.2, anche se ha affermato che la società ha apportato miglioramenti a tutti i livelli, incluso il pre-training, il passo iniziale nella creazione di un modello di intelligenza artificiale.

Quando Google ha rilasciato il suo modello Gemini 3 Pro il mese scorso, i suoi ricercatori hanno anche affermato che la società aveva apportato miglioramenti sia nel pre-allenamento che nel post-allenamento. Ciò ha sorpreso alcuni nel settore che credevano che le aziende di intelligenza artificiale avessero in gran parte esaurito la capacità di ottenere miglioramenti sostanziali dalla fase di pre-addestramento della costruzione del modello, e si è ipotizzato che OpenAI potesse essere stato colto di sorpresa dai progressi di Google in quest’area.



Source link

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Back To Top