OpenAI ha annunciato che ChatGPT aggiungerà alle proprie funzioni quella di poter creare immagini fotorealistiche, grazie al nuovo modello GPT-4o. La società cinese DeepSeek ha risposto mettendo a disposizione gratuitamente il suo nuovo modello di IA.

ChatGPT può creare immagini fotorealistiche

L’azienda OpenAI, che ha creato ChatGPT, ha annunciato che il chatbot sarà in grado di inserire all’interno delle proprie risposte immagini anche molto realistiche senza l’aiuto di programmi esterni.

La funzione si chiama ChatGpt Immagini ed è accessibile agli abbonati ChatGpt Plus, Pro e Team, paganti e gratuiti, e in arrivo per quelli Enterprise ed Edu.

Deepseek, tra i concorrenti di ChatGPT

Questa innovazione è stata resa possibile dal nuovo modello omnimodale su cui si basa il chatbot, chiamato GPT-4o. Si tratta del più avanzato modello mai rilasciato da OpenAI, in grado anche di correggere da solo le proprie risposte.

Le immagini di ChatGPT saranno diverse

OpenAI ha specificato che le immagini prodotte da ChatGPT immagini saranno diverse da quelle generate dai suoi concorrenti. Il chatbot utilizzerà un approccio auto-regressivo, invece del modello di diffusione.

Questo permette a ChatGPT, oltre che di produrre immagini fotorealistiche, di inserire testo scritto al loro interno, una funzione che quasi nessun’altra intelligenza artificiale generativa era stata in grado di proporre prima.

Un risultato frutto di “molti mesi di piccoli miglioramenti”, ha sottolineato al sito The Verge, Gabriel Goh, responsabile della ricerca di OpenAI. Le immagini così create non avranno un segno di riconoscimento, ma i loro metadati dimostreranno che sono generate con l’IA per limitare i deepfake.

La risposta di DeepSeek

A questo annuncio di OpenAI ha risposto immediatamente la più grande azienda cinese di intelligenza artificiale generativa, DeepSeek. La società ha lanciato il suo ultimo modello linguistico di grandi dimensioni, V3-0324.

L’intelligenza artificiale è stata aggiornata ed è disponibile sulla piattaforma Hugging Face attraverso una licenza Mit. Questo significa che l’utilizzo commerciale di questo modello sarà gratuito.

Questo nuovo modello sarebbe in grado di funzionare anche su computer commerciali, benché di alta fascia, come il Mac Studio di Apple. DeepSeek sostiene di aver speso solo 5 milioni di dollari per addestrarlo.