Većina promjena OpenAI-ja u ChatGPT-u uključuje ono što bot koji pokreće AI može učiniti : pitanja na koja može odgovoriti, informacije kojima može pristupiti i poboljšane temeljne modele . Ovaj put, međutim, mijenja se način na koji koristite sam ChatGPT. Tvrtka izbacuje novu verziju usluge koja vam omogućuje da AI bot pokrenete ne samo upisivanjem rečenica u tekstualni okvir, već i govorom naglas ili samo učitavanjem slike.

Nove značajke će biti dostupne onima koji plaćaju ChatGPT u sljedeća dva tjedna, a svi ostali će to dobiti “vrlo brzo”, prema OpenAI-ju.

Dio glasovnog chata prilično je poznat: dodirnete gumb i izgovorite svoje pitanje, ChatGPT ga pretvara u tekst i šalje u veliki jezični model, dobiva odgovor, pretvara ga natrag u govor i izgovara odgovor naglas. Trebao bi se osjećati kao da razgovarate s Alexom ili Google Assistantom, samo što će – nada se OpenAI – odgovori biti bolji zahvaljujući poboljšanoj osnovnoj tehnologiji.

Čini se da se većina virtualnih asistenata ponovno gradi kako bi se oslanjala na LLM – OpenAI je samo ispred ostalih.

Odličan OpenAI- jev model Whisper obavlja velik dio pretvorbe govora u tekst, a tvrtka izbacuje novi model teksta u govor za koji kaže da može generirati “zvuk poput ljudskog iz samo teksta i nekoliko sekundi uzorka govora. ” Moći ćete birati glas ChatGPT-a između pet opcija, ali čini se da OpenAI misli da model ima puno više potencijala od toga.

Činjenica da možete izgraditi sposoban sintetički glas sa samo nekoliko sekundi zvuka također otvara vrata za sve vrste problematičnih slučajeva upotrebe. “Ove mogućnosti također predstavljaju nove rizike, kao što je mogućnost zlonamjernih aktera da se lažno predstavlja” kažu iz OpenAI-a

Pretraživanje slika, u međuvremenu, pomalo je poput Google Lensa . Vi fotografirate sve što vas zanima, a ChatGPT će pokušati otkriti što pitate i odgovoriti u skladu s tim. Također možete upotrijebiti alat za crtanje u aplikaciji kako biste razjasnili svoj upit.

Izvor: bajtbox.com