GPT-4o, den nyeste flaggskipmodellen fra OpenAI, har mottatt blandede følelser fra brukere. Mens noen er imponert over dens hastighet og multimodale evner, er andre skuffet over det faktum at den ikke viser noen forbedringer i intelligens og resonnement i forhold til GPT-4. Men enten du er team «blown away» eller team «meh», er det fortsatt vanskelig å ignorere det faktum at GPT-4o sine multimodale evner er en game changer.
Her er visse måter GPT-4o vil kunne hjelpe deg etter at OpenAI lanserer de nye stemme- og synsfunksjonene.
Læringspartner/ veileder
Med GPT-40s evner kan det være den perfekte læringspartneren eller en veileder. Du kan bruke den til å lære språk eller få hjelp til å løse matematikkoppgaver. Du kan peke på objekter for å få hjelp med språklæring eller dele matematikkspørsmålene dine med det. Det vil ikke bare dele ut svarene til deg eller gjøre leksene dine for deg.
https://www.youtube.com/watch?v=_nSmkyDNulk
Det kan lage en rekke spørsmål for å hjelpe deg å forstå konseptet og komme til problemløsningsdelen selv, som en ekte veileder. Dessuten, med sine avanserte evner, er den i stand til å håndtere en situasjon «empatisk». Så mens den veileder deg, kan den vise utrolig tålmodighet og empati, dytte deg i riktig retning uten å bli frustrert. For mange mennesker kan det noen ganger være ganske vanskelig å få til i det virkelige liv.
De videre applikasjonene langs linjen er enda mer spennende, hvis du kunne bruke GPT-4o på smarte briller (som tar ideen fra Googles Project Astra) for alltid å ha læringspartneren din ved din side.
Få hjelp med intervjuforberedelse
ChatGPT, drevet av GPT-4o, kan være den ultimate partneren når det gjelder å forberede seg til intervjuer. Mens du allerede kunne simulere en frem og tilbake samtale med ChatGPT for å forberede deg til et intervju, og det kunne hjelpe til med å finne de tekniske aspektene ved det ganske fantastisk, var ikke prosessen like naturlig på grunn av faktorer som latens og fravær av multimodalitet i ChatGPTs kjerne.
Men med sine forbedrede resonneringsevner på tvers av stemme og syn, kan den gå et skritt lenger enn å hjelpe deg. For det første, med sin nye evne til å «se» deg, kan den til og med veilede deg med den estetiske delen av å gjøre deg klar til intervjuet, som antrekket ditt.
https://www.youtube.com/watch?v=wfAYBdaGVxs
Imidlertid er implikasjonene mye mer virkningsfulle. Med sine visuelle evner og sin evne til å tolke menneskelige følelser, kan den til og med gi deg tilbakemelding på kroppsspråket ditt, omtrent som en ekte coach.
Møteassistent
ChatGPT kan delta i møtene dine, lytte til samtalene dine og transkribere, oppsummere og til og med presentere sine meninger, alt i sanntid, som en ekte assistent.
Du kan spørre den hva som ble diskutert i samtalen, hva hver persons holdning var til et bestemt synspunkt, identifisere motstridende synspunkter, arbeide med dataanalyseproblemer, slå opp bestemt informasjon og mye mer.
Personlig språkoversetter
GPT-4o kan være en utmerket språkoversetterassistent. Den kan oversette en samtale i sanntid, uten at du trenger å be om den flere ganger. Så du kan ha en normal samtale på forskjellige språk, og hver gang en høyttaler er ferdig med å snakke, vil ChatGPT oversette den til det andre språket.
Hvordan er det forskjellig fra å bruke Google Translate eller et annet oversettelsesverktøy? Bortsett fra det faktum at du ikke trenger å slå på oversettelse hver gang og det holder samtalen naturlig, betyr GPT-4os evne til å forstå intonasjonen bak ordene at mindre går tapt i oversettelsen.
Tilgjengelighetsassistent for blinde
ChatGPT-4o, med sine synsevner, kan hjelpe synshemmede ved å se på omgivelsene dine for deg og beskrive det hele for deg.
https://www.youtube.com/watch?v=KwNUJ69RbwY
Selv om det virker ganske ambisiøst i sin nåværende tilstand, forestill deg implikasjonene hvis du kunne ha GPT-4o i smarte briller, som Meta Rayban-briller, der GPT-4o bokstavelig talt kan være øynene for en synshemmet person. Selv i den nåværende formen er det ganske utrolig at folk kan rette telefonens kamera mot noe, og det kan gi alle detaljene.
Hvis ChatGPT kunne bli i stand til å tolke tegnspråk, kan det til og med hjelpe døve i fremtiden.
Overvåkingsevner
ChatGPT-4o kan «potensielt» brukes til å overvåke barn, kjæledyr, syke og eldre, eller til og med bare ting som inngangsdører osv. Tenk deg at du må gå bort et øyeblikk og du vil at noen skal overvåke barnet ditt eller kjæledyret ditt og varsle deg med en gang hvis de deltar i farlige aktiviteter (som du kan definere).
Selv om det vil ta litt tid før du kan stole på at AI ikke gjør feil og leverer pålitelige resultater hver gang, er det definitivt et spennende mulig bruksområde for fremtiden.
Kodeassistent
Med ChatGPT som kan få tilgang til skjermen din med skjermdeling, kan du ha en kodeassistent ved din side og veilede deg gjennom. Selv om det vil være nyttig med andre apper også, med GPT-4o sine forbedrede kodingsmuligheter, vil det å få hjelp til koding være den beste applikasjonen.
Dataanalyse
GPT-4o har fantastiske forbedringer i hastighet i forhold til GPT-4 Turbo, og den bringer denne hastigheten til dataanalyse også. Den kan behandle regneark, analysere data og til og med lage statistiske diagrammer, grafer og diagrammer på mindre enn 3o sekunder.
Lage 3D-modeller
GPT-4o kan til og med lage STL-filer for 3D-modeller fra enkle tekstmeldinger, noe som øker hastigheten på visualiserings- og prototypeprosessen. Så, enten du ønsker å øke hastigheten på arbeidsflyten din eller om du ikke har den tekniske kunnskapen ellers som kreves for denne oppgaven, kan ChatGPT hjelpe deg!
Jeg brukte GPT-4o til å lage STL-fil for 3D-modell på ~ 20 sekunder på telefonen min. Ganske bemerkelsesverdig hva du kan generere med AI og enkel spørsmål nå. pic.twitter.com/2fbObrpPol
— Min Choi (@minchoi) 14. mai 2024
Opprette konsistente karakterer
OpenAI introduserte DALL-Es bildegenereringsmuligheter til ChatGPT for en stund tilbake. Men med GPT-4o kan du lage flere bilder av samme karakter mens du opprettholder karakterkonsistensen. Så du kan nå bruke ChatGPT for å lage konsistente karakterer for historiene dine, og det kan lage bilder av det i forskjellige handlinger.
Transkribere håndskrevne notater
Med GPT-4os økte muligheter innen bildegjenkjenning, kan den nå transkribere håndskrevne notater bedre. Du kan bruke den til å digitalisere notatene på skolen eller høyskolen. Den demonstrerer til og med fantastiske transkripsjonsevner mens den håndterer håndskrevne brev fra det attende århundre. Så selv om det vil være feil, vil det også feste hele prosessen eksponentielt!
GPT-4o er virkelig bemerkelsesverdig på 18. håndskrift. Jeg ga det følgende brev og ba det om en transkripsjon. Et par svært små feil … utrolig! pic.twitter.com/3JevZvd5p5
— Generativ historie (@HistoryGPT) 14. mai 2024
Mens GPT-4o ikke er en stor oppgradering over GPT-4 når det gjelder intelligens og resonnement, er det heller ikke en liten oppgradering på noen måte. Selv om du er en som er mer skremt av dens antropomorfisme eller dens likheter med Scarlett Johannsens AI i Her, kan du ikke nekte for at det faktum at det har blitt smartere, vil være nyttig på praktiske måter.
Det er imidlertid også et annet faktum som ikke kan overses når man vurderer praktiske applikasjoner for GPT-4o – ChatGPTs 128K kontekstvindu. Med et begrenset kontekstvindu kan ChatGPT bare være så nyttig i scenarier som å være møteassistent, språkoversetter. Spørsmålet om hvor lang tid inn i møtet/samtalen ville ChatGPTs kontekstvindu løpe ut er ekstremt gyldig. Det er også spørsmålet om begrensede brukshetter for GPT-4o.
Legg att eit svar