OpenAI avduker nytt AI-vertkøy for 3D-modellering

OpenAI avduker nytt AI-vertkøy for 3D-modellering
Dette AI-verktøyet lover å skulle omskape tekst til 3D-rendering på bare et par minutter – men det har sine begrensninger. (Foto: Shutterstock.com / rafapress)

OpenAI, forskningslaboratoriet som forsker på kunstig intelligens, har offentliggjort opplysninger om sin nyeste teknologi – en teknologi som vil by på store fremskritt for 3D-rendering.

OpenAI er selskapet som står bak tekst-til-bilde-generatoren DALL-E og den minst like populære AI-drevne tekstgeneratoren (Åpnes i ny fane) ChatGPT. Nå har de rettet oppmerksomheten mot oversettelse av tekstsnutter til tredimensjonale punktskyer. Dette verktøyet får navnet POINT-E.

Ifølge et dokument (Åpnes i ny fane) publisert av OpenAI, skaper POINT-E «tredimensjonale skymodeller på bare 1-2 minutter på bare ett skjermkort», sammenlignet med andre eksisterende løsninger som bruker mange timer og krever flere skjermkort.

OpenAI POINT-E

Et sitat fra dokumentet beskriver POINT-Es innledende posisjon i 3D-modelleringens verden:

«Selv om vår metode kommer til kort mot dagens mest avanserte løsninger når det gjelder kvaliteten man får, går det ekstremt mye raskere å generere, slik at man i mange situasjoner får en fornuftig avveining.»

Systemet genererer én visning av et bilde skapt på bakgrunn av en innskrevet tekst. Deretter genereres det en 3D-sky, noe som er langt mindre krevende å sette sammen. Dermed synker kravet til antall skjermkort. Man går også glipp av mange detaljer, og får veldig enkle modeller.

En sekundær AI er blitt opplært til å kompensere for noe av dette, men det fortelles at metoden «tidvis kan overse tynne eller små deler av objekter», som for eksempel plantestengler, slik at blomster ser ut til å sveve i luften.

OpenAI oppgir å ha trent opp den kunstige intelligensen på mange millioner 3D-modeller og deres metadata, men for øyeblikket har systemet selv skapt relativt få modeller.

Et eksempel på en fremtidig anvendelse, er objekter man kan 3D-printe. Og når systemet utvikler seg og bli mer avansert, vil det trolig bli benyttet i mer avansert bruk, som i spill – og til og med i TV-produksjoner.

Prosjektets åpne kildekode er tilgjengelig på GitHub (Åpnes i ny fane),  

Geir Tandberg Steigan

Skribent, forfatter og illustratør med en spesiell forkjærlighet for produkter og brukergrensesnitt fra Apple. 

Med bidrag fra