Dall-e, Adimen Artifizialaren erronka berriak

 In Berrikuntza Teknologikoa eta Sistema Adimendunak

Sarrera hau beste hizkuntza hauetan dago eskuragarri: English, Español

Sortu irudi errealistak modu naturalean adierazitako kontzeptuetatik, hala nola “astronauta bat zaldi gainean” edo “munstro baten itxura duen zopa-ontzi bat”. Eta imajina dezakezun edozer, surrealista bada ere. Hori da Dall-E 2-k egiten duena, adimen artifizialaren (AI) sistemen azken garapena Elon Musk-ek sortu zuen OpenAIk iragarritako ikerketa eta garapen konpainiak.

Izan ere, testu edo gako-hitzetatik irudiak sortzen dituzten antzeko aplikazioak eta AI sistemak ikusi ditugu. Baina Dall-E azken maketak sortutako irudiek ez dute jendea axolagabe uzten, bere kalitateari eta errealismoari esker, baita estilo surrealistari esker.

Dall-E izenak Pixar Wall-E pertsonaiaren eta Salvador Dalí maisu surrealistaren izenak uztartzen ditu. Tresna publikoarentzat gaitu berri da, erregistratu eta gozatu besterik ez dugu egin behar zuentzako era guztietako irudiak sortzeko.

Konpainiak Dall-E-k kontzeptuak, funtzioak eta estiloak esaldi labur batean konbinatuz sortzen dituen irudien adibideak partekatu zituen. Hala, “plastilinazko munstro baten itxura duen zopa katilu” esaldiak sortuko luke irudi hori eta bere aldaerak.

 

 

“Buztinez egindako munstro baten itxura duen zopa-ontzi bat” esaldia interpretatzean AI Dall-E-k sortutako irudia. Irudia: OpenAI

Aldiz, “artilez puntuz egindako munstro baten itxura duen zopa-ontzi bat” beste irudi hau-eta bere aldaerak sortuko luke.

Dall-E adimen artifizialak “artilez puntuz egindako munstro baten itxura duen zopa-ontzi bat” esaldiaren harira sortutako irudia. Irudia: OpenAI

Dall-E-k nola funtzionatzen duen

Dall-E-ren sare neuronalak “dagoeneko ikasten du irudien eta haiek deskribatzen dituen testuaren arteko erlazioa”, azaldu dute ikertzaileek. “Objektu indibidualak, zaldiak edo astronautak, adibidez, ulertzen ez ezik”, esan dute, “objektuak eta mugimenduak elkarren artean nola erlazionatzen diren” ere ulertzen zuen. Honela Dall-E-k “jakin” zuen astronautak zaldiz zaldiz zihoazen modu errealistan irudikatzen. Dall-E irudia sortzeko, “difusioa” izeneko prozesu bat erabiltzen du, lehenik ausazko puntuen eredu bat berrantolatu eta nahi den emaitza lortu arte, “lehen existitzen ez zen mapa” bat sortuz.

Ikertzaileentzat, Dall-Eren garapenak hiru oinarrizko baldintza betetzen ditu IA “erabilgarri eta segurua” garatzeko:

Publikoak orain arte ezinezkoa zen moduan adierazteko aukera ematen du. Horrek agerian uzten du AI sistemak idatziz galdetutakoa “ulertu” ote zuen edo, aitzitik, ikasitakoa errepikatu zuen besterik ez ote zuen.

AI sistemek mundua nola ikusten eta ulertzen duten ulertzen laguntzen du. Duela urtebete baino gehiago kaleratutako Dall-E-ren lehen bertsioarekin alderatuta, Dall-E-k 2 funtzio berri gehitzen ditu eta irudien ulermena eta kalitatea eta konplexutasuna hobetzen ditu, baita sortzen diren abiadura ere.

Lehendik dauden argazkiak atera eta aldaera konplexuak sor ditzakezu, hala nola erretratuaren angelua eta estiloa aldatzea.

Lehendik dagoen irudi bat editatzeko aukera ematen du objektu bat beste batekin ordezkatzeko, jatorrizko irudian ez dauden objektuak gehitzeko, estiloak, itzalak, islak eta ehundurak kontuan hartuta. Irudiaren esanahia ere alda dezakezu.

Testuinguru akademikoan, baliagarria izan daiteke infografia eta aurkezpenetan adierazi nahi dugunarekin ehuneko altuan bat datozen irudiak erabili ahal izatea eta egile-eskubideen mende egon daitezkeen irudiak aurkitzeko sarean bilaketa aspergarriak ekiditea.

Dall-E-ren erabileraren mugak

Duela gutxi arte, bere erabilgarritasuna mugatzeaz gain (orain erregistroan irekita dago publiko orokorrarentzat), OpenIAk muga batzuk ezarri ditu bere AI eredu berrien erabileran. Murrizketa hauek tresnaren erabilera kaltegarria edo abusua saihestea dute helburu.