Jis pagrįstas GPT-3 kalbos modeliu, kuris gali generuoti nuoseklų ir sklandų tekstą įvairiomis temomis. DALL-E išplečia GPT-3 pridedant regėjimo komponentą, kuris gali užkoduoti ir iššifruoti vaizdus. Tai leidžia DALL-E suprasti tekstą ir vaizdus bei kurti naujus jų derinius.
Šiame straipsnyje apžvelgsime kai kuriuos įdomiausius ir kūrybiškiausius teksto raginimus, kuriuos gali tvarkyti DALL-E, ir parodysime keletą savo sukurtų vaizdų pavyzdžių.
Kaip naudoti tekstinius raginimus su DALL-E?
DALL-E sujungia GPT-3, galingą kalbos modelį, ir CLIP, regėjimo modelį, kurio galima išmokti iš natūralios kalbos. DALL-E gali sukurti natūralius ir vaizduotės vaizdus, priklausomai nuo bet kokios teksto įvesties. OpenAI reikalauja užsiregistruoti ir prisijungti Norėdami naudoti DALL-E 2. Norėdami tai padaryti, galite sužinoti daugiau apie registracijos ir prisijungimo procesą skaitydami šį straipsnį ' Kaip užsiregistruoti ir prisijungti prie DALL-E 2? “:
Norėdami naudoti tekstinius raginimus su DALL-E, turite atlikti kelis pagrindinius veiksmus:
1. Įrašykite kiekvieną mažą elementą teksto eilutėje
DALL-E gali tvarkyti sudėtingus ir abstrakčius tekstinius raginimus, tokius kaip metaforos, analogijos, kompozicijos, transformacijos ir apribojimai. Vartotojai gali naudoti natūralią kalbą, raktinius žodžius arba jų derinį.
Pavyzdys
DALL-E gali generuoti vaizdus pagal tekstinius nurodymus. Šie tekstiniai raginimai reikalauja, kad DALL-E nuosekliai ir tikroviškai derintų skirtingas koncepcijas, formas, spalvas, tekstūras ir medžiagas. Pavyzdžiui, naudokite teksto raginimą ' penkiakampis, pagamintas iš sūrio, kuris dega ' kaip nurodyta žemiau:
2. Sužinokite apie stilių
Kita DALL-E savybė yra galimybė generuoti kelis vaizdus tam pačiam teksto raginimui, kurių kiekvienas turi skirtingą interpretaciją ar stilių.
Pavyzdys
DALL-E gali generuoti vaizdus katė, vilkinti kostiumą “, kurie skiriasi pagal kostiumo tipą, katės pozą, foną ir veido išraišką. Tai rodo, kad DALL-E turi turtingą ir įvairią vaizduotę ir gali sukurti ne tik tikslius, bet ir stebinančius bei humoristinius vaizdus:
3. Susiję su konkrečiais domenais arba kontekstais
DALL-E taip pat gali generuoti vaizdus, susijusius su konkrečiomis sritimis ar kontekstais, pavyzdžiui, menu, istorija, kultūra, mokslu ar fantastika.
Pavyzdys
DALL-E gali generuoti vaizdus Picasso paveikslas, vaizduojantis moterį dviem akimis “. Teksto raginimas reikalauja, kad DALL-E žinotų ar išmanytų domeną arba kontekstą ir generuotų nuoseklius bei tinkamus vaizdus:
4. Nepamirškite parašyti apie spalvas
Galite pridėti modifikatorių prie teksto raginimo, kad nurodytumėte vaizdo stilių, spalvą, perspektyvą arba išdėstymą.
Pavyzdys
Pavyzdys svarstomas įvedant teksto raginimą ' mėlynas namas su raudonu stogu Van Gogo stiliaus “, kaip matyti toliau pateiktame paveikslėlyje:
Papildomas patarimas: kaip patikslinti teksto raginimus ir Keisti vaizdus?
Pasirinktinai vartotojai gali patikslinti tekstinius raginimus arba modifikuoti vaizdus naudodami kai kuriuos DALL-E įrankius.
Pavyzdys
Galite paspausti dešinįjį pelės mygtuką ant paveikslėlio ir paspausti „ Redaguoti vaizdą “ parinktis pakeisti objekto spalvą arba formą paveikslėlyje:
Vartotojai taip pat gali naudoti „ priartinti “ įrankis, skirtas padidinti arba sumažinti tam tikrą vaizdo dalį, kaip nurodyta toliau:
Tai viskas apie skirtingą tekstinių raginimų naudojimą naudojant DALL-E.
Išvada
Norėdami naudoti tekstinius raginimus su DALL-E, vartotojai turi parašyti kiekvieną mažą elementą teksto eilutėje ir tiksliai žinoti stilių, sritis, kontekstus ir spalvas. DALL-E yra nuostabus įrankis, galintis padėti sukurti nuostabius ir originalius vaizdus iš teksto raginimų. Tai taip pat įdomus būdas tyrinėti savo vaizduotę ir pamatyti, ką gali sugalvoti DALL-E. Tačiau atminkite, kad DALL-E nėra tobulas ir kartais gali generuoti netinkamus, absurdiškus arba netikslius vaizdus. Visada naudokite DALL-E atsakingai ir pagarbiai.