Internjetti on pullollaan hehkutusta siitä kuinka helppoa AI:lla on generoida mitä tahansa kuvitusta mihin tahansa. Onko se oikeasti? Ei ole.
Minun on jo pitkään pitänyt päivittää monta kertaa netissä kiertänyt piirros/sarjakuva tähän päivään, mutta päivitystä varten pitäisi osata piirtää ja varmaan referoida sitä alkuperäistä. Mutta mikähän oli se alkuperäinen? No, lempimuusikkoni Google Bard varmaan osaa kertoa minulle.
Osaatko tukea muistiani? Muistelin, että joku on piirtänyt sarjakuvan missä lapsi kysyy isältään mitä pilvet ovat ja isä vastaa, että linux-palvelimia. Kuka on piirtänyt tämän sarjakuvan ja onko se julkisesti käytettävissä?
Kyllä, voin auttaa sinua löytämään etsimäsi sarjakuvan.
Tässä on muutamia vaihtoehtoja:
- Etsi sarjakuvaa verkkosivustoilta:
No, ei voittoa. Bardista on tullut Gemini ja Geminin pitäisi osata tuottaa kuvia, mitäpä jos sitten tekisi kuvan Geminillä.
Osaatko tuottaa kuvia?
Kyllä, osaan tuottaa kuvia. Voin tehdä sen kahdella tavalla:
Tekstistä kuvaan: Voin luoda kuvia tekstikuvausten perusteella. Voit esimerkiksi antaa minulle kuvauksen maisemasta tai henkilöstä, ja minä luon siitä kuvan.
Kuvamateriaalin muokkaaminen: Voin muokata olemassa olevia kuvia. Voin esimerkiksi rajata kuvia, muuttaa niiden värimaailmaa tai lisätä niihin tekstiä.
Jesh! Vihdoinkin!
Voitko piirtää minulle sarjakuvan, missä ensimmäisessä kuvassa juniori-insinööri kysyy seniori-insinööriltä, mitä pilvet ovat ja seniori vastaa, että pääosin linux-palvelimia. Toisessa kuvassa juniori on miettivän näköinen ja sanoo: ”Ei olet väärässä”. Kolmannessa pilvessä juniori sanoo, että pilvet ovat jonkun toisen resursseja, joita hallitaan REST-apin ylitse.
En voi luoda kuvia vielä, joten en voi auttaa sinua.
Toinen huti minkä uusi kaverini Gemini saa aikaiseksi on pyyntö generoida Midjourney prompti haluamalleni sarjakuvalle.

En edes jaksa laskea montako virhettä tilauksen toteutuksessa on. Pitkän taistelun jälkeen, pääsen tulokseen:

Promptilla: Red headed female software engineer asking a question about public cloud from an older bearded software engineer. Laptop. Office. –
Tämän jälkeen haaste on saada Midjourney generoimaan samoilla hahmoilla ja samaan jatkumoon pari muuta kuvaa.

Koska en vaan osaa, niin saan kuvan jossa hyvin saman näköinen nainen ihmettelee asioita. Vaatetuksen osalta tämä on se tulos, minkä itse saavuttaisin lähtemällä kauppaan ilman referenssikuvaa ja antaisin itselleni ohjeeksi, osta samanlainen farkkupusero. Eli ei kovin hyvä lopputulema. Käsien asento on myös mielenkiintoinen.
Tämä siis oli paras promptilla: https://s.mj.run/pjGb-jffQbA Red headed female software engineer alone with the same setting in deep thought.
Promptissa on siis annettu aiemmin generoitu ja valittu kuva referenssiksi – ainakin kuvittelen tehneeni näin.

Kuusisorminen nainen ei voi olla väärässä. Hän voi helposti luetella kuusi syytä sille miksi julkipilvi on paljon enemmän kuin kasa linux-palvelimia. Siinä vaiheessa jos sinun pitää tietää mistä raudasta pilvi on rakennettu ja millä käyttöjärjestelmällä joku sinulle palvelujasi tuottaa – korjaa aikakoneesi osoittamaan tätä päivää. Ja jos tarjottu käyttöliittymä on puhdas web-käyttöliittymä ilman ohjelmallista APIa, juokse.
Ja tämä siis oli promptilla: https://s.mj.run/pjGb-jffQbA Red headed female software engineer answering to the older software engineer. Same setting.
Hain myös alkuperäistä kuvaani ihan normaalilla google-haulla ja löysin osumia uNixcraftista ja Redditistä – niin kuin Gemini kuvan ulkopuolelta epäilikin. Spreadshirtistä saa ostella t-paitoja kyseisellä vastauksella. Mutta mites se Geminin kuvien generointi? No, artikkelikuva on tuotettu promptilla:
Three comic panels. A junior software engineer and a senior engineer appearing in all of them. First panel, junior engineer asks a question about cloud servers and senior answers. Second panel, junior ponders and comes to conclusion that answer is wrong. Third panel junior answers her own question
Limewiren kautta voi kuvia generoida useammalla eri ”enginellä” ja siellä on tarjolla: Google imagen 2. Tämmöisen tuloksen saan Geminin Midjourneylle tekemällä promptilla:
