HuMo-gen -tiimissä testattiin tekoälyn käyttämistä sukututkimuksessa. Tulos oli, että onhan siitä apua, mutta epävarman ja kömpelön tuloksen tekoäly vielä antaa. Tulos on siis aina tarkistettava.
Tekoälyä valjastettiin oppimaan ja lukemaan vanhoja käsinkirjoitettuja tekstejä EU-projektina vuodesta 2014 alkaen. Tällaisessa tapauksessa tekoälyn opettaminen vaatii hurjasti töitä. Tuloksena syntyi Transkribus. Tekoälyyn perustuva alusta osaa jo kohtuullisesti tulkita käsin kirjoitettua tekstiä.
Tekoäly on kätevä myös käännettäessä valmista tekstiä kieleltä toiselle, sillä tekoäly (esimerkiksi ChatGPT) kääntää tekstiä kokonaisvaltaisemmin kuin esimerkiksi Google kääntäjä.
Tiimi päätti kokeilla, mihin muuhun tekoälyä voisi hyödyntää. Ohessa eräs esimerkki keskustelusta yleiskäyttöisen tekoälyn (ChatGPT 3.5) kanssa. Tämä tekoäly lienee tunnetuin ja toimii melko sujuvasti myös suomenkielellä. Aluksi kysyttiin, tietääkö tekoäly mitään gedcom-tiedostomuodosta. Kun vastaus oli positiivinen, pyydettiin yksinkertainen gedcom, jota sitten parilla tarkennuksella korjattiin. Esimerkistä näkyy, että tekoälyllä on taipumusta englanninkieliseen ratkaisuun. Kuolinsyyn se kääntää englanniksi ja paikkojen nimiin lisää tarkenteen Finland. Lisäkysymyksillä tulosta on melko helppo muokata. Vastaus tulee sekunneissa näin lyhyessä tehtävässä. Alle kopioitus keskustelua ei ole muokattu.
User
Osaatko luoda gedcom-tiedoston annetuista lähtötiedoista?
ChatGPT 3.5
Kyllä, voin auttaa sinua luomaan GEDCOM-tiedoston annetuista lähtötiedoista. GEDCOM (Genealogical Data Communication) on standardoitu tiedostomuoto sukututkimustietojen vaihtamiseen ja tallentamiseen. Voitko kertoa minulle, mitä tietoja haluat sisällyttää GEDCOM-tiedostoon ja miten haluat niiden järjestettävän?
User
Gedcomiin kuuluu perhe. Isä Matti Mattila, syntynyt 1.1.1923 Loviisassa ja kuollut 2.3.1960 Helsingissä ja äiti Liisa Mattila, omaa sukua Pekkala, syntynyt 4.4. 1925 Oulussa ja kuollut 6.6.1977 Korppoossa. Isän kuolinsyy on tapaturma ja äidin kuolinsyy on humpuuki. Lisäksi perheessa on elossa oleva tytär Jussi, syntynyt 4.3.1945 ja poika Pekka, syntynyt 4.4.1949.
ChatGPT 3.5
Selvä! Tässä on yksinkertainen esimerkki GEDCOM-tiedostosta annettujen tietojen perusteella:
0 HEAD 1 SOUR MyGenealogySoftware 2 VERS 1.0 3 NAME Your Genealogy Program 0 @I1@ INDI 1 NAME Matti /Mattila/ 1 BIRT 2 DATE 1 JAN 1923 2 PLAC Loviisa, Finland 1 DEAT 2 DATE 2 MAR 1960 2 PLAC Helsinki, Finland 2 CAUS Accident 0 @I2@ INDI 1 NAME Liisa /Mattila/ 1 FAMS @F1@ 1 BIRT 2 DATE 4 APR 1925 2 PLAC Oulu, Finland 1 DEAT 2 DATE 6 JUN 1977 2 PLAC Korppoo, Finland 2 CAUS Quackery 0 @I3@ INDI 1 NAME Jussi /Mattila/ 1 BIRT 2 DATE 4 MAR 1945 0 @I4@ INDI 1 NAME Pekka /Mattila/ 1 BIRT 2 DATE 4 APR 1949 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 CHIL @I3@ 1 CHIL @I4@
Tässä tiedostossa:
Isä Matti Mattila on henkilö @I1@.
Äiti Liisa Mattila on henkilö @I2@.
Tytär Jussi Mattila on henkilö @I3@.
Poika Pekka Mattila on henkilö @I4@.
Perhe @F1@ koostuu isästä, äidistä ja heidän lapsistaan.
Tietojen tulee olla oikein muotoiltuja ja tarkkoja, jotta GEDCOM-tiedosto voidaan lukea oikein sukututkimusohjelmalla.
User
Miksi vaihdoit kuolinsyyksi Quackery?
ChatGPT 3.5
Pahoittelen sekaannusta. "Quackery" on englanninkielinen termi, joka tarkoittaa humpuukia tai petosta lääketieteellisessä kontekstissa. Voimme käyttää parempaa termiä, kuten "luonnollinen kuolema" tai "tuntematon syy", jos et halua määrittää tarkkaa kuolinsyytä. Onko jokin näistä vaihtoehdoista sopiva, vai haluatko määrittää jotain muuta?
User
Käytetään äidin kuolinsyynä huimausta!
ChatGPT 3.5
Ymmärretty. Tässä päivitetty GEDCOM-tiedosto äidin kuolinsyyn muuttamisella "huimaukseksi":
0 HEAD 1 SOUR MyGenealogySoftware 2 VERS 1.0 3 NAME Your Genealogy Program 0 @I1@ INDI 1 NAME Matti /Mattila/ 1 BIRT 2 DATE 1 JAN 1923 2 PLAC Loviisa, Finland 1 DEAT 2 DATE 2 MAR 1960 2 PLAC Helsinki, Finland 2 CAUS Accident 0 @I2@ INDI 1 NAME Liisa /Mattila/ 1 FAMS @F1@ 1 BIRT 2 DATE 4 APR 1925 2 PLAC Oulu, Finland 1 DEAT 2 DATE 6 JUN 1977 2 PLAC Korppoo, Finland 2 CAUS Dizziness 0 @I3@ INDI 1 NAME Jussi /Mattila/ 1 BIRT 2 DATE 4 MAR 1945 0 @I4@ INDI 1 NAME Pekka /Mattila/ 1 BIRT 2 DATE 4 APR 1949 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 CHIL @I3@ 1 CHIL @I4@
Tässä versiossa äidin kuolinsyy on "huimaus" (englanniksi "Dizziness").
User
Voitko säilyttää kuolinsyiden suomenkieliset ilmaisut?
ChatGPT 3.5
Tietenkin, tässä päivitetty GEDCOM-tiedosto, jossa käytetään suomenkielisiä ilmaisuja äidin kuolinsyyn osalta:
0 HEAD 1 SOUR MyGenealogySoftware 2 VERS 1.0 3 NAME Your Genealogy Program 0 @I1@ INDI 1 NAME Matti /Mattila/ 1 BIRT 2 DATE 1 JAN 1923 2 PLAC Loviisa, Finland 1 DEAT 2 DATE 2 MAR 1960 2 PLAC Helsinki, Finland 2 CAUS Accident 0 @I2@ INDI 1 NAME Liisa /Mattila/ 1 FAMS @F1@ 1 BIRT 2 DATE 4 APR 1925 2 PLAC Oulu, Finland 1 DEAT 2 DATE 6 JUN 1977 2 PLAC Korppoo, Finland 2 CAUS Huimaus 0 @I3@ INDI 1 NAME Jussi /Mattila/ 1 BIRT 2 DATE 4 MAR 1945 0 @I4@ INDI 1 NAME Pekka /Mattila/ 1 BIRT 2 DATE 4 APR 1949 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 CHIL @I3@ 1 CHIL @I4@
Tässä versiossa äidin kuolinsyy on "Huimaus".
User
Suomenna myös isän kuolinsyy, kiitos!
ChatGPT 3.5
Tässä päivitetty GEDCOM-tiedosto, jossa isän ja äidin kuolinsyitä on suomennettu:
0 HEAD 1 SOUR MyGenealogySoftware 2 VERS 1.0 3 NAME Your Genealogy Program 0 @I1@ INDI 1 NAME Matti /Mattila/ 1 BIRT 2 DATE 1. tammikuuta 1923 2 PLAC Loviisa, Suomi 1 DEAT 2 DATE 2. maaliskuuta 1960 2 PLAC Helsinki, Suomi 2 CAUS Tapaturma 0 @I2@ INDI 1 NAME Liisa /Mattila/ 1 FAMS @F1@ 1 BIRT 2 DATE 4. huhtikuuta 1925 2 PLAC Oulu, Suomi 1 DEAT 2 DATE 6. kesäkuuta 1977 2 PLAC Korppoo, Suomi 2 CAUS Huimaus 0 @I3@ INDI 1 NAME Jussi /Mattila/ 1 BIRT 2 DATE 4. maaliskuuta 1945 0 @I4@ INDI 1 NAME Pekka /Mattila/ 1 BIRT 2 DATE 4. huhtikuuta 1949 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 CHIL @I3@ 1 CHIL @I4@
Tässä versiossa isän kuolinsyy on "Tapaturma" ja äidin kuolinsyy on "Huimaus".
User
Päiväykset tulisi myös olla gedcom-standardin mukaisesti!
ChatGPT 3.5
0 HEAD 1 SOUR MyGenealogySoftware 2 VERS 1.0 3 NAME Your Genealogy Program 0 @I1@ INDI 1 NAME Matti /Mattila/ 1 BIRT 2 DATE 1 JAN 1923 2 PLAC Loviisa, Finland 1 DEAT 2 DATE 2 MAR 1960 2 PLAC Helsinki, Finland 2 CAUS Accident 0 @I2@ INDI 1 NAME Liisa /Mattila/ 1 FAMS @F1@ 1 BIRT 2 DATE 4 APR 1925 2 PLAC Oulu, Finland 1 DEAT 2 DATE 6 JUN 1977 2 PLAC Korppoo, Finland 2 CAUS Huimaus 0 @I3@ INDI 1 NAME Jussi /Mattila/ 1 BIRT 2 DATE 4 MAR 1945 0 @I4@ INDI 1 NAME Pekka /Mattila/ 1 BIRT 2 DATE 4 APR 1949 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 CHIL @I3@ 1 CHIL @I4@
Tässä versiossa päivämäärät on ilmaistu GEDCOM-standardin mukaisesti: "1 JAN 1923" (1. tammikuuta 1923), "2 MAR 1960" (2. maaliskuuta 1960), "4 APR 1925" (4. huhtikuuta 1925) jne.
User
Kiitoksia, tämä oli hieno ratkaisu!
ChatGPT 3.5
Ole hyvä! Olen iloinen, että voisin auttaa. Jos sinulla on muita kysymyksiä tai tarvitset lisäapua, älä epäröi kysyä!
Valmis gedcom avattiin ohjelmaan Sukujutut, joka hyväksyi tuloksen, mutta antoi kaksi huomautusta.
Puolisot 1 ja 2 samaa sukupuolta
Puolison 1 sukupuoli tuntematon
Tekoälyä pitäisi siis pyytää merkitsemään myös sukupuolet. Se hoitii nopsasti, sillä tekoäly jaksaa väsymättä tehdä mitä pyydetään.
HuMo-gen tiimi