mondjuk itt azt mondja, hogy a karakter hiba 5%, a szó hiba 20%, elég magas a szám, de persze lehetne javítani, mivel tudjuk nevekről van szó, pl keresztnevek eléggé szűk szettben voltak, meg vannak kitalálható szerkezetek (amit AI-jal lehetne felismertetni és automatikusan javítani, de a 100% persze nem garantált :)
ahogy látom a civil regiszterből hiányzik 1906 után a halotti (csak 1946 után folytatódik), márpedig 78 éves még simán lehetett a férfi, és 71 feletti a nő, amikor meghaltak. Addig átnéztem a halotti civilt, de nem voltak.
Ötlet: keresd meg az anyakönyvi hivatalt, és kérd ki a halottit (lásd lejjebb volt erről szó)...
Amennyiben valakinek módjában áll, úgy szeretnék segítséget kérni két felmenőm, Márton És Teréz halotti kivonatának felkutatásában. Ezek nélkül sajnos nem bizonyíthatóak a további szálak..
Az összes gyerekük Mikén született 1858 és 1875 között. Az utolsó információ róluk, hogy Radó János és Semsi Magdolna gyerekének születésénél Ők voltak a keresztszülők 1876-ban Mikén.
Egyenes ágon a következő két generáció szintén ugyan itt volt keresztelve, így nem világos, hogy miért nem találom a halottijukat Mike környezetében. A dohányföldek miatti tovább költözést számításba véve sem jutottam sokkal többre..
keresgéltem a Kozák-Weber pár ügyében, és azt láttam, hogy a Webernek volt más párja is, tehát 1884ben már Kozák volt, de lehet, hogy előtte más volt (és megözvegyült, és csak akkor ment férjhez a Kozákhoz). Találtam egy egy Annát a Weberrel, mint anya (Babarczon, ami szoszéd falu szintén):
Ahol az apa Lolics vagy Polics, dátum is jó, és elképzelhető, hogy miután az apa meghalt és a nő a Kozákhoz ment feleségül, emiatt a gyerek neve is Kozák lett.
Ehhez kellene találni egy Polics vagy Lolics halottit 1881vége 1883vége körül valahol a környéken, Babarczon átfutottam a halottit, de nem találtam.
Meg persze a legjobb lenne a házassági bejegyzés, ahol látható lenne, hogy uxor (valamikor 1881-1883 között).
a latin szótár szerint a praedium pusztát jelent, tehát valószínűleg Ráczgörcsöny (Görcsönydobóka) egyik pusztáján laktak (talán kicsit arrább költöztek Szabarból...)
A segítség abban kellene, hogy láthatóan a bejegyzésben az van, hogy Ráczgörcsöny, ami most Görcsönydobóka, de ott van egy "in praedib."??, amit nem értek. Egy latinos segítsége kellene.
Még amit lehetne csinálni, hogy átnézni a szabari anyakönyvet, hogy 1850-1890 között hány Kozák család keletkezett (Kozák fiú született, és házasodott meg ott), ha nincs sok (egyet ugye találtam a Josephust, aki a Weberrel jött össze), azoknak összeírni az összes gyereküket. A Josephusék jónak tűnnek, mert láthatóan több helyen jegyeztettek be gyereket, 1884, 1885ben és 1893-ban, tehát a 1881-es időpont jónak tűnik, hogy lehetett gyerekük (a házasságot persze meg kéne találni), és a környező falvakban meg kéne nézni őket...
Az a baj, hogy nincs nagyon senki, aki segíteni tudna, mert nagyapám nagyon korán meghalt (apum 14 éves volt), és a testvére szintén régen elköltözött valahova, nem tudjuk merre és a kapcsolatot se tartották apummal :S Tudtam, hogy ez az ág problémás lesz. De bízom benne, előbb utóbb a nyomukra akadok valahogy :)
Az egy lehetőség, hogy a szabariak egy idő után mégsem Hímesházán jegyeztették magukat, csak nem tudom hol. A környéket is meg kéne nézni, a környező falvak katolikus anyakönyveit 1880-1884 között...
Czigler Károly születési anyakönyvében láttam, hogy Cziegler Franciscus 1902-ben 26 éves volt, és Kozák Anna 21. Ebből úgy számoltam, hogy 1867-ben született Franciscus és 1881-ben Anna. Ezért +/- 1 évben átlapoztam az mohácsi/hímesi könyveket.
Igen, külön tanítás kell a magyar szövegre, ez mindenképp probléma. A Transkribusnál a jelenlegi modelljükkel 15000 szóra teszik a betanítási volument kézírásfelismerés esetén. Ez mondjuk nem kevés, de nem is annyira sok, hogy ne lehessen bármikor létrehozni. A konkrét folyamatról itt egy leírás, ha érdekel valakit: https://transkribus.eu/wiki/images/3/34/HowToTranscribe_Train_A_Model.pdf
Esély mindenre van, de ami érdekes, hogy bár Kozák Anna katolikus, de az indexált anyakönyvek között nincsen semmi nyoma (legalábbis én nem találtam meg), és Baranyában a 19. században sem igen születnek Kozák Annák. Ellenben a hímesházai anyakönyvben van 1862-ben egy szabari Kozák Erzésbet, lehet, hogy az ő testvére volt Kozák Anna? A szüleiknek több gyerekük is született, igaz az utolsó 1869 körül.
A későbbi házasság lehet a volt férj második házassága. Esetleg Kozák Anna valamikor nem sokkal 1927 előtt halhatott meg, talán Mohácson. Úgy látom, hogy a mohácsi polgári anyakönyvek '19 után már nem elérhetőek, és a pécsi egyházmegyei levéltárban is csak Mohács-sziget van meg. Pedig jó lett volna megnézni, hogy ha megvan a halottija, akkor mit írnak bele.
Sziasztok, ismét a segítségeteket kérném. Apai nagyapám ágán kutakodok jelenleg. Ez (https://www.familysearch.org/ark:/61903/3:1:33SQ-GPBH-RQG?from=lynx1UIV8&treeref=GWLW-LYF&i=39) alapján tudom, hogy Czigler Károly szülei Czigler Ferenc és Kozák Anna voltak. Kozák Anna 1902-ben volt 21 éves, tehát 1881. körül született. A dokumentum azt állítja, hogy Szabarban (feltételezem ez a mai Székelyszabar). Megnéztem a hímesházai anyakönyveket, de nem találom a születési bejegyzését. Van rá esély, hogy máshol anyakönyvezték?
A házassági anyakönyvi bejegyzésüket sem találom sem a mohácsi, sem a szabari könyvekben.
A probléma ezzel, hogy először egy nagy adag tanítás kell, és itt látom a problémát, hogy a régebbi magyar írásra nem nagyon van betanító alapanyagunk (a mostani magyarra talán van), és persze kétséges írásmódoknál az emberi agy használja a környezet adatait (pl tudjuk, hogy nincs olyan, hogy Vonács, hanem Kovácsnak kell annak lenni, és onnantól, ha V betűt látunk akkor K-nak értelmezzük, de ehhez fel kellett ismernünk, hogy az egy vezetéknév). Egyébként is a felismerésnél nem 100%-os találatot kapsz, hanem valószínűséget mondjuk 80% V, 50% K.
Szóval emberi interakció biztosan kell, ami néha az lesz, hogy egyszerűbb begépelni, amit látsz, de néha elfogadható lesz az eredmény...
Szerintem a használható kézírásfelismerés, és főleg az ezen alapuló indexelés még nagyon, nagyon távol van. A nyomtatott betűfelismerés is telis-tele van hibával, és a géppel-indexelt gyászjelentések csupa zagyvaságot gyártanak. Például Liszt Ferencről közölt egy Michigan-i újság gyászjelentést, amiből a gép megállapította, hogy életkora 9, rokona pedig Legende Von Der Heiligen Elisabeth (https://www.familysearch.org/ark:/61903/1:1:Q57X-KSYW?from=lynx1UIV8).
egyébként a katolikus anyakönyveknél szépen újrafényképezték a nem civileket (legalábbis, amit láttam eddig a matriculaban), az legalább már szemmel olvasható (ott az AI sem nagyon tud mit csinálni...)
bocs mindenkitől, hogy összezavartam a társaságot, csak néha elkeseredek mennyire nem érdekel senki döntéshozót a (valódi) múlt, és akkor ez van... ...de már összeszedtem magam...
A kézírás digitális felismerése nagyon gyerekcipőben jár, -nem lehetetlen, már vannak próbálkozások ha szépen van írva, na de a régi macskakaparásos írásra nem lesz soha digitális megoldás
mert még egy hozzáértő kutatónak is néha olyan nehézkes a kiolvasása, hogy csak na.
Ezek csak is manuális feldolgozással lehetséges, -legalábbis mai szemmel.
Szóval akkor most arról beszélgetünk, hogy az Arcanum OCR rendszerrel álljon neki a civil könyveknek, és ne képalapon, hanem adatbázist építve dolgozza fel őket?
A kézírás-felismerést jelentősen rontani fogja az a hülye alányomás, ami az anyakönyvi papírokon ott van, apró hullámok, vagy mik. Mivel a könyv színes, ez kiszűrhető lenne, de ehhez az is kéne, hogy Arcanumék szkenneljék újra, mert ami most elérhető, az ugye FF. Vagy nem? Ráadásul még Arcanum nélkül sem ártana újra fotózni digitálissal, mert amióta azok a filmek készültek, nagyságrendekkel javult minden, az optikák minősége, a digitális rögzítés ténye, stb. Némelyik kép olyan ótvar, hogy a széleken alig lehet elolvasni a torzítási hibák miatt.