Gjenbruk av data

Da har vi gjenbrukt at av data fra Knut Baardseth knyttet til “de blaa” permene. Samt alt av data “INO kontoret” samlet digitalt fra avisen “Folk og Land“. “de blaa” har en seksiffret numerisk kode hvor første siffer er 1. Det kan søkes direkte på dokumentkoden. Alt er skrevet med store bokstaver. Disse dataene er samlet fra ca 1986 og utover. “Folk og Land” dataene er tatt ut fra avisene som de viktigste opplysningene fra hvert enkelt nummer. “Folk og Land” har år og nummer som sin identifikasjon “1954_1”. Det kan søkes direkte på avisutgivelsen. Det som er nytt i 2014 er at alle dokumentene er OCR lest. Dette innebærer at alt av dokumenter, med alt innhold er lest inn. Gjenkjennelsen av tekst ligger på fra 20% til 85%. Dokumenter fra ”de blaa” som ikke har noe tekst i ”Tittel” feltet er dokumenter Knut Baardseth ikke har rukket over med teksting. De kommer opp i trefflisten fordi søkebegrepet blir funnet inne i dokumentet.