Digitāli radīto objektu vākšanas vadlīnijas
Aktualizēts 15.05.2026 — skatīt izmaiņu vēsturi
Objektu veidi
Latvijas kultūras telpā vēsturiski jau sākotnēji digitālā formātā radītos digitālos objektus (kādu būtisku daļu no tiem) ir iespējams pakāpeniski savākt un ilgtermiņā uzglabāt centralizēti digitālos arhīvos, kā arī tos ir iespējams pārveidot modernos digitālos formātos un izplatīt dažādās kultūras mantojuma institūciju IKT platformās. Digitāli radītos objektus ir iespējams dalīt gan pēc satura veida, gan pēc digitālo objektu formātiem, piemēram:
- digitālie teksta dokumenti (elektroniskie dokumenti, e-grāmatas, e-izdevumi) (.csv, .html, .odf, .pdf, citi Microsoft formāti);
- digitālie attēli (.dng, .jpeg, .jp2, .png, .tiff);
- digitālie video dokumenti (DPX, JPEG2000, MPEG-4);
- digitālie audio dokumenti (AIFF, BWF, FLAC, MPEG-4, WAV, MP3);
- sociālie mediji un oficiālās publikācijas - WEB (HTML tīmekļa lapas) .lv un .gov.lv domēni;
- digitālie multimediji: digitālā māksla, datorspēles, digitālās animācijas;
- e-pasti, ziņapmaiņas platformas sarakstes;
- citi digitālie formāti: datu bāzes, WARC, ARC, GeoTiff, GML, KML, SPSS.
Digitāli radītos objektus var dalīt arī pēc satura tēmām, piemēram, kultūra, vēsture, izglītība, māksla, zinātne, likumdošana, veselība, informāciju tehnoloģijas, dabas zinības, mediji, izdevēji, sabiedrība, valdība, pašvaldības, profesionālās organizācijas. Digitālo objektu skaits ir liels, un datņu formāti ļoti dažādi, skatīt https://www.loc.gov/preservation/digital/formats/fdd/browse_list.shtml. Digitāli radītiem objektiem ir dažādi autori - gan valsts iestādes, institūcijas, organizācijas, gan nevalstiskās organizācijas, gan komersanti un privātpersonas. Digitāli radītie objekti ir izvietoti uz dažādiem nesējiem: serveri ar interneta pieslēgumiem, bez interneta pieslēgumiem datoru cietie diski, dažādas pārnēsājamās atmiņu kartes, CD, DVD u.c.. Lai šos digitālos objektus pārkopētu uz digitāliem arhīviem (ilglaicīgas saglabāšanas IKT sistēmas), tiem digitalizācijas laikā ir jābūt tehniski pieejamiem (datu vai interneta pieslēgumi).
Organizatoriskie jautājumi
Digitāli radīto objektu kopēšanu ir iespējams veikt 3 veidos: a) manuāla kopēšana, b) automatizēta kopēšana, c) daļēji manuāla un automatizēta. Lai definētu vēlamo kopēšanas metodi, ir jāapzina mērķa digitālo objektu skaits, tehniskie parametri (operētājsistēmas, datu bāzes, datņu formāti, datu pieslēgumi u.c.) un organizatoriskie jautājumi (tai skaitā autortiesības, izplatīšanas tiesības). Kopš 2008.g. LNB regulāri veic Latvijas tīmekļa satura vākšanu jeb rasmošanu (automatizēta kopēšanas sistēma), vairāk informācijas: https://www.lnb.lv/lv/izdevejiem/rasmosana, un jau savākto saturu ir iespējams aplūkot: http://webarhivs.lndb.lv/. LNB arī turpmāk var nodrošināt centralizētu digitālo objektu pakāpenisku vākšanu, katru gadu nosakot kopējamo mērķa digitālo objektu apjomu (TB), jo tas prasa papildus jaunus IKT un finanšu resursus. Jāņem vērā, ka LNA pieņem glabāšanā valsts un pašvaldību institūciju, kā arī privātpersonu radītos elektroniskos dokumentus, digitāli radītās fotogrāfijas, audiovizuālos dokumentus un skaņas dokumentus, kuriem ir arhīviskā vērtība. Ja šiem digitālajiem objektiem ir kultūrvēsturiska vērtība, tad to vākšanai un ilglaicīgai saglabāšanai būtu vēlams izmantot šajās vadlīnijās definētos dažādo digitālo objektu datņu tehniskos parametrus un metadatu struktūras. Digitāli radīto objektu vākšanu var iedalīt četros būtiskos posmos: plānošana, sagatavošana, kopēšana, pēcapstrāde. Katrā posmā ir ieteicams ņemt vērā tālāk uzskaitītos ieteikumus: Plānošana
- Ņemot vērā Kultūras mantojuma digitalizācijas, ilglaicīgas saglabāšanas un pieejamības nodrošināšanas plānus, satura prioritātes un atlases kritērijus, tiek izveidoti digitālo objektu saraksti.
- Tiek apkopoti vākšanai nepieciešamie resursi.
- Tiek atvērts digitālo objektu vākšanas projekts.
Sagatavošana
- Tiek apkopoti digitālo objektu fiziskie un saturiskie parametri (datņu formāti, apjomi, serveri, domēni, piederība kolekcijām, minimālie metadati, autortiesības, īpašumtiesības, personas datu aizsardzības rādītāji).
- Tiek noteikta kopēšanas tehnoloģija (manuāli, automātiski) un laika grafiks.
- Tiek sagatavoti mērķa kopēšanas resursi (IKT sistēmas, datu bāzes, serveri, datu centri, datu nesēji). 4.Tiek definēts, kuriem digitālajiem objektiem būs nepieciešama saturiskā un tehniskā restaurācija.
Kopēšana
- Sākumā tiek veikta digitālo objektu restaurācija (tai skaitā serveru darbības atjaunošana, datu pieslēgumu izveide).
- Ja notiek automatizēta kopēšana, tad ar atbilstošu IKT sistēmu palīdzību tiek definēti mērķa kopējamie objekti (domēni, web lapu līmeņi, objekti) un kopēšanas fiziskās adreses.
- Kad sagatavošanas darbi ir pabeigti, tiek uzsākta fiziskā kopēšana.
- Arhīvdatnes un metadati tiek saglabāti ilglaicīgas saglabāšanas IKT sistēmās.
Pēcapstrāde
- Tiek veikta datņu konvertācija. Pēc tam, kad digitālajiem objektiem ir pārkopētas oriģinālās arhīvdatnes, tās ir iespējams uzlabot, izveidojot jaunas atvasinātās arhīvdatnes modernākos formātos, kā arī tiek izveidotas jaunas lietotājdatnes.
- Jaunām arhīvdatnēm un lietotājdatnēm tiek papildināti metadati.
- Tiek pārbaudīta digitālā objekta datu aizsardzība un tehniskā kvalitāte.
- Jaunās lietotājdatnes tiek izvietotas izplatīšanas IKT sistēmās.
Tehnoloģiskās un kompetenču vadlīnijas
Digitāli radīto objektu kopēšanu ir iespējams veikt, ja ir definēts kopēšanas process, piesaistīti atbilstošie IKT speciālisti, specializēta programmatūra un IKT iekārtas. Kopēšanas procesa nodrošināšanai ir nepieciešami satura vadības speciālisti, kuri nosaka saturiskos digitālo objektu atlases kritērijus, prioritātes un pašus mērķa objektus. Tālāk kopēšanas funkcijas pārvalda IT speciālisti, kuri, pirms tiek uzsākta kopēšana, tehniski sagatavo oriģinālos digitāli radītos objektus kopēšanai (vietne, serveris, iespējams, jāveic tehniskā restaurācija) un sagatavo kopēšanas IKT sistēmas (programmatūras, datu pieslēgumu, serveri) darbam. Ja tiek izmantotas automatizētas kopēšanas programmatūras, IT speciālisti nodrošina programmatūras darbības vadību un uzraudzību. Digitālo objektu vākšanai un kopēšanai ir nepieciešami speciālisti ar šādām kompetencēm:
- Satura vadītājs;
- IT tehniskais speciālists (WEB crawler programmatūras, datu bāzes, serveri, datu tīkli, drošība);
- IT grafiskās apstrādes speciālists (HTML web lapu un digitālo objektu restaurācijas darbi).
Tīmekļa rasmošana Automatizētai datņu vākšanai un kopēšanai ir iespējams izmantot WEB crawler programmatūras, piemēram, Heritrix, Spider, WEB Curator vai citas. Vairāk informāciju par WEB crawler ir iespējams iegūt dažādos interneta avotos, piemēram: https://en.wikipedia.org/wiki/Web_crawler, vai http://bigdata-madesimple.com/top-50-open-source-web-crawlers-for-data-mining/. Ir pieejamas dažādas kvalitātes bezmaksas un maksas WEB crawler programmatūras. LNB rasmošanas funkcijām pamatā izmanto profesionālas starptautiskas programmatūras un papildina to ar vietējo IKT sistēmu izstrādātāju veidotu papildu funkcionalitāti. Svarīgi, lai šāda WEB crawler programmatūra nodrošina šādu funkcionalitāti:
- WEB tīmekļa (HTML lapu, specifisku arhīvdatņu un to struktūras informācijas vākšana), arhivēšana un attēlošana;
- sistēmai jāspēj automatizēti savākt no NIC.lv IP adrešu apgabaliem dažādu datņu formātus, piemēram: pdf, ppt, doc, xls, ps, rtf, eml, arj, gz, rar, tar, zip;
- norādīto informācijas avotu automatizēta vākšana un ielāde, regulāra to indeksēšana, atjaunināšana no oriģinālajiem datu avotiem, ātra informācijas sameklēšanas sistēma pēc jebkuram lietotājam zināma dokumentu datu satura un attēlošana lietotājam draudzīgā Web tehnoloģiju formātā;
- sistēmai jāspēj izveidot ARC/WARC tīmekļa arhīva datnes un jānodrošina web aplikācija vākumu pārskatam. Sistēmas arhitektūrai ir jābūt būvētai tā, lai tā būtu spējīga apstrādāt lielus datu apjomus, kā arī lai būtu ērti integrējama un papildināma nākotnē;
- sistēmai ir jābūt izvietotai uz LNB IKT sistēmām (virtuālie serveri, datu centrs).
Digitālo objektu formāti un metadati
Digitālo teksta dokumentu, attēlu, video un audio objektiem ieteicams izmantot Digitālo objektu datņu tehniskie parametri. (https://lnb.lv/sites/default/files/media/bibliotekariem/Digitalizacijas_vadlinijas_A_pielikums_datnu_tehniskie_formati_v1.1_280518.xlsx) specificēto arhīvdatņu un lietotājdatņu formātus un parametrus. Nestandarta digitāli radīto objektu kopijām ir jāizstrādā individuāli datņu tehniskie formāti. Video, audio, attēlu, tekstu un HTML digitālajam objektam ir jāizveido atsevišķa arhīvdatne, no kuras vēlāk var tikt izveidota lietotājdatne. Digitālo objektu izveidotājs sagatavo digitālo objektu metadatus. Metadatu datnes nosaukumu izvēlas atbilstoši attiecīgā digitālā objekta datnes nosaukumam, saglabājot to kā elektronisku dokumentu. Metadatu struktūra ir jāveido, lai nodrošinātu ērtāku objektu meklēšanu potenciālajiem publisko izplatīšanas platformu lietotājiem. Digitāli radīto objektu metadatiem ieteicams izmantot atbilstošo https://dom.lndb.lv/data/type/interactiveresource.html specificēto struktūru.
Datņu un mapju nosaukumu veidošanas vadlīnijas
Veidojot digitāli radīto objektu datņu nosaukumus, vēlams ņemt vērā šādas norādes:
- Iestādes apzīmējums. Piemēram, LNB. Iestādes nosaukums var būt ar pilniem vārdiem.
- Digitālā objekta žanra apzīmējums vai nosaukums. Parasti viens burts, piemēram, “w”– web lapa, “e”– elektronisks izdevums, vai kādu citu pēc izvēles, ar nosacījumu, ka tas tiek lietots konsekventi.
- Digitālā objekta apzīmējums. Saturisks identifikators, piemēram, vērtības vai elementa nosaukums, vietas nosaukums vai personas vārds, iespējams saīsināts, kombinācijā ar digitālā objekta izveides gadu un datumu.
- Datnes tehniskais formāts. Datnes nosaukuma paplašinājums ir rakstzīmju kopa, kas pievienota datnes nosaukuma beigās un nosaka, ar kādā programmatūru datne var tikt atvērta. Pēc noklusējuma daudzas programmatūras paslēpj datnes nosaukumu paplašinājumus. Tomēr ir iespējams padarīt datnes nosaukumu paplašinājumus redzamus.
Piemērs: LNB_RIXC_Digitala_maksla_2005_12345.html Veidojot digitālo objektu mapju nosaukumus, vēlams ņemt vērā turpmāk rakstīto:
- pēc iestādes koda, kurā materiāls digitāli radīts, piemēram: LNB, RIXC,...;
- pēc objekta tēmas nosaukuma, piemēram, satura kolekcijas. Ja gari nosaukumi, tie ir jāsaīsina uz atslēgvārdiem;
- pēc citiem identifikatoriem, piemēram, RIXC uzskaites saraksta numurs, datums.
Mapēs jāveido šāds datņu komplekts:
- visas digitālo objektu arhīvdatnes;
- visas digitālo objektu lietotājdatnes;
- metadatu datne.
Kvalitātes kontroles pasākumi
Digitāli radītiem digitālajiem objektiem ir iespējams veikt šādu kvalitātes kontroli:
- Digitālo objektu atrādīšanas kvalitāte (vai objekts ir atverams, apskatāms, nav bojāts).
- Digitālo objektu saturiskā kvalitāte, atbilstība definētājiem normatīviem un standartiem.
- Digitālo objektu kopas pilnīgums (video, audio, attēli, teksti), atbilstība aprakstiem.
- Digitālo objektu atbilstība tehniskajiem parametriem (attēli, teksti, video, audio).
- Digitālo objektu nosaukumu, mapju un metadatu kvalitāte un digitālo nesēju kvalitāte.