Pāriet uz saturu

Datņu un mapju nosaukumu veidošana: Atšķirības starp versijām

No ''Latvijas Nacionālā bibliotēka''
Azogla (diskusija | devums)
Jauna lapa: <big>''<span style="color:#d00000; font-weight:bold; font-size:120%;">Aktualizēts <u>{{REVISIONDAY2}}.{{REVISIONMONTH}}.{{REVISIONYEAR}}</u></span>'' — [{{fullurl:Datņu un mapju nosaukumu veidošana|action=history}} skatīt izmaiņu vēsturi]''</big> <div style="border: 2px solid #d33; background-color: #fee; padding: 0.8em; border-radius: 6px;">'''⚠️ Šī lapa joprojām ir izstrādes stadijā.'''</div> Arhīvdatņu un Lietotājdatņu veido...
 
Azogla (diskusija | devums)
 
(5 starpversijas, ko mainījis tas pats dalībnieks, nav parādītas)
1. rindiņa: 1. rindiņa:
<big>''<span style="color:#d00000; font-weight:bold; font-size:120%;">Aktualizēts <u>{{REVISIONDAY2}}.{{REVISIONMONTH}}.{{REVISIONYEAR}}</u></span>'' — [{{fullurl:Datņu un mapju nosaukumu veidošana|action=history}} skatīt izmaiņu vēsturi]''</big>
<big>''<span style="color:#d00000; font-weight:bold; font-size:120%;">Aktualizēts <u>{{REVISIONDAY2}}.{{REVISIONMONTH}}.{{REVISIONYEAR}}</u></span>'' — [{{fullurl:Datņu un mapju nosaukumu veidošana|action=history}} skatīt izmaiņu vēsturi]''</big>
<div style="border: 2px solid #d33; background-color: #fee; padding: 0.8em; border-radius: 6px;">'''⚠️ Šī lapa joprojām ir izstrādes stadijā.'''</div>
<div style="border: 2px solid #d33; background-color: #fee; padding: 0.8em; border-radius: 6px;">'''⚠️ Šī lapa joprojām ir izstrādes stadijā.'''</div>
[[Arhīvdatņu veidošana|Arhīvdatņu]] un [[Lietotājdatņu veidošana|lietotājdatņu]] nosaukumu veidošanas shēmai jābūt izveidotai un apstiprinātai pirms digitalizācijas projektu uzsākšanas. Veidojot nosaukumu sistēmu, jāņem vērā, vai identifikatoru piešķiršanas funkciju paredzēts uzticēt automatizētai sistēmai vai cilvēkam, vai arī tiks izmantotas abas metodes. Metodes izvēle ir atkarīga no digitalizējamo objektu apjoma. Liela apjoma gadījumā vēlams izmantot automatizētu pieeju, bet maza apjoma gadījumā nosaukumus ir iespējams mainīt manuāli, apstrādājot katru [[Digitālais objekts|digitālo objektu]] atsevišķi. Lielākos digitalizācijas projektos, kad ir paredzēta digitālo objektu nodošana vairākos sūtījumos, nosaukumu sistēmā ir jāparedz kodi, kuri nodrošina objektu grupēšanu atbilstoši sūtījumiem. Jebkurā no metodēm ir jāveic datņu nosaukumu [[Kvalitātes kontrole|kvalitātes kontrole]], vai izveidotie datņu un mapju nosaukumi ir atbilstoši definētājai kārtībai. Piešķirot kultūras mantojuma iestādes nosaukuma kodu, ir ieteicams izmantot ISIL kodus jeb starptautiskos LDKK identifikatorus.
Pirms jebkura digitalizācijas projekta uzsākšanas ir obligāti jāizveido, tehniski jāpārbauda un jāapstiprina '''vienota datņu un mapju nosaukumu veidošanas shēma'''. Konsekventa nosaukumu sistēma nodrošina datu integritāti, novērš datņu pārrakstīšanas riskus un garantē digitālo objektu veiksmīgu importēšanu ilglaicīgās saglabāšanas sistēmās (repizitorijos).
Datņu nosaukumu veidošanas vadlīnijas:
 
* nosaukumi ir unikāli - neviens digitālais resurss nevar dublēt cita resursa identifikatoru;
=== Identifikācijas metodes un automatizācija ===
* nosaukumi ir saskanīgi, konsekventi strukturēti - atbilst vienotam paraugam/šablonam;
Metodes izvēle ir tieši atkarīga no digitalizējamo objektu apjoma un institūcijas infrastruktūras:
* nosaukumi ir labi definēti – ir loģiskais pamatojums, palīdz standartizēt un strukturēt;
* '''Automatizētā pieeja (Masveida digitalizācija):''' Liela apjoma projektos identifikatoru un nosaukumu piešķiršanu pilnībā uztic programmatūrai (piemēram, skenēšanas un pēcapstrādes stacijām vai digitālo objektu pārvaldības sistēmām). Tas izslēdz cilvēciskā faktora kļūdas.
* nosaukumi ir pastāvīgi - nosaukumā iekļautā informācija nedrīkst attiekties ne uz ko tādu, kas laika gaitā varētu mainīties, tie nav sasaistīti ar konkrētām programmatūrām, procesiem un sistēmām;
* '''Manuālā vai hibrīdā pieeja:''' Mazāka apjoma projektos pieļaujama manuāla datņu pārsaukšana, taču arī šajā gadījumā jāizmanto stingras validācijas maskas, lai novērstu pārrakstīšanās kļūdas.
* nosaukumi pakļaujas jebkuriem tehniskiem ierobežojumiem - simbolu ierobežojumiem nosaukumā - speciālie simboli, pauze, punkts (atskaitot pirms datnes paplašinājuma), kā arī ierobežojumiem simbolu skaitā. Vēlams, lai nosaukumi nesaturētu pārāk daudz simbolu, jo, kaut arī IKT sistēmas uztur garus datņu nosaukumus, pastāv programmatūras, kas saīsina datņu nosaukumus, lai varētu tos atvērt. Tāpat pastāv atsevišķi tīklošanas protokoli un datņu katalogu sistēmas, kas pārraides laikā var saīsināt pārraidāmo datņu nosaukumus. Laba prakse ir datnes nosaukumā aprobežoties ar 32 simboliem;
* '''Sūtījumu un partiju kontrolkodi:''' Ja digitālie objekti tiek nodoti pakāpeniski vai vairākos sūtījumos (partijās / ''batches''), nosaukumu struktūrā ieteicams iestrādāt specifisku partijas identifikatoru (piemēram, līguma numuru vai nodošanas datumu), kas atvieglo kvalitātes kontroli un masveida apstrādi.
* datnes paplašinājums ir obligāts, un tam jānorāda uz datu formātu (piem., .tif, .jpg, .gif, .pdf, .wav, .mpg);
 
* jāņem vērā maksimālais digitalizējamo objektu skaits, un tas jāatspoguļo nosaukuma ciparu skaitā (ja lieto ciparu numerācijas shēmu);
== Datņu nosaukumu veidošanas pamatprincipi ==
* nosaukuma sākumā jālieto liekās nulles, lai atvieglotu šķirošanu (ja tiek izmantotas vecās paaudzes programmatūras);
 
* nelietot pārāk sarežģītu vai garu nosaukumu shēmu, lai novērstu kļūdas manuālās ievades gaitā;
Labas prakses vadlīnijas nosaka, ka katram datnes nosaukumam jābūt:
* datnes nosaukumu veido tā, lai nepārprotami būtu identificējams oriģināls, t.i., datnes nosaukumā obligāti ietver oriģināla uzziņu kodu/inventāra numuru;
 
* nelietot latviešu alfabēta diakritiskās zīmes (valodas burtu īpašās zīmes), lietot tikai latīņu alfabēta burtus;
* '''Unikālam:''' Neviens digitālais resurss repozitorijā nedrīkst dublēt cita resursa nosaukumu vai identifikatoru.
* var lietot gan lielos, gan mazos burtus;
* '''Konsekventam:''' Visiem viena projekta vai kolekcijas failiem jābūt strukturētiem pēc stingri definēta šablona.
* skenēšanas laiku, vietu, personas vēlams rakstīt metadatos, nevis datnes nosaukumos;
* '''Pastāvīgam (Persistentam):''' Nosaukumā iekļautā informācija nedrīkst attiekties uz mainīgiem lielumiem (piemēram, nodaļas nosaukumu, pašreizējo programmatūru vai glabāšanas plauktu). Ideālā gadījumā nosaukuma pamatā ir objekta '''pastāvīgais identifikators (PID)''' vai starptautiskais '''ISIL kods''' (Starptautiskais bibliotēku un saistīto organizāciju identifikators).
* kaut arī nav ieteicams sniegt pārāk daudz informācijas datnes nosaukumā, tomēr neliels informācijas daudzums zināmā mērā var kalpot par datnes aprakstošiem metadatiem ekonomiska alternatīva bagātāku datu nodrošināšanai citviet;
* '''Sasaistītam ar oriģinālu:''' Datnes nosaukumam jānodrošina tieša un nepārprotama saite uz fizisko oriģinālu, tāpēc tajā obligāti ietver fiziskā objekta uzziņas kodu, fondu/kolekcijas numuru vai inventāra numuru.
* ja nozīme nosaukumā vērtējama kā īslaicīga, praktiskāk ir lietot vienkāršu numerācijas sistēmu, kuru pēc tam sasaistīt ar digitālo resursu kādā ārējā datu bāzē.
 
Datņu mapju struktūru veidošanā rekomendējams ievērot šādus principus:
== Tehniskie ierobežojumi un sintakse ==
* mapes nosaukums ir neatkarīgs no datņu nosaukumiem tajā;
 
* mapes var būt sakārtotas pēc datumiem vai digitalizācijas nodevumiem;
Mūsdienu IKT sistēmas tehniski spēj apstrādāt garus un sarežģītus nosaukumus, taču starpsistēmu migrācijā un tīkla protokolos joprojām pastāv kritiski ierobežojumi.
* mapju nosaukumi var atbilst oriģinālu satura grupām, piemēram, kolekcijām, fondiem, uzskaites sarakstiem, sērijām;
 
* mapes var būt grupētas pēc datņu veidiem (arhīvdatnes, lietotājdatnes);
=== 1. Atļautie un aizliegtie simboli ===
* vairāku lappušu dokumentiem mapes var būt saistītas ar lappušu numuriem.
* '''Tikai latīņu alfabēts:''' Nedrīkst izmantot latviešu alfabēta diakritiskās zīmes (garumzīmes, mīkstinājuma zīmes) vai citus nacionālos heroglifus/simbolus.
* '''Aizliegtie speciālie simboli:''' Nosaukumos ir stingri aizliegts izmantot tukšumzīmes (pauzes) un speciālos simbolus:
  <pre> / \ : * ? " < > | [ ] { } ; $ & % @ , </pre>
* '''Vārdu atdalītāji:''' Tukšumzīmju vietā loģisko daļu atdalīšanai atļauts izmantot tikai divus simbolus:
** Apakšsvītru (`_`) — strukturālo elementu un bloku atdalīšanai (piemēram, starp ISIL kodu un inventāra numuru).
** Domuzīmi / defisi (`-`) — viena bloka iekšējo elementu atdalīšanai (piemēram, hronoloģijai vai lapu numerācijai).
 
=== 2. Burtu reģistrs (Case Sensitivity) ===
Kaut arī ir atļauts lietot gan lielos, gan mazos burtus, jānodrošina stingra konsekvence. Daudzas operētājsistēmas (piemēram, uz Linux bāzēti serveri un mākoņkrātuves) atšķir lielos un mazos burtus, tādēļ `Foto001.tif` un `foto001.tif` tiks uztverti kā divi dažādi faili, kas var izraisīt datu zudumus sistēmu integrācijas laikā. Pamatprakse ir visā projektā lietot tikai mazos burtus (''lowercase'') vai stingri noteiktu reģistru sistēmu.
 
=== 3. Garuma ierobežojumi un ceļa garums ===
Vēsturiskais 32 simbolu ierobežojums vairs nav strikts standarts, taču joprojām ir spēkā **kopējā faila ceļa (Path length) ierobežojums** (piemēram, Windows vidē tie ir 260 simboli, ieskaitot visas mapes un apakšmapes). Tāpēc faila nosaukumam jābūt pēc iespējas kompaktākam.
 
=== 4. Skaitļu numerācija un liekās nulles ===
Ja shēmā tiek izmantota ciparu numerācija (piemēram, lapu vai kadru secībai), obligāti jāparedz '''fiksēts ciparu skaits ar liekajām nullēm priekšā''' (''padding''), prognozējot maksimālo iespējamo objekta apjomu. Tas nodrošina pareizu failu alfabētisko un hronoloģisko kārtošanu jebkurā programmatūrā.
 
{| class="wikitable" style="width:50%;"
! Plānotais apjoms !! Pareizs formāts !! Piemērs
|-
| Līdz 999 vienībām (3 zīmes) || `001, 002, ... 089, 120` || `LNB_F12_001.tif`
|-
| Līdz 9999 vienībām (4 zīmes) || `0001, 0002, ... 0450, 1100` || `LNB_K05_0001.tif`
|}
<blockquote>'''Svarīgi!''' Ja nulles netiek lietotas, sistēma datņu secību kārtos kļūdaini: 1, 10, 100, 2, 20...</blockquote>
 
=== 5. Datņu paplašinājumi ===
Datnes paplašinājums ir obligāts, tam precīzi jānorāda uz datu formātu un tas vienmēr rakstāms ar mazajiem burtiem (piemēram, `.tif`, `.jpg`, `.pdf`, `.wav`). Pirms paplašinājuma ir pieļaujams tikai viens punkts.
 
== Nosaukumu attiecība pret metadatiem ==
 
'''Zelta likums:''' Datnes nosaukums nav paredzēts satura aprakstīšanai. Skenēšanas laiku, vietu, operatora vārdu, fiziskos izmērus vai detalizētu satura izklāstu ir stingri ieteicams fiksēt struktūrētos metadatos (piemēram, METS/ALTO, MARC21 vai Dublin Core), nevis mēģināt to iekodēt garā un nepārskatāmā datnes nosaukumā.
 
Minimāls, standartizēts informācijas apjoms nosaukumā var kalpot kā ātra alternatīva tikai gadījumos, kad pilnvērtīga metadatu sistēma vēl nav ieviesta, taču ilgtermiņā praktiskāka ir īsa, unikāla identifikatora sistēma, kas ir sasaistīta ar ārējo datubāzi.
 
== Mapju struktūras veidošanas principi ==
 
Glabāšanas hierarhiju un mapju (direktoriju) struktūru veido neatkarīgi no konkrētajiem datņu nosaukumiem, ievērojot šādus strukturālos modeļus:
 
# '''Neatkarības princips:''' Mapes nosaukumam nav obligāti jādublē tajā esošo failu nosaukumi; tam jāraksturo struktūras līmenis.
# '''Hiearhija pēc satura grupām:''' Mapes pamatā atbilst oriģinālu fiziskajai vai loģiskajai struktūrai kultūras mantojuma iestādē:
#* `Kolekcija / Fonds` → `Aprakstāmais saraksts` → `Lieta / Sējums`.
# '''Grupēšana pēc datņu funkcijas:''' Var nodalīt arhīvdatnes (etalonkopijas) no publiskās lietotājdatnēm (piekļuves kopijām) atsevišķās mapju zarojumu sistēmās (piemēram, saknes mapē veidojot apakšmapes `/master` un `/access`).
# '''Vairāklapu dokumentu mapes:''' Grāmatām, periodikai vai lietām katram objektam tiek veidota sava unikāla mape, kuras iekšienē datnes tiek kārtotas atbilstoši fiziskajiem lapu vai kadru numuriem (izmantojot iepriekš minēto lieko nuļļu principu).
 
[[Kategorija:Digitalizācija]]
[[Kategorija:Datu pārvaldība]]
[[Kategorija:Metadati]]
[[Kategorija:Kvalitātes kontrole]]


== Skatīt arī ==
== Skatīt arī ==

Pašreizējā versija, 2026. gada 22. maijs, plkst. 15.04

Aktualizēts 22.05.2026skatīt izmaiņu vēsturi

⚠️ Šī lapa joprojām ir izstrādes stadijā.

Pirms jebkura digitalizācijas projekta uzsākšanas ir obligāti jāizveido, tehniski jāpārbauda un jāapstiprina vienota datņu un mapju nosaukumu veidošanas shēma. Konsekventa nosaukumu sistēma nodrošina datu integritāti, novērš datņu pārrakstīšanas riskus un garantē digitālo objektu veiksmīgu importēšanu ilglaicīgās saglabāšanas sistēmās (repizitorijos).

Identifikācijas metodes un automatizācija

Metodes izvēle ir tieši atkarīga no digitalizējamo objektu apjoma un institūcijas infrastruktūras:

  • Automatizētā pieeja (Masveida digitalizācija): Liela apjoma projektos identifikatoru un nosaukumu piešķiršanu pilnībā uztic programmatūrai (piemēram, skenēšanas un pēcapstrādes stacijām vai digitālo objektu pārvaldības sistēmām). Tas izslēdz cilvēciskā faktora kļūdas.
  • Manuālā vai hibrīdā pieeja: Mazāka apjoma projektos pieļaujama manuāla datņu pārsaukšana, taču arī šajā gadījumā jāizmanto stingras validācijas maskas, lai novērstu pārrakstīšanās kļūdas.
  • Sūtījumu un partiju kontrolkodi: Ja digitālie objekti tiek nodoti pakāpeniski vai vairākos sūtījumos (partijās / batches), nosaukumu struktūrā ieteicams iestrādāt specifisku partijas identifikatoru (piemēram, līguma numuru vai nodošanas datumu), kas atvieglo kvalitātes kontroli un masveida apstrādi.

Datņu nosaukumu veidošanas pamatprincipi

Labas prakses vadlīnijas nosaka, ka katram datnes nosaukumam jābūt:

  • Unikālam: Neviens digitālais resurss repozitorijā nedrīkst dublēt cita resursa nosaukumu vai identifikatoru.
  • Konsekventam: Visiem viena projekta vai kolekcijas failiem jābūt strukturētiem pēc stingri definēta šablona.
  • Pastāvīgam (Persistentam): Nosaukumā iekļautā informācija nedrīkst attiekties uz mainīgiem lielumiem (piemēram, nodaļas nosaukumu, pašreizējo programmatūru vai glabāšanas plauktu). Ideālā gadījumā nosaukuma pamatā ir objekta pastāvīgais identifikators (PID) vai starptautiskais ISIL kods (Starptautiskais bibliotēku un saistīto organizāciju identifikators).
  • Sasaistītam ar oriģinālu: Datnes nosaukumam jānodrošina tieša un nepārprotama saite uz fizisko oriģinālu, tāpēc tajā obligāti ietver fiziskā objekta uzziņas kodu, fondu/kolekcijas numuru vai inventāra numuru.

Tehniskie ierobežojumi un sintakse

Mūsdienu IKT sistēmas tehniski spēj apstrādāt garus un sarežģītus nosaukumus, taču starpsistēmu migrācijā un tīkla protokolos joprojām pastāv kritiski ierobežojumi.

1. Atļautie un aizliegtie simboli

  • Tikai latīņu alfabēts: Nedrīkst izmantot latviešu alfabēta diakritiskās zīmes (garumzīmes, mīkstinājuma zīmes) vai citus nacionālos heroglifus/simbolus.
  • Aizliegtie speciālie simboli: Nosaukumos ir stingri aizliegts izmantot tukšumzīmes (pauzes) un speciālos simbolus:
 / \ : * ? " < > | [ ] { } ; $ & % @ , 
  • Vārdu atdalītāji: Tukšumzīmju vietā loģisko daļu atdalīšanai atļauts izmantot tikai divus simbolus:
    • Apakšsvītru (`_`) — strukturālo elementu un bloku atdalīšanai (piemēram, starp ISIL kodu un inventāra numuru).
    • Domuzīmi / defisi (`-`) — viena bloka iekšējo elementu atdalīšanai (piemēram, hronoloģijai vai lapu numerācijai).

2. Burtu reģistrs (Case Sensitivity)

Kaut arī ir atļauts lietot gan lielos, gan mazos burtus, jānodrošina stingra konsekvence. Daudzas operētājsistēmas (piemēram, uz Linux bāzēti serveri un mākoņkrātuves) atšķir lielos un mazos burtus, tādēļ `Foto001.tif` un `foto001.tif` tiks uztverti kā divi dažādi faili, kas var izraisīt datu zudumus sistēmu integrācijas laikā. Pamatprakse ir visā projektā lietot tikai mazos burtus (lowercase) vai stingri noteiktu reģistru sistēmu.

3. Garuma ierobežojumi un ceļa garums

Vēsturiskais 32 simbolu ierobežojums vairs nav strikts standarts, taču joprojām ir spēkā **kopējā faila ceļa (Path length) ierobežojums** (piemēram, Windows vidē tie ir 260 simboli, ieskaitot visas mapes un apakšmapes). Tāpēc faila nosaukumam jābūt pēc iespējas kompaktākam.

4. Skaitļu numerācija un liekās nulles

Ja shēmā tiek izmantota ciparu numerācija (piemēram, lapu vai kadru secībai), obligāti jāparedz fiksēts ciparu skaits ar liekajām nullēm priekšā (padding), prognozējot maksimālo iespējamo objekta apjomu. Tas nodrošina pareizu failu alfabētisko un hronoloģisko kārtošanu jebkurā programmatūrā.

Plānotais apjoms Pareizs formāts Piemērs
Līdz 999 vienībām (3 zīmes) `001, 002, ... 089, 120` `LNB_F12_001.tif`
Līdz 9999 vienībām (4 zīmes) `0001, 0002, ... 0450, 1100` `LNB_K05_0001.tif`

Svarīgi! Ja nulles netiek lietotas, sistēma datņu secību kārtos kļūdaini: 1, 10, 100, 2, 20...

5. Datņu paplašinājumi

Datnes paplašinājums ir obligāts, tam precīzi jānorāda uz datu formātu un tas vienmēr rakstāms ar mazajiem burtiem (piemēram, `.tif`, `.jpg`, `.pdf`, `.wav`). Pirms paplašinājuma ir pieļaujams tikai viens punkts.

Nosaukumu attiecība pret metadatiem

Zelta likums: Datnes nosaukums nav paredzēts satura aprakstīšanai. Skenēšanas laiku, vietu, operatora vārdu, fiziskos izmērus vai detalizētu satura izklāstu ir stingri ieteicams fiksēt struktūrētos metadatos (piemēram, METS/ALTO, MARC21 vai Dublin Core), nevis mēģināt to iekodēt garā un nepārskatāmā datnes nosaukumā.

Minimāls, standartizēts informācijas apjoms nosaukumā var kalpot kā ātra alternatīva tikai gadījumos, kad pilnvērtīga metadatu sistēma vēl nav ieviesta, taču ilgtermiņā praktiskāka ir īsa, unikāla identifikatora sistēma, kas ir sasaistīta ar ārējo datubāzi.

Mapju struktūras veidošanas principi

Glabāšanas hierarhiju un mapju (direktoriju) struktūru veido neatkarīgi no konkrētajiem datņu nosaukumiem, ievērojot šādus strukturālos modeļus:

  1. Neatkarības princips: Mapes nosaukumam nav obligāti jādublē tajā esošo failu nosaukumi; tam jāraksturo struktūras līmenis.
  2. Hiearhija pēc satura grupām: Mapes pamatā atbilst oriģinālu fiziskajai vai loģiskajai struktūrai kultūras mantojuma iestādē:
    • `Kolekcija / Fonds` → `Aprakstāmais saraksts` → `Lieta / Sējums`.
  3. Grupēšana pēc datņu funkcijas: Var nodalīt arhīvdatnes (etalonkopijas) no publiskās lietotājdatnēm (piekļuves kopijām) atsevišķās mapju zarojumu sistēmās (piemēram, saknes mapē veidojot apakšmapes `/master` un `/access`).
  4. Vairāklapu dokumentu mapes: Grāmatām, periodikai vai lietām katram objektam tiek veidota sava unikāla mape, kuras iekšienē datnes tiek kārtotas atbilstoši fiziskajiem lapu vai kadru numuriem (izmantojot iepriekš minēto lieko nuļļu principu).

Skatīt arī