Archives on the web

Posted: noiembrie 27, 2010 in Arhive şi arhivişti
Etichete:, , ,

Am, pe acest blog, în persoana domnului Emil Perhinschi, un cititor care mă întreabă constant când începe digitalizarea arhivelor româneşti. Îi mulţumesc pentru lectură şi pentru interesul – atât de sporadic, din păcate, în societatea românească – faţă de soarta documentelor din Arhivele Naţionale. Sper ca acest post să îi placă şi să îi poată răspunde la întrebare mai detaliat decât am facut-o pînă acum. Şi sper să fie interesant şi pentru alţii, chiar pentru cei care nu se numără printre vizitatorii constanţi ai Arhivelor.
Zilele acestea am avut ocazia să particip la conferinţa organizată la Viena de ICARUS având exact această temă, „Archives on the web-Experiences, Challenges, Visions”. A fost o experienţă cât se poate de instructivă pentru mine, nu doar pentru că m-a ajutat să îmi confrunt cunoştinţele şi nivelul profesional cu ale altora, ci, mai ales, pentru că mi-a permis să îmi înfrunt una dintre principalele temeri personale: cum poţi vorbi, ca arhivist absolvent de studii umaniste, despre informatizare şi alte „IT stuff” fără să fii mini-tehnicus de vocaţie şi totuşi să nu cazi în ridicolul diletantismului. Cred că e o temere pe care o au, undeva bine ascunsă în mintea lor, majoritatea colegilor din România. Prea puţini îndrăznesc însă să o vocalizeze, de teama de a nu părea „defazaţi”. Eu cred, însă, că e firesc şi necesar să vorbim deschis despre temerile noastre, pentru a le putea apoi înfrunta cu mai multe şanse de succes.
Cum se întâmplă de câte ori iau contact cu mediul profesional extra-românesc, demonul facil al comparaţiei a pus stăpânire pe mine şi de această dată. L-am lăsat să mă bântuie, spunându-mi că, la urma urmei, se poate scoate ceva util din asta. Şi, spre surprinderea în primul rând a mea, concluziile nu au mai fost, pentru prima oară după mulţi ani, doar pesimiste.
Ca să mă înţelegeţi, voi spune mai întâi că a fost pentru prima dată când am putut prezenta un proiect concret, ceva ce ştiu cu destulă certitudine că se va şi întâmpla în realitate. Am putut, în consecinţă, discuta pe lucruri punctuale, pune întrebări şi răspunde la întrebări pe chestii practice, nu doar pe experienţe livreşti, ori wishful thinking. A fost un schimb real de idei şi informaţii pe care sper să le transmit cât mai repede şi cât mai departe printre arhiviştii români.
În al doilea rând, m-am simţit, pentru prima dată, acceptată în comunitatea profesională internaţională, ca reprezentant al unei instituţii de arhivă credibilă şi respectată. Nu e deloc cel mai mic lucru, dat fiind că, până mai acum câţiva ani, era greu să faci faţă fără ipocrizie întrebărilor stânjenitoare al căror substrat era real şi de înţeles.
În sfârşit, poate cea mai importantă constatare pentru mine a fost că nu suntem chiar aşa departe de „lumea civilizată”. Micile proiecte de digitalizare, cu parteneri din mediul academic, sunt cele care par a fi cele mai prizate şi de succes, în materie de digitalizare a documentelor de arhivă. Aşadar, politica pe care au dus-o Arhivele româneşti în ultimii trei ani, cu rezultate deja vizibile, de tipul Fototecii on-line a comunismului românesc, a fost corectă şi, ca să zic aşa, în trend. Chiar dacă aveam un feeling, e bine să mai ai, din când în când, câte o confirmare. Am remarcat, de asemenea, şi la alţii temerile şi îndoielile care mă macină pe mine, având astfel confirmarea că nu sunt singura angoasată de pe lumea asta. Mi-a plăcut constatarea unui coleg german că, în materie de informatizare a arhivelor, nimeni nu poate spune cu certitudine ce ne aduce ziua de mâine. Tot ce poţi face este să porneşti în explorare cu conştiinţa că fiecare pas e o descoperire şi chiar o autodescoperire. Desigur, cu cât ceea ce îţi propui este mai ambiţios, cu atât desţelenirea va fi mai dificilă, dar poţi oricând să-ţi faci curaj uitându-te în curtea vecinului şi încercând să nu-i repeţi greşelile. Am putut, tot pentru prima dată, să vorbesc despre preocupările româneşti pentru adoptarea standardelor arhivistice internaţionale de tipul ISAD(G) fără să bat câmpii, pentru că şi aici avem un proiect concret, în curs de finalizare.
Cred că paşii mici pe care i-am făcut până acum la Arhivele din România în direcţia informatizării (pentru că de la acest ground zero pornim), dar şi digitalizării (mobilizând resurse extra-instituţionale din zona academică) au fost pe de-o parte reali, pe de altă parte concreţi şi făcuţi în direcţia corectă.
Nu o spun doar pentru încurajare/autoîncurajare şi nici ca un mod bizantin – pe care îl detest – de a ridica „osanale”. Sunt prima care se îngreţoşază la ideea asta şi, de altfel, în alte privinţe, sunt perfect conştientă de defectele noastre. Mi-aş dori, spre exemplu, să trăiesc într-o comunitate profesională a arhiviştilor români care să fie mai puţin divizată pe criterii ariviste, în care să nu mai primeze logica lui homo homini lupus, ci aceea a interesului comun. Mi-aş dori să fim mai toleranţi unii cu alţii şi mai preocupaţi de calitatea muncii noastre. Mi-aş dori ca unii dintre noi să fie mai puţin blazaţi şi jemenfichişti, iar alţii mai puţin justiţiari. Mi-aş dori să nu ne mai proclamăm chiorii profeţi şi să înţelegem că a fi chior în ţara orbilor e, cel mult, o mare responsabilitate, în niciun caz însă o virtute. Mi-aş dori să fim solidari, să acţionăm toţi pentru aceleaşi scopuri şi, dacă se poate, să nu abdicăm de la convingerea că nu prestăm o simplă activitate birocratică, ci să vrem să facem o muncă cu adevărat intelectuală. Cum vedeţi, mi-aş dori multe.
Cel puţin în această direcţie a „digitalizării arhivelor”, cred însă – deşi multora le va părea paradoxal – că suntem pe drumul cel bun: am început cu paşi mici, dar concreţi în termeni de rezultate, încet-încet s-au mai urnit şi mentalităţile, am întredeschis o uşă şi ne facem curaj să intrăm pe ea. Cum zicea mama lui Napoleon, pourvu que ça dure! Îl invit pe domnul Emil Perhinschi să participe la noul concurs pe care Arhivele Naţionale îl propun cercetătorilor, iar pe colegii arhivişti să mă dezbată, comenteze, critice, beştelească.
Pentru cei interesaţi, găsiţi mai jos şi prezentarea PowerPoint cu care mi-am însoţit intervenţia la conferinţă:
Learning from others’ experiences

Comentarii
  1. delaepicentru spune:

    Io tot încerc să promovez o idee ce mi-a venit prin 2004. E drept, nu pentru arhivele naţionale, ci pentru ariva CNSAS. Pentru a nu înzorzona spaţiul de aici, o găsiţi la mine. Poate merită să aflaţi şi cîte ceva despre „ontica arhivistică” în viziunea unui nespecialist.

  2. Radu A. spune:

    Bravo!
    Mă bucură preocupările tale legate de informatizarea ANR!
    Am citit articolul tău postat pe site şi ţi-am urmărit prezentarea făcută la Viena.
    Eu am încercat să fac un site gratuit, bazat pe resursele oferite în acest moment de Internet şi a ieşit asta: http://sites.google.com/site/arhivearges/.
    Sunt de acord cu Emil că se poate face informatizare cu bani puţini. Situl Arhivelor Argeş este găzduit gratuit pe google sites care oferă doar 100 de MB, dar cu trafic nelimitat! Tot ce înseamnă spaţiu suplimentar de stoacare presupune să plăteşti. Pot spune că putem să folosesc alte situri care îmi ofereau mult mai mult spaţiu de stocare cum ar fi ucoz.com, drupal.org, joomla.org, etc. dar am ales google sites pentru că îmi inspiră mai multă încredere!
    Documentele de pe situl Arhivelor Argeş depăşeşc deja circa 3GB şi suntem de abia la început… Majoritate sunt păstrate pe situri terţe, tot gratuite, cum sunt cele de file hosting (pentru găzduirea documentelor text şi pdf folosesc scribd.com, dar mai sunt şi altele ca edocr.com, issuu.com, docstoc.com, pentru fişiere video folosesc youtube.com deţinut de google, etc. şi pentru fişiere foto, picasa.com, tot de la google care îşi fac împreună treaba foarte bine având în vedere că sunt resurse GRATUITE).
    Singurul impediment pe termen mai lung este că se poate să fii notificat că unele din servicii urmează să fie plătite sau mai rău, că se vor închide, dar şi în asemenea condiţii sigur vor exista soluţii…

    Şi încă ceva: inventarele PDF de pe situl ANR sunt de fapt ex-documente WORD.doc transformate în PDF-uri după care li s-a trântit un watermark (NB filigran) cu „Arhivele Naţionale ale României”, unele de culoare galben-icter, care se văd şi din satelit! Totuşi, unele nventare vechi, pot fi scanate sau fotografiate şi transformate în fişiere PDF searchable, dar din câte am văzut pe site nu e nici măcar unul…

    • Radu, ce spui tu merge pentru un trafic mic de date. Adica exact ce spuneam si eu: proiectele mici sunt fezabile ca si cost, dar prezinta riscul ca raman punctuale si au interconectivitate redusa. Cat priveste chestia cu pdf searchable, sa stii ca pentru asta iti trebuie licenta de Adobe Professional, care…stii cat costa pentru uz institutional? Sa nu-mi spui ca se poate face pdf si gratuit, ca stiu si am folosit pentru fisierele personale, dar pentru fisiere mai mari (cum sunt aceste Word-uri cu inventarele) deja nu mai functioneaza atat de bine.
      Ia gandeste-te, ti s-a intamplat vreodata in ultimul timp sa ti se aloce in buget bani pentru achizitionarea de licente de soft? Mie, nu.
      Tocmai asta cred ca va fi marele castig al proiectului nostru: vom crea un portal in care sa introduca si sa acceseze date toate structurile AN si care sa ofere cititorilor acces direct la documente (si la inventarele lor, asta e important).
      Apropo de cum faci accesibile on-line inventarele vechi, am avut ocazia sa vad asta in Franta, anul trecut. Ei au ales sa scaneze, sa ocerizeze si apoi sa copieze datele in campurile noii baze electronice. Lucrau cu o firma pakistaneza, care avea angajati multi si prost platiti. Nu i-a costat mult tot sistemul, cu portal si tot: vreo 100.000 euro. Chiar nu e mult, la aceasta anvergura a solutiei tehnice.

  3. Emil spune:

    „proiectele de anvergura sunt scumpe”

    Nu e nevoie de anvergura: e nevoie de access la documente pentru cele 300 de persoane interesate de arhivele istorice, deci nu e nevoie de super servere si infrastructura.

    Bani sunt: cat a cheltuit in 2004 Academia cu digitizarea unui singur periodic din Cernauti ? … din cate am auzit eu, pentru 600 de pagini scanate si publicate ca imagini simple s-au cheltuit 20000 Euro … si textele nici macar nu erau in domeniul public …

    Cat a costat fototeca ? Stiti ca sunt softuri gratuite care fac acelasi lucru, ba chiar mai bine ?

    Nu-mi raspundeti … acum mi-am amintit de anii in care faceam circuitul „Arhive (10 dosare, mare marjoritate chitante amestecate cu adeverinte etc., gata in 1 ora) -> 40 min. pe drum -> Biblioteca Academiei (3 buletine, doua ore de asteptare, o ora consultat cartea adusa) -> 20 min pe drum -> BCU” in fiecare zi si nu mi se mai pare amuzant.

    • Nu va raspund, daca nu doriti, dar sa stiti ca va dau dreptate. Circuitul pe care il descrieti e extrem de neplacut. Fototeca a costat extrem de putin, dar ea a fost facuta cu resursele tehnice ale partenerului. La AN suntem in stadiul in care avem cam un calculator la trei oameni, si asta la Bucuresti, unde stam inca bine. Unele dintre aceste calculatoare au deja 10 ani vechime. Cu scanerele stam si mai prost. De aceea vorbeam de un ground zero de la care trebuie sa plecam si care consta, efectiv, in achizitia de aparatura. In ce priveste capacitatea serverelor, din cate am mai vorbit si eu cu niste IT-isti, pentru volumul de date si de trafic pe care il avem noi (si orice arhiva din lumea asta), ele trebuie sa fie puternice; plus serverele asa-zise de back-up, obligatorii ca sa nu pierzi baza de date. Plus alte caracteristici tehnice pe care si partea de hard si cea de soft trebuie sa le indeplineasca pentru a putea comunica cu alte baze de date, a asigura interconectivitatea, sustine traficul, etc.
      Nu stiu cum stau lucrurile la Academie, deci nu discut, dar la sala de studiu a Arhivelor s-a marit si numarul de dosare, s-a micsorat si timpul de asteptare pentru ele.
      Imi pare rau ca va suntem antipatici. Noi ne straduim sa fim simpatici, dar – asta e! – cateodata mai dam si rateuri. Oricum, sunt mult mai mult de 300 de persoane care se intereseaza de documentele de la Arhive. Ceea ce nu poate decat sa ne bucure si sa ne motiveze. Va multumesc ca sunteti printre cei interesati si imi doresc ca numarul celor interesati sa creasca continuu.

  4. Emil spune:

    Detectez un pic de sarcasm ?

    Din pacate nu corespund baremului de varsta, fiind trecut de 35 de ani, si nici cercetator nu mai sunt, scriind soft pentru firme private din 2004. Interesul meu il puteti verifica in semnaturile de pe dosarele MCIP de … la origini pana catre 1900, sau in proiectul depus (degeaba, desi ceream f. putini bani) prin 2002-2003 inpreuna cu un coleg de la ISSEE privind digitizarea bibliotecii.

    Digitalizarea e o problema simpla, si se poate porni doar cu costuri anuale de maxim 2000 Euro in echipamente si sub 500Euro pe luna in munca (sau sunt mobilizati angajati care deja sunt platiti). Digitalizarea serioasa ar incepe cu scanarea indicilor arhivelor si includerea imaginilor intr-o baza de date accesibila pe web. Fototeca etc. sunt doar cascadorii care ajuta cercetarea la fel de mult ca si limita de 10 dosare pe zi pe care o practica arhiva pe vremea cand o frecventam, sau limita de trei buletine de cerere practicata de Biblioteca Academiei.

    Softul, suficient de bun sa puteti porni, care sa serveasca la administrearea colectiei de imagini si la publicarea pe web se scrie in 2 saptamani, daca nu va convine sa folositi unul deja scris pentru firme (www.alfresco.com, de ex., care e open source si gratuit daca nu ii platiti sa va instaleze ei).

    Ce aveti nevoie pentru a incepe serios digitalizarea:
    – 1 calculator cu 2 discuri dure puse in mirroring RAID (1TB ajunge pentru primul an) care sa serveasca si de storage, si de server de web,
    – un scanner de office
    – un HDD portabil pe USB si DVD-uri pentru backup.
    Cine va spune ca aveti nevoie de mai mult incearca sa va mulga de bani.

    Scanarea va dura 2 pagini pe minut cu un scanner f. ieftin, si mai mult de 30 pagini pe minut cu unul rezonabil la pret … arhiva are avantajul ca majoritatea dosarelor au foi volante, deci nu e nevoie de scannere speciale. Zvonul ca scanarea distruge documentele vechi e gargara: o coala dintr-un dosar are nevoie sa treaca prin scanner de maxim doua ori, e incalzita mai putin decat in copator, si dupa aceea nu va mai fi niciodata nevoie sa fie mutata de pe raft decat daca se inlocuiesc rafturile: avantajul mi se pare evident.

    De ce nu se prea scaneaza in Europa ? Pentru ca s-au alocat bani pe proiecte imbecile, cum ar fi „libraria europeana” (sau „motorul de cautare” european, care a inghitit sute de milioane de euro si nu a ajuns nicaieri), care a inghitit milioane de euro si a iesit o colectie de fotografii adunate de la institutiile care colaboreaza, si nu se baga bani in chestii care ar da rezultate utile, cum fac de ex. in Australia http://trove.nla.gov.au/, unde se pare ca sunt in stare sa digitizeze sistematic, sa treaca prin OCR imaginile si sa mobilizeze cititorii sa corecteze greselile de recunoastere, inclusiv periodice in format mare. Alt exemplu superb e BNF cu http://gallica.bnf.fr … nu vad de ce arhivele nu ar face la fel … in schim se pierd in nimicuri de fototeci care au „Sursa: – ” sau „Clasificare subiect:” … care e misiunea arhivelor daca nu sa permita citarea unei resurse dand acces la date de atribuire complete.

    Putem sta sa ne vaicarim sau sa ne ascundem dupa deget cat vrem, dar adevarul e ca e nevoie doar de dorinta adevarata de a face ceva.

    Nu o sa va mai stresez in viitor.

    • Nici vorba de sarcasm! Dimpotriva, chiar cred sincer ca avem nevoie de ajutor, sfat si chiar vigilenta ca sa nu dormim in front. Asa ca, va rog mult, mai stresati-ma si pe viitor. Chiar ma bucura, sincer. Sper sa va pot proba in viitorul apropiat ca avem si bunavointa si chiar ca miscam ceva.
      In ce priveste celelalte observatii, poate ca aveti dreptate: proiectele de anvergura sunt scumpe, rezultatele se vad doar in ani, nu in luni, asa ca putine organizatii sau state sunt dispuse sa investeasca in ele. Sper sa cream incepand cu 2011 la AN un portal mai asemanator cu Gallica decat cu Europeana, pentru ca exact asta e ideea de la care plecam si noi: mai intai inventare on-line si abia dupa aceea scanare de documente. Asta e, de altfel, ideea de la care se pleaca in general pentru punerea on-line a documentelor de arhiva.
      Daca nu cumva il stiti deja, un proiect care imi place este cel al Arhivelor din Croatia, ARHINET. Ei au inceput in 2006, dar deja rezultatele se vad. Cam asta e durata dupa care poti spune daca un proiect de informatizare in arhive a avut sau nu succes: doi-trei ani.

      • Avem deja niste inventare pdf-izate si accesibile, in acest format, on-line. Le gasiti aici:

        http://www.arhivelenationale.ro/index.php?lan=0&page=145

        Despre acest proiect austriac de digitizare zisa wiki, cu colaborarea cititorilor la completarea descrierii arhivistice, s-a vorbit si la conferinta de saptamana trecuta. Se pare ca si in Italia exista ceva asemanator. E o idee noua si interesanta, dar pentru asta iti trebuie mai intai un portal. Dupa ce il vom avea, poate incercam si in Romania aceasta experienta, ar fi frumos.

    • Sorin spune:

      Din umila mea experienţă într-ale digitalizării, un „scanner f.ieftin”, este total impropriu, iar munca necesară, o mare consumatoare de timp. Mai mult, datorită faptului că, digitalizarea unui document de arhivă prezintă cu totul alte caracteristici faţă de cea a unui „document oarecare”, impune prelucrarea acestor imagini astfel că un document în formă electronică poate conţine mai multe imagini. Într-adevăr, efortul privind dotarea nu ar trebui să fie foarte mare, adevărata piatră de încercare o reprezintă stabilirea unor norme de lucru şi implementarea acestora. Ce părere o să aveţi când veţi citi un document în formă electronică de genul = paginile 35-36, cu denumirea fişierelor imag1289-imag1290 şi fără alte metadate?! Şi apropo, nr. dosarelor cu foi volante pe care le-am întâlnit până acum, reprezintă cam 10-15 % din documentele scanate. Cu tot respectul!

  5. […] Archives on the web Sat Nov 27, 2010 13:02 pm Am, pe acest blog, în persoana domnului Emil Perhinschi, un cititor care mă întreabă constant când începe digitalizarea arhivelor româneşti. Îi mulţumesc pentru lectură şi pentru interesul – atât de sporadic, din păcate, în societatea românească – faţă de soarta documentelor din Arhivele Naţionale. Sper ca acest post să îi placă şi să îi poată […] […]

Lasă un răspuns către alinapavelescu Anulează răspunsul