Category Archives: tehnologie

3 siteuri demne de reținut pentru curatorii digitali

 

Europeana 4 D – Interfata spatio temporară

Acest proiect dezvoltat în cadrul Europeana este un exemplu de explorare a unor seturi de elemente nu doar geografic, dar și temporar. De exemplu se pot vedea de câte ori apare un anumit termen/cuvânt cheie de-a lungul timpului, în diverse părți ale globului. Un lucru foarte demn de admirat este folosirea unor hărți specifice perioadelor cercetate. Dacă se cercetează răspândirea crinului regal de-a lungul secolelor, de exemplu, harta Europei se modifică în funcție de configurațiile vremii. Se pot, bineînțeles, face comparații între diverse astfel de cuvinte cheie. Ce este promițător la acest proiect este, pe lângă faptul că sunt câteva seturi de date pregătite din Europeana, IMDB, Flikr sau din alte surse de date deschise (open data), se pot folosi propriile seturi de date, dacă sunt în format .kml. Mai multe specificații despre acest tip de fișier se pot găsi aici.Cred că este o unealtă foarte potrivită celor care vor să facă cercetări comparative și latura istorică are o relevanță ridicată.

Graphic Atlas

Un ghid excelent pentru identificarea perioadelor din care provine o anumită fotografie. Una dintre cele mai bine gândite și detaliate unelte de acest gen, mi-aș dori foarte mult să văd alte exemple asemnănătoare pentru documente aflate pe cele mai diverse suporturi. Se pot face mici incursiuni de detectiv arheologici pornind de la informațiile extrem de bine structurate în acest site. Un microscop ar fi o adăugare foarte utilă acestui mic kit informativ, multe dintre exemplele de procese fotografice conținând imagini foarte detaliate ale suprafeței sau marginii fotografiei. Un site excelent pentru cei care vor să se educe în diversele forme pe care le-a luat fotografia până acum.

Omeka

Omeka este unul dintre cele mai bine gândite sisteme de realizare a epozițiilor virtuale sau de implemetare a arhivelor digitale. Gândit de la bun început pentru fonduri de arhivă, are o seamă de funcții specializate: transformarea informațiilor dintr-un fișier .csv (care se poate obține foarte ușor dintr-un fișier .xls) în format Dublin Core, adăugarea unei hărți pentru geolocalizarea elemtentelor din colecție, implementarea sistemului Scripto pentru transcrierea colectivă a manuscriselor. Aceste funcții pot fi bineînțeles extinse cu ajutorul pluginurilor, la o adică putând fi create pluginuri care să îndeplinească funcții noi, și mai puternic customizate. Omeka este susținut de Center for History and New Media Roy Rosenzweig, cei care au susținut multe alte proiecte de implementare a uneltelor digitale în mediul universitar.

 

Experimentul Eminescu (1)

Zilele acestea mă las în totalitate fascinat de Processing. Pare a fi cel mai accesibil limbaj de programare pentru începători. Cel mai motivant aspect al Processingului este feedbackul foarte rapid pe care îl primesti de la cele câteva linii de cod pe care, ca începător, înveți să le scrii. Plus că se găsesc foarte multe coduri sursă cu care poti experimenta, începând de la cele de pe OpenProcessing pâna la codurile sursa ale unor giganți cum ar fi Flight 40 sau Jeremy Thorp.
Bineînțeles că ești mult mai motivat să înveți ceva dacă ai un proiect clar în minte. Azi mi-am amintit cum în liceu ni se spunea că Eminescu a reușit să își scrie întreaga operă folosind în jur de 5.000 de cuvinte (s-ar putea să îmi amintesc greșit sau să fi fost o informație falsă). Oricum ar fi, m-am gândit că e o bună provocare să folosesc processing pentru a analiza cât mai mult din opera sa și pentru a reda rezultatele cât mai spectaculos. E un bun început și poate vor fi și alții interesați de rezultate.

Scopuri:

  • să învăț comenzile legate de manipularea textului.
  • să realizez diverse statistici legate de corpusului unui text (să obțin numărul total de caractere, de cuvinte, numărul de ocurențe a fiecărui cuvânt, legăturile dintre diverse cuvinte, sa se facă automat distincția între diverse poezii și și acestea să poată fi analizate separat).
  • să redau aceste statistici sub formă grafică (cuvintele cele mai folosite să umple o imagine vectorială).

Opțional:

  • să realizez o interfață interactivă pentru analizarea corpusului de texte.

Primul lucru pe care l-am făcut a fost să caut o colecție cât mai mare a operelor sale. Bineînțeles, am preferat un format digital. Există un CD-ROM cu operele sale complete. Am intrat în posesia fișierului eminescu.iso. Interfața este doar pentru Windows, dar oricum nu cred ca mi-ar fi fost de mare ajutor. Din fericire informația este destul de accesibilă. În structura CD-ului există un director Program files > PETAR > Eminescu > DATA > OPERE cu multe fișiere HTML. Din păcate aceste fișiere sunt cam dezordonate și fiind o ediție critică conțin multe note de care nu am nevoie. Am căutat mai departe.

Pe WikiSource am găsit pagina dedicată lui Eminescu, cu multe texte. Dar cum sunt peste 500 de linkuri, am avut nevoie de o metodă rapidă de a salva toate fișierele din browser. Cea mai eficientă a fost pluginul de Firefox DownThemAll!. Foarte rapid am obținut toate paginile cu texte pornind de la pagina principală. Ceea ce m-a interesat in continuare a fost să obțin un fișier .txt care să conțină toate textele descărcate. Le-am deschis pe toate în Pages, dar cred ca la fel ar funcționa și în Word. Pages a recunoscut doar textul din interiorul fișierelor .html, igonorând tagurile. Printr-un șir de “Find and replace” am reușit să curăț acceptabil textul. Totuși, va mai dura o vreme până când voi avea o variantă măcar beta a textului de folosit.
De ce am nevoie de o versiune în format .txt a textului? Pentru că Processing are o grămadă de opțiuni foarte utile, există deja o tradiție de analizare a clasicilor cu ajutorul acestor unelte  (Shakespeare a fost deja supus unui tratament mult mai riguros). Uneori rezultatele sunt de-a dreptul spectaculoase.

.