luni, ianuarie 21, 2008

Comisia Europeană simplifică şi face mai accesibilă traducerea asistată de calculator


Comisia Europeană simplifică şi face mai accesibilă traducerea asistată de calculator Comisia Europeană face un nou pas în demersul de promovare a multilingvismului, considerat un element fundamental al unităţii Europei în diversitate. Comisia deţine o culegere care reuneşte aproximativ un milion de fraze, însoţite de traducerile lor de foarte bună calitate în 22 dintre cele 23 de limbi oficiale ale UE – inclusiv cele ale noilor state membre. Această culegere, cea mai vastă existentă într-un număr atât de mare de limbi, este acum disponibilă gratuit. Acest tip de date este foarte căutat de dezvoltatorii de sisteme de traducere asistată de calculator, în cadrul cărora programul de traducere automată „învaţă” din textele traduse manual modul în care se traduc corect cuvintele şi frazele, în funcţie de context. Aceste date contribuie, de asemenea, la dezvoltarea altor instrumente software lingvistice, cum ar fi corectoarele ortografice şi gramaticale, dicţionarele online şi sistemele de clasificare a textelor multilingve.

Leonard Orban, Comisarul european pentru multilingvism, a afirmat: „Prin această iniţiativă, Comisia Europeană intenţionează să impulsioneze tehnologiile limbajului uman, să sprijine multilingvismul şi să transforme traducerea asistată de calculator într-un instrument mai simplu, mai ieftin şi mai accesibil. Cetăţenii din comunităţile lingvistice mai mici vor avea mai uşor acces la documente şi pagini web disponibile numai în cele mai utilizate limbi.”

Janez Potočnik, Comisarul european pentru ştiință și cercetare, a declarat: „Această colecţie unică de date din domeniul lingvistic contribuie la crearea unei noi generaţii de instrumente software de procesare a limbajului uman şi sprijină dezvoltarea competitivităţii sectorului lingvistic, care este deja unul dintre sectoarele cu cea mai rapidă creştere din Uniunea Europeană.”

Instituţiile UE au mai multe texte multilingve decât orice altă organizaţie, întrucât legislaţia UE trebuie să fie disponibilă în toate cele 23 de limbi oficiale. Serviciile de traducere ale instituţiilor lucrează cu 253 de combinaţii posibile de perechi lingvistice şi traduc aproximativ 1,5 milioane de pagini pe an.

Pe internet se pot găsi numeroase traduceri ale unor texte în engleză sau franceză, însă pentru limbi ca letona sau româna astfel de materiale sunt rare şi sunt practic inexistente în cazul combinaţiei dintre două limbi pentru care există puţine resurse.

În consecinţă, Comisia face publice, pe baza cooperării dintre traducătorii săi şi specialiştii din structurile interne, culegeri ample de fraze extrase din documente juridice, pe teme tehnice, politice şi sociale, disponibile în 22 de limbi. În acest fond de traduceri se pot găsi fraze care au echivalent în toate celelalte limbi oficiale. Doar traducerile în irlandeză rămân încă nedisponibile. Publicarea acestor date lingvistice ilustrează politica transparentă a Comisiei în vederea reutilizării resurselor sale de informaţii şi se înscrie în abordarea adoptată prin deschiderea bazelor de date ale UE, Eur-Lex şi IATE, care conţin documente legislative, respectiv resurse terminologice.

Comisia deţine o vastă experienţă în ceea ce priveşte dezvoltarea instrumentelor de procesare a textelor multilingve şi se situează în prima linie a multilingvismului, făcând accesibile pentru public site-uri de căutare a ştirilor, care acoperă până la 35 de limbi, prin intermediul instrumentului său European Media Monitoring. Cel de-al şaptelea Program-cadru pentru cercetare şi dezvoltare – prin componenta sa „Tehnologiile informaţiei şi comunicaţiilor” – sprijină cercetarea în domeniul traducerii asistate de calculator şi a altor tehnologii care ţin de limbaj.

Pentru mai multe informaţii despre datele privind traducerile:

http://langtech.jrc.it/DGT-TM.html

European Media Monitor poate fi accesat la următoarea adresă: http://emm.jrc.it/overview.html


(http://europa.eu/rapid/pressReleasesAction.do?reference=IP/08/60&format=HTML&aged=0&language=RO&guiLanguage=en)

Niciun comentariu: