Hizkuntzen Arteko Corpusaren eta Egungo Testuen Corpusaren azken eguneratzearen aurkezpena

Aurreko ostiralean, maiatzaren 6an, EHUren Euskara Institutuaren zuzendari Pello Salabururekin batera, corpus eleaniztun berritzaile bat aurkeztu genuen Abandoibarrako Bizkaia Aretoan egindako prentsaurrekoan: Hizkuntzen Arteko Corpusa (HAC), hain zuzen ere. Hizkuntzak lan-tresna dituzten profesionalentzat oso baliagarri izango da corpus berria, bai itzultzaile, irakasle, idazle nahiz ikertzaileentzat. Era berean, euskaren corpusik handienaren (Egungo Testuen Corpusa) azken eguneratzea ere aurkeztu zen. Aipatzekoa da EHUren Euskara Institutuak Hizkuntza Politikarako sailburuordetzaren diru laguntza jaso duela azkeneko 12 urteotan. Aipatutako bi corpus hauez gain ere Euskara Institutuak garatutako beste bi produktu aurkeztu ziren.

Hizkuntza Corpusa:

Hizkuntza Corpus bat formatu elektronikoan bildutako testu multzo bat da. Izan ere, corpusak erreminta paregabeak dira hizkuntza bat ikertzeko eta kontsultak egiteko orduan. Bere helburua da esaldi edota hizkuntza baten alderdi konkreturen bat ikertzerakoan erreferentziazko elementua izatea. Corpusak ezinbestekoak dira gaur egun. Izan ere, hizkuntza guztiek egiten dituzte corpusak helburu desberdinekin. Euskara Institutuak ere baditu zenbait corpus. Askotan ezinbestekoa da corpus hauetan kontsultak egitea, informazio handia ematen baitute. Honakoak dira aurkeztu ziren produktu horien ezaugarri nagusiak:

Hizkuntzen Arteko Corpusa (HAC):

Corpus berezi eta berritzaile honek lau hizkuntza parekatzen ditu, testu berberekin: euskara, gaztelania, frantsesa eta ingelesa. Parekoak diren testuetan idazle bakoitzak hitza nola erabili duen ikusten da. Izan ere, corpus hau itzulpenak egiteko, adibidez, oso baliagarria da. Aldi berean, itzultzaileen lan egokia zein batzuetan ezinbestean egin behar diren ‘tranpatxoak’ agerian uzten ditu.

Hizkuntzen Arteko Corpusak lau hizkuntza hauetan idatzita dauden liburu eta testuak jasotzen ditu. Hau da, berdin du jatorrizko hizkuntza zein den. Izan ere, corpus honek bere barruan ditu Aristotelesen ‘Metafisika’ lana edota Jonathan Swiften ‘Gulliver-en bidaiak’ liburua. Lan hauek beste hainbat hizkuntzara egokitu dira baina frantsesez, euskaraz, gaztelaniaz eta ingelesez daudenez, badute tokia corpus honetan.

Honela, bilatzailean ‘etxea’ hitza idazten badugu, adibidez, testu hauetan zehar ‘etxea’ hitza agertzen diren esaldi guztiak agertuko zaizkigu eta itzultzaileek esaldi horiek nola itzuli dituzten ikusi ahal izango dugu. Erreminta paregabea da hau hizkuntza lan tresnatzat duten profesionalentzako. Alegia, oso baliagarria da beste itzultzaileen erreferentziak izateko.

Egungo Testuen Corpusa (ETC)

ETC XXI. mendeko testuekin egindako corpusa da eta bilaketak lemaka edo hitzeka egiteko aukera ematen du. Gordeta dituen testuak espresuki aukeratuak dira. Alegia, ez dira estatistikaz itsu-itsuan aukeratu, baizik eta argitaratzen diren testuen kalitateagatik aukeratu dira. Iturriak askotarikoak dira: liburuak, eleberriak, egunkariak, aldizkariak, eta abar. Testu hauek jatorrizkoak edota itzulpenak izan daitezke. Aipatu beharra dago dagoeneko 270 milioi hitz dituela Egungo Testuen Corpusak (hasiera batean 205 milioi hitz zituen eta azken eguneratzea dela eta, beste 65 milioi hitz gehitu zaizkio).

“Corpus honen hitz kopurua izugarria da: 270 milioikoa. Konparazio baterako, 2015ean RAErenak 215 milioi zituen”

Corpus honen hitz kopurua izugarri handia da. Izan ere, euskaraz dagoen corpusik handiena da. RAEren mende honetako testuen corpusarekin alderatuta, Egungo Testuen Corpusak hitz kopuru gehiago dauka. 2015ean egin zuten azken eguneratzea eta garai hartan 215 milioi hitz zituen RAErenak.

Bestalde, batez ere ikasleei begira egin diren bi aplikazio aurkeztu ziren:

Euskal Adizkitegi Automatikoa (ordenagailuan, telefono eta tabletetan). Euskal adizkien berri ematen du. Aditz formanteak (nor-nori-nork), aldia (oraina, iragana) eta ahala (bai, ez) aukeratu eta modu automatikoan sortzen ditu adizkiak. Edo alderantziz: adizkia eman eta osagaiak ateratzen ditu kolore ezberdinetan.

Euskal Kasutegi Automatikoa (ordenagailuan): nahi den hitza hartu, numeroa (sing/pl), kasua edo postposizio mota aukeratu, eta berehala emango du adibide bat, eta esteka egiten du datu-baseetan ditugun gainerako adibide guztietara. Hitzaren definizioa ere ematen du.

Oso pozgarria egin zitzaidan guzti hauen aurkezpenean egotea, Euskara Institutua garatzen ari den hizkuntza-programa eta baliabideen berri emateko ekitaldian. Izan ere, 2008an sinatu zuen Eusko Jaurlaritzak Institutuarekin lehenbiziko lankidetza hitzarmena; eta, zorionez, elkarlan hori fruitu bikainak ematen ari da; ostiralean azaldutako proiektu zehatzez gainera, hor dago, besteak beste, Euskal Gramatika Sarean egitasmoa ere, Institutua duela zenbait urte lantzen ari dena eta hasiera beretik sarean eskuragarri egon dena.

Hizkuntza bat —eta euskara ez da salbuespen bat— kode huts bat izatetik zerbait bizia izatera hiztunen ezpainetan eta idazleen testuetan igarotzen da. Hiztunik gabe ez dago hizkuntza bizirik. Eta idazlerik gabe ez dago hizkuntza aurreraturik. Hizkuntza komunikatzeko tresna dugu gizakiok. Hizkuntza baten biziraupenean eta ‘osasun’ mailan, bada beti giltzarri den ezaugarri bat: unean uneko gizartearentzat eta hiztunentzat baliagarria izaten asmatzea. Guk ongi dakigu hizkuntza baten bilakaeran faktore anitzek eragiten dutela, hizkuntzaz kanpoko askok barne. Eragiten dute faktore politikoek, sozialek, kulturalek. Eragiten dute faktore indibidualek ere: hiztunen gogoak, atxikimenduak, hizkuntza gaitasunak eta abarrek. Baina hizkuntza bat sasoiko eta sendo egon dadin, berebiziko garrantzia du baita ere hizkuntzaren beraren garapenak: alegia, corpusa hiztunen beharretara une oro egokitzeko ahalmenak eta baliabide linguistikoak berritzeko gaitasunak. Axularrek aizkora zorrotzaren metafora erabili zuen euskara komunikaziorako hizkuntza baliagarriaren —garatutako hizkuntzaren— balioa azpimarratzeko, eta Mitxelenak “elkarrekin mintzatzeko tresna zorrotza” izatea eman zion eginkizun euskarari.

Duela berrogeita hamar urte pasatxo euskararen batasuna abiatu zen. Duela hogeita hamabost urte pasatxo euskara biziberritzeko prozesua, autogobernuak ahalbidetu duena. Nekez sinetsi zitekeen orduan, euskarak gaur duen egoera eta dituen baliabideak izango zituenik. Esparru eta giro jakin batzuetara zokoratuta egotetik, esparru, giro eta funtzio sozial ugari bere egitera igaro da euskara. Euskarak, gaur, ez du arrotz eskola, ez unibertsitatea, ez teknika, ez hedabideak, ez lan mundua, ez kirola, ez beste ezein arlo. Euskarak era askotako erabiltzaileak ditu, gero eta gehiago. Zorionez, baita gero eta arlo gehiagotan ere: idazle, kazetari, itzultzaile, ikasle, irakasle, profesionalak eta abar.

Eta euskara-erabiltzaileok lanabes eta erreferentzia egokiak behar ditugu, kontsultatzen errazak eta gure jarduna etengabe hobetzeko baliagarriak. Euskara Institutuak aurkeztutako corpusak horren adibide bikaina dira. Aukera ematen digute gaur egungo hizkuntza produkzioen berri modu  hautatu eta sistematikoan berehala jasotzeko. Gizarte modernoen erronka nagusietako bat informazioa eta jakintza kudeatzen jakitea den honetan, hara non euskarazko gaur-gaurko produkzioaren berri bat-batean jasotzeko baliabide eraginkorrak ditugun sarean, denon eskura.

Hori dena erabiltzaileen mesederako da, une jakin batean izan ditzakegun zalantzak berehala argitzeko modua ematen digulako. Eta ona da, nola ez, euskararentzat berarentzat ere. Tresna biziagoa, ahaltsuagoa, zehatzagoa, zorrotzagoa bihurtzen duelako. Erabiliaren erabiliz bakarrik hobetu daitekeelako hizkuntza bat. Maiatzaren 5ean aurkeztu genuen ‘Eta hemendik aurrera zer?’ dokumentua, Euskararen Aholku Batzordearen Euskara 21 Taldeak onartua. Dokumentu horretan jasotzen dira datozen 20 urteetarako hizkuntza politikaren oinarriak.  Helburuetan helburu da, euskara bizia, gero eta biziagoa. Horretarako ez dago erabilera beste errezetarik, eta erabiltzeko, lehen esan bezala, tresna arina, aberatsa eta erosoa izan behar zaigu euskara. Horretarako lagungarria da, bete-betean, Euskara Institutuaren lana eta ostiralean aurkeztutakoa.

Lizardi olerkari handiak behin esan zuenez “baina nik hizkuntza larrekoa nahi haunat, noranahikoa; jakite hegoek igoa; soina zahar, berri gogoa…”. Zer ondo uztartzen den Lizardiren amets hura egin ditugun urratsekin: hizkuntza zaharra bai, baina modernoa ere bai; gogoberritua, eguneratua, zorroztua, noranahiko prestatua. Olerki hura zela eta, Bernardo Atxaga idazleak behinola esandako hitz hauek datozkit gogora: “Bada, «noranahikoa» izateko, literaturan bezala biologian zein administrazioan erabili ahal izateko, euskarak prestaketa modu hori behar zuen. Hori gabe, aldarrikatu zezakeen hainbatek —herri tradizioaren edertasunaz ohartzeko gai izandakoek, kasu— bere balioa; baina urte gutxiko kontua izango zen. Izan ere, erabilerak eusten dio hizkuntzari; erabilerak ematen dio baliorik handiena”.

Egungo Testuen Corpusa  eta Hizkuntza Arteko Corpusa izan genituen ostiralean mintzagai. Corpus-lanabes hauetan, pentsa daiteke erabilera ikergaia dela; baina, zinez, erabilera xede da, baita ere. Gaur egungo hizkuntza-ekoizpen erreala ongi ezagutzeak eta zabaltzeak hegoak emango baitizkio euskarari. Gauza bera esan daiteke aditzak edo deklinabideak kontsultatzeko ‘on line’ aplikazioez ere.

Uste dut badugula nabarmendu beharreko beste kontu bat: euskara eta berrikuntza eskutik doazela, euskara eta komunikazio-teknologia berriak ongi atxikita doazela, gaur egungo gizarte aurreratu batek eskatzen duen bezala. Horregatik, zorionak, Salaburu jaunari, egiten ari diren lan bikainagatik. Gertu izango gaituzte lantegi honetan, elkarlan leialean, 2008. urtetik hona izan gaituzten bezalaxe. Hizkuntza Politikarako Sailburuordetzak euren esku jarritako dirua, ez da gastua, inbertsioa da, inbertsio errentagarria: erruz biderkatua itzultzen baitiote diru hori gizarteari, euskal hiztunei, euskararen erabiltzaileei.

la foto 2

Pello Salabururekin, ostiraleko prentsaurrekoan.

Partekatu - Comparte:
  • Print
  • Add to favorites
  • del.icio.us
  • Facebook
  • Twitter
  • Google Bookmarks

Acerca de Patxi Baztarrika

Patxi Baztarrika Galparsoro (Ataun, 1958) Filosofia eta Letretan lizentziatua Euskal Herriko Unibertsitatean. 2005etik 2009ra eta 2012ko abendutik aurrera, Eusko Jaurlaritzako Hizkuntza Politikarako sailburuordea. Lehenago Andoaingo Udalean hizkuntza teknikari modura aritutakoa. 'Babeli gorazarre' liburuaren egilea (2010).
Esta entrada fue publicada en Idatziak-Articulos. Guarda el enlace permanente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *