WEB 3.0
Web 3.0 martxan jartzerako orduan, “Data Web” delakoak paper garrantzitsua bete du, interneten banatzen den informazioa XML, RDF eta mikroformatoetakoa baita. Data Web-ek datuen sartze eta eguneratzea errazten du, interaktiboagoa bihurtuz. Horregatik smentika-weberako lehen urratsa izan da.
Web 3.0-k ez du alde hori bakarrik aztertzen. Askok inteligentzia artifiziala ezinezkotzat jotzen dute baina Google bezalakoek uste dute egingarria dela. Haien nahietako bat, adibidez, gauzak iragarri eta aurreikustea da.
Web 3.0 semantika-webaren garapen gisara ere uler daiteke.
Web 3.0-ren beste urratsetako bat 3 dimentsiotako bisiora jotzea da, bertan Web 3D Consortium da buru.
Web 1.0 irakurtzea ahalbidetzen duen sarea da, Web 2.0 aurrekoaren estensio bat da, irakurtzea eta idaztea ahalbidetzen duena, erabiltzaileari parte hartze aktiboa eskainiz. 3.0-k webguneen edukien artean zentzuzko erlazioak sortzeko balioko du, aurreko bien estensioa izanik.
UZEIk dituen egitasmoak
Hona hemen UZEIren egitasmoak:
-Euskararen normalizazio linguistikoaren alde lan egitea
- Euskararen barnean, xede berezietako hizkeren finkapena eta hedapena sustatzea. Euskararekin zerikusia duten hiztegi eta lan terminologiko eta lexikografikoak egitea, horretarako irizpide lexikografikoak eta terminologikoak finkatuz.
- Datu-banku terminologikoa eta Datu-base lexikografikoa antolatu eta mantentzea. Terminologia eta lexikografiako ikastaroak antolatu eta ematea. Lexikografiari eta terminologiari buruzko biltzarretan eta jardunaldietan parte hartzea. Kontsulta telematikoaren zerbitzuak sortu eta mantentzea.
- Euskal lexikoaren eboluzio zehatza etengabe aztertzea, egungo euskararen lexikoaren corpusa bilduz eta ikertuz.
- Hizkuntza naturala prozesatzeko proiektuetan parte hartu eta hizkuntzalaritza aplikatuaren arloan ikerketak bultzatzea eta indartzea.
- Euskararen moldatze-lanak burutzea, bai bertan testu originalak sortuz eta baita ere beste hizkuntzetan sortutako testuak itzuliz.
- Unibertsitateekin eta hizkuntzaren arloan ikerketa egiten duten bestelako erakundeekin harreman kulturalak izatea eta lankidetza-hitzarmenak egitea.
- Bekadunak trebatu eta ikerketa-proiektuetan sartzeko aukera ematea.
UZEI
UZEI 1977an sortu zen, hizkuntza edozein hiztunek edozein lan-eremutan egokitasunez eta zehaztasunez erabil dezan.
Urtetan egindako hiztegi terminologiko guztiak banku terminologiko batean sartu ziren. Honela, 1986an EUSKALTERM terminologia-bankua sortu zen bere baitan.
1987an, 226/1987 Dekretuaren arabera eta berariazko lankidetza-hitzarmena izenpetuz, Eusko Jaurlaritzaren Babespeko Elkarte bihurtu zen hizkuntza-plangintzako ikerlanean aritzeko.
1989an, Onura Publikoko aitorpena eman zion Eusko Jaurlaritzak hizkuntzaren ikerketan eskaintzen dituen zerbitzuengatik, Euskal Autonomia Erkidegoaren interes orokorreko lanak sustatzen dituelako.
Egun hauek dira UZEIren jarduera-lerro nagusiak:
Hiztegi Orokorra: UZEIko Lexikografia Sailak Euskaltzaindiaren Hiztegi Baturako ikerketa-lana egiten du. Hiztegi osagarriak ere lantzen ditu sail honek (Sinonimoen Hiztegia adibidez).
Corpusgintza: Euskarazko testu-corpusen diseinuan, egituratzean eta lematizazioan aitzindaria da UZEI. Emaitzarik aipagarriena XX. Mendeko Euskararen Corpusa da. Egun, itzulpen-corpusak kudeatzeko sistemen garapenean ari da UZEI.
Hiztegi teknikoak: Hastapenetik ari da UZEI hiztegigintzan. Hiztegiak UZEIk sortu zuen EUSKALTERM banku terminologiko publikoan integratzen dira. UZEI, terminologiaren normalkuntzarako erabakiak hartzen dituen Eusko Jaurlaritzaren Terminologia Batzordeko kide da.
Itzulpengintza teknikoa: Lan terminologikoarekin lotura izanik, UZEIk arlo berezietako itzulpen eta lokalizazioak egiten ditu, besteak beste informatikan, medikuntzan, zuzenbidean, arkitekturan eta enpresa-kudeaketan.
Trebakuntza: Bere lanaren hedapenari garrantzia ematen dio UZEIk. Horrela jardunaldiak eta kongresuak antolatzeaz gain, trebakuntza eskaintzen du bere ezagutza-esparrutan, unibertsitatean eta graduondokoetan.
Hizkuntza-teknologiak: UZEI INNOBASQUEko kide da eta hainbat ikerketa-lerro ditu irekiak bere ezagutza-esparruetan (terminologian eta lexikografian). Horretaz gain Bruselako Adierazpenaren sinatzaile ere bada UZEI.
Iztulpengintza automatikoa
Itzulpengintza etengabe hedatzen ari den honetan, ondorengo dokumentua aurkitu dut itzulpengintzaren teknikarik sinpleena ulertzeko, prozesua alegia: http://www.justizia.net/docuteca/Documentos/2990Zer%20da%20itzulpen%20automatikoa.pdf
Egia da euskaraz oso zaila dela itzultzaile automatiko bat egitea. Izan ere, euskara hain da ezberdina non makina batek zailtasunak dituen itzultzeko.
Itzulpen automatikoa (labur IA edo MT – Machine translation) da iturburu-hizkuntzako testu batetik abiatuta helburu-hizkuntzako testu (ia) baliokide bat lortzea makina bat erabilita. IA ez da nahastu behar konputagailuz lagundutako itzulpenarekin ez eta itzulpen-memorien erabilpen soilarekin.
Itzulpengintza automatikoa hizkuntza teknologiaren garapenean nabarmen lagundu duen diziplina da. Zeregin nagusia hori duten elkarte zientifikoak, aldizkari bereziak, unibertsitate departamentuak eta enpresak daude. Martin Kayren esanetan[1]:
| Itzultzeko makinak lortzeko irrika horrek hizkuntzalaritza, filosofia, matematika edo informatika diziplinetako zenbait buruargiren arreta merezi izan du. Horretaz gain, itzulpen automatikoak jarraitzaile leial batzuengan erakarpen liluragarria pizten du. Zer dela eta lilura hori? |
Bitarteko mekanikoen bidez itzultzea bada erronka zientifiko bat. Baina itzulpen automatikoak horrenbesteko interesa piztearen benetako arrazoiak ez du sustrai zientifikorik, behar praktikoan du jatorria, informazioaren jarioan alegia.
Suedia eta Finlandia Europako Batzordean sartu zirenean 1995ean, 60.000 arautze komunitario inguru itzuli behar izan ziren, “acquis communautaire” izenaz ezagutzen direnak. Hiru urte beranduago, 1999an, Bruselako legegizonen ahalegin nekaezinari esker, 20.000 arautzetan handitu zen kopurua. Ekialdeko Europako herriak EBan berehala sartzeak oso hizkuntza egoera delikatuan jartzen du Batzordea eta teknologia berrien aurrerakadak baino ezin lagun dezake egoera arintzen.
2007ko euskarazko itzultzaile automatikoa sortzeko lehia
Eusko Jaurlaritzako Hizkuntza Politikarako Sailburuordetzak jarri zuen abian euskarazko itzultzaile automatikoa sortzeko prozesua. Lehiaketa publikora deitu aurretik hizkuntzen prozesamendu automatikoan lan egiten zuten bost enpresei (Eleka Ingeniaritza Linguistikoa, EmergiaTech, InterLan System, Automatic Trans eta Translendium) informazioa eskatu eta itzulpen proba bat jarri zien. 2007ko apirilean egindako aurkezpen eta probak adituek aztertu zituzten eta ondoren, uda aurretik, lehiaketa publikoa abiatu zuten. Lorea Bilbao Hizkuntza Politikarako Sailburuordetzako aholkulariaren esanetan, gaztelania-euskara eta euskara-gaztelania itzultzaileak bi urtean egin ditzakete.
Zer da Corpus bat?
Euskaraz “c” hizkia erabiltzen ez den arren, adituek corpus “c”-rekin idaztea gomendatzen dute.
Corpus bat hizkuntza batean dauden adibide-hitzen zerrenda baten modukoa da. Atalka banatu ohi dira corpusak, bakar bat egitea ez litzatekeelako zehatza izango.
Elhuyar hiztegiak, adibidez, zientziaren inguruko korpus bat kaleratu du sarean.
Internet informazio-iturri ikaragarria da. Inork gutxik jartzen du zalantzan hori. Egun, informazioa bilatzeko ez ezik, gero eta gehiago erabiltzen da hizkuntza-kontsultak egiteko, corpusak osatzeko eta abarretarako. Hala, Internet baliabide linguistiko eta corpusen iturri aproposa bilakatzen ari da pixkanaka. Horren adibide bat da CorpEus, Internet euskarazko corpus erraldoi gisa baliatzeko aukera ematen duen tresna.
Corpusen kontuak baditu bere alde ez hain onak ere. CorpEus orain arteko corpusen osagarri izango da. Alabaina, abantailak ez ezik, zenbait desabantaila ere baditu. Batetik, arestian aipatu den bezala, Internet linguistikoki etiketatu gabea denez, nolabaiteko ziurgabetasuna izango du beti lema bat baino gehiago dituzten hitzekin. Pilotari hitza bilatzean, adibidez; izan ere, pilota hitzaren datiboa ez ezik, pilotan jokatzen duen pertsona ere bada pilotaria. Beste desabantaila bat da orraztu gabea dela neurri handi batean –blogak, foroak, eduki pertsonala eta horrelakoak, batez ere–; abantaila gisa ikus badaiteke ere (ahozko hizkuntzatik hurbil dagoen eredua ematen delako), desabantaila ere bada, kalitatez txarragoa eta akastuna izan baitaiteke.
Hona hemen Elhuyar Fundazioko kideen argazki bat:
Euskaltzaindia
Euskaltzaindia Oñatin sortu zen 1919an. Gaur egun Bilboko Plaza Berrian du egoitza eta Euskal Herriko lurralde ezberdinetan dauzka ordezkaritzak.
Hona hemen Euskaltzaindiaren helburuak:
-Euskara zaintzea
-Euskara aztertzea
-Euskara zabaltzea
-Euskara hobetzea
-Euskararen gramatika-arauak aztertzea
-Hizkuntzaren erabilera bultzatu eta euskaldunen hizkuntza-eskubideen alde egitea
Euskaltzaindiako lehen euskaltzain-burua Resurrección María Azkue (1919-1951) izan zen eta geroztik andana bat pasatu dira. Euskaltzaindian buruez gain euskaltzainak daude. Maila ezberdinean kokatuta daude eta euskaltzainen zerrenda bat egin daiteke.
Euskaltzaindia batzorde ezberdinetan banatuta dago, hona hemen batzordeen zerrenda:
Euskaraz ez dakitenentzat, Euskaltzaindiari buruz ari den gune eder bat aurkitu dut sarean: http://www.euskonews.com/0041zbk/gaia4103es.html
Euskaltzaindiak euskararen arautzeari buruz idatzi duen dokumentu hau baliagarria izan daiteke Euskaltzaindia zer den ez dakien batek ulertzeko: http://www.euskomedia.org/PDFAnlt/riev/45011041.pdf
Hiztegiak sarean
Sarean geroz eta hiztegi gehiago aurki ditzakegu. Geroz eta jende gehiagok jotzen du sarera hiztegiak kontsultatzeko, aldi berean praktikoa eta fidagarria baita. Hori bai, kontuz ibili behar da non sartzen garen kontsulta bat egiterako orduan.
Sarean euskaraz dugun baliabiderik aberatsena hiztegia.net. Webgune horrek euskaraz sarean dauden hiztegia guztietarako esteka dauka eta atlka banatuak ditu:
-Orokorrak
-Sinonimoak
-Herriz herri
-Entziklopediak
-Gaika
-Erderazkoak
Nik etengabe erabiltzen dudan sareko hiztegi bat Harluxet Hiztegi entziklopedikoa da. Aldi berean fidagarria, praktikoa, erosoa eta interesagrria iruditzen zait eta.
Bestalde, sarean beste eratako hiztegiak aurki ditzakegu, eta ez soilik euskarazkoak. Hizkuntzatik hizkuntzara itzultzen duten hiztegiak aipatuko ditut orain. Hona hemen hiztegi horien zerrenda txiki bat:
Ingelesa: http://dictionary.reference.com/
Frantsesa: http://www.le-dictionnaire.com/
Gaztelania-euskara: http://www1.euskadi.net/hizt_3000/indice_e.htm
Multilinguea : www.wordreference.com
A taldearen lana
A taldea Arrate Pavón, Maria Lanz, Alba Estrada, Janire Etxebarrieta eta bostok osatzen dugu. Gure lana juntagailu hautakariei buruzkoa da eta bertan zein juntagailu noiz erabili behar den zehazten dugu.
Gure lana wikian kaleratu dugu, Joseba Abaituarentzako egindako lana baita.
Hona proiektua aurrera eramateko erabili dugun bibliografia:
Corpus-a osatzeko erabilitako bibliografia:
- UZEI: http://www.uzei.com
- Ereduzko prosa gaur corpusa: http://www.ehu.es/euskara-orria/euskara/ereduzkoa/
- Xx.mendeko euskararen corpus estilistikoa: http://www.euskaracorpusa.net/XXmendea/
Bibliografia
Sarean
- Euskaltzaindia: http://www.euskaltzaindia.net
- Harluxet hiztegi entziklopedikoa: http://www1.euskadi.net/harluxet/
- http://www.hiru.com
- http://www.erabili.com
Liburuak
- MICHELENA, L. (1987 – 2005): Orotariko Euskal Hiztegia. Bilbao. Euskaltzaindia
- Euskal gramatika osoa (1995-2000), Ilari Zubiri eta Entzi Zubiri, Didaktiker
- Euskara eta Literatura, Ibaizabal (1997), Ana Mari Agirre
El libro electrónico
En 1971 se dieron los primeros pasos hacia lo que hoy en día conocemos como libro electrónico o libro digital, con Michael Hart al frente del Proyecto Gutemberg (www.gutenberg.net.) de la Universidad de Illinois, el cual consiste en una biblioteca digital gratuita en cuyo acervo se encuentran obras clásicas de autores como Skakespeare, Poe y Dante y otras del dominio público (no sujetas a derechos de autor), cuya colección alcanza la suma de 2,000 libros hasta abril del 2002.
Diez años después, en 1981, salió al mercado el primer libro electrónico con fines comerciales, el Random House’s Electronic Dictionary, editado por Random House, pero la verdadera expansión del libro digital llegó en marzo del 2001 cuando el famoso novelista Stephen King, apoyado por la editora electrónica Simon&Schuster, lanzó en exclusiva a través de Internet su novela Riding the Bullet, que en tan sólo 48 horas vendió 500 mil copias, cada una en 2 dólares y medio; un mes después, Vladimir Putin publicó en red sus memorias.
A partir de entonces comenzaron a surgir varias editoriales electrónicas, y las tiendas virtuales comenzaron a incluir libros digitales en su catálogo; algunos ejemplares para la venta y otros se ofrecen en forma gratuita.
También conocido como libro digital o eBook, el libro electrónico es una publicación cuyo soporte no es el papel sino un archivo electrónico, su texto se presenta en formato digital y se almacena en diskette, CD-Room o en Internet. El libro electrónico permite incorporar elementos multimedia como vídeo, audio, y en el caso de Internet, posibilita enlaces a otras páginas de libros digitales de la red.
La Norma Open eBook
Con el objeto de unificar el formato de publicación utilizado por las editoriales electrónicas, se presentó la Normativa Open eBook (www.openebook.com ), promovida por el Open eBooK Forum, en la 1» Feria del Libro Electrónico celebrada en 1998 en Gaithersburg, Maryland, Estados Unidos. De esta manera, en 1999 se logró la versión final 1.0 de la especificación denominada “Estructura de Publicación del Libro-e Abierto (Open eBook Publication Structure)”, que determinó la plataforma html y xml como el estándar para esta forma electrónica.
He encontrado en internet un sitio interesante con e-books: http://www.artxibogipuzkoa.gipuzkoakultura.net/libros-e-liburuak/bekak-becas02.php
