Post on 13-Feb-2017
Bloc 2:
«Lexicografia i informàtica: l’elaboració i difusió dels diccionaris»
Noves Tecnologies aplicades a la Filologia catalana
Sandra Montserrat sandra.montserrat@ua.es
1. Explicar la importància de la informàtica en l’elaboració idistribució de la tasca lexicogràfica
2. Analitzar i saber gestionar bases de dades per al’elaboració de diccionaris electrònics en català, així comtambé les interfícies d’usuari.
3. Descriure els principals diccionaris electrònics del català,en relació amb les característiques de consulta.
Objectius
2.1 El treball del lexicògraf i les noves tecnologies
- Què és la lexicografia?
Recordem amb freqüència Escalígero, que fa quatre segles va dir en bellsversos llatins que els grans criminals no haurien de ser condemnats a mort,ni a treballs forçats, sinó a compilar diccionaris, ja que aquesta tascacomporta tots els treballs possibles. I també el prefaci que Samuel Johnsonva escriure per al seu diccionari: “El trist destí de qui habita en les faenesmés baixes de l’intel·lecte és el de ser espentats més per la por al castic queper l’esperança del premi; el de trobar-se exposats a la censura, sense capesperança de rebre elogis, el de caure en la desgràcia per les seues erradeso ser castigats pels oblits i mai més ser lloats pels èxits i recompensats perla seua diligència. Entre aquests infeliços mortals es troben els autors delsdiccionaris” (Modificat i traduït a partir de Marina, J.A, y López Penas, M.(2000), El diccionario de los sentimientos, Barcelona: Anagrama)
Vocables Escurs(http://www.lluisvives.com/servlet/SirveObras/jlv/72586176426892126449935/index.htm)
Diccionari Escrig (http://www.lluisvives.com/FichaObra.html?Ref=3874&portal=1)
2.1 El treball del lexicògraf i les noves tecnologies
- Què és la lexicografia ara?
Gelpí (2003:309) assenyala dos moments i dos fetsrevolucionaris en la pràctica lexicogràfica:
1. XVIII Incorporació de la fitxa
2. XX Incorporació de la informàtica
DCVB
Pascual (1994). En la fixació de la lexicografia moderna hiha un moment important i ineludible: la celebració delCongrés Internacional de lexicografia celebrat a Exeter(1983). Arran d’aquest Congrés es va fundar EURALEX(European Association for Lexicography).
http://www.euralex.org/
2.1 El treball del lexicògraf i les noves tecnologies
- Què és la lexicografia ara?
Es defineix la tasca d’un lexicògraf
a) Ha de tenir en compte els progressos de la semànticateòrica, però no ha de perdre de vista que ha de ferDICCIONARIS.
- exigències editorials- temps d’edició de l’obra- compromisos contractuals, limitacions d’espai,
rendibilitat de l’obra, resposta del públic, etc.
2.1 El treball del lexicògraf i les noves tecnologies
- Què és la lexicografia ara?
b) La faena del lexicògraf consisteix bàsicament en tres operacions:
Selecció de materials (MACROESTRUCTURA)Descripció dels materials seleccionats (MICROESTRUCTURA)Presentació de l’obra (edició)
2.1 El treball del lexicògraf i les noves tecnologies
- Què és la lexicografia ara?
Es defineix la tasca d’un lexicògraf
c) Tanmateix, el lexicògraf, a més, ha de conéixer les eines i lesqüestions informàtiques si aspira a una obra lexicogràfica dequalitat, moderna i àgil (Águila Escobar 2006:4). Apareix elconcepte de BASE DE DADES i de DICCIONARI ELECTRÒNIC
Actualment conviuen els plantejaments metodològics tradicionals –especialment en la forma consolidada durant el segle XIX-, ques’apliquen encara d’una manera bastant generalitzada, amb elspostulats de l’anomenada lexicografia moderna, que s’han anatobrint pas amb una sèrie de realitzacions concretes; elsplantejaments més innovadors són, en bona part, conseqüència delsavenços significatius que la linguística ha fet durant el segleXX. Des d’un altre punt de vista, l’extraordinari desenvolupament deles tècniques informàtiques ha tingut una repercussió notable en larenovació medològica: la utilització dels ordinadors i de lesgrans bases de dades permet el tractament adequat i sistemàticde l’enorme quantitat d’informació que entra en joc a l’horad’elaborar un diccionari (Rafel 2005:11)
2.1 El treball del lexicògraf i les noves tecnologies
- Què és la lexicografia ara?
2.1 El treball del lexicògraf i les noves tecnologies
- En què consisteix la tasca del lexicògraf ara?
LEXICOGRAFIA MODERNA
1. Fase lexicogràfica (Rafel 2005: 73-80)
a) Analitza les novetats teòriquesb) Analitza les novetats pràctiques (corpus)
2. Fase diccionarística (elaboració, base de dades)
LEXEMÀTICA
3. Productes lexicogràfics: el diccionari electrònic
F1. Fase lexicogràfica (Rafel 2005: 73-80)
a) Analitza les novetats teòriquesb) Analitza les novetats pràctiques (corpus)
2.1 El treball del lexicògraf i les noves tecnologies
qualsevol teoria lingüística, comporta una visió particularsobre el lèxic i, per tant, proposa unes tasqueslexicogràfiques determinades (Badia 1994:15)
Lexicografia moderna
Lexicografia tradicional
cognitivisme
estructuralisme
generativisme
a) Analitza les novetats teòriques
2.1 El treball del lexicògraf i les noves tecnologies
abillàr, adornar, aliñar, componer (Diccionario Valenciano-Castellano, Carles Ros, 1764)
apetìr, apetecèr: quando se toma por deseàr una cosa, y gustàr mucho de ella: lo que no
se entiende solo de las cosas corporales, como las viandas, y alimentos (que en essa
significacion, en Valenciano, se dize tambien, abellìr): si que assimesmo se estiende à lo
que el animo desea, como las honras, dignidades. (Diccionario Valenciano-Castellano,
Carles Ros, 1764)
bugàda, colàda: fer bugàda, hazer la colada, ò colar la ropa: ponerla en la canasta de mimbres, ò
en el coladèro, ù tarro de hazer la colada, y echar la lexìa, para que colando, y passando por los
agujeros que forman los mimbres, se limpie, y blanquèe. NOTA XII: en Valencia se haze la colada
en un tarro grande, que nombran cosi, con la o agùda: èste à la parte de abaxo, ù la inferior,
tiene un agujero, con unos como labios, ù hocicos que salen afuera, en forma circular,
nombrado el agujero, en Valenciano, duèll, donde se encàxa un cañòn de caña gruesso, y và por
èl colando la lexìa, à una caldera, que hay à la lumbre, para calentarla: encima del cosi ponen un
colador (ù cernadero) que se nombra cendrèr, que es de càñamo, pero gordo, y burdo, con un
àro, para que no se derràme la lexìa, ni la ceniza, que echan al cendrèr, ò cernadero, ù coladòr.
(Diccionario Valenciano-Castellano, Carles Ros, 1764)
Lexicografia tradicional
apuntarse. v. r. [...] // Comensar á ferse agre lo vi. Repuntarse, apuntarse [...].
blanquet, a. adj. [...] // m. Plom reduhit per los vapors del vinagre á una substancia
semblant al guix peró blavenca, y mès suau al tacto. Albayalde, cerusa calde plomo. [...]
// Afeyt que usan las donas para semblar blancas. Blanquete [...].
bordo. m. Costat exterior de la nau y també tota ella. Bordo. [...] // Volta de la nau sobre
lo costat pera guanyar lo vent. Bordo. [...] // met. Passeig freqüent. Bordo. [...].
Pere Labèrnia (1839-1840)
Lexicografia tradicional
Exemple del Diccionari Escolar Valencià, Vox (s.v. pondre)
Estructuralisme
Jordi Ginebra i Anna Montserrat (1999):
Diccionari d’ús dels verbs catalans.
Règim verbal i canvi i caiguda de
preposicions
Generativisme
Didac. Diccionari de català http://www.dicdidac.cat/
DEFINICIONS EXPERIENCIALS
Cognitivisme
Longman Dictionary of Contemporary English (s.vcatch) http://www.ldoceonline.com/
Cognitivisme
DEFINICIONS EXPERIENCIALS
«Los lingüistas hablan ahora de un lexicón mental,entendiendo por tal la realidad mental que existe en loshablantes y que se plasma en una red de conexionessemánticas, morfológicas, fonológicas y, también,onológicas y culturales, en el seno del cual cada plabratiene un papel único y especial, con sus conexiones ylazos (asociativos, estructurales, colocativos, etc.)peculiares» (Luque Durán 1998: 89)
«s’ha retornat a una idea natural des del punt de vistapsicològic, que el coneixement que els parlants tenim dela llengua és més un coneixement de les seves peceslèxiques que no pas de relacions entre esructuressintàctiques abstractes [...] La lexicografia està cridadaa esdevenir una branca essencial de la lingüística»(Badia 1997: 4)
Cognitivisme i diccionaris
b) Analitza les novetats pràctiques: els diccionaris basats en corpus
Els lexicògrafs sempre han buscat fonts d’informació per aescollir els lemes o definir les entrades d’un diccionari(Pérez 2002, en línia)
a) La intuïciób) Altres diccionarisc) Fonts tradicionals (llibres, cites…)
Estas tres fuentes de información, aunque parcialmente válidas,no se consideran hoy día suficientes para la ardua labor decompilación de diccionarios que quieran dar una visiónactualizada y completa del uso lingüístico (Pérez 2002, en línia)
2.1 El treball del lexicògraf i les noves tecnologies
Los diccionarios basados en córpora son repertorios quemuestran la lengua tal y como se considera que es, ya que sebasan en datos comprobados directamente y no sólo enrepertorios anteriores o conocimientos lexicográficos (Soler, enlínia)
Els diccionaris basats en corpus
Para la mayoría de los lexicógrafos, los córpora se hanconvertido en una herramienta lexicográfica fundamental para elestudio de las diferentes acepciones de una palabra que han deincluirse en las entradas léxicas y para el estudio de lascolocaciones y la fraseología (Pérez 2002, en línia)
Diccionari descriptiu de la llengua catalana (DDLC) http://dcc.iecat.net/ddlc/index.asp
Els diccionaris basats en corpus
Els diccionaris basats en corpus
(COBUILD o Longman)
Longman Dictionary of Contemporary English (s.v angry)
Longman Dictionary of Contemporary English (s.v flask)
PROTOTIPICITAT
Longman Dictionary of Contemporary English (s.v pin)
PROTOTIPICITAT
2.2 Gestió de diccionaris en base de dades
Continguts
F2. Fase diccionarística (elaboració del diccionari)
La base de dades constitueixen un dels grans avençostecnològics de la mà de la informàtica, i s’ha convertit enun element essencial en la lexicografia actual (ÁguilaEscobar 2006: 5):
1. Cal dissenyar-les bé, d’acord amb l’objectiu2. Permeten la revisió ràpida i contínua del que
s’elabora3. Permeten l’estructuració i sistematització
Base de dades del Diccionari escolar Valencià Vox
La aparición de los recursos informáticos en la vida cotidiana de losestudiosos e investigadores dentro del campo de la lingüística (al igual queen otros campos), supone, entre otros aspectos, la apertura de productostradicionales a nuevas dimensiones. En el caso de los diccionarios, lainformática propicia que sean liberados del férreo corsé que en muchossentidos supone el papel. Se discute sobre si la informática anulará al libroimpreso o si convivirán los dos soportes, pero ya nadie duda de laimportancia que puede tener el soporte electrónico. [...] El diccionario enformato electrónico ofrece muchas más posibilidades de las que permite elantiguo soporte. Entre las más importantes cabe mencionar: a) facilidad demanejo, b) accesos múltiples a las informaciones y c) recorridos de lecturadiversos, d) saltos hipertextuales, e) saltos reticulares, f) multidiccionario, g)multimedia y h) interacción y actualización. Algunas de estas posibilidadesaún no se encuentran en los diccionarios accesibles en la Red, pero es desuponer que en un futuro inmediato podremos ya gozar de ellas(Joan Torruella i Casañas, «Los diccionarios en la Red», Seminario deFilología e Informática : http://seneca.uab.es/)
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Continguts
F3. Productes lexicogràfics
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Un diccionari electrònic és aquell que està fet en suportelectrònic i es consulta mitjançant procedimentsinformàtics (Gelpí 2003:310):
1. Diccionaris màquina: incorporats a sistemes de traducció automàtica
2. Diccionaris digitalitzats: versionselectròniques de diccionaris editats en paper
3. Diccionaris en línia: veritables diccionarisdigitals disponibles en CD-Rom i internet
Continguts
1. Diccionaris màquina
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
# Declaració de símbols
%symbol <PresInd>; # Present d'indicatiu
%symbol <1p>; # Primera persona
%symbol <sg>; # Singular
%symbol <2p>; # Segona persona
%symbol <pl>; # Plural
# ... etc.
# Definició de paradigmes
[ó] >(ó:<sg>) # noms en
| (ons:<pl>) ; # -ó
[pi1] >(e:<1p><sg>) # present d'indicatiu
| (es:<2p><sg>)
| (a:<3p><sg>)
| (em:<1p><pl>)
| (eu:<2p><pl>)
| (en:<3p><pl>);
[V1C] >(0:<PresInd>)[pi1] # primera conj.
| (av:<ImpInd>)[ii1]
| (àveu:<ImpInd><2p><pl>)
# ... etc.
# Diccionari
%dic
(estim:estimar<verb>)[V1C];
(acci:acció<noun><fem>)[ó] # acció
Continguts
2. Diccionaris digitalitzats
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
DIEC
Continguts
3. Diccionaris en línia
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Diccionari de sinònims de frases fetes
Continguts
Característiques dels diccionaris electrònics(digitalitzats i en línia)
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
El diccionari digitalitzat no significa solament un canvi desuport, sinó que implica tot un canvi del concepte d’obralexicogràfica. Segons Torruella (en línia) permet:
a) Facilitat de consultab) Accesos múltiples a la informacióc) Recorreguts de lectura diversosd) Salts hipertextualse) Salts reticularsf) Multidiccionarig) Multimèdiah) Interacció i actualització
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
a) Facilitat de consulta
DCVB
Continguts
Gran Diccionari de la llengua catalana http://www.grec.net/home/cel/dicc.htm
a) Facilitat de consulta
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
b) Accesos múltiples a la informació i c) Recorreguts delectura diversos
Diccionario combinatorio español contemporáneo (CLAVE)http://clave.librosvivos.net/
Continguts
Continguts
Diccionario de colocaciones del español http://www.colocacionesp.com/
b) Accesos múltiples a la informació i c) Recorreguts delectura diversos
Continguts
Continguts
d) Salts hipertextuals
DRAE
Continguts
e) Salts reticulars
Diccionario de inglés Oviedo http://tradu.scig.uniovi.es/trad.html
Continguts
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Multidiccionario e diccion@rios Espasa
f) Multidiccionaris
Continguts
f) Multidiccionaris
Collins http://diccionario.reverso.net/
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
g) Multimèdia
Diccionarios Vox http://www.diccionarios.com/
Continguts
La hiperenciclopèdia http://www.grec.cat/home/hec/fr_pres.htm
g) Multimèdia
Continguts
La aparición de los recursos informáticos en la vida cotidiana de losestudiosos e investigadores dentro del campo de la lingüística (al igual queen otros campos), supone, entre otros aspectos, la apertura de productostradicionales a nuevas dimensiones. En el caso de los diccionarios, lainformática propicia que sean liberados del férreo corsé que en muchossentidos supone el papel. Se discute sobre si la informática anulará al libroimpreso o si convivirán los dos soportes, pero ya nadie duda de laimportancia que puede tener el soporte electrónico. [...] El diccionario enformato electrónico ofrece muchas más posibilidades de las que permite elantiguo soporte. Entre las más importantes cabe mencionar: a) facilidad demanejo, b) accesos múltiples a las informaciones y c) recorridos de lecturadiversos, d) saltos hipertextuales, e) saltos reticulares, f) multidiccionario, g)multimedia y h) interacción y actualización. Algunas de estas posibilidadesaún no se encuentran en los diccionarios accesibles en la Red, pero es desuponer que en un futuro inmediato podremos ya gozar de ellas(Joan Torruella i Casañas, «Los diccionarios en la Red», Seminario deFilología e Informática : http://seneca.uab.es/)
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Continguts
F3. Productes lexicogràfics
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Un diccionari electrònic és aquell que està fet en suportelectrònic i es consulta mitjançant procedimentsinformàtics (Gelpí 2003:310):
1. Diccionaris màquina: incorporats a sistemes de traducció automàtica
2. Diccionaris digitalitzats: versionselectròniques de diccionaris editats en paper
3. Diccionaris en línia: veritables diccionarisdigitals disponibles en CD-Rom i internet
Continguts
1. Diccionaris màquina
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
# Declaració de símbols
%symbol <PresInd>; # Present d'indicatiu
%symbol <1p>; # Primera persona
%symbol <sg>; # Singular
%symbol <2p>; # Segona persona
%symbol <pl>; # Plural
# ... etc.
# Definició de paradigmes
[ó] >(ó:<sg>) # noms en
| (ons:<pl>) ; # -ó
[pi1] >(e:<1p><sg>) # present d'indicatiu
| (es:<2p><sg>)
| (a:<3p><sg>)
| (em:<1p><pl>)
| (eu:<2p><pl>)
| (en:<3p><pl>);
[V1C] >(0:<PresInd>)[pi1] # primera conj.
| (av:<ImpInd>)[ii1]
| (àveu:<ImpInd><2p><pl>)
# ... etc.
# Diccionari
%dic
(estim:estimar<verb>)[V1C];
(acci:acció<noun><fem>)[ó] # acció
Continguts
2. Diccionaris digitalitzats
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
DIEC
Continguts
3. Diccionaris en línia
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Diccionari de sinònims de frases fetes
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Continguts
Característiques dels diccionaris electrònics(digitalitzats i en línia)
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
El diccionari digitalitzat no significa solament un canvi desuport, sinó que implica tot un canvi del concepte d’obralexicogràfica. Segons Torruella (en línia) permet:
a) Facilitat de consultab) Accesos múltiples a la informacióc) Recorreguts de lectura diversosd) Salts hipertextualse) Salts reticularsf) Multidiccionarig) Multimèdiah) Interacció i actualització
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
a) Facilitat de consulta
DCVB
Continguts
Gran Diccionari de la llengua catalana http://www.grec.net/home/cel/dicc.htm
a) Facilitat de consulta
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
b) Accesos múltiples a la informació i c) Recorreguts delectura diversos
Diccionario combinatorio español contemporáneo (CLAVE)http://clave.librosvivos.net/
Continguts
Continguts
Diccionario de colocaciones del español http://www.colocacionesp.com/
b) Accesos múltiples a la informació i c) Recorreguts delectura diversos
Continguts
Continguts
d) Salts hipertextuals
DRAE
Continguts
e) Salts reticulars
Diccionario de inglés Oviedo http://tradu.scig.uniovi.es/trad.html
Continguts
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
Multidiccionario e diccion@rios Espasa
f) Multidiccionaris
Continguts
f) Multidiccionaris
Collins http://diccionario.reverso.net/
Continguts
2.3 La difusió del tasca lexicogràfica: tipus de diccionaris electrònics
g) Multimèdia
Diccionarios Vox http://www.diccionarios.com/
Continguts
La hiperenciclopèdia http://www.grec.cat/home/hec/fr_pres.htm
g) Multimèdia
Continguts