Idegennyelvű korpuszok

16
Idegennyelvű korpuszok Idegennyelvű korpuszok Idegennyelvű korpuszok Kuti Judit MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály [email protected]

description

Idegennyelvű korpuszok. Kuti Judit MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály [email protected]. Korpuszok fajtái. általános korpuszok – többé-kevésbé reprezentatív mintavétel egy nyelv állapotáról nagy méretű korpuszok pl. nemzeti korpuszok - PowerPoint PPT Presentation

Transcript of Idegennyelvű korpuszok

Page 1: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Idegennyelvű korpuszokIdegennyelvű korpuszok

Kuti JuditMTA Nyelvtudományi Intézet

Korpusznyelvészeti Osztá[email protected]

Page 2: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Korpuszok fajtái általános korpuszok – többé-kevésbé reprezentatív mintavétel egy nyelv állapotáról

nagy méretű korpuszok pl. nemzeti korpuszok angol - British National Corpus (BNC) német - IDS Mannheim korpuszai francia – Kanadai Francia Korpusz

speciális korpuszok – a vizsgálat tárgya és célja szerinti szövegválasztás

általában kisebb méretű korpuszok, pl. különböző nyelvváltozatok korpuszai

Page 3: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 4: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 5: Idegennyelvű korpuszok

Idegennyelvű korpuszok

beszélt nyelvi / írott nyelvi korpuszokBritish National Corpus written / spoken (EN)Freiburger Korpus / Korpora der geschriebenen Sprache (DE)

különböző műfajokat vizsgáló korpuszok pl.: angol versek

német újságírói nyelv (NEGRA korpusz) francia Le Monde korpusz

gyereknyelvi korpusz - CHILDES

történeti korpuszok francia középkori korpusz portugál középkori korpusz (1500-1900) német rendszerváltás kori korpusz

Speciális korpuszok

Page 6: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Korpuszokban való keresésKonkordanciák készítése:

„Online Concordancer” Web konkordancia készítő programok:

WebCONC:

a Google által elért szövegekben keres

a találatokat kontextusban adja ki

WebCORP szógyakorisági listák készítése egyes weboldalakról type-token megkülönböztetés speciális lekérdezési beállítások

Page 7: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 8: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 9: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 10: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 11: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 12: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Korpuszok felhasználási lehetőségei

Korpusz alapú szótárak:COBUILD (Collins Birmingham University International Language Databank)

az első korpusz-alapú angol egynyelvű szótár„The Bank of English” korpusz alapján

Longman Dictionary of Contemporary EnglishLongman Corpus Network alapjánonline elérhető

DWDS (Digitales Wörterbuch der deutschen Sprache )a Wörterbuch der deutschen Sprache alapján, a DWDS korpusz példáivalközös keresőfelületkollokációk és szemantikai relációk megjelenítése

Page 13: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 14: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 15: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Page 16: Idegennyelvű korpuszok

Idegennyelvű korpuszok

Tanulói korpuszok: Longman’s Corpus of Learner’s English (LCLE)

10 millió szó8 különböző nyelvi tudásszint

International Corpus of Learner’s English (ICLE)

19 alkorpuszhaladó tudásszintű nyelvtanulók magyar nyelvtanulók anyagaival való kiegészítése folyamatban (ELTE, MTA Nyelvtudományi Intézet)