# Over het GCND Versie: DATUM Auteurs: Inhoudsopgave toevoegen ## I. Inleiding ## II. Achtergrond Over voorgeschiedenis, verloop project, partners enz? ## III. Inhoud van het corpus ### 3.1. Spraakopnames Over gebied enz. Kaart met spreiding? ![GCND_simplemap](https://hackmd.io/_uploads/rkWRBCW2a.jpg) ![GCND_simplemap_colour](https://hackmd.io/_uploads/ry2YDRZna.jpg) ### 3.2. Transcripties Hier gewoon grote lijnen, gedetailleerder transcriptieprotocol onderaan? Ook iets over kwaliteitscontrole en foutenmarge (idealiter dan al verwijzing naar artikel over project Chelsey) ### 3.3. Lemma's en POS-tags Afhankelijk van uiteindelijke procedure (alles met Alpino of maar gedeeltelijk): hier beschrijven Lijst van POS-tags + voorbeelden? ### 3.4. Syntactische annotatie Alpino toelichten Lijst van categorielabels en dependentielabels (cf. parsing for dummies?) Eventueel ook een versie maken van "dependentiebomen for dummies" die niet op UGent-studenten gericht is en linkje daarnaar invoegen? Hier opnieuw grote lijnen, gedetailleerder parsingprotocol onderaan (cf. hackmd beslissingen parsing) ### 3.5. Metadata #### 3.5.1. Opname ##### Kloekecode ##### Provincie ##### Land ##### Dialectregio en -subregio Provincies en landen zijn administratieve eenheden, die niet noodzakelijk ook dialectologische eenheden vormen. Zo is vrij algemeen aanvaard onder taalkundigen dat het Oost-Vlaamse dialectgebied en de provincie Oost-Vlaanderen slechts gedeeltelijk samenvallen. Om de gebruiker ook toe te laten op dialectgebied te zoeken, kenden we iedere opnamelocatie een dialectregio (bvb. Limburgs/Vlaams/...) en -subregio (bvb. Oost-Limburgs/West-Zeeuws-Vlaams/...) toe. **Gebiedsindeling** KAART NOG MAKEN: per kloekeplaats: label = nummer van subregio, kleur van label = regio *I. Limburgs* * 1.1. Ripuarisch gebied *(WLD 10)* * 1.2. Overgangsgebied Oost-Limburg-Ripuarisch *(WLD 20)* * 1.3. Oost-Limburg *(WLD 30)* * 1.4. Centraal Limburg *(WLD 40)* * 1.5. West-Limburg *(WLD 51, 52, 54)* - inclusief Budels *(WBD 90)* * 1.6. Zuid-Gelders Limburg *(WLD 90)* *II. Overgang Limburgs/Brabants/Gelders/Hollands* * 2.1. Beringerland *(WLD 53)* > overgang Limburgs-Brabants * 2.2. Truierland (Zuid-Brabants-West-Limburgs overgangsgebied) - *(WLD 60 + Brabantse plaatsen Rummen (P 107a) en Grazen (P108))* * 2.3. Cuijk *(WBD 80, incl. Kleverlands: WLD 100)* **> eigenlijk Gelderse dialecten (bij vervolgproject bij Gelders/Kleverlands?)** * 2.4. Westhoek *(WBD 70)* **> eigenlijk Hollandse dialecten (bij vervolgproject bij Holland?)** *III. Brabants* * 3.1. Noordwest-Brabant *(WBD 10)* * 3.2. Midden-Noord-Brabant *(WBD 20)* * 3.3. Oost-Noord-Brabant *(WBD 30, inclusief Lommels: WLD 80)* * 3.4. Kempen *(WBD 40, incl. WLD 72)* * 3.5. Zuid-Brabant *(WBD 50)*, incl. dialecten van de Denderstreek (provincie Oost-Vlaanderen) waar ook Brabantse dialecten worden gesproken (cf. Taeldeman & Belemans & Goosssens 2000:31) * 3.6. Geteland *(WBD 60 > incl. WLD73)* *IV. Overgang Brabants/Oost-Vlaams* * 4.1. Overgangszone Oost-Vlaams/Brabants *(cf. Taeldeman)* * 4.2. Waasland *(cf. Taeldeman 2005)* incl. Zeeuwse plekken Koewacht t/m Nieuw-Namen (cf. Taeldeman 1979) + Antwerpse dorpen Zwijndrecht, Brucht en St-Anneke (Belemans & Goossens 2000:31) *V. Oost-Vlaams* * 5.1. Oost-Vlaanderen *(cf. Taeldeman 2005)* > incl. Zeeuwse plekken Overslag, Zuiddorpe en WEstdorpe (cf. Taeldeman 1979), alsook Sas van Gent (ondanks eilandkarakter) > 'Echte' Oost-Vlaams *VI. Overgang West-Vlaams-Oost-Vlaams* * 6.1. Overgangszone West-Vlaams/Oost-Vlaams *(cf. Taeldeman 2005)* *VII. West-Vlaams* * 7.1. Noord-West-Vlaanderen *(cf. Devos & Vandekerckhove)* * 7.2. Westelijk West-Vlaanderen *(cf. Devos & Vandekerckhove)* * 7.3. Binnen-West-Vlaanderen *('continentaal West-Vlaams' bij Devos & Vandekerckhove 2005)* * 7.4. Frans-Vlaanderen * 7.5. West-Zeeuws-Vlaanderen (cf. Taeldeman 1979), incl. Eede *VIII. Overgang Vlaams naar Zeeuws* * 8.1. Land van Axel (sterkste afwijkingen van Oost-Vlaamse en Wase dialecten, grootste overeenkomsten met die van de Zeeuwse eilanden en West-Vlaanderen, cf. Taeldeman 1979), incl. Philippine (ondanks eilandkarakter) * 8.2. Land van Hulst (vrij sterk verbonden met de oostelijk Wase dialecten, cf. Taeldeman 1979, incl. Hulst zelf, ondanks eilandkarakter) *IX. Zeeuws* (Van Driel 2004) * 9.1. Noord-Beveland * 9.2. Zuid-Beveland * 9.3. Walcheren * 9.4. Tholen en Sint-Philipsland * OK 9.5. Schouwen-Duiveland * OK 9.6. Goeree-Overflakkee **Verantwoording** Voor de afbakening van de **Limburgse en Brabantse subgebieden** namen we de hoofdregio's van het Woordenboek van de Limburgse Dialecten en het Woordenboek van de Brabantse Dialecten als uitgangspunt. Die gebiedsindelingen bouwen op klankgrenzen (isoglossen), en worden beschreven en gemotiveerd in Belemans & Goossens (2000:27-70; *Inleiding WBD deel III*) en Kruijsen (2001:xviii-xli; *Inleiding WLD deel III*). De beschrijvingen bevatten ook oplijstingen van alle locaties/kloekecodes die tot een specifiek gebied worden gerekend; op die manier kon onze database voor de Limburgse en Brabantse dialecten relatief makkelijk met dialectregio-informatie worden verrijkt. Alleen wat een aantal grensdialecten betreft, moesten we nog een aantal knopen doorhakken, omdat die vaak door hun provinciale ligging in resp. het WBD/WLD werden behandeld, maar eigenlijk bij een andere dialectfamilie aansluiten (cf. Belemans & Goossens 2000:31): *Plaatsen in de provincie Brabant waar Limburgs wordt gesproken*: - De Brabantse plaatsen Rummen en Grazen behoren strikt genomen tot het Limburgse dialectgebied , meer specifiek het Truierlands, maar werden om praktische redenen in het WBD behandeld (WBD 60). Hier delen we deze plaatsen in bij het Limburgse (Truierlandse) dialectgebied (GCND 22). - De plaatsen Budel, Groot Schoot, Maarheeze en Soerendonk (WBD 90: Budels) vormen een vergelijkbaar geval: officieel behoren ze tot de provincie Noord-Brabant (vandaar ook behandeld in WBD), maar het dialect is er eigenlijk Limburgs, meer specifiek vertoont het gelijkenissen met de West-Limburgse dialecten. Om die reden rekenen we het Budels bij de West-Limburgse dialecten (GCND 15). *Plaatsen in de provincie Limburg waar Brabants wordt gesproken* - De Limburgse plaatsen Halen, Linkhout, Loksbergen, Meldert, Zelem en Zelk worden in het WLD afzonderlijk behandeld (WLD 73), omdat ze eigenlijk aansluiten bij de Brabantse 'Getelandse' dialecten ; hier voegen we ze dan ook samen met de Brabantse Getelandse dialecten (WBD 60, GCND 36). - De WLD-gebieden 71 en 72 (resp. Noorderkempens en Zuiderkempens) sluiten aan bij de Kempense dialecten; we behandelen ze in onze database dan ook als delen van het Kempens dialectgebied (GCND 34). - Het Lommels wordt in het WLD als een aparte regio behandeld (WLD 80) omdat het volgens de WBD-auteurs een Brabants dialect is (Kempenlands); hier rekenen we het dan ook bij de Brabantse dialecten (Oost-Noord-Brabant). *Plaatsen in de provincies Limburg en Noord-Brabant waar geen Limburgs of Brabants wordt gesproken* - Het Kleverlands wordt in het WLD als aparte regio behandeld (WLD 100) en het Cuijks in het WBD als afzonderlijke regio (WBD 80) omdat beiden au fond Gelderse (meer specifiek Kleverlandse) dialecten zijn. hier behandelen we die twee samen als 'Cuijks' en beschouwen we ze als overgangsdialecten naar het Gelders (GCND 23). *Overgangszone Brabants - Oost-Vlaams* Volgens Taeldemans beschrijving "Hoewel het Waaslands een gedeeltelijk verbrabantst dialect is, vormt de benedenloop van de Schelde toch een duidelijke dialectgrens met het Antwerps. De drie Antwerpse dorpen op de linkeroever van de Schelde, Zwijndrecht, Burcht en St.-Anneke, sluiten bij de Waaslandse dialecten aan en worden daarom uitzonderlijk ook in het WVD behandeld. In het zuiden vormt de Oost-Vlaamse Denderstreek zoals gezegd (cf. 1) een brede overgangszone naar het Brabants. Van een dialectgrens kan hier m.b.t. de provinciegrens niet gesproken worden: de dialecten uit de streek van Dendermonde sluiten aan bij het Kleinbrabants in het WBD-gebied en de dialecten uit de Denderstreek sluiten aan bij het Brabantse Pajottenlands. In deze overgangszone fungeert de provinciegrens als louter pragmatische gebiedsgrens tussen WVD en WBD."" :::warning In het WBD ... > Taeldeman ::: Voor de afbakening van de **West-, Oost- en Zeeuws-Vlaamse dialecten** vertrokken we niet vanuit het Woordenboek van de Vlaamse Dialecten en dat van de Zeeuwse dialecten, omdat de insteek bij de gebiedsindeling daar provincie- en streekaanduidingen waren (zoals 'Veurne-Ambacht', 'Meetjesland', 'de streek van Zottegem') - voor de herkenbaarheid bij de niet-taalkundig geschoolde gebruiker - en niet linguïstische grenzen. De WVD-indeling is daardoor weinig compatibel met die van het WBD en WLD. Een op fonologische leest gestoelde indeling vinden we wel bij Devos & Vandekerckhove (2005:29) voor de West-Vlaamse dialecten, Taeldeman (2005:19) voor de Oost-Vlaamse dialecten, Taeldeman (1979:172) voor Zeeuws-Vlaanderen en van Driel (2004) voor de Zeeuwse dialecten. Voor onze dialectindeling baseren we ons dan ook op de indelingskaarten in die werken. Voor het Frans-Vlaams dient de landsgrens België-Frankrijk als uitgangspunt. De dialecten aan Franse zijde van die grens vertonen weliswaar heel veel overeenkomsten met de West-Vlaamse, maar doordat de dialecten aan Franse zijde veel minder beïnvloed werden door het Standaardnederlands (taalisolement vanaf 1713), vind je vandaag in de buurt van de staatsgrens ook verschillende taalgrenzen (cf. Ryckeboer 2013). Bovendien onderscheiden de dialecten ten zuiden van de staatsgrens zich van de West-Vlaamse door intenser taalcontact met het Frans (cf. Ryckeboer 2004, 2013). **Waarschuwing** Dialectgebieden afbakenen is een moeilijke onderneming. Zoals de WBD-redactie destijds ook schreef: "Een taallandschap is, bepaald als het wordt door factoren van de meest uiteenlopende aard, een dusdanig gecompliceerde grootheid dat er geen enkel criterium te vinden is aan de hand waarvan men tot een volkomen bevredigende afbakening zou kunnen geraken" (Weijnen & Van Bakel 1967:6, voorlopige inleiding WBD). De GCND-dialectafbakening moet dan ook heel uitdrukkelijk als een rudimentair hulpmiddel bij het zoeken en analyseren gezien worden, niet als de ultieme waarheid over de structuur van het zuidelijk-Nederlandse dialectlandschap. Iedere gebruiker kan indien gewenst andere indelingen maken via de locatie-zoekmodule. **Lijst: Kloekecodes + toegekende dialectgebied** Eventueel link naar Excelfile/tab-separated txt? Handig voor wie zelf met de gebiedsindeling aan de slag wil/wil karteren/...? 81 #### 3.5.2. Spreker ##### Mobiliteit woonplaats - niet mobiel = **metadata vermelden geen andere verblijf- of woonplaatsen** - mobiel, zelfde provincie = Als ooit op andere plaatsen in zelfde provincie gewoond - mobiel, andere provincie = Als ooit op andere plaatsen buiten provincie gewoond Zodra op de infofiche een extra woonplaats genoteerd werd, werd de spreker als 'mobiel' gecategoriseerd. Het kan echter ook om mobiliteit in de context van de legerdienst of de wereldoorlogen (vluchten/...) gaan. Aangezien die informatie niet consistent werd genoteerd, hanteerden we het vrije botte criterium: andere plaats genoteerd = mobiel. ##### Mobiliteit werkplaats * niet mobiel: werk op zelfde plek als woonplaats (of infofiche zegt er niets over) - mobiel, zelfde provincie: werk buiten woonplaats, maar in zelfde provincie - mobiel, andere provincie: als ooit gewerkt buiten provincie ### ... ## IV. Corpusstatistieken Hoeveel uur opnames Hoeveel plaatsen Hoeveel opnames Hoeveel sprekers Hoeveel woorden transcripties Hoeveel woorden geparset ... Niet al te uitgebreid, want zal hopelijk nog evolueren en dan moeten we iederen keer updaten ## V. Toegang en gebruiksrechten ## VI. Zoekinterface ### 6.1. Zoeken in het GCND ### 6.2. Zoekresultaten exporteren ### 6.3. Enkele syntactische case-studies ter illustratie ## VII. Transcriptieprotocol Stuk uit Handelingen van de KCTD? ## VIII. Protocol syntactische annotatie Op basis van 'gcnd beslissingen' ## Referenties Belemans, Rob, & Jan Goossens. 2000. Woordenboek van de Brabantse Dialecten. Deel III. Inleiding - Klankgeografie van de Brabantse Dialecten. Assen: Van Gorcum. Kruijsen, Joep. 2001. Inleiding bij deel III van het WLD: de Algemene Woordenschat. Assen: Koninklijke Van Gorcum. Ryckeboer, Hugo. 2004. Frans-Vlaams. Taal in stad en land. Tielt: Lannoo. Ryckeboer, Hugo. 2013. A West Flemish dialect as a minority language in the north of France. In Frans Hinskens & Johan Taeldeman (red.), 782-799. Weijnen, A., & J. Van Bakel. 1967. Voorlopige inleiding op het Woordenboek van de Brabantse dialecten. Assen: Van Gorcum.