Meestgebruikte woorden uit verkiezingsprogramma's 2e kamer 2012 | Winfred van Kuijk

Verkiezingsprogramma’s 2012 in beeld gebracht

By • Published: August 11, 2012 • Last updated: December 2, 2013 • Filed in: Miscellaneous

Share

Geen daden maar woorden

Net als in 2010 heb ik de verkiezingsprogramma’s van de grotere eerste 12 partijen voor de Tweede Kamerverkiezingen 2012 gedownload en de meestgebruikte woorden in beeld gebracht. Des te vaker het woord wordt gebruikt, des te groter het getoond wordt.

Nog steeds niet heel erg wetenschappelijk (gaat het om “meer moeten” of “minder moeten”?), toch is in veel gevallen aan de woorden te herkennen om welke partij het gaat. Ook leuk om te zien wat er veranderd is ten opzichte van de vorige keer.

De partijen

Klik op het plaatje voor een grotere versie.

VVD:
VVD
PvdA:
PvdA
PVV:
PVV
CDA:
CDA
SP:
SP
D66:
D66
GroenLinks:
GroenLinks
ChristenUnie:
ChristenUnie
SGP:
SGP
Partij voor de Dieren:
Partij voor de Dieren
Piratenpartij:
Piratenpartij
Partij voor Mens en Spirit (MenS):
Partij voor Mens en Spirit (MenS)


Observaties

Wat voorbeelden van zaken die opvallen:

  • Bij de PVV springt onze er nog meer uit dan de vorige keer, islamitisch is kleiner geworden, Europese woorden veel groter.
  • Nederland wordt relatief gezien veel genoemd door… GroenLinks.
  • De VVD legt graag uit (daarom) en SGP houdt het graag duidelijk (concreet), en GroenLinks geeft voorbeelden (zoals).
  • Nog steeds komen woorden als economie of banken relatief weinig voor in alle programma’s.
  • De partijen houden kerk en staat netjes gescheiden, God komt weinig voor.
  • PVV is zeer kort van stof, PvdA en ChristenUnie hebben juist weer veel te vertellen, in ieder geval hebben ze ruim 4x zoveel tekst als de PVV.
  • De PVV staat ook onderaan in de woordenschat, de andere partijen gebruiken ongeveer 2x meer verschillende woorden.
  • Weinig verrassend staat dieren nog steeds met stip op één bij de Partij voor de Dieren.
  • Bij de Piratenpartij gaat het om informatie, internet, overheid, en gegevens.



Het top-10 lijstje

Door een suggestie van dMb in de comments heb ik er ook nog een ouderwets lijstje van gemaakt, om te zien wat nou de populaire en unieke woorden zijn. En bijkomend voordeel: wat staat er nou op 1, welke woorden gebruikt elke partij, wat is de verdeling in die top-10, etc.?
Voordat we het top-10 lijstje bekijken, nog even benadrukken dat dit allemaal hartstikke pseudo-wetenschap is en dat veelgebruikte Nederlandse woorden er automatisch uitgefilterd zijn.

Groen = veelgebruikt, rood = uniek.
Top 10

Observaties top-10

Wat voorbeelden van zaken die opvallen in de top-10 lijstjes:

  • Vrijwel elke partij heeft het over mensen, moeten en nederland,
    alleen PVV en Piratenpartij hebben het niet over mensen,
    bij GroenLinks en de SP moet minder.
  • D66 en ChristenUnie hebben het meest verdeelde woordgebruik, PVV het minste.
  • De VVD en SP zijn niet heel uniek in hun woorden.
  • De PVV heeft een eigen woordenschat, bestaande uit eu-…, brussel, gaat, terug.
  • Ook de kleinere partijen hebben hun eigen vocabulaire, zoals de Piratenpartij waar het gaat om informatie, internet, open, gegevens, alle.
  • Specifiek voor PvdA: werk.
  • Specifiek voor CDA: iedereen.
  • Specifiek voor D66: kwaliteit.
  • Specifiek voor ChristenUnie: samenleving.
  • Specifiek voor Partij voor de Dieren: dieren, natuur, voedsel en plaats.
  • Specifiek voor MenS: zie, dient, kosten en gebruik.

De details

  • De partijprogramma’s heb ik 11 augustus als PDF bestanden gedownload via de links op de websites van de partijen (een aantal waren nog in concept): VVD, PvdA, PVV, CDA, SP, D66, GroenLinks, ChristenUnie, SGP.
  • Op 15 augustus de verkiezingsprogramma’s gedownload van Partij voor de Dieren, Piratenpartij, Partij voor Mens en Spirit (MenS).
  • De tekst heb ik opgeslagen, alle cijfers en leestekens er uit gehaald, kop- en voetteksten verwijderd, naam van de partij er uit gehaald en zo goed mogelijk afgebroken woorden weer samengevoegd.
  • De woorden daarna gestopt in het tagcloud programma Wordle, alle veelgebruikte Nederlandse woorden worden er automatisch uitgehaald.
  • De plaatsing en kleuren van de woorden is willekeurig bepaald door het programma, de grootte is afhankelijk van hoe vaak het woord voorkomt.
  • Ik ben niet verbonden aan een bepaalde partij en heb dit voor de lol gemaakt.
  • Gebruik de plaatjes waar+zoals je wilt. Het enige dat ik vraag: vermeld de bron. Oftewel:
    Creative Commons License

32 Responses to “Verkiezingsprogramma’s 2012 in beeld gebracht”

  1. Johan says:

    Valt me tegen dat de libertarische partij er niet bij staat

  2. Humprey says:

    Sinds wanneer behoren Mens en Spirit, de Piratenpartij, en Partij voor de Dieren tot de grotere partijen?
    Of negeren jullie gewoon sommige partijen. Mensen open je ogen en verwijder die jarenlange hersensspoeling.
    Kijk ook wat onder andere de Partij van de Toekomst en de SOPN te zeggen hebben.

    Veel goeds aan iedereen

  3. Johan de Witt says:

    Hulde, prachtig idee, mooi uitgevoerd !

  4. Andre says:

    Overigens worden dit soort technieken weldegelijk ook serieus wetenschappelijk gebruikt. Statistiek over gebruikte woorden, vooral als ook wordt meegenomen bij welke andere woorden ze in de buurt staan, kan goed gebruikt worden om te scoren waar documenten over gaat, en met welke andere documenten ze gerelateerd zijn.

    De suggestie van LJM is een goede wat mij betreft: het zou goed zijn de relatieve frequenties te gebruiken van woorden over alle programma’s heen. Zo kan je de verschillen benadrukken en de algemeenheden die overal voorkomen wegfilteren.

    • winfred says:

      Goed punt Andre. Absoluut, text analyse is nuttig en een vak apart. Ik noemde het om te voorkomen dat de indruk gewekt wordt dat deze pagina serieus en wetenschappelijk is. M’n aanpak is transparant, maar er zijn tal van op- en aanmerkingen te plaatsen. Bijvoorbeeld, belangrijkste manco bij het analyseren van alleen woorden is denk ik dat er geen context is. En bij het verwerken van woorden hou ik geen rekening met zinnen als “voor- en nadelen”, dat zou eigenlijk verwerkt moeten worden als “voordelen en nadelen”. Ook zou ik liever wordstemming gebruiken (europees, europese, etc.). Enz.

  5. Roni Klinkhamer says:

    Leuk, goed idee, bedankt!

  6. LJM says:

    Wat leuk zou zijn is om het gemiddelde te berekenen van alle partijprogramma’s en om dan de verhoudingen te berekenen. Dan kun je daarna een lijst maken van woorden die relatief gezien het vaakst voorkomen bij bepaalde partijen. Dan vallen woorden als Moeten, Nederland, Mensen weg bij de meeste partijen.

  7. PL says:

    Ik vind uw concept best interessant, maar helaas mis ik een serieuze partij als de Libertarische Partij. Ik hoop dat u ook betreffende hun verkiezingsprogramma wilt publiceren?

    Ik kijk er in ieder geval naar uit!

  8. Jan Hopmans says:

    Leuk gedaan. Zou je de Piratenpartij hier ook aan toe willen voegen? Ik ben best nieuwsgierig naar de bevindingen die je hierover vindt. =)

  9. Joris says:

    Ik snap dat het er leuker uitziet, maar ik vind eigenlijk dat je de woorden allemaal in dezelfde kleur moet (kunnen) zetten; de donkere en roodachtige kleuren trekken nu ongefundeerde extra aandacht volgens mij.

  10. Jan-Willem says:

    Ik ben ook benieuwd naar de nieuwe partijen! (piratenpartij, mens en spirit etc.)

  11. Paul says:

    Leuk. Kleine opmerking mbt de observaties:

    “…hebben ze ruim 4x zoveel tekst als…”

    Moet zijn: ‘4x meer tekst dan’ (en ‘net zoveel als’).

    Ben geen taalpurist, maar als ‘t me opvalt moet ik het toch even kwijt…

  12. dMb says:

    Ook leuk misschien om toe te voegen Winfred; welke woorden zijn uniek per partij? Verder; Leuk gedaan:)

  13. Menno says:

    Leuk dit te lezen. Wel een kritische opmerking. Waarom is de auteur blij dat kerk en staat ‘netjes’ gescheiden zijn en het woord God weinig voorkomt? Wat is er mis met religieus geïnspireerde politiek?

    • winfred says:

      Natuurlijk hoeven religie en politiek niet gescheiden te zijn. De opmerking is eerder andersom bedoeld: de christelijke partijen gebruiken opvallend weinig religieuze woorden.

  14. A.J. Stoffels says:

    Leuk! Opvallend is ook de omvang van de woorden “moeten” en “krijgen” (soms even zoeken ivm kleur).

    Gebruik Wordle zelf ook om snel een beeld te krijgen van een stuk tekst. Nadeel is wel dat zelfstandig naamwoord en bijvoeglijk naamwoord (Nederland & Nederlandse) als 2 aparte woorden worden geteld. Dat is alleen handmatig te verhelpen in de woordscorelijst op Wordle, dus het blijft inderdaad een indicatie.
    Tot slot is het handig om te weten dat Wordle van voor naar achter in het document min of meer van links naar rechts in het plaatje plaatst. Dat geldt uiteraard niet voor woorden die overal in de tekst voorkomen.

    N.B. Het programma van D66 is ook nog concept, dat wordt 24/25 augustus pas vastgesteld.

    • winfred says:

      Goed punt, niet alleen het VVD programma was concept. Ik heb het nu als algemene opmerking toegevoegd bij de links. De lijst die ik aan Wordle gaf had ik zelf al gegroepeerd en gesorteerd op frequentie (bij Wordle: zie Advanced).

  15. P. Raasveldt says:

    Wat mij treft is een taalverarming (of de angst om zaken te benoemen). Ik zie zo vaak het woord “mensen” in alle programma’s. In een willekeurig programma (PvdA) op pagina 6, 2e alinea komt het 6 keer voor. En het zou makkelijk vervangen kunnen worden door: degenen, werknemers, werklozen, of zelfs weggelaten kunnen worden.
    We snappen allemaal dat de verkiezingsprogramma’s over mensen gaan en niet over dieren (behalve dan misschien bij de PvdD).

Leave a Reply

« | Home | »