Over ons 🤖

Laten we elkaar leren kennen

Vertel me de missie en visie

Leg het verhaal achter Mach8 uit

Stel een vraag!

Hallo daar 👋

Hoe kunnen we je helpen?

Volledige naam

E-mail

Bericht

Mijn gegevens mogen worden gebruikt om me op de hoogte te houden van relevant nieuws van Mach8

Bellen

+31 13 71 13 708

•

E-mail

innovation@mach8.io

Kennisbank›AI Tools & Technologie

AI Tools & Technologie·7 min·4 mei 2025

Wat is een vector database en waarom heb je die nodig voor RAG?

Als je een AI-toepassing wilt bouwen die antwoorden geeft op basis van jouw eigen documenten, kom je al snel vector databases tegen. Ze zijn de technische ruggengraat van RAG-systemen, maar hun werking is niet altijd duidelijk.

Vector databases zijn een fundamenteel onderdeel van moderne AI-toepassingen die werken met eigen kennisbases. Ze stellen een AI in staat om snel en semantisch te zoeken in grote hoeveelheden tekst, zonder dat elk document letterlijk in de prompt hoeft te staan. Dit artikel legt uit hoe dat werkt en wanneer je een vector database nodig hebt.

Wat is een vector database?

Een vector database slaat gegevens op als vectoren: lijsten van getallen die de betekenis van een stukje tekst wiskundig representeren. Die numerieke representaties worden embeddings genoemd. Een zin als "Hoe vraag ik verlof aan?" wordt omgezet naar een vector van honderden of duizenden getallen die de semantische betekenis vastleggen.

Het bijzondere is dat semantisch vergelijkbare teksten ook vergelijkbare vectoren hebben. Dat betekent dat je op betekenis kunt zoeken in plaats van op exacte woorden. "Hoe neem ik vakantiedagen op?" en "Verlofaanvraag indienen" zitten dicht bij elkaar in de vectorruimte, ook al zijn de exacte woorden anders.

Waarom heb je dit nodig voor RAG?

Bij Retrieval-Augmented Generation (RAG) zoekt het systeem in een kennisbank naar relevante passages, en geeft die passages mee als context aan het taalmodel. De kwaliteit van dat zoeken bepaalt de kwaliteit van de antwoorden.

Als je duizenden documenten hebt, kun je ze niet allemaal in elke prompt stoppen: dat is te duur en gaat de contextlimiet van het model te boven. Een vector database lost dit op: je zoekt snel de meest relevante passages op op basis van de vraag van de gebruiker, en geeft alleen die mee aan het model.

Hoe werkt het technisch?

Het proces verloopt in twee fasen:

Indexering: Je splitst je documenten op in kleinere stukken (chunks). Elk stuk wordt omgezet naar een embedding via een embedding-model (bijvoorbeeld text-embedding-3 van OpenAI of een open-source alternatief). Die embedding sla je op in de vector database, samen met de oorspronkelijke tekst.

Retrieval: Als een gebruiker een vraag stelt, zet je de vraag ook om naar een embedding. De vector database zoekt de chunks die het dichtstbij deze query-embedding liggen. Die chunks geef je mee als context aan het taalmodel.

Welke vector databases zijn beschikbaar?

Populaire opties zijn:

Pinecone: cloud-native, volledig beheerde dienst, eenvoudig te integreren
Weaviate: open-source met goede filter- en hybride zoekmogelijkheden
Qdrant: open-source, hoge performance, goed te hosten op eigen infrastructuur
pgvector: een extensie voor PostgreSQL waarmee je vector-zoekopdrachten uitvoert in je bestaande database

Voor kleinere use cases of prototypes is pgvector een pragmatische keuze: je hebt al een database, je voegt vector-functionaliteit toe zonder een apart systeem te beheren. Voor grotere of complexere toepassingen zijn gespecialiseerde vector databases beter geschikt.

Chunking: een onderschat detail

Hoe je documenten opdeelt in chunks, heeft grote invloed op de kwaliteit van retrieval. Te kleine chunks missen context; te grote chunks bevatten te veel irrelevante informatie naast het relevante stuk.

Goede chunking houdt rekening met de structuur van het document: paragraafgrenzen, koppen en logische eenheden. Overlappende chunks, waarbij het einde van het ene chunk ook het begin van het volgende is, helpen om context niet te verliezen bij een grens.

Wanneer heb je geen vector database nodig?

Voor kleine kennisbases, minder dan 50-100 documenten, kun je soms ook simpele keyword-zoekopdrachten of zelfs alle documenten direct in de context plaatsen. Vector databases voegen complexiteit toe; die complexiteit is alleen gerechtvaardigd als de schaal of de kwaliteitseisen dat vereisen.

Conclusie

Vector databases zijn een krachtig maar technisch onderdeel van RAG-systemen. Ze stellen AI in staat om snel en semantisch te zoeken in grote kennisbases. Mach8 bouwt RAG-architecturen met de juiste keuze aan vector database-technologie voor elke specifieke use case.

Wil je een RAG-systeem bouwen voor jouw documentatie? Neem contact op met Mach8.

Klaar om AI in te zetten?

Wij helpen je van strategie naar implementatie. Plan een vrijblijvend gesprek.

Plan een gesprek

Meer lezen

AI Tools & Technologie·7 min

Claude vs. GPT-4 vs. Gemini: welk model kies je voor zakelijk gebruik?

Claude, GPT-4 en Gemini zijn de drie meest gebruikte AI-modellen voor zakelijke toepassingen. Leer wat de praktische verschillen zijn en wanneer je welk model inzet.

AI Tools & Technologie·6 min

Wat is tokengebruik en hoe beinvloedt het de kosten van AI?

Tokens bepalen wat je betaalt voor AI-gebruik. Leer wat tokens zijn, hoe je ze telt en hoe je je kosten beheerst bij zakelijke AI-toepassingen.

Stationsstraat 5

5038EA - Tilburg

+31 13 71 13 708

innovation@mach8.io

Knowledge base

Onderdeel van United Playgrounds