Over ons 🤖

Laten we elkaar leren kennen

Vertel me de missie en visie

Leg het verhaal achter Mach8 uit

Stel een vraag!

Hallo daar 👋

Hoe kunnen we je helpen?

Volledige naam

E-mail

Bericht

Mijn gegevens mogen worden gebruikt om me op de hoogte te houden van relevant nieuws van Mach8

Bellen

+31 13 71 13 708

•

E-mail

innovation@mach8.io

Kennisbank›Implementatie & Techniek

Implementatie & Techniek·7 min·4 mei 2025

Containerisatie van AI-applicaties: Docker en deployment best practices

Een AI-applicatie die lokaal werkt maar in productie crasht vanwege afhankelijkheidsproblemen is een klassiek scenario. Containerisatie lost dat op: je verpakt je applicatie inclusief alle afhankelijkheden in een image die overal hetzelfde draait.

Docker is al jaren de standaard voor het containeriseren van webapplicaties. Voor AI-applicaties gelden dezelfde voordelen, maar er zijn extra overwegingen: grotere images vanwege ML-bibliotheken, GPU-ondersteuning bij on-premise modellen, en de manier waarop je omgevingsvariabelen en secrets injecteert. Dit artikel beschrijft de aanpak.

Waarom containeriseren?

Containerisatie biedt drie hoofdvoordelen:

Reproduceerbaarheid: Exact dezelfde omgeving lokaal, in staging en in productie. Geen "werkt bij mij" meer.
Portabiliteit: Dezelfde container draait op AWS, Google Cloud, Azure, een eigen server of een laptop.
Isolation: Afhankelijkheden van verschillende applicaties staan los van elkaar en botsen niet.

Voor AI-applicaties is reproduceerbaarheid extra waardevol: ML-bibliotheken hebben complexe afhankelijkheden en kleine versieverschillen kunnen leiden tot andere modelgedrag of crashes.

Een basis-Dockerfile voor een Python AI-applicatie

Een eenvoudige Dockerfile ziet er zo uit:

FROM python:3.11-slim

WORKDIR /app

COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

COPY . .

CMD ["python", "main.py"]

Gebruik slim-images om de imagegrootte te beperken. Installeer dependencies voor het kopiëren van de rest van de code zodat Docker de layer kan cachen: als je code verandert maar je dependencies niet, hoeft Docker alleen de bovenste laag opnieuw te bouwen.

GPU-ondersteuning bij on-premise modellen

Als je modellen lokaal draait op een GPU, heb je een andere base image nodig. NVIDIA biedt nvidia/cuda-images die CUDA-ondersteuning bevatten. Combineer dat met torch of transformers voor de modelinfrastructuur.

GPU-containers vereisen ook dat de Docker runtime op de host GPU-toegang heeft. Bij NVIDIA GPU's gebruik je de NVIDIA Container Toolkit. In een Kubernetes-omgeving gebruik je de device plugin van NVIDIA.

Dit is complexer dan gewone CPU-containers en vereist specifieke infrastructuur. Zorg dat je dit vroeg in het project uitzoekt, niet op het moment van deployment.

Secrets en environment variables

Secrets nooit in de Docker image bakken. Injecteer ze altijd bij runtime via:

docker run -e OPENAI_API_KEY=... myapp
Een .env-bestand via docker run --env-file .env myapp
De secrets-faciliteiten van je deployment platform (Kubernetes Secrets, AWS ECS task definitions)

Controleer je .dockerignore-bestand: het moet je .env-bestand uitsluiten zodat dat niet per ongeluk in de image belandt.

Multi-stage builds voor kleinere images

Voor productie wil je zo klein mogelijke images. Multi-stage builds helpen daarbij: je bouwt in een grote builder-image en kopieert alleen de benodigde bestanden naar een slanke productie-image.

FROM python:3.11 AS builder
WORKDIR /app
COPY requirements.txt .
RUN pip install --user --no-cache-dir -r requirements.txt

FROM python:3.11-slim
WORKDIR /app
COPY --from=builder /root/.local /root/.local
COPY . .
CMD ["python", "main.py"]

Deployment opties

Eenmaal gecreëerd, kun je Docker images deployen via:

Docker Compose: voor eenvoudige multi-container setups op één server
Kubernetes: voor schaalbare, gedistribueerde productieomgevingen
Managed container services: AWS ECS/Fargate, Google Cloud Run, Azure Container Apps — volledig beheerde oplossingen zonder clusterbeheer

Voor de meeste kleinere AI-applicaties is een managed service zoals Cloud Run de meest eenvoudige keuze: je pusht een image en het platform regelt de rest.

Health checks en graceful shutdown

Voeg een health check endpoint toe aan je applicatie zodat het platform kan controleren of de container gezond is. Bij AI-applicaties kan opstarttijd langer zijn door het laden van modellen of het initialiseren van verbindingen.

Implementeer ook graceful shutdown: zorg dat lopende AI-aanroepen worden afgerond voordat de container stopt, in plaats van abrupt afgebroken te worden.

Conclusie

Containerisatie is geen luxe maar een professionele standaard voor AI-applicaties in productie. Bij Mach8 deployen we AI-systemen standaard via containers zodat ze reproduceerbaar, draagbaar en eenvoudig bij te werken zijn.

Wil je weten hoe Mach8 AI-applicaties naar productie brengt? Bekijk onze AI-agents service of neem contact op.

Klaar om AI in te zetten?

Wij helpen je van strategie naar implementatie. Plan een vrijblijvend gesprek.

Plan een gesprek

Meer lezen

Implementatie & Techniek·7 min

Hoe zet je een AI development omgeving op?

Een goede AI development omgeving bepaalt hoe snel je kunt bouwen en testen. Lees welke keuzes je moet maken en hoe je valkuilen voorkomt.

Implementatie & Techniek·6 min

Structured output bij LLMs: betrouwbare JSON uit een taalmodel halen

LLMs produceren niet altijd valide JSON. Leer hoe je structured output afdwingt voor betrouwbare AI-integraties in je applicaties.

Stationsstraat 5

5038EA - Tilburg

+31 13 71 13 708

innovation@mach8.io

Knowledge base

Onderdeel van United Playgrounds