Ga naar inhoud
Private AI

AI op jouw eigen hardware, in jouw eigen datacenter

Closed loop. Vaste kosten. Volledige controle.

Een dedicated LLM-omgeving die we voor je opzetten op hardware in jouw datacenter. Je IP komt niet uit het pand, je betaalt voor capaciteit in plaats van per token, en je houdt de regie over wie wat ziet.

Wanneer Private AI past

Niet elk bedrijf wil zijn AI op een hyperscaler draaien. Niet elke business case houdt stand bij per-token-afrekening. En sommige organisaties willen hun IP simpelweg niet het pand uit, ongeacht de SLA van een externe cloud. Denk aan engineering-tekeningen, octrooi-relevante kennis of klantdossiers.

Voor die organisaties bouwen we een private AI-omgeving. Eigen hardware in jouw datacenter, een open-weight LLM die volledig binnen die omgeving draait, en een inference-runtime die wij voor je inrichten en beheren.

Drie redenen waarom organisaties hiervoor kiezen

IP blijft binnen je eigen muren

Engineering-data, klantdossiers, octrooi-relevante research: niets daarvan verlaat je netwerk. Geen externe API-call, geen externe logging, geen vraag over data-retentie bij een leverancier. Air-gapped als dat de eis is.

Voorspelbare kosten in plaats van per-token

Bij hoog inference-volume schaalt per-token-afrekening lineair mee met succes. Met eigen hardware liggen de kosten vast: je investeert eenmaal in capaciteit en daarna draait de oplossing zonder marginale kosten per gebruik.

Eigen regie over model en governance

Je kiest welk model je draait (Llama, Mistral, DeepSeek of een ander open-weight model), je bepaalt de update-cyclus, en je voldoet aan compliance-eisen die strenger zijn dan EU-data-residency. Denk aan defence, kritische infrastructuur of R&D-zwaar IP.

Hoe we het neerzetten

1

Scoping en hardware-selectie

We bepalen samen welk inference-volume je verwacht, welke modellen je nodig hebt, en welke hardware daar het beste bij past: GPU-class, on-prem servers, edge-deployment of een combinatie.

2

Installatie en model-deployment

We installeren de inference-runtime, deployen het gekozen LLM, en koppelen het aan jouw bestaande systemen: Active Directory, SharePoint, ERP, PDM, afhankelijk van waar je data zit.

3

Agents en use cases bouwen

Op de private LLM bouwen we vervolgens dezelfde agents als op een hyperscaler: HR, Legal, Finance, of branche-specifiek (werkvoorbereiding, kennisontsluiting, dossiervorming). Vanaf het moment dat de omgeving staat, geldt dezelfde belofte als op andere stacks: eerste agent in productie binnen 60 dagen.

4

Beheer en knowledge transfer

We draaien het de eerste maanden naast je IT-team, dragen kennis over, en jij beslist of je het beheer overneemt of dat we het blijven doen.

Drie deployment-modellen naast elkaar

Welke past bij jouw situatie?

Hyperscaler
Microsoft · Google · AWS
Best voor
Snelle time-to-value, bestaande stack
Kostenmodel
Per-token of capaciteit
IP-controle
Data-residency te kiezen, geen fysieke isolatie
Volentis
EU-soevereine SaaS
Best voor
EU-soevereiniteit zonder eigen infrastructuur
Kostenmodel
Subscription
IP-controle
EU-data-residency, geen Cloud Act-exposure
Private AI
Eigen hardware, open-weight LLM
Best voor
IP-criticaliteit, hoog inference-volume
Kostenmodel
Vaste hardware-investering, geen per-token
IP-controle
Volledig binnen jouw netwerk, optioneel air-gapped

Voor wie dit past

Private AI is geen standaard-keuze. Het past bij organisaties die:

  • IP-gevoelig zijn: engineering, R&D, defence, kritische infrastructuur, life sciences
  • Hoge inference-volumes verwachten waar per-token-afrekening de business case ondergraaft
  • Strengere data-eisen hebben dan EU-residency (bijvoorbeeld air-gapped, classified, of contractueel vastgelegd)
  • Al een eigen datacenter of colocatie-capaciteit hebben om in te plaatsen
  • Bewust afstand willen houden van vendor lock-in bij hyperscalers
Eerlijk

Wanneer Private AI géén goede match is

Eerlijk: als time-to-value voorop staat, of als je net begint met AI en nog niet weet welk volume je gaat draaien, dan is een hyperscaler of Volentis vaak een betere eerste stap. Private AI verdient zich terug bij volume en bij IP-criticaliteit, niet bij een eerste pilot.

Veelgestelde vragen over Private AI

Welk LLM draait er op een Private AI-omgeving?

We werken meestal met open-weight modellen zoals Llama, Mistral of DeepSeek. Welke we kiezen hangt af van je use cases (Nederlandstalig, code, redenering), je hardware-capaciteit en je voorkeur. We adviseren neutraal. We hebben geen leverancier-belang in een specifiek model.

Welke hardware is nodig?

Voor de meeste enterprise use cases volstaat een paar GPU-servers (NVIDIA L40S, H100 of equivalent). Voor hoge concurrent gebruikers of zwaardere modellen schalen we mee. De exacte specs bepalen we in de scoping-fase, op basis van je verwachte inference-volume.

Wat kost een Private AI-traject?

De hardware is een eenmalige investering die afhangt van je verwachte inference-volume en gekozen modellen. De bouw van agents bovenop de private LLM volgt onze standaard Build & Run-tarieven. In de scoping-fase krijg je een onderbouwde totale TCO op maat over 3-5 jaar, inclusief vergelijking met hyperscaler-alternatieven, zodat je een geïnformeerde keuze kunt maken.

Hoe zit het met model-updates?

Open-weight modellen worden snel beter. Wij volgen de releases van Llama, Mistral, DeepSeek en anderen, en stellen voor wanneer een upgrade waarde toevoegt. Jij beslist; wij voeren de upgrade uit als je akkoord bent.

Wat als wij later toch naar een hyperscaler willen?

Geen vendor lock-in. De agents die we bovenop je private LLM bouwen, draaien grotendeels op dezelfde frameworks die ook op Microsoft, Google of AWS werken. Een latere overstap is geen herbouw. We zijn daar van begin af aan op ingericht.

Past Private AI bij jouw situatie?

Een verkennend gesprek waarin we kijken naar je use case, je verwachte inference-volume en of een private omgeving inderdaad de beste keuze is. Geen verkoop. Een eerlijk advies, ook als de uitkomst 'hyperscaler' of 'Volentis' is.