Laat AI elke foto of screenshot uitleggen
Door Chatday Editorial Team ·
Dit is een trucje dat de meeste mensen nog steeds niet hebben geprobeerd: je kunt een foto aan een AI geven en gewoon vragen wat erop te zien is. Niet googelen, niet bijsnijden, niet zelf een omschrijving typen. Je laat het plaatje zien en praat ermee als met een vriend die toevallig een beetje van alles weet. De ingrediëntenlijst van een snack die je niet kunt uitspreken, een vreemde foutmelding die je laptop liet vastlopen, een plant in de tuin van je buren, een grafiek in een artikel die je halverwege kwijtraakte. Richt je camera, stel je vraag, krijg een helder antwoord terug. Je fotorol veranderde stilletjes in een zoekbalk, en bijna niemand gebruikt hem zo.
Wat het betekent als AI een foto kan zien
Jarenlang kon een chatbot alleen werken met de woorden die je intypte. De nieuwere modellen zijn anders. Ze zijn multimodaal, wat een mooi woord is voor: ze nemen meer op dan tekst. Je kunt een plaatje toevoegen, en de AI leest het zoals hij een zin leest, en beantwoordt er vervolgens vragen over. Google bouwde zijn Gemini-modellen zo dat ze tekst, beeld, audio en video in één keer aankunnen, en de nieuwste modellen van OpenAI en Anthropic accepteren ook afbeeldingen. De grote namen die je al kent kunnen nu allemaal naar een foto kijken.
In de praktijk betekent dat dat jij niet langer de vertaler bent. Vroeger tuurde je naar een etiket, typte je uit wat je zag, en hoopte je dat je het goed genoeg had omschreven. Nu laat je de AI gewoon het etiket zien. Hij doet het turen. De verschuiving klinkt klein, maar hij haalt de meest irritante stap weg: het omzetten van wat je voor je hebt in woorden voordat je überhaupt je vraag kunt stellen.
Waar je je camera het best op richt
De snelste manier om het te snappen is de breedte ervan te zien. Hier zijn de alledaagse klussen waar mensen het vaakst naar grijpen, wat je vraagt en wat je terugkrijgt.
| Maak een foto van… | Vraag… | Wat je terugkrijgt |
|---|---|---|
| Een voedingslabel of ingrediëntenlijst | Staat hier iets bij waar iemand met een notenallergie van weg moet blijven? | Een heldere uitleg van de kleine lettertjes |
| Een plant, insect of paddenstoel | Wat is dit, en is het veilig om aan te raken? | Een beste gok plus een zetje om het te bevestigen |
| Een foutmelding die je scherm liet vastlopen | Wat betekent dit en hoe los ik het op? | Stap voor stap probleemoplossing |
| Een handgeschreven briefje of oud receptkaartje | Typ dit voor me uit | De tekst, overgetypt |
| Een grafiek of diagram dat je niet volgt | Leg in één regel uit wat dit laat zien | De trend in gewone woorden |
| Een menu in een andere taal | Wat is hier vegetarisch? | Een vertaalde, gefilterde shortlist |
| Een huiswerk- of rekensom | Loop met me door hoe ik dit oplos | De stappen, niet alleen het antwoord |
| Een outfit, een kamer, een slide | Wat zou jij hieraan veranderen? | Eerlijke, concrete feedback |
Geen van deze vereist een speciale app of instelling. Je uploadt de foto in de chat, typt je vraag ernaast, en dat is de hele truc.
Het best voor alledaagse wat-is-dit-momenten
Het klassieke gebruik is nieuwsgierigheid. Een insect op de vensterbank, een vreemd symbool op een kledinglabel, een gebouw waar je op vakantie langsliep. Maak een foto, vraag wat is dit, en je hebt binnen seconden een startpunt. Behandel het antwoord als een slimme gok in plaats van als de waarheid, zeker bij alles wat je gaat eten, aanraken of waar je je veiligheid van laat afhangen. Vraag de AI in die gevallen om aan te geven hoe zeker hij is, en controleer het daarna.
Het best voor het lezen van wat te klein of te rommelig is
Dit is de stille held. AI is goed in het uit een beeld halen van tekst, inclusief handschrift, het deel dat vroeger lastig was. Een onleesbaar doktershandschrift, een recept in het handschrift van je oma, een bonnetje, een whiteboard na een vergadering. Vraag om transcribeer dit precies, en je krijgt getypte tekst die je kunt doorzoeken, plakken of opschonen. Bij echt rommelig handschrift wordt het niet perfect, maar het is sneller dan zelf typen en je verbetert alleen de paar woorden die hij miste.
Het best voor screenshots en techniek waar je vastloopt
Screenshots zijn ook beelden, en hier blinkt het uit voor wie geen techneut is. Loop je tegen een onbegrijpelijke foutmelding aan, een instellingenscherm dat je niet snapt, of een app die niet wil luisteren? Maak er een screenshot van, plak het erin, en vraag wat je moet doen. Omdat de AI drukke schermen kan lezen, kan hij naar precies de knop wijzen die je mist, in plaats van een algemeen heb je al geprobeerd opnieuw op te starten. Wil je de moeiteloze versie proberen, dan is Chatday’s tool om afbeeldingen te analyseren hier precies voor gemaakt: gooi het plaatje erin, stel je vraag.
Hoe je een helder, bruikbaar antwoord krijgt
Zoals bij alles met AI: je krijgt eruit wat je erin stopt. Twee dingen bepalen de kwaliteit van het antwoord, en allebei heb je zelf in de hand.
Ten eerste de foto. Een scherp, goed verlicht plaatje van dichtbij wint het van een donker, scheef plaatje. Als alleen de ingrediëntenlijst je interesseert, snijd dan bij tot de ingrediëntenlijst. Schittering op een scherm of etiket is meestal de boosdoener als een AI tekst verkeerd leest, dus kantel het om de weerspiegeling weg te halen. De AI kan alleen werken met wat daadwerkelijk in de pixels zichtbaar is.
Ten tweede de vraag. Wat is dit levert je een vaag antwoord op. Wat is dit, en zou het veilig zijn voor een hond om te eten levert je het antwoord op dat je echt wilde. Vertel wie je bent en waarom je het vraagt. Ik ben allergisch voor zuivel, is er iets op dit menu waar ik van weg moet blijven verandert een muur van buitenlandse tekst in een shortlist van twee regels. Hoe concreter je vraag, hoe bruikbaarder het antwoord.
Waar AI-zicht nog de mist in gaat
Nu het eerlijke deel, want een tool die je blindelings vertrouwt is een tool die je vroeg of laat in de steek laat. AI die beelden leest is echt nuttig, maar heeft serieuze blinde vlekken.
Hij kan met veel zelfvertrouwen onzin verkopen. De AI geeft je een keurig, overtuigend klinkend antwoord, zelfs als hij het plaatje verkeerd heeft gelezen, en hij zegt vrijwel nooit ik weet het niet zeker tenzij je ernaar vraagt. Dit is hetzelfde overdreven zelfvertrouwen waardoor chatbots in tekst met veel overtuiging dingen verzinnen, en het geldt net zo goed voor foto’s. Precieze getallen zijn een veelvoorkomende valkuil: hij leest misschien de trend van een grafiek goed, maar haalt een specifieke waarde eruit verkeerd, dus kopieer geen exacte cijfers uit een beeld zonder ze zelf te controleren.
Hij heeft ook grenzen die je moet respecteren. Hij kan slordig handschrift of een wazig plaatje verkeerd lezen. Hij is geen arts, advocaat of accountant, dus een foto van een huiduitslag, een contract of een medische scan verdient een echte professional, geen onderbuikgevoel van een chatbot. En om privacyredenen zullen de goede modellen een specifieke onbekende niet identificeren van een foto, en dat is een functie, geen fout.
Welke AI is het best in het lezen van beelden?
Eerlijk gezegd zijn de grote modellen hier inmiddels allemaal goed in, en de grotere hefboom is je foto en je vraag, niet het merk. Dat gezegd hebbende: ze hebben net iets andere sterke kanten. Sommige zijn sterker met drukke screenshots en documenten, andere met snelle wat-is-dit-vragen uit de praktijk. De enige manier om te weten welke bij jou past, is dezelfde foto aan een paar van ze te geven en te vergelijken. Wil je er twee tegen elkaar afzetten, dan kun je de modellen naast elkaar zien in de vergelijker.
Een korte opmerking over de neefjes van deze truc. Als je afbeelding eigenlijk een lang document is, zoals een contract of een onderzoekspaper, krijg je een beter resultaat door het bestand te uploaden en met een PDF te chatten, want dan kan hij elke pagina lezen in plaats van één foto. En als de foto zelf het probleem is, vervaagd, gekrast of lage resolutie, dan is dat een ander klusje: AI kan ook oude foto’s herstellen en opschonen in plaats van ze alleen te lezen.
De conclusie
De volgende keer dat je naar een etiket tuurt, vastloopt op een foutmelding of staart naar een grafiek die net zo goed in een andere taal kon staan: stop met uittypen wat je ziet. Laat de AI gewoon het plaatje zien en vraag het. Hij leest de kleine lettertjes, ontcijfert het screenshot, transcribeert het kriebelschrift en legt de grafiek uit, allemaal in gewone woorden, in een paar seconden. Houd de eerlijke grenzen in gedachten, controleer alles wat ertoe doet, en je hebt er een echt nuttige vaardigheid bij die niets kost om te proberen.