Omdat 1000 paar ogen meer zien dan 1.


“Computer vision is an interdisciplinary scientific field that deals with how computers can be made to gain high-level understanding from digital images or videos.
Aldus Wikipedia

Het doel van computer vision is de computer het verhaal dat een afbeelding vertelt te laten begrijpen. Dit kan betrekking hebben op zowel foto’s als (live) video. Voor ons mensen is dit een eenvoudig iets. We zien (meestal) in een oogopslag wat een beeld ons wil vertellen. Voor computers is het een ander verhaal. Daar is het zelfs een zeer ingewikkelde taak voor.

Wat is computer vision dan precies?

Als we bijvoorbeeld een boek op een foto zien, zien we dat het een boek is, wat voor soort boek (groot, klein, hard of soft cover), de titel, de auteur, het genre, hoe het een onderdeel van de foto is (onderwerp, staat ergens in de kast, ligt op tafel, wordt gebruikt als deurstopper) enzovoort. Een computer ‘ziet’ alleen de pixels, of beter gezegd, de intensiteit van de pixels van de foto. Voor een computer bestaat er geen direct verband tussen de pixels, laat staan dat een computer zo inhoud kan geven aan wat er op een afbeelding staat.

Om het de inhoud van een afbeelding te ontrafelen wordt computer vision gebruikt.

Bij computer vision wordt gebruik gemaakt van basis bewerkingen op de te onderzoeken afbeelding, image-classification en deep learning om inhoud te geven aan het verhaal op de foto.

Basisbewerkingen

Onder de basisbewerkingen van computer vision vallen zaken als het inlezen en tonen van een afbeelding, het tekenen van lijnen, rechthoeken, cirkels en tekst, omzetten naar verschillende kleurschema’s, resizing, cropping, roteren, maskeren, morphen, smoothen, blurren, bepalen van kleurverloop en edge- en contour detection.

Eigenlijk de zaken die je met photoshop kan doen, maar dan zonder de fancy UI. Hiervoor wordt gebruik gemaakt van speciale libraries zoals bijvoorbeeld OpenCV.

Al deze technieken worden al dan niet in combinatie met elkaar gebruikt in image classification en deep learning scenario’s.

Image Classification

Image classification is het toekennen van een label uit een vooraf gedefinieerd set van labels aan een afbeelding.

Om de classificatie makkelijker te maken worden de afbeeldingen bewerkt om ongewenste elementen uit de afbeelding te verwijderen, of het te classificeren onderwerp juist beter detecteerbaar te maken.

Voor classificatie wordt gebruik gemaakt van machine learning en deep learning algoritmes.

Deep Learning voor Computer Vision

Bij deep learning voor computer vision wordt onder andere gebruik gemaakt van neurale netwerken om de inhoud van de afbeelding te begrijpen.

Het trainen en evalueren van een netwerk is een zware taak die precies goed genoeg moet gebeuren. Als een netwerk niet goed getraind wordt, zal het niet in staat blijken te zijn een aangeboden afbeelding juist te classificeren.

Voorbeelden van Computer Vison

Computer vision wordt op veel gebieden ingezet. Denk aan kenteken herkenning, gezichtsherkenning, kwaliteitscontrole (afwijkingen ten opzichte van de referentie), medische toepassingen (detecteren van breuken, gewrichtsslijtage of tumoren) en, ook hot vandaag de dag, besturingssystemen voor zelfrijdende auto’s.

Voor het detecteren van een object op zich is vaak geen deep learning nodig. Voor het identificeren van het object, wordt meestal wel deep learning gebruikt.

Meer weten?
Ik ga hier graag met je over in gesprek.
Stuur me een mail (hier) óf
stuur me een DM via mijn LinkedIn profiel hieronder.


Peter Lans

Development Consultant

Leave a comment

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *