Hoe aannames onze wegen veiliger maken

Machine Learning heeft ons de afgelopen jaren de kans gegeven om dingen te automatiseren die voorheen niet mogelijk waren

| BrainCreators | 5 min | 21 juli 2021 18:19
Exclusief
Trending
Gewaardeerd
Copyright: BrainCreators
Machine Learning heeft ons de afgelopen jaren de kans gegeven om dingen te automatiseren die voorheen niet mogelijk waren. Computer Vision gebruikt Machine Learning om objecten in images te herkennen. We hoeven hierdoor niet langer specifiek een algoritme voor een taak te schrijven. In plaats daarvan kunnen we een Machine Learning model trainen hoe de taak moet worden uitgevoerd door het voorbeelden te laten zien.

Binnen de wegenbouw zien we dat bedrijven ook willen innoveren en hierdoor snel met Machine Learning aan de slag gaan. Een recente ontwikkeling is het gebruik van Machine Learning voor het opsporen van defecten in wegdek, zoals scheuren en barsten. Om dit te realiseren is het nodig om een model te trainen en images, oftewel trainingsdata zoals videobeelden, te voeden met annotaties (voorbeelden). Het model voorspelt vervolgens waar defecten zijn en/of vergelijkt het met de annotaties waardoor het zichzelf kan verbeteren. Dit wordt net zolang herhaald totdat het model goed voorspelt en het de annotaties niet meer nodig heeft. Daarna kan het model worden ingezet in de echte wereld om bijvoorbeeld wegen te inspecteren.

Het probleem van i.i.d. aannames

Het leerproces achter het Machine Learning model is gebaseerd op enkele aannames over de data, waarvan de belangrijkste de onafhankelijke en identiek verdeelde i.i.d. aanname is. We noemen dit ook wel independent and identically distributed (i.i.d.) assumption. De i.i.d. aanname heeft veel ontwikkelingen in Artificial Intelligence mogelijk gemaakt. Het houdt echter niet altijd stand. Als de kansverdeling verandert, dan is de i.i.d. aanname niet betrouwbaar.

Voor een model dat afhankelijk is van de i.i.d. aanname, weten we niet wat er zal gebeuren. Het kan blijven werken, maar het kan ook op onverwachte manieren mislukken. Een i.i.d. aanname bestaat namelijk uit twee onderdelen, het independent (onafhankelijk) en het identically distributed (gelijk verdeeld) deel. Het independent deel gaat ervan uit dat waarnemingen elkaar niet beïnvloeden. Hierdoor hoeft het model een voorspelling op basis van een image niet te onthouden om een voorspelling te doen voor een andere foto. Bij de identically distributed variabele gaat het daarentegen wel vaak mis. Dit deel impliceert dat echte data dezelfde distributie heeft als de trainingsdata. Hierdoor maken modellen vaak de verkeerde voorspellingen, omdat data uit de échte wereld voortdurend verandert vanwege verschillende factoren. Machine Learning modellen moeten daarom voortdurend observeren, leren van de omgeving en hun gedrag aanpassen bij veranderingen.

Een image van een weg in Italië heeft bijvoorbeeld een andere distributie dan een Nederlandse weg. De verschillen kunnen variëren van het type asfalt dat wordt gebruikt tot de gemiddelde omgevingstemperatuur. Een distributie kan worden beïnvloed door al deze factoren en meer. Bovendien is het onmogelijk om te meten of twee plaatjes uit dezelfde distributie komen. Hierdoor is het niet mogelijk om de aanname te controleren. Stel je voor dat je een vorkheftruck bouwt zonder te kunnen controleren hoeveel gewicht hij kan dragen. Hoewel we de werkelijke verdeling niet kunnen meten, is het wel vaak mogelijk om iets te zeggen over het verschil in verdeling tussen de twee images. Voor wegen geldt hetzelfde, images van wegen in Italië zullen uit een andere distributie moeten komen dan images van wegen in Nederland. Want wat gebeurt er als we een model in Nederland opleiden en het in Italië gaan gebruiken? Waarschijnlijk zal het niet helemaal mislukken, want scheuren uit andere landen zijn hetzelfde als die in Nederland. Echter zal het model ongetwijfeld, door externe factoren, veel meer fouten bevatten.

Fouten bij i.i.d. aannames voorkomen

Om dit op te lossen zal er nieuwe trainingsdata uit Italië moeten komen. Ook al heb je in Nederland al duizenden annotaties gemaakt, er zullen duizenden foto's met gebreken uit Italië geannoteerd moeten worden. Een meer efficiëntere aanpak is om de bestaande i.i.d. aanname te vervangen door een nieuwe. Tenslotte zullen sommige kenmerken invariant blijven, ongeacht de verandering in distributie. Om dit te realiseren zullen er meerdere domeinen gebruikt moeten worden om het model opnieuw te trainen. In dit geval vertellen we het model welke domeinen er zijn en passen een methode toe zoals Invariant Risk Minimization (IRM) of Causal Matching (CM).

Deze methoden werken als volgt. Het model verzamelt een aantal kenmerken die het gebruikt om bepaalde defecten, zoals scheuren, te herkennen. Het houdt bij welke kenmerken het in elk domein gebruikt. In Zuid-Holland is bijvoorbeeld de binnenkant van een scheur in de weg zwart, terwijl deze in Groningen lichtgrijs is. Echter zijn de vormen van de scheuren vergelijkbaar. Door deze twee te vergelijken ziet het model in dat het geen aandacht moet besteden aan de kleur, aangezien dit een veranderlijk kenmerk is. In plaats daarvan zou het alleen de vorm moeten gebruiken. Wanneer we dit model in Italië of Noorwegen inzetten, heeft het geleerd om alleen de vorm van de scheur te gebruiken en zal het daar even goed werken.

Machine Learning draait om kennis van data

Kortom, Machine Learning neemt een steeds belangrijkere plek in binnen het uitvoeren van de taken. Voor de wegenbouw zal deze ontwikkeling ook veel impact hebben en zorgen voor tal van nieuwe mogelijkheden om het wegen beter en veiliger te maken. Echter draait het bij Machine Learning niet alleen om het verzamelen van data. Hoewel meer data over het algemeen betere resultaten geeft is de kennis over de data zelf en het kiezen van de juiste domeinen zeker zo belangrijk. Dankzij i.i.d aannames is het eenvoudiger om prestaties van modellen te verbeteren. Door vervolgens informatie over de distributie op te nemen, zoals we doen bij het gebruik van IRM of CM, kan een model generaliseren naar nooit eerder vertoonde situaties met minder data. Op deze manier kunnen bedrijven efficiënter met data omgaan en beter hun weg vinden in de wereld van Machine Learning.
Auteur: Daniël Nobbe, Research Intern bij BrainCreators
Auteur: Maarten Stol, Principal Scientific Advisor bij BrainCreators

Hoe vind je dit artikel?


Waardering: Uitstekend (9 ratings).

Content op basis van interesse of taal liever niet meer zien? Ga dan naar settings om eenvoudig je voorkeuren in te stellen.

Over BrainCreators

BrainCreators is in 2016 opgericht door drie ondernemers die elkaar in de jaren 90 hebben leren kennen via de opleiding Artificial Intelligence aan de Universiteit van Amsterdam. BrainCreators wil met intelligente automatisering de kwaliteit van het leven verbeteren door repeterende handelingen te automatiseren. Dankzij haar BrainMatter platform kunnen organisaties snel digitale inspecteurs ontwikkelen, die direct als digitale dienst inzetbaar zijn in de fysieke wereld.
Meer over BrainCreators

Disclaimer

Dit artikel is een ingezonden bericht en valt buiten de verantwoordelijkheid van de redactie.
20191030101402.jpg
De grootste Nederlandse site over Android
20191030103431.png
Conference by app developers, for app developers!
20191029200614.jpg
Drive value with data
20200608191257.png
Dé leukste website op het gebied van zorg in Nederland
20191030100036.png
Voor professionals met passie voor digitale revolutie!
20200707165104.png
Meer meisjes en vrouwen in bèta, techniek en IT
20191029224512.jpg
Het no-nonsense internetbureau
© 2019-2021, alle rechten voorbehouden.
Voor onze dienstverlening geldt dat vermelde prijzen altijd excl. BTW zijn en dat onze algemene voorwaarden van toepassing zijn.
Beeldmateriaal is eigendom van hun respectievelijke eigenaren en wordt gebruikt op een 'fair use' basis met bronvermelding.
TechVisor
Het vizier op de tech industrie.