[] De manier waarop we de werkwijze: "gegevens naar intelligentie" gaan leren is door een aantal praktijksituaties te bekijken, en zo de basis te leren van methoden die we in voor echte praktische toepassingen gaan gebruiken. Dat is één van unieke eigenschappen van deze cursus In onze eerst toepassing kijken we naar het voorspellen van huizenprijzen. Met de intelligentie die we zo verkrijgen voorspellen we de waarde van een huis die niet in de verkoop staat. We weten niet wat de waarde is, maar we willen dat af leiden uit andere gegevens van het huis. Wat zijn onze gegevens? In dit geval, kijken we naar andere huizen en hun verkoopprijzen om de prijs te bepalen van het huis waar wij belangstelling voor hebben. Bij deze verkoopprijzen gaan we kijken naar eigenschappen van de huizen. Bijvoorbeeld hoeveel slaapkamers het huis heeft. hoeveel badkamers, het woonoppervlakte, enzovoort. Wat we gaan doen: onze machine learning methode gaat die huiseigenschappen relateren aan de verkoopprijs. Als we dat model, van de relatie tussen huiseigenschappen en verkoopprijzen, kennen dan kunnen we dat gebruiken om de verkoopprijs te voorspellen voor het nieuwe huis. Van dit huis bepalen we eerst de eigenschappen en van daaruit dan de verwachte verkoopprijs. Deze machine learning methode wordt regressie genoemd. In onze tweede praktijksituatie gaan we sentiment analyse onderzoeken. We baseren ons op beoordelingen van een aantal restaurants Bijvoorbeeld: de sushi was perfect, het eten was perfect, maar de service was slecht. We gaan die beoordeling bekijken om te classificeren of deze een positieve sentiment inhoudt. Was een goede beoordeling: duim omhoog, was het slechte beoordeling: duim omlaag. Hoe gaan we dit doen? We gaan eerst kijken naar een grote hoeveelheid andere beoordelingen, naar hun beoordelingsteksten met bijbehorende positieve of negatieve review. Daarmee leren we het verband te begrijpen waarmee we sentiment kunnen classificeren. In dit voorbeeld zouden we in de tekst van de beoordeling kunnen gaan kijken hoe vaak het woord 'perfect' en hoe vaak het woord 'slecht' voorkomt. Vanuit de andere beoordelingen die we hebben, zouden we een soort beslissingsgrens kunnen bepalen: vanuit het gebruik van deze twee worden of het een positieve of negatieve beoordeling is. De manier hoe we dit leren van andere beoordelingen is gebaseerd op de beoordeling samen met de bijbehorende tekst. Deze methode wordt classificatie genoemd. In onze derde praktijksituatie bestuderen we een document zoek- of aanbevelingsysteem Met de intelligentie die we daarmee krijgen kunnen een artikel, boek of zoiets aanbevelen, waarin de lezer mogelijk geïnteresseerd kan zijn. Onze gegevensverzameling is een enorme collectie van artikelen, waaruit we gaan aanbevelen. wat we doen, in deze situatie is uitproberen en zoeken of we structuur in de gegevensverzamelingen kunnen vinden voor groepen van artikelen. Mogelijk is er een verzameling artikelen over sport en wereldnieuws en een verzameling over amusement en wetenschap. Als we deze structuren vinden, gaan onze verzameling artikelen annoteren met bijbehorende labels, die we proberen af te leiden uit de gegevensverzameling. Dit zouden we kunnen gebruiken voor snel zoeken van vergelijkbare artikelen als degene die ik op dat moment zit te lezen over het onderwerp: wereldnieuws. Met behulp van de labels kan snel een ander artikel opgehaald worden omdat ik weet waarmee er gezocht wordt. Deze aanpak wordt clustering genoemd. In onze vierde praktijksituatie gaan we onze bezig houden met een echt belangrijk onderdeel: collaborative filtering. Deze methode heeft veel invloed gehad, in de afgelopen tien jaar, op veel domeinen. We kijken vooral naar product aanbeveling, waarbij er, vanuit je voorafgaande aankopen, een aanbeveling wordt gedaan van producten waarin je mogelijk ook geïnteresseerd zou zijn om deze te kopen. In deze praktijksituatie is het data die we gebruiken om intelligentie af te leiden om product aanbevelingen te kunnen doen. We willen het verband begrijpen tussen wat je eerder gekocht hebt en wat je in de toekomst zou willen gaan kopen. Hiervoor gaan we kijken naar de aankoophistorie van andere gebruikers gecombineer met, indien mogelijk, andere eigenschappen van die gebruikers. Het basisidee is het rangschikken van de gegevens van gebruikers en producten in een matrix waarbij de gevulde vakjes producten voorstellen die de klant daadwerkelijk gekocht heeft. Dat zijn de producten die die klant dus leuk vond om te kopen. Vanuit deze matrix gaan we eigenschappen van klanten en producten afleiden. Deze eigenschappen van klanten en producten leiden we af uit de gegevensverzameling van aankopen uit het verleden. Over deze eigenschappen gaan we nadenken om te bepalen hoeveel overeenstemming er is tussen wat de klant waardeert, eigenschappen die de klant waardeert en of het product daadwerkelijk betrekking heeft op deze eigenschappen. Als voorbeeld: stel de klant is een moeder, zij heeft zeker eigenschappen met andere klanten die ook moeder zijn. Van daaruit kunnen zaken over producten afleiden. Waar gaat het dan over? Bijvoorbeeld baby producten zijn belangrijk voor jonge moeders. Die informatie gebruiken we om aanbevelingen te doen. Deze aanpak uitgaande van de matrix, de producten - klanten matrix, naar deze afgeleide eigenschappen over klanten en producten wordt matrix factorization genoemd. Dan onze laatste praktijksituatie, daarin Gaan we kijken naar visuele product aanbevelingen. Onze gegevensverzameling bestaat uit het door iemand op het web plaatsen, van een afbeelding en niet van tekst. Zij plaatsen een afbeelding, zoalss een zwarte schoen, zwarte laars, of een hoge hakken schoen, of werkschoen of sportschoen. Daarna willen ze graag een verzameling schoenen zien, die voor hen van belang zouden kunnen zijn. Schoenen, die er visueel hetzelfde uitzien als die op de afbeelding die geplaatst is. Daarna willen ze informatie hierover kunnen zoeken, om uiteindelijk iet te kunnen kopen. De manier hoe we dit mogelijk gaan maken om in staat te zijn van één afbeelding naar meerder gerelateerde afbeeldingen te gaan moeten we essentiële eigenschappen uit de afbeelding kunnen herleiden om vergelijkbare afbeeldingen te vinden. De manier waarop we deze gedetailleerde eigenschappen afleiden wordt deep learning genoemd. In het bijzonder kijken we naar neurale netwerken, waarbij elke laag van het neurale netwerk meer gedetailleerde eigenschappen vertegenwoordigd. In het schoenenvoorbeeld zal de eerste laag in de afbeelding de verschillende lijnen detecteren, Bij de tweede laag gaan we hoeken herkennen en andere vergelijkbare van belang zijnde eigenschappen. Hoe dieper we gaan in de lagen, hoe meer gedetailleerde eigenschappen er herkend gaan worden. Zoals je hiervoor hebt kunnen zien, gaan we een serie van echte praksituaties doorlopen, echte praktijksituaties met een echte machine learning toepassingen. Hierdoor ontdekken we een serie krachtige methoden. En wordt je in staat gesteld om nieuwe machine learning technieken te ontwikkelen en toe te passen. Technieken voor andersoortige situaties als de praktijksituaties in deze cursus. De praktijksituaties in deze cursus leren ons de basis van de methoden, die we beschrijven met herkenbare voorbeelden. []