In deze blog gaan we een Lineair Regressiemodel trainen en verwachten dat het correct presteert op een verse input.
Het basisidee van elk machine learning model is dat het wordt blootgesteld aan een groot aantal inputs en ook de output krijgt aangeleverd die voor hen van toepassing is. Bij het analyseren van steeds meer gegevens probeert het de relatie tussen de invoer en het resultaat te achterhalen.
Bedenk eens een heel primitief voorbeeld: u moet beslissen of u afhankelijk van het weer een jas draagt of niet. U hebt toegang tot de trainingsgegevens zoals we die noemen –
+---------------------+---------------+
| Outside Temperature | Wear a Jacket |
+---------------------+---------------+
| 30°C | No |
| 25°C | No |
| 20°C | No |
| 15°C | Yes |
| 10°C | Yes |
+---------------------+---------------+
Op de een of andere manier vindt uw geest een verband tussen de invoer (temperatuur) en de uitvoer (beslissing om een jas te dragen).
Dus, als de temperatuur 12°C is, zou u toch een jas dragen, hoewel u nooit de uitkomst voor die specifieke temperatuur te horen hebt gekregen.
Nu gaan we verder met een iets beter algebraïsch probleem dat de computer voor ons zal oplossen.
Voordat we beginnen, vergeet niet scikit-learn te installeren, het biedt eenvoudig te gebruiken functies en voorgedefinieerde modellen die veel tijd besparen
pip install scikit-learn
Hier, X is de invoer en y is de uitvoer.
Gezien de trainingsset zou je gemakkelijk kunnen raden dat de output (y) niets anders is dan (x1 + 2*x2 + 3*x3).