Neste blog, iremos treinar um Modelo de Regressão Linear e esperamos ter um desempenho correcto numa nova entrada.
A ideia básica de qualquer modelo de aprendizagem de máquinas é que este seja exposto a um grande número de entradas e também forneça a saída aplicável a elas. Ao analisar cada vez mais dados, tenta descobrir a relação entre a entrada e o resultado.
Considerar um exemplo muito primitivo quando se tem de decidir se se deve ou não usar um casaco, dependendo do tempo. Tem acesso aos dados de formação como lhe chamamos –
+---------------------+---------------+
| Outside Temperature | Wear a Jacket |
+---------------------+---------------+
| 30°C | No |
| 25°C | No |
| 20°C | No |
| 15°C | Yes |
| 10°C | Yes |
+---------------------+---------------+
De alguma forma, a sua mente encontra uma ligação entre a entrada (temperatura) e a saída (decisão de usar um casaco).
Assim, se a temperatura é de 12°C, ainda usaria um casaco, embora nunca lhe tenha sido dito o resultado para essa temperatura em particular.
Agora, passemos a um problema algébrico ligeiramente melhor que o computador irá resolver para nós.
Antes de começarmos, não se esqueça de instalar o scikit-learn, ele fornece funções fáceis de usar e modelos predefinidos que poupam muito tempo
pip install scikit-learn
Aqui, X é a entrada e y é a saída.