Categories
程式開發

僅用8 行代碼即可建立一個線性回歸模型


本文最初發表在Towards Data Science 博客,經原作者Braden Riggs 授權,InfoQ 中文站翻譯並分享。

數學建模和機器學習常常會讓人感覺像是難以探索和學習的課題,尤其是對那些不熟悉計算機科學和數學領域的人來說尤為如此。我很驚訝地從我的非理工科的朋友那裡聽到,他們在自己的項目中嘗試使用基本的建模技術時感到不知所措,而且他們可能會陷入這個領域的語義中。這是一種恥辱,因為線性建模在許多情況下都是非常有用的,並且加上互聯網上的所有開放源代碼,實現自己的模型從未如此簡單過。因此,下面是我用Python 理解並實現基本線性回歸模型的簡單指南。

什麼是線性回歸?

線性回歸是一種數學建模的一種形式,通常用於評估因變量(如體重)和自變量(如身高)之間的關係。我們的大腦能夠很自然地做到這一點,只是以一種不太精確的方式而已。如果我讓你判定189 厘米和158 厘米的人哪個人體重更重,你可能會選擇189 厘米的人。當然,158 厘米的人也可能會更重,但我敢打賭,在你與人交往的經歷中,你已經確定了人的身高與體重之間的某種關係。線性回歸就是建立這種關係並從中提取意義的一種精確的數學方法。

它是如何工作的?

線性回歸的工作原理是通過創建一條最佳擬合線。最佳擬合線是最能捕捉X 軸和Y 軸之間關係的直線。例如,這種關係可以是,隨著“X”的增加,“Y”也會隨之增加:

原文鏈接:【https://www.infoq.cn/article/H5MDLR2jq4jidAFMphuV】。未經作者許可,禁止轉載。