Một ví dụ về Simple Linear Regression là model dự đoán mức độ ô nhiễm không khí dựa trên giá xăng (giá xăng cao thì đa số mọi người cũng sẽ tém tém việc đi lại hơn nhỉ?). Trong ví dụ này thì input variable (aka. independent hay explanatory variable) là giá xăng, còn output variable (aka. dependent hay response variable) là mức ô nhiễm không khí.
Khi học tới Simple Linear Regression model (model có 1 input variable và 1 output variable như ví dụ trên), đa số các bạn sẽ biết nó còn được gọi là một Univariate Regression Model. Theo 'logic' đó, khi gặp Multiple Linear Regression model, thì nhiều bạn (trong đó có Cherry :">) đã nghĩ nó được gọi là Multivariate model. Tuy nhiên, cách dùng này là không chính xác và cũng hơi đáng tiếc là ít ai sẽ chỉ ra cho bạn điểm này cho bạn khi dạy (đặc biệt là nếu người dạy không strong về statistics thì có khi họ cũng không biết).
simple linear regression: giá xăng -> mức ô nhiễm không khí
multiple linear regression: giá xăng & số lượng phương tiện giao thông & ... -> mức ô nhiễm không khí
Để ý hai dòng tóm tắt trên, từ 'Multiple' trong Multiple linear regression thực ra là để chỉ việc model đó có 'nhiều hơn 1 INPUT variable'. Còn từ 'multivariate' là để chỉ model có 'nhiều hơn 1 OUTPUT variable'. Do đó, Multiple linear regression không phải là một Multivariate model, mà thực chất nó là một Univariate model.
留言