Trong thống kê, lỗi bình phương trung bình (MSE: Mean Squared Error) là giá trị trung bình của các bình phương sai số, phản ánh sự khác biệt giữa các ước lượng và giá trị thực tế. MSE là hàm rủi ro, thể hiện kỳ vọng của tổn thất sai số bình phương hoặc tổn thất bậc hai. Sự khác biệt này có thể do ngẫu nhiên hoặc do các ước lượng thiếu thông tin chính xác hơn.
MSE đại diện cho moment bậc hai của sai số, kết hợp cả phương sai và thiên bias của ước lượng. Đối với ước lượng không thiên bias, MSE chính là phương sai của ước lượng. MSE có đơn vị đo lường là bình phương của giá trị ước lượng. Tương tự như độ lệch chuẩn, căn bậc hai của MSE cho ra sai số root-mean-square (RMSE) hoặc độ lệch root-mean-square (RMSD), có đơn vị tương tự như giá trị ước lượng. Đối với ước lượng không thiên bias, RMSE là căn bậc hai của phương sai và được gọi là độ lệch chuẩn.
Khái niệm và đặc điểm cơ bản
MSE dùng để đánh giá chất lượng của một ước lượng (như một hàm toán học liên kết mẫu dữ liệu với tham số dân số từ đó dữ liệu được lấy mẫu) hoặc yếu tố dự đoán (như bản đồ chức năng có số liệu vào tùy ý để một mẫu giá trị biến ngẫu nhiên). Định nghĩa của MSE có thể khác nhau tùy thuộc vào việc mô tả một ước lượng hay một yếu tố dự đoán.
Đánh giá dự đoán
Nếu là một vector chứa giá trị dự đoán, và là vector các giá trị quan sát thực tế, thì MSE của phép dự đoán có thể được tính theo công thức sau:
MSE chính là trung bình () của bình phương các sai số (). Đây là một chỉ số dễ dàng tính toán cho một mẫu cụ thể (và do đó phụ thuộc vào mẫu).