Trong thống kê, trung bình số học có hai định nghĩa liên quan đến nhau:
- trung bình số học, hay còn gọi chính xác hơn là trung bình số học, để phân biệt với trung bình nhân hay trung bình điều hòa. Nó cũng được gọi là trung bình của mẫu.
- giá trị kỳ vọng của một biến ngẫu nhiên, còn được biết đến là trung bình của tổng thể (population mean).
Ngoài Thống kê, các giá trị trung bình còn được sử dụng trong hình học và phân tích (và thường được gọi là trung bình); nhiều loại trung bình khác nhau đã được phát triển cho các mục đích này (ít được sử dụng trong Thống kê). Xem mục Các loại trung bình khác để biết thêm chi tiết.
Trung bình mẫu thường được dùng để ước lượng xu hướng trung tâm, chẳng hạn như trung bình của tổng thể. Tuy nhiên, còn có các ước lượng khác. Ví dụ, trung vị có thể là lựa chọn tốt hơn trung bình mẫu để ước lượng xu hướng trung tâm.
Với một biến ngẫu nhiên có giá trị thực X, trung bình số học chính là giá trị kỳ vọng của X. Nếu không có giá trị kỳ vọng, biến ngẫu nhiên đó không có trung bình số học.
Đối với một tập hợp dữ liệu, trung bình số học là tổng của tất cả các quan sát chia cho số lượng quan sát. Khi chọn phương pháp này để mô tả phương sai tương đối (communality) của dữ liệu, thường dùng độ lệch chuẩn để thể hiện sự phân tán của các quan sát.
Độ lệch chuẩn là căn bậc hai của phương sai, cho biết trung bình sự khác biệt giữa các giá trị và giá trị trung bình là bao nhiêu đơn vị.
Giá trị trung bình là giá trị duy nhất mà tổng bình phương các độ lệch xung quanh nó là nhỏ nhất.
Nếu tính tổng bình phương các độ lệch từ bất kỳ phương pháp đo xu hướng trung tâm nào khác, kết quả sẽ lớn hơn so với khi sử dụng trung bình số học. Đó là lý do độ lệch chuẩn và trung bình số học thường được đưa vào báo cáo thống kê cùng nhau.
Một phương pháp đo lường phân tán khác là độ lệch trung bình, tương đương với trung bình của các độ lệch tuyệt đối so với giá trị trung bình. Phương pháp này ít bị ảnh hưởng bởi các giá trị ngoại lệ hơn, nhưng có thể khó hơn khi tích hợp với các tập dữ liệu khác.
Lưu ý rằng không phải tất cả các phân phối xác suất đều có giá trị trung bình hoặc phương sai; phân phối Cauchy là một ví dụ điển hình.
Dưới đây là tổng quan về một số phương pháp tính toán trung bình số học cho một tập hợp n số. Xem giải thích các ký hiệu trong Bảng ký hiệu toán học.
Trung bình số học
Số bình quân số học, hay còn gọi là trung bình, là loại số bình quân phổ biến nhất, thường được nhắc đến đơn giản là 'trung bình'.
Số bình quân số học dễ bị nhầm lẫn với số trung vị hay mode. Đây là giá trị trung bình của một tập hợp dữ liệu hoặc phân bố. Trong những phân bố lệch, giá trị trung bình có thể không trùng với số trung vị hay mode. Ví dụ, thu nhập bình quân có thể cao hơn nhiều so với thu nhập của đa số người, trong khi thu nhập trung vị nằm ở mức chia đôi dân số. Mode là giá trị xuất hiện nhiều nhất và thường thấp hơn trung bình.
Điều này có nghĩa là nhiều loại phân bố lệch, như phân phối mũ hay phân phối Poisson, thường được mô tả tốt nhất bằng số bình quân số học.
Ví dụ
Một bài toán thực nghiệm cho các dữ liệu: 34, 27, 45, 55, 22, 34. Cách tính trung bình cộng là như sau:
- Có tổng cộng 6 số. Vậy n = 6
- Tính tổng của các số, ta có được 217
- Để tìm trung bình cộng, chia tổng cho n: 217/6 = 36.17
Trung bình nhân
Trung bình nhân là chỉ số hữu ích cho các tập hợp số khi ta quan tâm đến sản phẩm của chúng, chẳng hạn như tỷ lệ tăng trưởng.
Ví dụ
Bài toán thực nghiệm với dữ liệu: 34, 27, 45, 55, 22, 34. Phương pháp tính số bình quân nhân là như sau:
- Có tổng cộng 6 số. Vậy n = 6
- Tính tích của tất cả các số, ta được 1699493400.
- Để tìm số bình quân nhân, ta tính căn bậc n (6) của tích, kết quả là 34.5451100372
Số bình quân điều hòa
Số bình quân điều hòa là chỉ số hữu ích cho các tập hợp số khi chúng được xem xét liên quan đến một đơn vị cụ thể, ví dụ như vận tốc (quá trình di chuyển trên mỗi đơn vị thời gian).
Ví dụ minh họa
Một thí nghiệm cung cấp dữ liệu: 34, 27, 45, 55, 22, 34. Cách tính trung bình điều hòa
- Có 6 số liệu trong tập dữ liệu, vì vậy n=6
- Tính tổng biểu thức trong mẫu số, ta thu được 0.181719152307
- Lấy nghịch đảo của tổng đó, ta có 5.50299727522
- Để tính trung bình điều hòa, nhân giá trị này với n để có được 33.0179836513
Trung bình lũy thừa
Số bình quân lũy thừa là một mở rộng của số bình quân số học, số bình quân nhân, và số bình quân điều hòa. Công thức định nghĩa của nó như sau
Bằng cách chọn các giá trị khác nhau cho tham số m, ta có thể tính được số bình quân số học (m = 1), số bình quân nhân (m → 0), hoặc số bình quân điều hòa (m = −1)
Số bình quân lũy thừa có thể được mở rộng thêm để trở thành số bình quân-f tổng quát (generalized f-mean)
Việc lựa chọn hàm f(x) và lấy nghịch đảo sẽ cho ra các loại số bình quân khác nhau: số bình quân số học với f(x) = x, số bình quân nhân với f(x) = log(x), hoặc số bình quân điều hòa với f(x) = 1/x.
Trung bình gia quyền
Trung bình gia quyền được áp dụng khi chúng ta muốn kết hợp các số bình quân từ các mẫu khác nhau thuộc cùng một tổng thể chung:
Các trọng số đại diện cho trọng số của mẫu i. Trong nhiều ứng dụng khác, chúng phản ánh mức độ tin cậy của ảnh hưởng của mẫu lên trung bình thông qua các giá trị tương ứng.
Trung bình cắt cụt
Khi dữ liệu chứa các giá trị ngoại lệ không chính xác, như những giá trị quá lớn hoặc quá nhỏ, người ta thường sử dụng trung bình cắt cụt (truncated mean). Trung bình cắt cụt được tính bằng cách: loại bỏ một lượng dữ liệu nhất định ở hai đầu dữ liệu, thường là các phần bằng nhau ở mỗi đầu, và sau đó tính trung bình cộng của phần dữ liệu còn lại. Tỷ lệ phần trăm của giá trị bị loại bỏ được ghi lại như một phần của tổng số giá trị.
Trung bình khoảng tứ phân vị
Trung bình khoảng tứ phân vị (interquartile mean) là một dạng trung bình cắt cụt. Nó được tính bằng trung bình cộng của các giá trị sau khi đã loại bỏ phần tư giá trị nhỏ nhất và lớn nhất.
Trung bình cắt cụt
Trung bình của một hàm số
Trong giải tích, đặc biệt là giải tích đa biến, trung bình của một hàm được hiểu một cách lỏng lẻo là giá trị trung bình của hàm trên miền xác định của nó. Nếu hàm là đơn biến, hàm trên khoảng (a,b) được tính như sau
Đây là sự mở rộng của trung bình cộng. Bên cạnh đó, trung bình nhân cũng có thể được tổng quát hóa cho các hàm số, bằng cách định nghĩa trung bình nhân của hàm f như sau
Trong lý thuyết đo lường (measure theory) và lý thuyết xác suất, cả hai loại trung bình này đều có vai trò quan trọng hơn trong các ứng dụng.
Các loại trung bình khác
- Trung bình cộng - hình học
- Trung bình cộng - điều hòa
- Trung bình Cesàro
- Trung bình Chisini
- Trung bình hình học - điều hòa
- Trung bình Heronian
- Trung bình Identric
- Trung bình Lehmer
- Trung bình bình phương
- Trung bình căn bậc hai
- Trung bình Stolarsky
- Trung bình hình học trọng số
- Trung bình điều hòa trọng số
- Entropy của Rényi (trung bình f tổng quát)
- Xu hướng trung bình
- Thống kê mô tả
- Độ phân tán
- Số trung vị
- Mode (chế độ)
- Thống kê tổng quát
Các liên kết bên ngoài
- So sánh giữa trung bình cộng và trung bình nhân của hai số