Trong lý thuyết xác suất, hàm phân phối tích lũy (Tiếng Anh: Cumulative distribution function hay viết tắt CDF) mô tả toàn bộ phân phối xác suất của một biến ngẫu nhiên với giá trị thực X. Đối với mỗi giá trị thực x, hàm phân phối tích lũy được định nghĩa như sau:
Trong đó, vế phải diễn tả xác suất mà biến ngẫu nhiên X nhận giá trị nhỏ hơn hoặc bằng x. Vì vậy, xác suất mà X nằm trong khoảng [a, b] là F(b) − F(a) nếu a < b. Theo quy ước, chữ F hoa được dùng cho hàm phân phối tích lũy, trong khi chữ f
Lưu ý rằng trong định nghĩa trên, dấu 'nhỏ hơn hoặc bằng' ('≤') có thể được thay bằng dấu 'nhỏ hơn' ('<'). Điều này sẽ tạo ra một hàm khác, nhưng cả hai hàm đều có thể dễ dàng chuyển đổi từ nhau. Quan trọng là không nên lẫn lộn hai kiểu dấu này, vì điều đó có thể dẫn đến kết quả sai. Ở các nước nói tiếng Anh, quy ước thường sử dụng dấu 'nhỏ hơn hoặc bằng' ('≤') thay vì dấu 'nhỏ hơn' ('<').
Xác suất để X có giá trị chính xác bằng b được gọi là 'xác suất điểm' (point probability) là
Kết nối với hàm mật độ xác suất
Hàm phân phối tích lũy F(t) tương ứng với hàm mật độ xác suất f(x) được biểu diễn bằng công thức:
Biến ngẫu nhiên
Biến ngẫu nhiên x có hàm phân phối tích lũy F(x) có thể được liên hệ với biến ngẫu nhiên đều y trong khoảng [0,1] qua công thức sau:
- x = F(y)
Trong đó, F(y) là hàm nghịch đảo của F(x).
- Phân phối xác suất
- Hàm mật độ xác suất