
Dạng toán về xác suất (Probability) và tần số tương đối (Relative Frequency) là một phần quan trọng trong chương trình Toán THPT tại Việt Nam. Trong SAT Math, dạng bài này có một số đặc điểm khác biệt, yêu cầu người học không chỉ nắm vững khái niệm mà còn biết cách áp dụng linh hoạt vào các bài toán thực tế. Bài viết dưới đây sẽ cung cấp cái nhìn tổng quan về dạng bài Probability and Relative Frequency trong SAT Math, hướng dẫn cách làm chi tiết và kèm theo các ví dụ minh họa giúp người học rèn luyện hiệu quả.
Tổng quan về dạng bài toán Probability và Relative Frequency trong SAT Math
Class | Attendance | Total | |
Attending | Not attending | ||
Freshman | 81 | 24 | 105 |
Sophomore | 53 | 49 | 102 |
Total | 134 | 73 | 207 |
Điểm khác biệt ở dạng bài tập này so với bài toán xác suất thống kê học sinh Việt Nam thường gặp ở chỗ: SAT Math tập trung vào phần Data analysis khá nhiều, có nhiều tới ứng dụng thực tế như dự đoán về lĩnh vực y tế hay tính toán rủi ro.
Trong khi đó, bài tập xác suất chúng ta hay gặp thường không có bảng dữ liệu như trên, nên một số học sinh chưa quen sẽ lúng túng khi gặp phải. Mặc dù vậy, dạng bài tập này vẫn được đánh giá khá dễ, không đánh đố phức tạp nên người học chỉ cần luyện tập chăm chỉ và làm bài cẩn thận để đảm bảo chính xác.
Chiến lược giải quyết dạng bài Probability và Relative Frequency
Đọc kỹ đề bài để tìm ra yêu cầu
Đọc bảng tần số hai chiều và chọn ra dữ kiện cần thiết
Tính xác suất hay tần số tương đối
Kiểm tra lại kết quả
Cách thức đọc hiểu bảng tần số hai chiều
Để có thể làm được dạng bài tập này, người học cần hiểu rõ và khai thác tốt các dữ liệu từ bảng tần số hai chiều. Trước hết, two-way frequency table là bảng thể hiện số liệu thu thập được từ nhiều nguồn thuộc 2 categories (hạng mục) khác nhau. Một hạng mục sẽ được biểu thị bằng cột, và hạng mục còn lại được biểu thị bằng hàng. Các hạng mục này còn được gọi là qualitative variables (biến định tính).
Ví dụ như trong bảng thống kê số học sinh tham gia đội tuyển Toán, Anh và Văn dưới đây, ta có thể thấy hai hạng mục chính là giới tính và môn học:
Gender | Subject | Total | ||
Maths | English | Literature | ||
Male | 13 | 10 | 2 | 25 |
Female | 4 | 12 | 9 | 25 |
Total | 17 | 22 | 11 | 50 |
Từ bảng trên, ta có thể rút ra một số thông tin cơ bản như sau:
Số học sinh nam, nữ tham gia đội tuyển toán lần lượt là 13 và 4.
Số học sinh nam, nữ tham gia đội tuyển anh lần lượt là 10 và 12.
Số học sinh nam, nữ tham gia đội tuyển văn lần lượt là 2 và 9.
Tổng số học sinh nam tham gia đội tuyển là 25.
Tổng số học sinh nữ tham gia đội tuyển là 25.
Tổng số học sinh tham gia đội tuyển là 50.
Phương pháp tính xác suất và tần số tương đối từ bảng tần số hai chiều
Sau khi xác định được chính xác những dữ kiện cần tìm, phần còn lại của bài tập chỉ còn chia các giá trị và đi tìm phân số, phần trăm, hay xác suất.
Xác suất (Probability)
Xác suất là một con số miêu tả khả năng một sự kiện có thể diễn ra. Tất cả các xác suất đều được tính và thể hiện dưới dạng phân số, cũng như số thập phân hoặc phần trăm. Dưới đây là công thức tính xác suất người học cần nắm vững:
P(event)=number of favourable outcomestotal number of outcomesTrong công thức này:
Number of favourable outcomes = số kết quả thuận lợi cho một biến cố.
Total number of outcomes = số phần tử trong không gian mẫu.
Tần số tương đối (Relative frequency)
Tần số tương đối thường được viết dưới dạng số thập phân và được tính bằng công thức sau:
Relative frequency=number of times an event has occurrednumber of trialsTrong công thức này, trials là số lần thử quan sát được.
Chú ý: Công thức tính xác suất và tần số tương đối trông có vẻ giống nhau. Trong toán tiếng Anh, hai khái niệm này được sử dụng thay phiên, bởi chúng tuy khác nhau nhưng về cơ bản đều có chung một ý tưởng.

Những điều cần lưu ý khi giải bài toán Probability và Relative Frequency
Bài tập tìm kiếm dữ liệu thiếu sót
Các câu hỏi liên quan đến đi tìm giá trị chưa có rất ít khi xuất hiện trong bài thi SAT. Người học có thể tính được các giá trị còn thiếu trong bảng tần số hai chiều dựa vào các xác suất hoặc tần số tương đối đã có. Một số bài tập sẽ không cung cấp các totals ngay từ đầu, trong trường hợp như vậy, người học cần phải tự kẻ thêm hàng và cột để tính toán.
Ví dụ bài tập minh họa
Human blood can be classified into four common blood types: A, B, AB, and O. It is also characterized by the presence (+) or absence (-) of the rhesus factor. The table below shows the distribution of blood type and rhesus factor for a group of people. If one of those people who is rhesus negative (-), the probability that the person has blood type AB is 1/3.
What is the value of x?
Blood type | ||||
Rhesus factor | A | B | AB | O |
+ | 41 | 39 | 20 | 74 |
- | x | 6 | 10 | 9 |
Giải đáp và phân tích chi tiết
Trước hết, người học cần đi tìm các số tổng còn thiếu trong bảng dữ liệu trên. Vì đề bài yêu cầu chọn một người bất kỳ có rhesus âm, nên ta sẽ tính tổng nhóm người này trước:
x+6+10+9=x+25Vì xác suất một người có rhesus âm thuộc nhóm máu AB là 1/3 theo đề bài, người học có thể suy ra được phương trình sau:
13=10x+25=> x+25=30
=> x = 5
Vậy giá trị của x cần tìm là x=5.
Những sai lầm thường gặp khi làm bài tập
Dưới đây là một số lỗi sai người học thường hay mắc phải khi xử lý dạng bài tập này:
Tính sai không gian mẫu: Đây là một lỗi sai hay gặp ở bài toán xác suất. Khi gặp một số câu hỏi trông có vẻ đơn giản và quen thuộc, người học nếu không cẩn thận sẽ dễ bỏ qua chi tiết trong đề bài, tự mặc định sample size và từ đó tính sai đáp án.
Không luyện tập các dạng bài thực tế: Những câu hỏi liên quan đến dice (xúc xắc) hay cards (thẻ bài) cũng có thể xuất hiện trong SAT Math. Người học nên luyện tập trước để hiểu các tính chất và mẹo làm bài với những câu hỏi này.
Không kiểm tra lại đáp án: Sau khi tính ra kết quả, người học có thể kiểm tra thử với những dữ kiện đã có trong đề để chắc chắn đáp án của mình là chính xác. Ngoài ra, đừng quên rằng xác suất luôn nằm trong khoảng từ 0 đến 1.
Không học thuộc công thức: Với dạng two-way frequency tables, rất ít bài toán yêu cầu vận dụng quy tắc xác suất như Independent Rules (biến cố độc lập),… Tuy nhiên, việc nắm vững lý thuyết sẽ giúp người học có nền tảng vững chắc cũng như tăng sự tự tin trước những câu hỏi nâng cao.

Bài tập ứng dụng thực tế
Bài 1
A survey asked high school juniors and seniors if they could study abroad, would they choose Germany, France or Spain. The results appear below.
Class | Country | Total | ||
Germany | France | Spain | ||
Junior | 25 | 19 | 7 | 51 |
Senior | 32 | 26 | 19 | 77 |
Total | 57 | 45 | 27 | 128 |
What is the probability that a student chosen at random is a junior and did not select France?
Bài 2
Tourists to Japan in 2010 (in thousands) | |||
Country of Origin | Stayed up to 2 weeks | Stayed over 2 weeks | Total |
China | 562 | 215 | 777 |
South Korea | 435 | 198 | 633 |
Taiwan | 315 | 160 | 475 |
Hong Kong | 194 | 100 | 294 |
United States | 112 | 79 | 189 |
Total | 1618 | 752 | 2370 |
Verify the probabilities for each statement:
I: Check if the probability for South Korean tourists staying up to 2 weeks is 69%
II: Check if the probability for tourists from China staying >2 weeks is 14%
III: Check if the probability for US tourists staying >2 weeks is 59%
Based on the verification, determine which statements are true.
Bài 3
Use the information in the table to answer the following questions. State the probabilities as fractions and round to the nearest hundredth.
Voted | Did not vote | Total | |
Republican | 78 | 25 | 103 |
Democrat | 63 | 14 | 77 |
Total | 141 | 39 | 180 |
a) What is the probability someone chosen at random is a Republican or is a Democrat?
b) Given that someone is a Democrat, what is the probability they did not vote?
Giải thích và đáp án chi tiết
Bài 1
Trước hết, người học cần tìm sample size. Vì đề bài yêu cầu chọn một học sinh bất kỳ, nên số phần tử của không gian mẫu ở đây là 128 - tổng số học sinh làm khảo sát.
Tiếp theo, người học cần tìm số kết quả thuận lợi cho biến cố “a junior and did not select France”. Dựa vào bảng dữ liệu, ta dễ dàng tính được con số này là:
51−19=32Cuối cùng, người học thực hiện tính xác suất dựa vào công thức đã học. Ta lấy số kết quả thuận lợi cho biến cố chia cho số phần tử của không gian mẫu:
P=32128=0.25=25%
Câu hỏi 2
I: Check if the probability for South Korean tourists staying up to 2 weeks is 69%
Không gian mẫu = 633 nghìn người (tổng số khách du lịch Hàn Quốc).
Số khách du lịch Hàn Quốc ở lại lên đến 2 tuần là 435 nghìn người.
P=435633=69%=> Ý 1 là True.
II: Check if the probability for tourists from China staying >2 weeks is 14%
Không gian mẫu = 777 nghìn người (tổng số khách du lịch Trung Quốc).
Số khách du lịch Trung Quốc ở lại lên đến 2 tuần là 215 nghìn người.
P=215777=28%=> Ý 2 là False.
III: Check if the probability for US tourists staying >2 weeks is 59%
Không gian mẫu = 189 nghìn người (tổng số khách du lịch Mỹ).
Số khách du lịch Mỹ ở lại lên đến 2 tuần là 79 nghìn người.
P=79189=42%=> Ý 3 là False.
Câu hỏi 3
a) What is the probability someone chosen at random is a Republican?
Sample size = tổng số người được khảo sát = 180.
Số kết quả thuận lợi cho biến cố = tổng số Republican = 103.
Người học lấy số kết quả thuận lợi cho biến cố chia cho số phần tử của không gian mẫu:
P=103180=57%b) Given that someone is a Democrat, what is the probability they did not vote?
Số mẫu = tổng số người là đảng viên Dân chủ = 77.
Số kết quả thuận lợi cho sự kiện = tổng số đảng viên Dân chủ không tham gia bỏ phiếu = 14.
Người học chia số kết quả thuận lợi cho sự kiện với tổng số phần tử trong không gian mẫu:
