
Data (danh từ): thông tin số liệu
Khái niệm cơ bản
Trong toán học, “data” (dữ liệu) thường đề cập đến thông tin dạng số hoặc biểu đồ được dùng để phân tích, so sánh hoặc dự đoán. Dữ liệu có thể được trình bày dưới dạng bảng, đồ thị, biểu đồ tần suất, hoặc mô tả bằng lời.

Ví dụ: Một khảo sát được thực hiện trên 100 học sinh về số giờ họ học mỗi ngày. Dữ liệu thu được như sau:

Trung bình mỗi học sinh học bao nhiêu giờ mỗi ngày?
→ Đây là bài toán phân tích data – sử dụng bảng dữ liệu để tính toán trung bình (mean).
Minh họa thực tế
Data point (danh từ): một đơn vị dữ liệu
Là một giá trị đơn lẻ trong tập dữ liệu, thường biểu diễn một quan sát hoặc phép đo.Ví dụ: Trong bảng khảo sát thời gian học, “2 giờ – 30 học sinh” là một data point.
Outlier (danh từ): giá trị bất thường trong tập dữ liệu
Là một điểm dữ liệu khác biệt rõ rệt so với phần còn lại của tập dữ liệu.Ví dụ: Trong tập {10, 12, 11, 13, 55}, số 55 là một outlier.
Trend (danh từ): khuynh hướng biến đổi
Là mô hình thay đổi chung của dữ liệu theo thời gian hoặc điều kiện nào đó.Ví dụ: Biểu đồ doanh thu cho thấy xu hướng tăng đều qua các tháng.
Random (tính từ): không theo quy luật
Khái niệm cơ bản
Trong toán học, “random” (ngẫu nhiên) mô tả một lựa chọn hoặc kết quả xảy ra không theo quy luật nào và không thể dự đoán trước. Trong SAT Math, từ này thường dùng trong các bài toán xác suất, nơi mỗi kết quả có cơ hội xảy ra như nhau.
Ví dụ: Một chiếc hộp chứa 5 quả bóng được đánh số từ 1 đến 5. Một quả bóng được rút ngẫu nhiên từ hộp. Xác suất để rút được quả bóng số 3 là bao nhiêu?

→ Giải thích: Vì việc chọn bóng là random, nên mỗi quả có xác suất bằng nhau là 1/5.
Trường hợp minh họa
Random sample (danh từ): tập mẫu được chọn không theo quy tắc
Tập hợp được chọn từ tổng thể sao cho mỗi phần tử có cơ hội được chọn như nhau.
Ví dụ: Chọn ngẫu nhiên 50 học sinh từ toàn trường để làm khảo sát.
Random interval (danh từ): phạm vi xác định ngẫu nhiên
Khoảng giá trị được tạo ra ngẫu nhiên, dùng để mô tả phạm vi ước lượng trong thống kê.
Ví dụ: Khoảng ước lượng 90% cho điểm trung bình là từ 72 đến 78.
Random variable (danh từ): đại lượng có giá trị không xác định trước
Biến nhận giá trị số dựa trên kết quả của một phép thử ngẫu nhiên.
Ví dụ: Số lần xuất hiện mặt ngửa khi tung 3 đồng xu là một biến ngẫu nhiên.
Đánh giá kiến thức từ vựng
Bài kiểm tra thuật ngữ - data
Fill in the blank with one of these words: outlier, trend, data point
On a scatterplot, each dot represents a single ________________.
A point that lies far from the others and does not follow the general pattern is called an ________________.
When the values generally increase or decrease, we say there is a clear ________________.
Bài tập kiểm tra thuật ngữ - random
Exercise 1: Match each term with its suitable definition.
Term | Definition |
|---|---|
1. Random Interval | A. A value or outcome determined by chance that can vary in a probabilistic experiment. |
2. Random Variables | B. A subset chosen from a larger group, where each member has an equal chance of being selected. |
3. Random Sample | C. A range of values generated based on random selection, often used in simulations or probability. |
Exercise 2: Fill in the blank with one of these words: random interval, random variables, random sample
A ________________ is a subset of a population selected in a way that each member has an equal chance of being chosen.
The value of the ________________ depends on the outcome of a probability experiment.
The wait time for a bus arriving between 8:00 a.m. and 8:30 a.m. can be modeled by a ________________.
Vấn đề ứng dụng thực tiễn
Tình huống thực tế - data
Exercise 1: A report from a fitness tracker company shows that for every 5 minutes a person walks, they burn approximately 18 calories.
Based on this data, how many calories would a person burn in 20 minutes of walking?
If a person wants to burn at least 100 calories by walking, how many minutes should they walk, based on the data?
Exercise 2: A local health report provides data that recommends public staircases have a maximum step height of 7 inches for safety and accessibility.
If a staircase has a total rise of 35 inches, what is the minimum number of steps required to follow this guideline?
A staircase has 4 steps and a total rise of 30 inches. Based on the data, is this staircase within the recommended step height limit? Why?
Vấn đề thực hành - random
Exercise 1: A school wants to conduct a survey about students’ lunch habits. From a total of 1,200 students, the principal decides to take a random sample of 10% of the students to ensure fairness.
How many students should be included in the random sample?
One class of 60 students is chosen entirely for the survey. Based on the original method, is this selection representative of the whole school? Why or why not?
Exercise 2: A statistics teacher wants to choose a random sample of students from a group of 200 to test a new question format. She plans to select only 8% of the students for the trial.
How many students should be included in the random sample?
If she selects 20 students from the same class, is this selection method valid based on the plan? Why or why not?
Lời giải
Kết quả bài tập - data
Kiểm tra từ vựng
data point
outlier
trend
Bài toán thực tế
Exercise 1:
72 calories
28 minutes
Exercise 2:
5 steps
7.5 inches > 7 inches —> No
Đáp án vấn đề - random
Kiểm tra từ vựng
Exercise 1:
1 – C
2 – A
3 – B
Exercise 2:
random sample
random variables
random interval
Bài toán thực tế
Exercise 1:
120 học sinh
Không
Bài tập 2:
16 học sinh
Không. Việc chọn 20 học sinh từ một lớp không đại diện cho toàn bộ 200 học sinh - không mang tính ngẫu nhiên và dẫn đến sai lệch.
