
SAT Math kiểm tra tổng hợp kỹ năng toán học và phân tích dữ liệu, đặc biệt trong phần Problem Solving and Data Analysis (Giải quyết vấn đề và Phân tích dữ liệu) – một trong bốn chủ đề chính. Trong đó, dạng bài scatterplots (biểu đồ phân tán) thường xuất hiện nhằm đánh giá khả năng đọc hiểu, xác định xu hướng và phân tích mối quan hệ giữa các biến. Bài viết này sẽ hướng dẫn cách tiếp cận hiệu quả để giải quyết dạng bài này, giúp thí sinh nâng cao kỹ năng và cải thiện điểm số trong kỳ thi SAT Math.
Khái quát về dạng bài Scatter plots trong SAT Math
Trên thực tế, các dữ liệu trong đời thực thường không chính xác tuyệt đối và khi thiết lập các mô hình biểu diễn dữ liệu thì các các điểm biểu diễn sẽ phân tán, tạo thành một vùng chứ không nằm trên một đường xu hướng tuyến tính (linear).
Tuy nhiên trong SAT Math, các dữ liệu được lý tưởng hoá để xây dựng một phương trình (equation) và đồ thị đơn giản giúp việc tính toán thuận lợi và đơn giản hơn.
Ví dụ:

Biểu đồ phân tán ở trên cho thấy giá nhà ở tương đối và mật độ dân số của một số thành phố lớn của Hoa Kỳ trong năm 2005. Ở biểu đồ trên, trục y đại diện cho relative housing cost (giá nhà ở tương đối so với trung bình giá nhà ở trên cả nước), và trục x là population density (mật độ dân số). Biểu đồ này cho thấy:
Tại khu vực có giá nhà ở so với trung bình giá nhà ở trên cả nước là khoảng 50% (tức là giá nhà bằng 50% trung bình giá nhà ở trên cả nước) thì mật độ dân số là khoảng 4,000 người/ dặm vuông diện tích đất.
Tại khu vực có giá nhà ở so với trung bình giá nhà ở trên cả nước là khoảng 300% (tức là giá nhà gấp ba lần trung bình giá nhà ở trên cả nước) thì mật độ dân số là khoảng 25,000 người/ dặm vuông diện tích đất.
Phương trình của Line of best fit (Đường xu hướng): y=180x−252
Line of best fit (đường xu hướng) và Regression line (đường hồi quy) là gì?
Nhìn vào ví dụ bên trên, có thể thấy Line of best fit là đường (thường là đường thẳng) biểu diễn xu hướng của tập hợp các điểm dữ liệu (data points). Có thể nhận thấy là đường thẳng này không đi qua hết tất cả các điểm. Đối với những dạng bài tập tìm đường xu hướng, hãy chọn đường gần nhiều điểm nhất có thể. Ngoài ra, có một số lưu ý quan trọng:
Điểm thuộc đường xu hướng là những dự đoán chính xác nhất, và giá trị y của điểm đó gọi là giá trị dự đoán.
Điểm không thuộc đường xu hướng sẽ có giá trị y chênh lệch so với điểm tương ứng trên đường xu hướng, và khoảng chênh lệch đó chính là sự chênh lệch giữa giá trị thực và giá trị dự đoán.
Độ dốc của đường xu hướng (slope) biểu diễn xu hướng lên hoặc xuống của biến.
Đôi khi người học bắt gặp khái niệm về Regression line (đường hồi qui). Đây là hình dạng của đường đồ thị biểu diễn mối quan hệ giữa mỗi biến độc lập và biến phụ thuộc, được tính bằng công thức y = mx + b, trong đó:
m: slope (độ dốc) biểu thị mức độ thay đổi của y khi x thay đổi 1 đơn vị.
b: y-intercept (giao điểm với trục y) là giá trị của y khi x = 0.

Độ dốc (Slope) của đường thẳng
Slope (độ dốc) miêu tả độ nghiêng hoặc độ dốc của đường xu hướng. Nó biểu thị mức độ thay đổi của giá trị y khi giá trị x thay đổi 1 đơn vị.
Công thức tính slope: m=ΔyΔx=y2−y1x2−x1
Trong đó:
m là slope (độ dốc)
(x1, y1) và (x2, y2) là hai điểm bất kỳ trên đường thẳng
Δy là sự thay đổi của y
Δx là sự thay đổi của x
Ý nghĩa của slope:
Slope > 0: Đường thẳng đi lên từ trái qua phải, nghĩa là khi x tăng, y tăng
Slope < 0: Đường thẳng đi xuống từ trái qua phải, nghĩa là khi x tăng, y giảm.
Slope = 0: Đường nằm ngang, phương trình tuyến tính có dạng y = m (m là hằng số)
Slope không xác định: Đường thẳng đứng, phương trình tuyến tính có dạng x = n (n là hằng số)

5 loại bài tập Scatterplots phổ biến và phương pháp làm bài hiệu quả
1. Phân tích xu hướng dữ liệu (Trend Analysis)
Dạng bài này yêu cầu nhận biết xu hướng chung của dữ liệu: xu hướng tăng, giảm hoặc không có mối quan hệ rõ ràng. Câu hỏi phổ biến ở dạng này là “What trend does the data represent?”.
Chiến lược:
Quan sát các điểm dữ liệu trên biểu đồ.
Nếu các điểm tăng từ trái qua phải: xu hướng tăng (increasing trend).
Nếu các điểm giảm từ trái qua phải: xu hướng giảm (decreasing trend).
Nếu các điểm rải rác không có mẫu rõ ràng: không có xu hướng (no trend).
Example:
A scatter plot shows the number of study hours (x) and test scores (y). What trend does the data represent?
A. No trendB. Increasing trendC. Decreasing trendD. Unstable variation

Solution:
The data demonstrates an increasing trend, meaning that as the number of study hours increases, the test scores also tend to increase. Therefore, the correct answer would be B. Increasing trend.
2. Xác định phương trình đường hồi quy tuyến tính (Regression Line Equation)
Dạng bài này yêu cầu tìm phương trình đường thẳng y = mx + b đại diện cho xu hướng dữ liệu. Câu hỏi phổ biến của dạng này là “What is the equation of the regression line?”.
Chiến lược:
Phương trình hồi quy tuyến tính có dạng y = mx + b
Xác định m bằng công thức:
Xác định b bằng cách thay x = 0 vào phương trình hồi quy tuyến tính.
Example:
The data illustrates the relationship between the number of jogging hours per week (x) and the number of calories burned (y). The scatter plot shows a regression line with a slope of m = 50 and a y-intercept of b = 200. What is the equation of the regression line?
A. y = 50x + 200B. y = 200x + 50C. y = 50x − 200D. y = 200x − 50
Solution:
The slope (m) is 50. This means for every unit increase in x, y increases by 50 units.
The y-intercept (b) is 200. This means when x = 0, the value of y is 200.
Therefore, the correct regression line equation is: A. y = 50x + 200
3. Dự báo giá trị (Prediction Using the Regression Line)
Dạng bài này sử dụng phương trình đường hồi quy hoặc xu hướng biểu đồ để dự đoán giá trị y từ một giá trị x đã cho (hoặc ngược lại). Câu hỏi phổ biến của dạng này là “What is the predicted value of y if x = a?”.
Chiến lược: Thay giá trị x đã cho vào phương trình hồi quy tuyến tính để tính y, hoặc ngược lại.
Example:
The regression line y = 2x + 10 represents the relationship between the number of working hours (x) and weekly income (y). If a person works 5 hours, what is their predicted income?
A. 10B. 15C. 20D. 40
Solution:
Substitute x = 5 into the equation: y = 2 x 5 + 10 = 20. Therefore, the correct answer is C. 20
4. Phân tích mối tương quan (Correlation Strength and Direction)
Dạng bài yêu cầu xác định mức độ và hướng tương quan giữa hai biến. Câu hỏi phổ biến của dạng này là “What type of correlation is shown?”.
Chiến lược:
Tương quan dương (Positive Correlation): Cả x và y đều tăng.
Tương quan âm (Negative Correlation): Khi x tăng, y giảm.
Không tương quan (No Correlation): Các điểm rải rác không theo quy luật.
Xác định độ mạnh yếu:
Nếu các điểm gần đường hồi quy → tương quan mạnh.
Nếu các điểm xa đường hồi quy → tương quan yếu.
Example:
The scatter plot below shows the relationship between the number of hours students spend studying (x) and their exam scores (y). Based on the trend in the data, determine the correlation between the two variables. What type of correlation is shown in the data?
A. Positive correlationB. Negative correlationC. No correlation

Solution:
The scattered data points show some variability, but the line of best fit indicates a positive correlation, suggesting that as study hours increase, exam scores tend to improve. Therefore, the correct answer is A. Positive correlation
5. Phát hiện giá trị ngoại lai (Outliers)
Giá trị ngoại lai là những điểm nằm cách xa xu hướng chung của dữ liệu. Dạng bài này yêu cầu xác định hoặc phân tích ảnh hưởng của giá trị ngoại lai. Câu hỏi phổ biến của dạng này là “Which point is an outlier?”.
Ví dụ:

Biểu đồ phân tán trên hiển thị dữ liệu của các học sinh trong một chuyến đi leo núi (mỗi điểm đại diện cho một học sinh).
Tuy nhiên, có hai điểm không khớp với xu hướng chung. Hai điểm này đại diện cho hai học sinh Brad và Sharon.
Sharon có thể được coi là một outlier vì bạn ấy nặng khoảng 55kg nhưng mang một chiếc ba lô nặng hơn nhiều so với những người bạn cùng số cân nặng với bạn ấy làm.
Brad có thể được coi là một outlier vì bạn ấy nặng khoảng 70kg nhưng mang một chiếc ba lô nhẹ hơn nhiều so với những người bạn cùng số cân nặng với bạn ấy làm.
Chiến lược:
Tìm điểm nằm xa nhất so với xu hướng chung hoặc đường hồi quy.
Phân tích xem điểm ngoại lai ảnh hưởng như thế nào đến xu hướng.
Nếu bài yêu cầu xác định outlier, chỉ cần nêu giá trị x, y.
Example:
Michelle was researching different computers to buy for college. She looked up the prices and quality ratings for a sample of computers. Her data is shown in the scatter plot to the right, where each point is a computer.
Michele wants to buy a computer whose quality rating is far higher than the pattern would predict based on its price.
Which of the labeled points represents a computer that Michele wants to buy?
A. AB. BC. CD. D

Solution:
The computer described by point B costs about $600. Based on the pattern, its quality rating should be around 60 or 62, but its quality rating is about 82.
Its quality rating is far higher than the pattern predicts based on its price, so Michele should want to buy it. Therefore, the correct answer is B.
Những điều cần lưu ý khi làm bài với biểu đồ Scatter plots
Hiểu rõ trục tọa độ:
Trục x (trục ngang): Thường đại diện cho biến độc lập.
Trục y (trục dọc): Đại diện cho biến phụ thuộc.
Không nhầm lẫn dữ liệu và xu hướng:
Một số câu hỏi đánh lừa bằng cách đưa ra các điểm ngoại lai không thuộc xu hướng chính. Đừng để những điểm này làm sai lệch phân tích.
Thực hành thường xuyên:
Làm quen với các biểu đồ phức tạp và học cách đọc nhanh thông tin.
Sử dụng máy tính đồ thị:
Máy tính có thể hỗ trợ tính toán nhanh giá trị hồi quy hoặc kiểm tra mối quan hệ tuyến tính.
Bài tập thực hành

From 2014 to 2018, the number of students enrolled in the Sunrise school district generally ____________ (increased/ decreased/ stayed the same).
The school district saw the smallest change in the number of students enrolled between ____________ (2015 and 2016/ 2016 and 2017/ 2017 and 2018).
Bài 2: Chọn đáp án đúng
Liam wants to buy a new bicycle. He decides to save money gradually over several weeks until he reaches his target. Once he has enough money, Liam waits for a sale before making the purchase. Finally, he buys the bicycle during the sale event and uses all the money he saved.
Before Liam has enough money for the bicycle, as time elapses, the amount of money he saves ____________ (increases/ decreases/ remains constant).
After Liam saves enough money, but before he buys the bicycle, the amount of money he has ____________ (increases/ decreases/ remains constant).
When Liam spends the money on the bicycle, the amount of money he has ____________ (increases suddenly/ decreases suddenly/ remains constant).
Giải đáp
The graph trends upward from left to right, which means from 2014 to 2018, the number of students enrolled in the Sunrise school district generally increased.
The table below shows the enrollment by year as well as the change in enrollment from the previous year.
Year | Enrollment | Change from previous year |
|---|---|---|
2014 | 2,000 | n/a |
2015 | 2,400 | +400 |
2016 | 2,700 | +300 |
2017 | 2,900 | +200 |
2018 | 3,000 | +100 |
The school district saw the smallest change in the number of students enrolled between 2017 and 2018.
Bài 2:
Liam gradually saves money over the course of several weeks, so as time elapses, the amount of money he saves increases.
After Liam has enough money, he holds onto it while waiting for a sale. This means the amount of money he has saved neither increases nor decreases during this time period; it remains constant.
Cuối cùng, Liam tiêu hết số tiền vào chiếc xe đạp. Việc chi tiêu toàn bộ số tiền cùng lúc khiến số tiền anh đã tiết kiệm giảm đột ngột.
Biểu đồ dưới đây mô tả tình huống này.

Đọc tiếp: Cách giải bài tập dạng Linear and Exponential Growth trong SAT Math
