
Tôi rất tiếc phải thông báo rằng đây lại là mùa bầu cử.
Nhưng những người nghiện tin tức này có thể tin tưởng vào những con số mà họ đang thấy không?
Có một khoảng thời gian khi dường như khoa học mới về dự báo bầu cử - tổng hợp tất cả các cuộc thăm dò, áp dụng các kỹ thuật thống kê và điều chỉnh với các loại dữ liệu kinh tế và lịch sử khác - có thể dự đoán chính xác những gì sẽ xảy ra mỗi bốn năm một lần. Nate Silver, người sáng lập FiveThirtyEight và cha đẻ của ngành học hiện đại này, nổi tiếng khi dự đoán chính xác cuộc bầu cử Tổng thống năm 2008 và 2012.

Sau năm 2016, khi các cuộc thăm dò không thể nắm bắt được sự ủng hộ cho Donald Trump từ phần đa người lao động. Sau thất bại đó, ngành thăm dò đã thề không để bị đánh lừa một lần nữa. Nhưng điều gì đã xảy ra vào năm 2020? Các cuộc thăm dò không thể nắm bắt được sự ủng hộ cho Donald Trump từ phần đa người lao động. Những gì đã được dự đoán là một chiến thắng thoải mái cho Joe Biden cuối cùng lại chỉ là sự chênh lệch nhỏ ở Hội đồng Cử tri, khi Biden chiến thắng với các biên độ rất hẹp ở các bang quyết định nơi mà các cuộc thăm dò đã phóng đại ưu thế của ông.
G. Elliott Morris là một nhà báo dữ liệu tại The Economist, nơi ông điều hành hoạt động dự báo bầu cử của tạp chí - một kỹ năng ông đã rèn luyện khi còn là sinh viên đại học. Mô hình của ông đã dự đoán Biden có 97% cơ hội chiến thắng vào năm 2020 và dự đoán rằng ông sẽ giành được 356 phiếu bầu cử. (Ông chỉ giành được 306.) Trong cuốn sách mới Strength In Numbers, Morris thừa nhận những thất bại của các cuộc thăm dò qua các năm nhưng lập luận rằng các cuộc thăm dò vẫn cần thiết cho dân chủ. Tuần này, ông đã nói chuyện với Mytour về những gì đã sai trong cuộc bầu cử trước đó, khó khăn khi dự đoán những gì sẽ sai trong lần tới, và tại sao câu trả lời cho các cuộc thăm dò tồi tệ là mọi người chỉ cần tin tưởng chúng ít hơn một chút.
Cuộc phỏng vấn này đã được rút gọn và chỉnh sửa nhẹ.
Mytour: Năm 2016, một cách nổi tiếng, các cuộc thăm dò khá là không chính xác. Năm 2020, chúng lại không chính xác một cách khá tương tự. Hiểu biết tốt nhất của chúng ta về điều gì đã sai?
G. Elliott Morris: Trong bất kỳ năm nào, nhà thăm dò đều đối mặt với một vấn đề căn bản: Những người họ nói chuyện có thể không đại diện cho toàn bộ dân số. Họ có thể nói chuyện với quá nhiều cử tri da trắng, quá nhiều cử tri không tốt nghiệp đại học, hoặc quá nhiều cử tri nghèo hoặc giàu.
Sau năm 2016, có vẻ như thống nhất là, “Oops, chúng ta không bao gồm đủ cử tri da trắng không tốt nghiệp đại học. Vì vậy nếu chúng ta sửa chữa điều đó, chúng ta sẽ tốt.” Đó là cốt truyện trước khi vào năm 2020, phải không?
Năm 2016, có mức độ phân chia cao hơn về giáo dục hơn bao giờ hết, với khoảng cách lớn hơn giữa cách mà những người không tốt nghiệp đại học và tốt nghiệp đại học bỏ phiếu. Một số nhà thăm dò biết cách tính đến điều đó - để đảm bảo rằng cuộc thăm dò của họ có tỷ lệ đúng của cử tri không tốt nghiệp đại học - nhưng không phải tất cả các nhà thăm dò đã làm điều đó. Và vì vậy, bạn đã có những sai số từ các cuộc thăm dò mẫu quá cao về mức độ học vấn. Và vì giáo dục đã trở thành yếu tố có liên quan đến sự lựa chọn bỏ phiếu, họ đã phóng đại sự ủng hộ từ Đảng Dân Chủ trong năm 2016.
Vào năm 2020, tôi nghĩ một cách đọc ngây thơ từ các cuộc thăm dò sẽ cho rằng, “Okay, nếu bạn điều chỉnh theo giáo dục, thì bạn sẽ ổn.” Đó là quan điểm của một số người. Nhưng chúng ta đã có một loại sai số mới trong năm 2020 được gọi là sai số không phản hồi, trong đó những người Cộng hòa có khả năng ủng hộ Donald Trump đặc biệt cũng là những người rất không có khả năng phản hồi vào các cuộc thăm dò. Vì vậy, ngay cả khi bạn có tỷ lệ đúng về các nhóm dân số, về giáo dục, bạn vẫn sẽ bỏ sót những người Cộng hòa này.
Nói cách khác, ngay cả khi bạn điều chỉnh cho cử tri không tốt nghiệp đại học, điều bạn không nhận ra là bạn không có một mẫu đại diện của họ.
Đúng. Một số nhà thăm dò vào năm 2020 thậm chí còn điều chỉnh để đảm bảo cuộc thăm dò của họ có mẫu đúng của những người ủng hộ Trump và Clinton năm 2016. Nhưng họ gặp phải vấn đề tương tự. Có thể là những người ủng hộ Trump năm 2016 mà phản hồi là những người ít có khả năng hỗ trợ Trump bây giờ, và điều đó làm cho cuộc thăm dò của bạn thiên vị hướng đến Đảng Dân Chủ.
Khi vào cuộc bầu cử giữa kỳ, khả năng chúng ta có kết quả chính xác hơn so với lần trước là bao nhiêu?
Bởi vì các cuộc thăm dò vào năm 2016, 2018 và 2020 đều thiên vị Đảng Dân Chủ, giả định là điều này sẽ xảy ra trong năm nay. Nhưng không có lý do tự nhiên nào cho việc mô hình không phản hồi sẽ giữ nguyên giữa hai cuộc bầu cử này. Có một lý thuyết rằng vì Donald Trump nói với người ủng hộ của ông rằng các cuộc thăm dò là tin giả hoặc điều gì đó tương tự, vì vậy họ ít có khả năng phản hồi vào các cuộc khảo sát trong những năm đó. Nhưng không có cách nào chắc chắn về lý do tại sao mô hình này xảy ra. Do đó, chúng ta không biết liệu điều này sẽ tiếp tục trong tương lai hay không.
Vì vậy, tôi không thể ngồi đây và nói với bạn rằng các cuộc thăm dò sẽ thiên vị đảng Cộng hòa trong năm nay. Dự đoán duy nhất thực sự tốt là chúng ta vẫn đang trong môi trường mà việc không phản hồi theo đảng chơi vai trò quan trọng trong việc một cuộc thăm dò hoặc một trung bình cuộc thăm dò sẽ chính xác như thế nào. Và vì vậy, chúng ta vẫn nên mong đợi khả năng cao hơn về việc lỡ đánh giá lớn hơn so với những gì chúng ta đã mong đợi trở lại khi tỷ lệ phản hồi thăm dò cao hơn, và bạn phải làm ít công việc hơn với mẫu của bạn để làm cho nó đại diện.
Vậy nên, chúng ta chỉ nên dự kiến khả năng cao hơn về việc lỡ đánh giá hệ thống, và công chúng cũng như truyền thông nên thiết lập kỳ vọng phù hợp.
Đúng vậy. Trong cuốn sách của tôi, tôi lập luận rằng báo chí và công chúng nên có kỳ vọng thấp hơn đối với các cuộc thăm dò so với những gì họ đã có trong năm 2016 hoặc 2020. Kỳ vọng rằng trung bình các cuộc thăm dò sẽ cung cấp một dự đoán không thiên vị về cuộc bầu cử, hoặc có lỗi tối đa là 3 hoặc 4 phần trăm, là sai. Chúng ta được sắp xếp theo đảng, vượt xa so với những gì dân số của chúng ta cho biết về người bạn sẽ bỏ phiếu cho, điều chỉnh theo đảng hoặc thực hiện một điều chỉnh khác để đảm bảo bạn có một cuộc thăm dò chính trị đại diện hơn bao giờ hết - nhưng đó là một công việc rất khó khăn.
Bạn không thể chỉ nhìn vào đảng phái của người dân, vì có nhiều người là cử tri Cộng hòa, nhưng họ đăng ký là Độc lập hoặc họ không đăng ký với bất kỳ đảng nào, và cũng vậy đối với cử tri Dân Chủ.
Và bạn thậm chí không có đăng ký đảng ở mọi tiểu bang. Wisconsin, ví dụ, không có đăng ký đảng. Và ngay cả khi có, những người đăng ký là Cộng hòa không phải lúc nào cũng là cử tri Cộng hòa. Đó chỉ có thể là điều họ đăng ký ban đầu, nhưng bây giờ họ là Đảng Dân Chủ đáng tin cậy và chỉ đơn giản không cập nhật thông tin.
Làm thế nào chúng ta trong truyền thông đóng góp vào việc hiểu sai dữ liệu thăm dò?
Hãy nghĩ về một tưởng tượng. Có thể một tổ chức thăm dò phát hành hai cuộc thăm dò: một cách đây một tháng chỉ ra Đảng Dân Chủ dẫn trước năm, và một ngày hôm nay chỉ ra rằng họ chỉ dẫn trước hai. Sau đó một nhà phê bình chính trị báo cáo, “Có sự di chuyển ba phần trăm về phía Cộng hòa trong tháng qua.” Không đúng. Bất kỳ nhà thăm dò nào cũng sẽ nói với bạn, chúng ta thực sự không biết liệu điều đó là sự di chuyển thực sự vì nó nằm trong phạm vi lỗi. Nếu bạn phải viết bài này về cuộc đua ngựa, giải thích rằng bạn thực sự không biết đang diễn ra điều gì.
Việc báo cáo về các cuộc thăm dò và dự báo thực sự có thể ảnh hưởng đến kết quả bầu cử. Có một lập luận mạnh rằng thông báo của James Comey ngay trước cuộc bầu cử năm 2016, rằng FBI đang mở lại điều tra email của Hillary Clinton, đã đủ để làm thay đổi kết quả cuộc bầu cử trong tuần cuối. Sau này, Comey nói rằng ông đã chắc chắn Hillary sẽ thắng, và vì vậy ông không nghĩ hành động của mình sẽ làm thay đổi kết quả. Nói chung hơn, có lẽ nếu cử tri Dân Chủ không tự tin như họ đã, một số người không bận tâm đến việc bỏ phiếu có thể đã bỏ phiếu. Trách nhiệm của các nhà thăm dò và nhà dự báo là gì, khi trong việc dự đoán kết quả, bạn thực sự có thể ảnh hưởng đến kết quả?
Có một nghiên cứu đáng chú ý về tác động của xác suất dự đoán bầu cử đối với tỉ lệ cử tri tham gia bầu cử. Đó là một thử nghiệm trong đó người ta được thông báo về xác suất của ứng cử viên họ sẽ chiến thắng, sau đó có cơ hội quyên góp tiền cho ứng cử viên đó. Các nhà nghiên cứu kết luận rằng càng cao xác suất chiến thắng, càng ít người được động viên để tiêu tiền. Kết quả cho thấy nếu mọi người đọc dự đoán bầu cử nói rằng Hillary Clinton có 99% thay vì, hãy nói, 70%, thì tỷ lệ cử tri tham gia sẽ giảm đi khoảng hai phần trăm. Đó không phải là điều không đáng kể. Đó là một vài triệu người. Điều đó chắc chắn đủ để thay đổi kết quả bầu cử. Nhưng đó vẫn chỉ là một nghiên cứu. Chúng ta không biết liệu điều đó đúng cho hành vi bầu cử thực tế hay không. Và thậm chí ước lượng đó cũng đi kèm với một phạm vi lỗi.
Ngoài ra, chúng ta biết rằng trong chiến dịch, hành vi ứng cử viên phổ biến nhất là khẳng định rằng bạn đang chiến thắng ngay cả khi bạn đang thua. Điều đó gợi ra ít nhất là một niềm tin dân gian rằng người ta sẽ có khả năng bỏ phiếu cho bạn nếu họ tin rằng bạn là người chiến thắng, điều này có phần trái ngược với những gì tôi vừa đề xuất.
Đúng vậy. Tôi nghĩ có xu hướng giữa những người chỉ trích các dự đoán bầu cử là nó thay đổi kết quả, rằng nó nguy hiểm. Tôi không thuyết phục về điều đó. Tôi nghĩ điều đó có thể, vì vậy tôi nghĩ nó đáng được nghiên cứu hơn. Và tôi đã làm việc với những người đang thực hiện nghiên cứu này. Tôi không muốn ngăn chặn nó. Nhưng tôi cũng nghĩ một số người chỉ trích quá quyết đoán về những tác động này.
Điều quan trọng khác tôi muốn nói là, nếu lời trích dẫn của Comey đúng, thì thực sự ông cần phải lắng nghe các dự đoán bầu cử tốt hơn, chỉ ra con số thực tế là khoảng 70%. Vì vậy đây trở thành một lý lẽ để có thêm các dự đoán.
À, dự báo “tốt” là gì? Nếu chúng ta quay lại năm 2016, như bạn nói, dự báo của Nate Silver cho biết Trump có 30 phần trăm cơ hội để chiến thắng. Các mô hình khác ước tính khả năng chiến thắng của Trump khoảng 1 phần trăm hoặc tỷ lệ đơn số thấp. Cảm giác là, vì Trump thắng, vì vậy Nate Silver “đúng”. Nhưng tất nhiên, chúng ta không thể nói thế. Nếu bạn nói rằng một sự kiện có 1 trên 100 cơ hội xảy ra, và nó xảy ra, điều đó có thể có nghĩa là bạn đánh giá thấp nó, hoặc có thể chỉ là sự kiện có cơ hội 1 trên 100 đã xảy ra.
Đây là vấn đề khi xác định xem mô hình dự đoán bầu cử đã được điều chỉnh đúng cho sự kiện thế giới thực hay không. Quay lại năm 1940, chúng ta chỉ có 20 cuộc bầu cử tổng thống trong mẫu mẫu của chúng ta. Vì vậy không có cơ sở thống kê thực sự cho một xác suất chính xác ở đây. 97 so với 96 - với kích thước mẫu thử nghiệm hạn chế của chúng ta, rất khó để biết liệu những điều này có được hiệu chỉnh đúng đến 1 phần trăm hay không. Toàn bộ bài toán này không chắc chắn như truyền thông, tôi nghĩ, khiến người tiêu dùng tin vào các cuộc thăm dò và dự báo.
Trong sách của bạn, bạn nói về người thăm dò ý dự bầu cử của Franklin Roosevelt, người đã là một thiên tài sớm của việc thăm dò ý dự—nhưng sau này, sự nghiệp của ông cũng đi vào vết xe đổ, phải không?
Người này, Emil Hurja, là người thăm dò ý dự và dự báo bầu cử xuất sắc của Franklin Roosevelt. Ông đã tạo ra kiểu tổng hợp đầu tiên của các cuộc thăm dò, cuộc thăm dò theo dõi đầu tiên. Một nhân vật thú vị trong câu chuyện về việc thăm dò ý dự. Ông rất chính xác ở đầu tiên. Năm 1932, ông dự đoán rằng Franklin Roosevelt sẽ thắng với 7,5 triệu phiếu bầu, ngay cả khi người khác dự đoán rằng Roosevelt sẽ thua. Ông thắng với 7,1 triệu phiếu. Vì vậy Hurja được hiệu chỉnh tốt hơn so với các nhà thăm dò ý dự khác vào thời điểm đó. Nhưng sau đó ông thất bại vào năm 1940, và sau đó ông chỉ chính xác như một nhà thăm dò ý dự trung bình.
Trong đầu tư, khó để vượt qua thị trường trong một khoảng thời gian dài. Tương tự, với việc thăm dò ý kiến, bạn phải liên tục suy nghĩ lại phương pháp và giả định của mình. Ngay cả khi ở giai đoạn đầu, Emil Hurja được gọi là “Phù thủy của Washington” và “Người nhìn thấy tương lai ở Crystal Falls, Michigan,” nhưng thành tích của ông suy giảm theo thời gian. Hoặc có lẽ ông chỉ may mắn ở giai đoạn đầu. Sau sự việc, khó để biết liệu ông thực sự là một nhà dự đoán thiên tài.
Tôi đề cập đến điều này vì—tôi không cố ý làm bạn hoảng sợ, nhưng có thể lỗi lớn nhất của bạn sẽ xảy ra ở đâu đó trong tương lai, vẫn chưa đến.
Đó là bài học ở đây. Điều tôi muốn mọi người suy nghĩ đến là, chỉ vì các cuộc thăm dò ý kiến đã thiên vị theo một hướng trong vài cuộc bầu cử gần đây không có nghĩa là chúng sẽ thiên vị theo cùng cách và cùng lý do trong cuộc bầu cử tiếp theo. Điều thông minh nhất chúng ta có thể làm là đánh giá mọi cuộc thăm dò với cái nhìn về cách dữ liệu đó được tạo ra. Các câu hỏi này được sắp xếp đúng không? Cuộc thăm dò này có phản ánh người Mỹ qua các xu hướng dân số và chính trị của họ không? Địa điểm này có uy tín không? Có điều gì đó đang diễn ra trong môi trường chính trị có thể khiến người Dân chủ hoặc Cộng hòa trả lời điện thoại hoặc tham gia khảo sát trực tuyến ở tỷ lệ cao hơn hoặc thấp hơn so với đảng khác không? Bạn phải suy nghĩ qua tất cả những kết quả có thể trước khi chấp nhận dữ liệu. Và vì vậy, đó là một lý do để xem xét các cuộc thăm dò ý kiến với sự không chắc chắn hơn so với cách chúng ta đã xử lý chúng trong quá khứ. Tôi nghĩ rằng đó là một kết luận khá rõ ràng từ vài cuộc bầu cử gần đây. Nhưng quan trọng hơn, đó là cách chính xác mà các nhà thăm dò ý kiến đến với ước tính của họ. Cuối cùng, đó không phải là sự thật tuyệt đối về ý kiến cộng đồng. Và đó là cách tôi muốn mọi người suy nghĩ về vấn đề này.
