Làm thế nào những sai lầm của điều tra dân số thế kỷ 19 đã kích thích ngành công nghiệp máy tính của Hoa Kỳ
Hiến pháp Hoa Kỳ yêu cầu tiến hành điều tra dân số vào đầu mỗi thập kỷ.
Điều tra này luôn mang đầy ý nghĩa chính trị, và vẫn còn. Điều đó rõ ràng từ các tranh cãi trước điều tra dân số năm 2020.
Tuy nhiên, ít người biết được tầm quan trọng của điều tra dân số trong việc phát triển ngành công nghiệp máy tính của Hoa Kỳ, một câu chuyện mà tôi kể trong sách của mình, Republic of Numbers: Unexpected Stories of Mathematical Americans through History. Lịch sử này bao gồm sự thành lập của công ty xử lý dữ liệu tự động đầu tiên, Tabulating Machine Company, cách đây 125 năm vào ngày 3 tháng 12 năm 1896.
Tăng trưởng dân số
Việc duy nhất mà Hiến pháp quy định rõ ràng về việc sử dụng điều tra dân số là để phân chia ghế trong Hạ viện. Các bang có dân số đông hơn sẽ có nhiều ghế hơn.
Một diễn giải tối giản về nhiệm vụ của điều tra dân số chỉ đòi hỏi báo cáo tổng dân số của mỗi bang. Nhưng điều tra dân số chưa bao giờ tự giới hạn bản thân mình chỉ vào điều này.
Một yếu tố phức tạp nảy sinh ngay từ đầu, với sự phân biệt trong Hiến pháp giữa "người tự do" và "ba phần tư của tất cả những người khác." Đây là sự thoả hiệp nồng nàn và nổi tiếng của cha đẻ quốc gia giữa các bang có nhiều người bị nô lệ và các bang ít người sống.
Cuộc điều tra dân số đầu tiên, năm 1790, cũng tạo ra sự phân biệt không được yêu cầu bởi Hiến pháp về độ tuổi và giới tính. Trong các thập kỷ sau đó, nhiều đặc điểm cá nhân khác cũng được thăm dò: tình trạng nghề nghiệp, tình trạng hôn nhân, tình trạng học vấn, nơi sinh sống và nhiều hơn nữa.
Khi đất nước phát triển, mỗi cuộc điều tra yêu cầu sự cố gắng lớn hơn so với lần trước, không chỉ để thu thập dữ liệu mà còn để biên soạn nó thành dạng có thể sử dụng. Xử lý điều tra dân số năm 1880 không hoàn thành cho đến năm 1888.
Đó đã trở thành một bài tập chán ngắt, dễ mắc lỗi, và công việc văn phòng có quy mô hiếm khi thấy.
Vì dân số rõ ràng đang tiếp tục tăng nhanh chóng, những người có trí tưởng tượng đủ có thể dự đoán rằng việc xử lý điều tra dân số năm 1890 sẽ là một công việc kinh hoàng nếu không có sự thay đổi trong quy trình.
Một phát minh mới
John Shaw Billings, một bác sĩ được giao trợ giúp Văn phòng điều tra dân số với việc biên soạn số liệu sức khỏe, đã chặt chẽ quan sát những nỗ lực lớn để tổng hợp dữ liệu thô của năm 1880. Anh ta bày tỏ lo ngại của mình với một kỹ sư cơ khí trẻ đang giúp đỡ trong điều tra dân số, Herman Hollerith, một cựu sinh viên mới tốt nghiệp trường Columbia School of Mines.
Vào ngày 23 tháng 9 năm 1884, Văn phòng Sở hữu Trí tuệ Hoa Kỳ ghi lại một bản đệ trình từ Herman Hollerith, 24 tuổi, có tiêu đề "Nghệ thuật Biên soạn Thống kê".
The Hollerith electric tabulating machine in use in 1902. Image via US Census BureauBằng cách cải tiến dần dần ý tưởng từ bản đệ trình ban đầu này, Hollerith đã thắng một cuộc thi năm 1889 để cải thiện việc xử lý điều tra dân số năm 1890.
Các giải pháp công nghệ được Hollerith nghĩ ra bao gồm một bộ các thiết bị cơ khí và điện. Đổi mới quan trọng đầu tiên là chuyển đổi dữ liệu từ tờ điểm dân số viết tay thành các lỗ đục trên thẻ. Như Hollerith diễn đạt, trong bản đệ trình sửa đổi năm 1889 của mình,
"Một lỗ được đục tương ứng với mỗi người, sau đó một lỗ tùy thuộc vào việc người đó là nam hay nữ, một lỗ ghi lại liệu người đó có phải là người bản xứ hay người nước ngoài, một lỗ khác ghi lại liệu người đó có phải là người da trắng hay người da màu, và còn nhiều hơn nữa."
Quá trình này đòi hỏi phải phát triển máy móc đặc biệt để đảm bảo lỗ có thể được đục chính xác và hiệu quả.
Sau đó, Hollerith nghĩ ra một máy để "đọc" thẻ, bằng cách sử dụng đinh để kiểm tra thẻ, để chỉ khi có lỗ, đinh mới đi qua thẻ để tạo ra một kết nối điện, dẫn đến việc tăng số liệu trên bộ đếm tương ứng.
Ví dụ, nếu một thẻ cho một nông dân nam da trắng đi qua máy, một bộ đếm cho mỗi hạng mục này sẽ được tăng lên một. Thẻ được làm chắc chắn đủ để cho phép đi qua máy đọc thẻ nhiều lần, để đếm các hạng mục khác nhau hoặc kiểm tra kết quả.
Số liệu tiếp tục rất nhanh chóng đến mức cần thiết cho phân chia quốc gia theo tiểu bang đã được chứng nhận trước cuối tháng 11 năm 1890.
This ‘mechanical punch card sorter’ was used for the 1950 census. Image via US Census BureauSự phát triển của thẻ đục lỗ
Sau thành công của điều tra dân số, Hollerith đã kinh doanh bán công nghệ này. Công ty mà ông sáng lập, Tabulating Machine Company, sau khi ông nghỉ hưu, trở thành International Business Machines – IBM. IBM dẫn đầu trong việc hoàn thiện công nghệ thẻ cho việc ghi và tổng hợp dữ liệu lớn cho nhiều mục đích khác nhau.
Đến những năm 1930, nhiều doanh nghiệp đã sử dụng thẻ để thực hiện các thủ tục ghi chú, như thanh toán lương và tồn kho. Một số nhà khoa học chuyên sâu về dữ liệu, đặc biệt là những nhà thiên văn học, cũng thấy thẻ tiện lợi. IBM đã chuẩn hóa thẻ 80 cột và phát triển máy đánh thẻ mà sau này không thay đổi nhiều trong thập kỷ.
Xử lý thẻ trở thành một chân của ngành công nghiệp máy tính mạnh mẽ mọc lên sau Chiến tranh thế giới thứ Hai, và IBM trong một thời gian ngắn trở thành tập đoàn thứ ba lớn nhất thế giới. Xử lý thẻ phục vụ như một cấu trúc hỗ trợ cho máy tính điện tử thuần túy nhanh chóng và hiệu quả về không gian, mà ngày nay đang chiếm ưu thế, với ít bằng chứng còn lại về chế độ cũ.
A blue IBM punch card. Image via Gwern/Wikimedia CommonsNhững người đã lớn lên biết về máy tính chỉ là thiết bị dễ dàng mang theo, có thể giao tiếp bằng cách chạm một ngón tay hoặc thậm chí bằng giọng nói, có thể không quen thuộc với máy tính phòng to của những năm 1950 và 60, nơi phương tiện chính để nạp dữ liệu và hướng dẫn là bằng cách tạo một bộ thẻ tại máy đánh thẻ, và sau đó đưa bộ đó vào máy đọc thẻ. Điều này tiếp tục làm thủ tục mặc định cho nhiều máy tính cho đến thập kỷ 1980.
Nhưng người tiên phong máy tính Grace Murray Hopper nhớ lại về sự nghiệp ban đầu của mình, "Ở những ngày đó, mọi người đều sử dụng thẻ đục, và họ nghĩ họ sẽ sử dụng thẻ đục mãi mãi."
Hopper đã là một thành viên quan trọng của nhóm tạo ra máy tính đa dụng có thể kinh doanh đầu tiên, Universal Automatic Computer, hoặc UNIVAC, một trong những con quái vật đọc thẻ. Phù hợp với đúng là, UNIVAC đầu tiên được giao, vào năm 1951, là cho Cơ quan điều tra dân số Hoa Kỳ, vẫn đang ham muốn cải thiện khả năng xử lý dữ liệu của mình.
Không, người dùng máy tính sẽ không sử dụng thẻ đục mãi mãi, nhưng họ đã sử dụng chúng qua chương trình đáp trăng Apollo và đỉnh điểm của Chiến tranh Lạnh. Hollerith có lẽ đã nhận ra những hậu duệ trực tiếp của máy đếm dân số của ông từ thập kỷ 1890 gần 100 năm sau đó.
Đây là phiên bản cập nhật của một bài viết ban đầu được xuất bản vào ngày 15 tháng 10 năm 2019.

Bài viết của David Lindsay Roberts, Giáo sư Thực hành Toán học, Trường Cao đẳng Cộng đồng Prince George, được tái xuất bản từ The Conversation theo giấy phép Creative Commons. Đọc bài viết gốc.
