Một Cơ Sở Dữ Liệu về Virus Động Vật Có Thể Giúp Dự Đoán Đại Dịch Tiếp Theo?

Năm 2016, Michael Letko chuyển từ Thành phố New York đến Hamilton, Montana—một thị trấn có 4,800 dân cư nằm giữa Blodgett Canyon và đường cao tốc 93 ở đầu phía nam của Thung Lũng Bitterroot.
Trong những ngày đầu tiên của tiểu bang, một căn bệnh lạ, chết người nảy sinh từ những khu rừng thông đen này, đánh gục những người định cư bằng một vết đen và sự nhiễm trùng dữ dội. Cuối cùng, các nhà khoa học đặt tên cho nó là sốt đ spotted Rocky Mountain, và họ đặt tên cho cơ sở nghiên cứu họ xây dựng để nghiên cứu vi khuẩn gây sốt (và những con ve chuyển nó) là Phòng thí nghiệm Rocky Mountain. Năm 1937, phòng thí nghiệm trở thành một phần của Viện Y tế Quốc gia, phát triển thành một nhà máy vaccine quốc gia khi Mỹ tham gia Chiến tranh thế giới thứ hai. Đây là nơi, vào năm 2008, NIH mở phòng thí nghiệm sinh học cấp độ 4 đầu tiên của mình—cấp độ cao nhất cho các cơ sở giữ chất sinh học. Ngày nay, hơn 400 nhà khoa học như Letko làm việc bên trong khuôn viên mái đỏ, tiến hành nghiên cứu về một số tác nhân gây bệnh nguy hiểm nhất được biết đến của con người.
Letko đến phòng thí nghiệm của chuyên gia vi khuẩn Vincent Munster, hăng hái để nghiên cứu về một số vi khuẩn này. Munster nghiên cứu về sinh thái virus—cách chúng sống trong các loài chủ khác nhau và đôi khi nhảy qua giữa các loài. Ông thường gửi những người nghiên cứu thực tập đến những địa điểm như Cộng hòa Dân chủ Congo, Trinidad và Tobago, và Jordan để thu thập mẫu máu hoặc que thăm phân từ dơi và lạc đà, mà đội của ông sau đó nghiên cứu tại các cơ sở nghiên cứu có độ an toàn tối đa của phòng thí nghiệm. Dơi là đối tượng đặc biệt quan trọng vì chúng đã tiến hóa khả năng độc đáo để sống chung với virus, bao gồm cả những loại có khả năng chuyển giao cho con người. SARS, MERS, virus Marburg, Nipah, và có lẽ cả Ebola đều bắt đầu từ dơi.
Letko không phải là một nhà khoa học kiểu đó. Anh đã dành nhiều năm nghiên cứu một loại protein do HIV sản xuất và mô hình hóa cấu trúc phân tử của nó để hiểu cách nó đóng cửa phản ứng miễn dịch của chủ nhân. Anh đã trở nên xuất sắc trong việc tìm hiểu hình dạng của các protein virus và cách những kẽ hở và khe phân tử đó cung cấp quyền truy cập vào tế bào hoặc chống lại các tấn công. Nhưng cho đến năm 2017, khi anh gặp một sinh viên Bỉ đang thăm phòng thí nghiệm của Munster, anh mới có ý tưởng về việc làm gì với tài năng này.
Sinh viên Bỉ đã dành toàn bộ thời gian của mình trong chương trình tiến sĩ để khám phá virus, xây dựng chuỗi gen từ mẫu dơi giống như những mẫu mà đội của Munster mang về từ ngoại ô. Nhiều gen mà anh ta đã tổng hợp đến từ coronavirus, một trong những gia đình phổ biến nhất trong vương quốc virus. Sau đợt bùng phát SARS năm 2003, các nhà khoa học nhận ra rằng có lẽ họ nên chú ý nhiều hơn đến chúng, vì khả năng nhảy qua giữa các loài. Sự cần thiết mới này—kết hợp với sự xuất hiện của các công nghệ chuỗi gen mới được kích thích bởi Dự án Gen Học Nhân loại—đã mở đầu cho một cuộc sống mới trong khám phá virus. Trong thập kỷ và một nửa tiếp theo, các nhà khoa học đã khám phá ra một kho dữ liệu lớn về coronavirus lưu hành trong các quần thể động vật hoang dã trên toàn thế giới.
Tìm kiếm “coronavirus” trên GenBank, một kho lưu trữ công cộng cho các chuỗi gen, và hôm nay bạn sẽ tìm thấy hơn 35,000 chuỗi. Coronavirus của lạc đà. Coronavirus của nhím. Coronavirus của cá voi Beluga. Và, tất nhiên, rất nhiều coronavirus của dơi.
Nhưng rất ít người đã thực hiện công việc thí nghiệm thực tế—tìm hiểu cách những coronavirus này hoạt động, cách chúng xâm nhập vào cơ thể của chủ nhân, và khả năng chúng có thể chuyển sang con người là bao nhiêu. “Tôi nhận ra có rất nhiều dữ liệu và chúng ta hiểu rất ít về tất cả,” Letko nói.
Anh ta đặc biệt ám ảnh bởi một coronavirus có tên HKU4-CoV. Một chuỗi của protein gai của nó được xuất bản vào tháng 2 năm 2007 bởi một nhóm nghiên cứu Trung Quốc đã phát hiện ra nó trong máu của những con dơi họ đã thu thập từ các hang động sâu trong tỉnh Quảng Đông. Đó là một trong hàng trăm chuỗi được xuất bản trong thời kỳ bùng nổ chuỗi gen mà không có sự ồn ào. Sau đó, năm 2012, MERS bùng phát tại Ả Rập Saudi. Khi các nhà khoa học xác định chuỗi gen của virus MERS mới, họ nhận ra rằng protein mà nó sử dụng để tấn công tế bào người gần như giống hệt như của HKU4-CoV. Khi các nhà nghiên cứu khác đang nghiên cứu về các họ hàng của virus MERS kiểm tra virus dơi, họ nhận ra rằng nó cũng có khả năng xâm nhập vào tế bào người thông qua cùng một receptor. Nhưng vào thời điểm đó, không ai đã tạo liên kết giữa chuỗi protein của HKU4-CoV và khả năng lây nhiễm vào người. “Nếu dữ liệu đó đã sẵn có vào thời điểm bùng phát MERS, các nhà khoa học đã có một ưu thế trong việc tìm ra cách nó lây truyền và những loại thuốc nào có thể hoạt động chống lại nó,” Letko nói.
Letko muốn làm cho loại dữ liệu đó trở nên có sẵn. Vì vậy, anh quyết định xây dựng một nền tảng có thể thử nghiệm thực nghiệm bộ gen coronavirus của thế giới, để xem loại nào có khả năng cao nhất để xâm nhập vào tế bào người.
Tại bất kỳ thời điểm nào, có hàng chục nghìn coronavirus duy nhất đang được vận chuyển bởi động vật. Nhưng chỉ có một số ít đã bao giờ chuyển sang người. Nếu bạn có thể hiểu được điều làm cho những virus đó khác biệt, Letko giả thuyết, bạn có thể tạo ra một hệ thống dự đoán để dự báo những loại virus nào có tiềm năng xuất hiện trong các dân số người. “Nếu bạn muốn tìm hiểu xem đại dịch tiếp theo sẽ bắt nguồn từ đâu,” anh nói, “coronavirus là nơi tốt để bắt đầu, vì chúng vượt qua rào cảm nhận loài, chúng có thể nhiễm trùng người, và chúng có ở mọi nơi.”
Vậy tại sao trước đây không ai thử nghiệm điều này? Một lý do là việc tách ra virus từ các mẫu ngoại ô là khó khăn. Tế bào trong nền văn hóa không giống như tế bào ở động vật hoang dã. Thường thì chúng không cung cấp cho virus được thu thập từ tự nhiên những gì chúng cần để phát triển, điều này có nghĩa là các nhà khoa học không thể giữ chúng sống đủ lâu để thực hiện thí nghiệm. Và việc đảo ngược kỹ thuật cả virus từ chuỗi gen của nó là đắt đỏ. Coronavirus có kích thước gen lớn nhất trong số tất cả các virus RNA. Việc tạo ra chỉ một cái có thể tốn khoảng $15,000.
Coronavirus có tên là vì sự xuất hiện của các protein gai trên bề mặt chúng, khi phóng to, trông giống như một vương miện. Những protein gai đó là những gì virus sử dụng để vào tế bào chủ, nơi nó có thể nhân đôi và lây nhiễm. Hầu hết các coronavirus có protein gai gần như giống nhau, trừ phần đỉnh của cái được gọi là “miền kết nối với receptor,” hoặc RBD. Những sự khác biệt tinh tế trong hình dạng của phần này của protein gai quyết định loại tế bào mà virus có thể nhiễm trùng. Vì vậy, đó là phần mà Letko đã chú ý.
Suốt cả năm 2018, anh đã làm việc để xây dựng một hệ thống các hạt virus tổng hợp được kỹ thuật để biểu diễn một phiên bản chung của protein gai coronavirus mà anh có thể thay đổi RBD như Lego. Những hạt tổng hợp này trông giống như virus. Và chúng có thể vào tế bào giống như virus. Nhưng chúng thiếu các phần chính mà chúng cần để nhân đôi. Thay vào đó, khi chúng vào một tế bào, chúng sẽ kích thích một phản ứng hóa học làm cho nó phát sáng màu vàng lục. Khi Letko thả những phần virus tổng hợp này vào tế bào nhím mà anh đã làm để biểu diễn các receptor người khác nhau, anh có thể dễ dàng kiểm tra xem chuỗi RBD nào có thể truy cập vào mỗi receptor: Anh có thể biết vì chúng sáng. Nó mất cả một năm để anh phát triển ý tưởng và chứng minh nó có thể hoạt động.
Tháng 1 năm 2019, anh bắt đầu đưa nó vào hành động. Bắt đầu với tất cả các chuỗi được xuất bản từ một nhánh con của cây phả hệ coronavirus được gọi là beta-coronaviruses, anh xác định các khu vực RBD của chúng và bắt đầu chia thành các nhóm con. Mặc dù chúng có gen duy nhất so với nhau, nhiều trong số các virus này chia sẻ cùng một RBD. (Chỉ có khoảng 30 biến thể trong tất cả 200 chủng biết đến của beta-coronaviruses.) Sau đó, anh sao chép và dán những chuỗi đó vào các hạt virus tổng hợp của mình, ti exposed chúng cho các dòng tế bào biểu diễn receptor người, và bắt đầu xếp hạng tiềm năng lây nhiễm của chúng.
Ngoài các beta-coronaviruses đã biết, như SARS, anh đã nghiên cứu các chủng chưa được đặc trưng, chủ yếu là từ dơi guốc Trung Quốc. Mất thời gian để kiểm tra và xác minh kết quả, nhưng qua các tháng, Letko đã có thể hoàn thiện hệ thống của mình. Đến cuối năm 2019, anh có thể lấy một chuỗi từ Genbank, và một tuần sau tạo dữ liệu thử nghiệm về việc virus có thể nhiễm trùng tế bào người hay không—và nhận biết được tế bào nào, và virus có thể xâm nhập chúng như thế nào.
Tháng 12, anh bắt đầu gõ kết quả của hai năm lao động của mình. Anh chuẩn bị gửi chúng đến một tạp chí để đánh giá của đồng nghiệp khi báo cáo về một loại viêm phổi bí ẩn bắt đầu rò rỉ từ Vũ Hán, Trung Quốc. Đầu tháng 1, các cơ quan y tế Trung Quốc thông báo họ đã phân lập chủng nguyên của đợt bùng phát bí ẩn đó. Đó là một coronavirus mới, chưa từng xuất hiện trước đây ở người.
“Điều đó đã thay đổi tất cả,” Letko nói. Nhà nghiên cứu trên khắp thế giới nhảy vào dữ liệu—để cố gắng tìm ra nơi virus đến từ đâu và thu thập gợi ý về cách nó tấn công tế bào người. “Đột nhiên chúng ta có đợt bùng phát này và cơ hội hoàn hảo để chứng minh sức mạnh của phương pháp. Chúng tôi bỏ tất cả mọi thứ để cố gắng xác định receptor,” anh nói.
Vào ngày 10 tháng 1, các nhà khoa học Trung Quốc đã công bố gen của virus. Là cuối tuần. Letko tải xuống gen và xác định chuỗi RBD, đoạn mã chứa hướng dẫn cho đầu nối receptor quan trọng. Anh nhập nó vào một bảng tính Excel tự động thêm các đoạn mã khác để làm cho nó hoạt động với hệ thống của anh. Ba mươi phút sau, anh có một chuỗi anh có thể kiểm tra.
Sau đó đến phần khó khăn nhất: đợi. Vì các công ty tổng hợp DNA không nhận đơn hàng vào cuối tuần, anh không thể gửi chuỗi cho đến sáng thứ Hai. Nhưng đến thứ Năm, đoạn mã DNA đã được gửi đến phòng thí nghiệm của Munster ở Hamilton và Letko bắt đầu sao chép mã vào các hạt virus của mình. Sớm, chúng đang biểu diễn protein gai với một phần nhỏ của coronavirus mới ở cuối. Letko phát hiện ra rằng những bộ giống virus này có thể nhiễm trùng tế bào người bằng cách sử dụng cùng một receptor mà SARS sử dụng, ACE2. Receptor này phổ biến trong tế bào phổi, đáng chú ý vì coronavirus mới gây ho ở các trường hợp nhẹ và cơn khó thở nặng ở những trường hợp tồi tệ.
Thời gian trôi qua từ khi chuỗi được công bố đến khi Letko xác định điểm tấn công: bảy ngày.
“Nó nhanh đến không tin được, gần như quá nhanh để tưởng tượng,” nói Kristian G. Andersen, một chuyên gia gen bệnh truyền nhiễm tại Viện Nghiên cứu Scripps, người không tham gia vào công việc. Phòng thí nghiệm của ông sử dụng dữ liệu DNA để theo dõi sự tiến hóa của các đợt bùng phát bao gồm Ebola, Zika, và hiện nay, coronavirus mới chính thức được đặt tên là Sars-CoV-2.
Tốc độ như vậy có thể chứng minh quyết định trong đợt bùng phát hiện tại, theo Andersen. Với vaccine và phương pháp điều trị mới vẫn còn một vài tháng nữa mới sẵn sàng cho thử nghiệm trên người, hy vọng duy nhất để chống lại—thay vì chỉ là ngăn chặn—virus là sử dụng lại các loại thuốc đã tồn tại. Và mẹo để chọn đúng loại là biết được loại nào có thể ngăn chặn con đường nhập của virus. “Rất nhiều điều đó phụ thuộc vào cách nó liên kết với tế bào người,” Andersen nói. “Các nghiên cứu như này, cho thấy thí nghiệm về sự liên kết, là quan trọng.”
Những nhóm khác, làm việc chỉ với dữ liệu chuỗi trong tuần đầu tiên sau khi gen được công bố, sử dụng mô hình máy tính để đoán xem protein gai trông như thế nào và nó có thể sử dụng receptor nào. Họ cũng đưa ra giả thuyết rằng nó sẽ sử dụng ACE2. Nhưng trong mô phỏng của họ, virus dường như không thể gắn chặt vào địa điểm đó như mạnh mẽ như SARS. Trong một bản in trước đăng trực tuyến ngày 21 tháng 1, một nhóm từ Đại học Thành phố Hồng Kông và Đại học Công nghệ Hồng Kông viết rằng “khả năng nhiễm và độ độc hại của virus mới này nên thấp hơn nhiều so với virus SARS ở người.” Trong vài ngày sau, khi số lượng ca nhiễm mới tại Trung Quốc tăng vượt xa so với đợt bùng phát của SARS, các hạn chế của các phương pháp tính toán như vậy trở nên rõ ràng.
Là dấu hiệu cho thấy tốc độ nhanh chóng mà nghiên cứu khoa học đang diễn ra trong đợt bùng phát này, Letko và Munster đăng bản in trước của họ (đã được chấp nhận xuất bản) vào ngày tiếp theo. Họ không phải đợi lâu để được xác nhận. Ngày tiếp theo, ngày 23 tháng 1, một nhóm nghiên cứu từ Viện Virology của Wuhan thông báo họ đã thử nghiệm mẫu sống của virus mới đối với các dòng tế bào người biểu diễn protein ACE2 và những dòng không có ACE2. Nó chỉ có thể nhiễm trùng những dòng mang receptor.
Hiện nay, chỉ có các chất ức chế ACE đã được FDA chấp thuận chỉ hoạt động để chặn một receptor khác, không phải ACE2. Việc sàng lọc các chất hóa học có thể ngăn chặn coronavirus mới từ việc nhập cảnh vào ACE2 đã bắt đầu. Nhưng Andersen nói rằng bất kỳ loại thuốc mới nào dành cho ACE2 có lẽ cũng không được phát triển kịp thời để chấm dứt đợt bùng phát hiện tại.
Trong khi đó, các bác sĩ ở Trung Quốc đang thử nghiệm một chất chống virus thử nghiệm mang tên remdesivir, đã từng được sử dụng vào năm 2018 để cố gắng kiểm soát đợt bùng phát Ebola ở Cộng hòa Dân chủ Congo. Nó hoạt động bằng cách chặn một enzym virus sử dụng để tự sao chép. Phân tích gen cho thấy coronavirus có một enzym tương tự đủ để thuốc có thể hiệu quả chống lại đợt bùng phát hiện tại. Tuần trước, các nhà khoa học ở Trung Quốc công bố một báo cáo cho thấy remdesivir có thể thực sự ngăn chặn virus. Và vào thứ Năm, The New York Times đưa tin rằng cơ quan y tế Trung Quốc đã bắt đầu đăng ký bệnh nhân tham gia hai thử nghiệm lâm sàng về loại thuốc này, dự kiến sẽ kết thúc ngay vào tháng 4.
Vì vậy trong khi ông hy vọng đóng góp của mình mang lại gợi ý cho các nhà sản xuất thuốc và cơ quan y tế công cộng để kiểm soát đợt bùng phát này, Letko đã nghĩ đến đợt bùng phát tiếp theo. Cuộc khảo sát của ông về beta-coronaviruses đã tìm thấy một số chủng đang sống trong dơi nhưng có khả năng nhiễm trùng người. Ông muốn tìm hiểu thêm về chúng để dữ liệu sẽ sẵn có lần tới khi một căn bệnh mới đột ngột xuất hiện. “Mục tiêu cuối cùng là dự đoán các sự kiện tràn ngập. Và bạn chỉ có thể làm được điều đó nếu bạn biết những virus đang lưu hành ngay bây giờ trong động vật có khả năng nhiễm trùng người,” Letko nói. “Nếu chúng ta có những loại công cụ như vậy, thì chúng ta có thể nhận thức những đe dọa đang hiện hữu sớm hơn nhiều.”
Kể từ tháng 12, Sars-CoV-2 đã lây nhiễm gần 45.000 người trên toàn thế giới, và làm mất đi sinh mạng của 1.114 người, theo một bảng theo dõi đợt bùng phát thời gian thực do các nghiên cứu viên tại Đại học Johns Hopkins duy trì.
Trong vài tháng tới, Letko sẽ rời khỏi Hamilton để bắt đầu phòng thí nghiệm riêng tại Đại học Washington. Ở đó, anh dự định mở rộng dự án của mình để nghiên cứu về các gia đình coronavirus khác, và các protein chúng không chỉ sử dụng để nhập vào tế bào, mà còn để né tránh hệ thống miễn dịch và lây lan giữa người. Cuối cùng, anh hy vọng phòng thí nghiệm của mình sẽ là một trong nhiều phòng thí nghiệm trên khắp thế giới sử dụng hệ thống mà anh xây dựng để mô tả coronavirus, tạo ra một cơ sở dữ liệu thông tin về tương tác protein mà các nhà khoa học có thể sử dụng để nhanh chóng nhận diện virus mới có tiềm năng gây đại dịch.
“Đối với tất cả những người thu thập và tạo ra tất cả những chuỗi này, chúng ta cần cũng nhiều người mô tả chúng,” Letko nói. “Điều đó sẽ đòi hỏi một nỗ lực thực sự lớn. Nhưng tôi nghĩ rằng nó sẽ đáng giá.”
- Giải phóng kratom: Bên trong văn hóa ma túy nóng bỏng nhất ở Mỹ
- Mark Warner đối mặt với Big Tech và điệp viên Nga
- Sự khởi đầu gian nan của Lực lượng Vũ trụ Hoa Kỳ trên internet
- Lịch sử của ảnh thức ăn, từ tranh nghệ thuật đến ảnh 'grams brunch
- Tôi giám sát thiết bị điện tử của thiếu niên của mình, và bạn cũng nên vậy
- 👁 Sử ký bí mật về nhận diện khuôn mặt. Ngoài ra, tin tức mới nhất về trí tuệ nhân tạo
- 🎧 Âm thanh không đúng? Hãy kiểm tra tai nghe không dây, thanh âm và loa Bluetooth yêu thích của chúng tôi
