Nhà khoa học tìm thấy các chuỗi trình tự của virus được phát hiện sớm nhất mà đã bị xóa một cách bí ẩn.

Bằng cách lục tung các tài liệu được lưu trữ trên Google Cloud, một nhà nghiên cứu cho biết ông đã phục hồi được 13 chuỗi trình tự coronavirus được phát hiện sớm nhất, mà đã biến mất khỏi cơ sở dữ liệu vào năm ngoái.

*Các bác sĩ tại Bệnh viện Trung Nam thuộc Đại học Vũ Hán ở Vũ Hán chăm sóc một bệnh nhân Covid vào tháng 1 năm 2020. Credit…Xiong Qi /Xinhua, via Associated Press.*

Carl Zimmer, Ngày 23 tháng 6 năm 2021… Theo The New York Times.

Trần H Sa lược dịch.

Khoảng một năm trước, các chuỗi trình tự di truyền từ hơn 200 mẫu virus ở các ca nhiễm Covid-19 ban đầu tại Vũ Hán đã biến mất khỏi cơ sở dữ liệu khoa học được lưu trử trên mạng trực tuyến.

Bây giờ, bằng cách lục tung các tài liệu được lưu trữ trên Google Cloud, một nhà nghiên cứu ở Seattle báo cáo rằng ông ta đã phục hồi được 13 trong số các chuỗi trình tự ban đầu đó - thông tin mới kích thích sự tò mò để hiểu rõ khi nào và làm sao mà virus có thể đã lây lan vào con người từ dơi hoặc từ động vật khác .

Bài phân tích mới, được công bố vào hôm thứ ba (22/6/2021), củng cố các đề xuất trước đây rằng một loạt các coronavirus có thể đã lan truyền ở Vũ Hán trước khi xảy ra các đợt bùng phát ban đầu liên quan đến ngôi chợ mua bán động vật và hải sản, vào tháng 12 năm 2019.

Khi chính quyền Biden điều tra nguồn gốc virus gây tranh cãi, được gọi là SARS-CoV-2, việc nghiên cứu không làm tăng thêm cũng không làm giảm bớt giả thuyết rằng mầm bệnh đã bị rò rỉ khỏi một phòng thí nghiệm nổi tiếng ở Vũ Hán. Nhưng nó đặt ra câu hỏi về lý do tại sao các chuỗi trình tự ban đầu bị xóa, và cho thấy rằng có thể có nhiều phát hiện hơn để phục hồi các chuỗi trình tự ban đầu từ các góc khuất của internet.

Michael Worobey, một nhà sinh vật học tiến hóa tại Đại học Arizona, người không tham gia vào nghiên cứu cho biết: "Đây là một phần tuyệt vời trong công việc dò tìm sự thật và nó thúc đẩy đáng kể các nỗ lực để hiểu biết nguồn gốc của SARS-CoV-2. "

Jesse Bloom, một nhà virus học tại Trung tâm Nghiên cứu Ung thư Fred Hutchinson, người viết báo cáo mới, đã gọi việc xóa các chuỗi trình tự này là đáng ngờ. "Có vẻ như các chuỗi trình tự đã bị xóa để che khuất sự tồn tại của chúng", ông viết trong bài báo, chưa được đồng nghiệp đánh giá (việc cần có cho một bài báo khoa học…THS) hoặc xuất bản trên một tạp chí khoa học.

Tiến sĩ Bloom và Tiến sĩ Worobey thuộc về nhóm các nhà khoa học trực tính, nói thẳng thắn, họ đã từng kêu gọi nghiên cứu thêm về cách đại dịch bắt đầu ra sao. Trong một lá thư được công bố vào tháng 5, họ phàn nàn rằng không có đủ thông tin để xác định xem liệu có hay không những khả năng rò rỉ từ trong phòng thí nghiệm khiến lây lan coronavirus, hoặc nó nhảy sang người do tiếp xúc với động vật bị nhiễm bệnh ở bên ngoài phòng thí nghiệm.

Chuỗi trình tự di truyền của các mẫu virus nắm giữ những manh mối quan trọng về cách SARS-CoV-2 di chuyển sang con người từ một động vật khác, rất có thể là một con dơi. Điều quý giá nhất trong tất cả, chính là các chuỗi trình tự của virus từ đầu đại dịch, bởi vì chúng đưa các nhà khoa học đến gần hơn với sự kiện lây lan ban đầu.

Trước đây, Tiến sĩ Bloom từng xem xét dữ liệu di truyền nào đã được công bố bởi các nhóm nghiên cứu khác nhau, ông đã bắt gặp một nghiên cứu vào tháng 3 năm 2020 với bảng tính bao gồm thông tin về 241 chuỗi trình tự di truyền, được thu thập bởi các nhà khoa học tại Đại học Vũ Hán. Bảng tính chỉ ra rằng các nhà khoa học đã đưa các chuỗi trình tự lên một cơ sở dữ liệu trên mạng trực tuyến có tên là Kho Lưu trữ Cơ Sở Dữ liệu Sinh Học (Sequence Read Archive), được quản lý bởi Thư viện Y khoa Quốc gia của chính phủ Hoa Kỳ.

Nhưng khi vào đầu tháng này, Tiến sĩ Bloom tìm kiếm các chuỗi trình tự trong cơ sở dữ liệu của Vũ Hán, kết quả duy nhất của ông là "không tìm thấy mục nào".

Bối rối, ông ta quay trở lại bảng tính để tìm thêm bất kỳ manh mối nào. Nó chỉ ra rằng 241 chuỗi trình tự đã được thu thập bởi một nhà khoa học tên là Aisi Fu tại Bệnh viện Renmin ở Vũ Hán. Tìm kiếm trong tài liệu y khoa, cuối cùng Tiến sĩ Bloom tìm thấy một nghiên cứu khác được đăng lên mạng trực tuyến vào tháng 3 năm 2020 bởi Tiến sĩ Fu và các đồng nghiệp, mô tả một thử nghiệm mới dựa trên kinh nghiệm và bằng chứng về SARS-CoV-2. Các nhà khoa học Trung Quốc đã công bố nó trên một tạp chí khoa học ba tháng sau đó.

Trong nghiên cứu đó, các nhà khoa học viết rằng họ đã xem xét 45 mẫu từ tăm bông mũi (que lấy mẫu từ mũi để xét nghiệm …THS) được lấy "từ những bệnh nhân không nằm viện nhưng bị nghi ngờ nhiễm Covid-19 ngay từ đầu". Sau đó, họ tìm kiếm một phần thực thể di truyền của SARS-CoV-2 trong tăm bông. Các nhà nghiên cứu đã không công bố các chuỗi trình tự thực tế của các gen mà họ lấy được từ các mẫu. Thay vào đó, họ chỉ công bố một số đột biến trong virus.

Nhưng một số manh mối chỉ ra cho Tiến sĩ Bloom rằng các mẫu từ tăm bông là nguồn gốc của 241 chuỗi trình tự đã bị xóa mất. Các bài báo không bao gồm lời giải thích về lý do tại sao các chuỗi trình tự đã được tải lên Kho Lưu trữ Cơ Sở Dữ liệu Sinh Học, lại biến mất sau đó.

Xem xét kỹ kho lưu trữ, Tiến sĩ Bloom phát hiện ra rằng nhiều chuỗi trình tự được lưu trữ dưới dạng tài liệu trên Google Cloud. Mỗi chuỗi trình tự được chứa trong một tài liệu trên Cloud và tên của các tài liệu đều được chia sẻ cùng một định dạng căn bản, ông báo cáo.

Tiến sĩ Bloom đã hoán đổi mã cho một chuỗi trình tự bị thiếu từ Vũ Hán. Đột nhiên, ông ta có chuỗi trình tự. Tất cả đã được ông ta sắp xếp để phục hồi 13 chuỗi trình tự từ Cloud theo cách này.

Với dữ liệu mới này, Tiến sĩ Bloom một lần nữa nhìn lại giai đoạn đầu của đại dịch. Ông kết hợp 13 chuỗi trình tự với các chuỗi trình tự khác của coronavirus giai đoạn đầu đã được công bố, hy vọng sẽ đạt được tiến bộ trong việc xây dựng phả hệ (cây dòng họ) của SARS-CoV-2.

Việc tìm ra tất cả các bước mà SARS-CoV-2 phát triển từ một virus trên dơi là một thách thức, vì các nhà khoa học vẫn chỉ có một số lượng mẫu hạn chế để nghiên cứu. Một số mẫu sớm nhất đến từ chợ mua bán động vật và hải sản Huanan ở Vũ Hán, nơi xảy ra dịch bệnh vào tháng 12 năm 2019.

Nhưng những virus ở ngôi chợ đó thực sự có thêm ba đột biến vốn bị thiếu trong các mẫu SARS-CoV-2 được thu thập vài tuần trước đó. Nói cách khác, những loại virus xuất hiện sớm hơn trông giống như coronavirus được tìm thấy trong dơi, ủng hộ ý tưởng rằng có một số dòng virus ban đầu không đi qua ngôi chợ mua bán động vật và hải sản.

Tiến sĩ Bloom phát hiện ra rằng các chuỗi trình tự bị xóa mà ông ta phục hồi được từ Cloud cũng thiếu những đột biến bổ sung đó. Tiến sĩ Bloom nói: "Chúng qua ba bước để giống với coronavirus trên dơi hơn so với virus từ chợ động vật và hải sản Huanan. "

*Chợ mua bán động vật và hải sản Huanan ở Vũ Hán vào tháng 1 năm 2020. Credit..Dake Kang/ Associated Press*

Ông nói, điều này cho thấy rằng, vào thời điểm SARS-CoV-2 lan đến ngôi chợ, nó đã được lan truyền một thời gian ở Vũ Hán hoặc xa hơn thế nữa. Ông lập luận, các virus được tìm thấy ở ngôi chợ, không hoàn toàn đại diện cho sự đa dạng của coronavirus vốn đã lây lan vào cuối năm 2019.

Ông nói, "Có lẽ bức tranh của chúng tôi về những gì đã có mặt ngay ban đầu ở Vũ Hán từ những gì đã được sắp xếp theo trình tự, có thể là hơi có thành kiến".

Trong báo cáo của mình, Tiến sĩ Bloom thừa nhận rằng kết luận này sẽ phải được xác nhận với một phân tích sâu hơn về các chuỗi trình tự của virus. Tiến sĩ Worobey nói rằng ông và các đồng nghiệp của mình đang thực hiện một nghiên cứu có quy mô lớn về gen của SARS-CoV-2, để hiểu rõ hơn về nguồn gốc của nó và bây giờ họ sẽ thêm 13 chuỗi trình tự vừa được phục hồi của Tiến sĩ Bloom.

Tiến sĩ Worobey nói: "Những dữ liệu bổ sung này sẽ đóng một vai trò to lớn trong nỗ lực đó. "

Không rõ tại sao thông tin có giá trị này lại bị mất tích ngay từ đầu. Các nhà khoa học có thể yêu cầu xóa các tài liệu bằng cách gửi email cho người quản lý của Kho Lưu trử Cơ Sở Dữ Liệu Sinh Học (Sequence Read Archive). Thư viện Y khoa Quốc gia Hoa Kỳ, nơi quản lý kho lưu trữ, nói rằng 13 chuỗi trình tự đã bị xóa vào mùa hè năm ngoái.

Renate Myles, phát ngôn viên của Viện Y tế Quốc gia cho biết: "Những chuỗi trình tự SARS-CoV-2 này đã được đưa ra xem xét để đăng lên Kho Lưu trử Cơ sở Dữ liệu Sinh học (SRA) vào tháng 3 năm 2020 và sau đó được yêu cầu rút lại bởi đệ trình của điều tra viên vào tháng 6 năm 2020."

Cô nói rằng điều tra viên, người mà cô không cho biết tên, nói với các nhà quản lý kho lưu trữ rằng các chuỗi trình tự đang được cập nhật và sẽ được thêm vào một cơ sở dữ liệu khác. Nhưng tiến sĩ Bloom đã lục soát mọi cơ sở dữ liệu mà ông ta biết, và vẫn chưa tìm thấy chúng. "Rõ ràng tôi không thể loại trừ rằng các chuỗi trình tự nằm ở đâu đó trên một số cơ sở dữ liệu hoặc trang web khác, nhưng tôi đã không thể tìm thấy chúng ở bất kỳ nơi nào mà hiển nhiên tôi đã tìm kiếm", ông nói.

Ba trong số các đồng tác giả của nghiên cứu thử nghiệm năm 2020 mà qua đó tạo ra 13 chuỗi trình tự đã không trả lời ngay lập tức các email hỏi về phát hiện của Tiến sĩ Bloom. Nghiên cứu đó đã không cung cấp thông tin liên lạc cho một đồng tác giả khác, Tiến sĩ Fu, người cũng được ghi tên trên bảng tính từ một nghiên cứu khác.

Một số nhà khoa học hoài nghi rằng có một cái gì đó nham hiểm ở đằng sau việc loại bỏ các chuỗi trình tự. Stephen Goldstein, một nhà virus học tại Đại học Utah cho biết: "Tôi thực sự không hiểu điều này chỉ ra một sự che đậy tội ác tầm cở như thế nào ".

Tiến sĩ Goldstein lưu ý rằng bài kiểm tra đã liệt kê các đột biến cá nhân mà các nhà nghiên cứu ở Vũ Hán tìm thấy trong các thử nghiệm của họ. Mặc dù các chuỗi trình tự đầy đủ không còn trong kho lưu trữ, thông tin quan trọng đã được công khai trong hơn một năm, ông nói. Nó chỉ được giấu trong một định dạng khác gây khó khăn cho các nhà nghiên cứu tìm thấy.

Tiến sĩ Goldstein nói: "Tất cả chúng ta đều bỏ lỡ hồ sơ tương đối mơ hồ này. "

"Bạn thực sự không thể nói lý do tại sao chúng bị loại bỏ," Tiến sĩ Bloom thừa nhận trong một cuộc phỏng vấn. "Bạn có thể nói rằng hậu quả thực tế của việc loại bỏ chúng là mọi người không nhận thấy chúng tồn tại". Ông cũng lưu ý rằng chính phủ Trung Quốc đã ra lệnh tiêu hủy một số mẫu virus lúc ban đầu, và cấm xuất bản các bài báo về coronavirus mà không có sự chấp thuận của họ.

Về phần mình, tiến sĩ Worobey vẫn muốn có câu trả lời. "Tôi hy vọng chúng tôi nghe từ các tác giả đã tạo ra, nhưng sau đó đã xóa, những chuỗi trình tự quan trọng này để chúng tôi có thể hiểu thêm về động lực của họ khiến họ đã làm như vậy. Nhìn theo giá trị bên ngoài nó chắc chắn là kỳ lạ và thực sự đòi hỏi một lời giải thích", ông nói.

Bất kể điều gì đã xảy ra với 13 chuỗi trình tự này, Tiến sĩ Bloom bây giờ tự hỏi những gì là các manh mối khác mà có thể phát hiện được từ mạng trực tuyến. Để xây dựng lại nguồn gốc của Covid-19, tất cả những manh mối đó tiềm ẩn những khả năng quan trọng.

Ông nói, "Lý tưởng nhất, chúng ta cần cố gắng tìm càng nhiều chuỗi trình tự khác của virus lúc ban đầu, càng tốt. Và tôi nghĩ rằng nghiên cứu này cho thấy rằng chúng ta nên tìm kiếm ở khắp mọi nơi".

Tìm kiếm Blog này

Hoàng Trường Sa

Nhà khoa học tìm thấy các chuỗi trình tự của virus được phát hiện sớm nhất mà đã bị xóa một cách bí ẩn.

Bài đăng phổ biến từ blog này

Đánh giá Hạm đội 6 chiếc tàu ngầm lớp Kilo của Việt Nam

Trận hải chiến Hoàng Sa 1974.

Tìm hiểu tinh thần chống bắc thuộc của người Việt trong từng giai đoạn lịch sử. PHẦN I.