Khi giải mã bộ gen của con người, nhiều người nghĩ rằng nhân loại đã thực sự hiểu được chính mình. Tuy nhiên, tại thời điểm hiện tại, những phát hiện mới về gen không ngừng được công bố và cho thấy chúng còn nhiều bí ẩn hơn chúng ta nghĩ rất nhiều.
Nhiều người tin rằng nhân loại đã khám phá ra mọi bí mật về gen người vào năm 2003 khi giải mã hoàn chỉnh bộ gen của con người. Tuy nhiên, vẫn còn những phần nhỏ bị bỏ qua, nhưng đó chỉ là những khoảng trống nhỏ vì chúng dường như không có bất kỳ chức năng nào (thứ được coi là 'DNA rác' vào thời điểm đó).
Tuy nhiên, ngay cả trong 'rác' cũng có những 'kho báu' tiềm ẩn. Nghiên cứu gần đây đã chỉ ra rằng các biến thể ở các vùng không có trình tự này liên quan phức tạp đến sức khỏe con người, từ quá trình lão hóa đến các bệnh như ung thư và các rối loạn phát triển như tự kỷ.
Trong thời gian gần đây, một nghiên cứu mang tính bước ngoặt cuối cùng đã giải đáp những bí ẩn về bộ gen, phân tích trình tự hoàn chỉnh của những DNA chưa được giải mã trước đó.
Ngày nay, các nhà khoa học đang phát hiện ra rằng một số trình tự gen mã hóa các protein không có bất kỳ tổ tiên rõ ràng nào, được gọi là gen mồ côi.
Các nhà nghiên cứu ước tính rằng một số gen mồ côi này đã phát triển một cách tự nhiên trong quá trình tiến hóa của chúng ta, không giống như các gen khác mà chúng ta thừa hưởng từ tổ tiên.
Trong một bài báo xuất bản mới trên tạp chí Cell Reports, các nhà nghiên cứu ở Ireland và Hy Lạp đã phát hiện khoảng 155 phiên bản nhỏ hơn của trình tự DNA (ORF), tạo ra các protein quan trọng cho sự phát triển của tế bào hoặc liên quan đến các bệnh như chứng loạn dưỡng cơ và viêm võng mạc sắc tố, một bệnh di truyền hiếm gặp ảnh hưởng đến mắt.
'Đây là nghiên cứu đầu tiên nghiên cứu nguồn gốc tiến hóa cụ thể của các DNA nhỏ này và các protein tương ứng', Nikolaos Vakirlis, nhà khoa học tại Trung tâm Nghiên cứu Khoa học Y sinh ở Hy Lạp và là tác giả chính của bài báo, nói.
Hầu hết chúng ta đều quen với DNA, gồm 4 nucleotide: adenosine (A), thymine (T), cytosine (C) và guanine (G). Các trình tự cụ thể như AATCGA, đó là công thức mà ribosome sử dụng để tạo ra protein.

Khi ribosome đọc một chuỗi nucleotide, một chuỗi ba gọi là codon sẽ xác định nơi bắt đầu và kết thúc đọc, tương tự như trang đầu tiên và trang cuối cùng của một cuốn sách.
Aoife McLysaght, Giáo sư di truyền học tại Trường Đại học Trinity Dublin ở Ireland và là tác giả chính của bài báo, nói với Inverse rằng khoảng trống giữa codon bắt đầu và codon kết thúc được gọi là ORF.
Cô ấy giải thích: 'Đó là một đoạn DNA có thể mã hóa một loại protein có độ dài nhất định. Tuy nhiên, chúng tôi không chắc liệu đó có phải là gen hay không, vì vậy cần phải nghiên cứu thêm'.
Nguyên tắc chung là ORF càng dài thì khả năng mã hóa một loại protein có chức năng càng cao.
'Khi ORF có độ dài ngắn, chúng ta không thể biết chúng mã hóa cho điều gì, liệu chúng có ý nghĩa sinh học hay chỉ là sự ngẫu nhiên, vì vậy cần phải nghiên cứu thêm', McLysaght nói.
Nếu những ORF nhỏ này quan trọng và tạo ra các protein ảnh hưởng, liệu chúng có thể giải thích cách các gen mới tiến hóa và đặc điểm mới xuất hiện trong một loài không?
Có vô số ORF nhỏ trong bộ gen, vì vậy việc sàng lọc xem cái nào hoạt động và không hoạt động là rất quan trọng. Sau đó, việc tìm kiếm tổ tiên của chúng sẽ là một nhiệm vụ lớn tiếp theo của các nhà nghiên cứu.
Hiện nay, các nhà khoa học đã phân tích một bộ dữ liệu gồm các ORF nhỏ ở người được xác định là có chức năng sinh học và ghép lại thành một cây phát sinh loài, biểu đồ biểu thị mối quan hệ tiến hóa giữa các sinh vật.
Việc này được thực hiện bằng cách so sánh trình tự của ORF nhỏ với các trình tự tương tự ở các loài có quan hệ họ hàng gần với con người như tinh tinh, đười ươi, khỉ đột...
McLysaght nói: 'Nếu bạn chỉ tìm thấy ORF ở người, có vẻ như đó là đặc điểm của con người. Nhưng nếu nó xuất hiện ở các loài linh trưởng khác, có thể nó xuất phát từ một tổ tiên chung'.

Các nhà khoa học phát hiện có khoảng 155 ORF nhỏ tạo ra các protein hoàn toàn từ đầu — điều được gọi là sự xuất hiện của gen de novo — trong các vùng duy nhất trong DNA.
Hơn một phần tư trong số các trình tự di truyền ngắn này (cụ thể là 44) dường như chỉ xuất hiện ở con người và gây ra các khuyết tật tăng trưởng trong các dòng tế bào bất tử.
Ba ORF khác dường như có liên quan đến các bệnh như loạn dưỡng cơ, viêm võng mạc sắc tố và một tình trạng di truyền hiếm gặp ảnh hưởng đến sự phát triển gọi là hội chứng Alazami có liên quan đến một gen có tên LARP7.
Một ORF khác dường như có liên quan chặt chẽ với mô tim và là ORF mà con người chia sẻ với tinh tinh.
McLysaght và Vakirilis nói rằng đây mới chỉ là bước khởi đầu để hiểu cách ORF tham gia vào việc tạo ra các gen mới, quá trình tiến hóa của con người và vai trò của chúng đối với sức khỏe và bệnh tật.
Vakirlis nói: 'Còn rất nhiều việc phải làm và rất nhiều ORF cần nghiên cứu. Nhiều loại có thể gây bất lợi và gây hại cho một sinh vật'.
