Gen phân mảnh là loại gen có trình tự mã hóa không liên tục, trong đó các đoạn êxôn mã hóa amino acid xen kẽ với các đoạn intrôn không có mã. Thuật ngữ này trong tiếng Anh được dịch ra là 'interrupted gene' hoặc 'split gene'.
Tổng quan
Đến nay, đã xác định ba loại 'mảnh' của gen và DNA, gồm êxôn, intrôn và gen phân mảnh.
- (1) Các đoạn êxôn chứa thông tin mã hóa amino acid và làm cho gen biểu hiện;
- (2) Các đoạn intrôn không có mã di truyền, nằm xen kẽ với các đoạn êxôn;
- (3) Các đoạn không có mã di truyền, nằm ngoài vùng mã hóa và có vai trò điều hòa và cấu trúc, gọi là các đoạn liên quan.
Trong các sinh vật nhân thực đã nghiên cứu: loại (1) chiếm trung bình khoảng 2%, loại (2) chiếm khoảng 24% và loại (3) chiếm gần 75%. Ví dụ, gen của con người có 26.564 gen (dự án bộ gen con người xây dựng vào tháng 10 năm 2003) chứa 233.785 êxôn và 207.344 intrôn. Vì vậy, trung bình có khoảng 8,8 êxôn và 7,8 intrôn trên mỗi gen, phần còn lại là các đoạn dùng cho enzim nhân đôi, enzim phiên mã, điều hòa và cấu trúc histon trong nhiễm sắc thể. Đây là kết quả của quá trình tiến hóa dài ngày trong lịch sử sinh học.
Lược sử
- Từ những năm 1960 - 1970, đã có nhiều nghiên cứu về gen, giúp khoa học hiểu được mỗi gen mã hóa prôtein bao gồm ba vùng: vùng điều hòa, vùng mã hóa và vùng kết thúc (xem hình bên).
- Vùng điều chỉnh
- Đoạn khởi động promotor là nơi RNA polymerase nhận diện và gắn để bắt đầu quá trình sao chép. Nó có trình tự nucleotit phù hợp để phù hợp với trình tự nhận diện của RNA polymerase tương ứng.
- Đoạn điều chỉnh promotor có trình tự nucleotit đặc hiệu để các protein điều chỉnh có thể gắn vào và điều chỉnh hoạt động của gen khi cần thiết.
- Vùng mã hóa chứa thông tin về các axit amin. Đây là một chuỗi polynucleotit mang thông tin cho chuỗi axit amin. Tế bào nguyên bào có vùng mã hóa liên tục gọi là gen không chia nhỏ, trong khi tế bào thực có vùng mã hóa không liên tục: gồm các đoạn intron không có mã xen kẽ với các đoạn exon chứa mã, gọi là gen chia nhỏ, trong đó các bộ ba mã di truyền nằm trong các đoạn gián đoạn do sự xen ngắt của các intron.
- Vùng kết thúc ở đầu 5’ của mạch gốc (cũng là đầu 3' ở mạch bổ sung) chứa tín hiệu kết thúc quá trình sao chép RNA.
- Mô hình này đã được chứng minh ở nhiều loài vi khuẩn và được cho là cũng áp dụng cho loài người. Tuy nhiên, một số thí nghiệm thực hiện vào cuối những năm 1970 lại cho thấy kết quả khác biệt.
- Nhà sinh học hóa học người Pháp Pierre Chambon và các cộng sự mô tả vào năm 1977 rằng gen ovalbumin của gà mã hóa cho protein ovalbumin gồm 386 axit amin, tuy nhiên, RNA tương ứng lại ngắn hơn đáng kể so với gen. Điều này đã dẫn đến giả thuyết 'gen mao mạch', nghĩa là một gen có thể bị 'mạch' những đoạn không phải là gen.
- Các thí nghiệm của Richard J. Roberts và Phillip A. Sharp cũng như của Walter Gilbert cho thấy các quan sát tương tự. Đặc biệt, khi sử dụng kỹ thuật lai acid nucleic, các nhà nghiên cứu đã nhận thấy khi lai ghép một mạch đơn DNA gốc với một mạch RNA do nó tạo ra, họ thu được một mạch lai kép khá hoàn chỉnh, nhưng có một vòng lồi giữa hai mạch đã nối lại. Điều này cho thấy rằng gen có chiều dài lớn hơn RNA của nó và có thể bị cắt bỏ, tạo ra các đoạn DNA rác.
- Những nghiên cứu tiếp theo của Richard J. Roberts, Phillip A. Sharp và Walter Gilbert vào năm 1978 đã phát hiện ra sự tồn tại của exon, intron và thuật ngữ 'gen chia nhỏ' từ đó. Cùng với các thành tựu khác, các nhà khoa học này đều được trao Giải Nobel vào năm 1980.
- Sau này, các sinh vật nhân thực ở các cấp độ thấp đã được phát hiện có cơ chế gen chia nhỏ. Ngoài ra, quá trình tổng hợp tRNA cũng yêu cầu xử lý và chỉnh sửa tương tự như mRNA, bao gồm cắt bỏ các trình tự nucleotit cụ thể, sau đó ghép nối chúng. Điều này cho thấy rằng gen chia nhỏ không chỉ tồn tại trong gen dùng để tổng hợp mRNA, mà còn trong gen tRNA và các loại gen khác.
- Gen cấu trúc của vi khuẩn mang chuỗi mã hóa dài được gọi là gen liên tục hoặc gen không phân mảnh (hình bên, chú thích A). Sau khi phiên mã, mRNA có thể được tạo ra ngay để dịch mã, vì mRNA chỉ mang chuỗi liên tục các bộ ba mã di truyền. Tuy nhiên, ở sinh vật nhân thực, sau khi phiên mã xong, RNA sơ khai (pre-RNA) chứa các đoạn 'thừa' như intrôn, cần phải qua quá trình chế biến để trở thành RNA trưởng thành.
Ý nghĩa
Các đoạn intrôn trong gen phân mảnh không mang chuỗi bộ ba mã di truyền, chỉ đơn thuần là những đoạn 'thừa' về mặt thông tin, nhưng lại có vai trò quan trọng trong cấu trúc của DNA trên nhiễm sắc thể, đóng vai trò trong bảo vệ và lưu giữ thông tin di truyền.
Vì có những 'mảnh' thừa này, việc loại bỏ chúng là cần thiết để RNA trưởng thành sau phiên mã trở nên gọn gàng hơn rất nhiều. Đó là biến đổi sau phiên mã (Post-transcriptional modification) hay xử lý RNA.
Sau khi tạo ra protein, bản dịch mã có thể được biến đổi thêm. Đó là biến đổi sau dịch mã (Post-translational modification) để tạo ra các sản phẩm khác, thường là các phức hợp có chức năng đặc biệt, như quá trình Palmitôlêyô hóa protein.