Protein (hay còn gọi là Đạm) là các phân tử lớn được hình thành từ các đơn vị cơ bản là amino acid. Những đơn vị này kết nối với nhau bằng các liên kết peptide, tạo thành chuỗi polypeptide dài. Các chuỗi này có khả năng xoắn, cuộn hoặc gấp theo nhiều kiểu khác nhau, hình thành các cấu trúc không gian đa dạng của protein.
Protein là hợp chất đại phân tử được cấu tạo từ hàng loạt đơn vị amino acid. Mỗi amino acid gồm ba thành phần chính: nhóm amine (-NH2), nhóm carboxyl (-COOH) và nguyên tử cacbon trung tâm nối với một nguyên tử Hydro và nhóm R biến đổi, quyết định tính chất của từng amino acid. Đã có hơn 20 loại amino acid được phát hiện trong các loại protein khác nhau trong cơ thể sống.
Cấu tạo hóa học
- Hợp chất hữu cơ bao gồm bốn nguyên tố chính là C, H, O, N, thường có thêm S và đôi khi P.
- Thuộc nhóm đại phân tử với phân tử lớn nhất dài tới 0,1 micromet, có khối lượng phân tử lên đến 1,5 triệu đ.v.C.
- Là dạng đa phân tử, các đơn vị cơ bản là amino acid.
- Có hơn 20 loại amino acid khác nhau cấu thành các protein, mỗi amino acid bao gồm ba thành phần: gốc cacbon (R), nhóm amin (-NH2) và nhóm carboxyl (-COOH), khác biệt ở gốc R. Kích thước trung bình của mỗi amino acid khoảng 3Å.
- Các amino acid liên kết với nhau bằng liên kết peptide để tạo thành chuỗi polypeptide. Liên kết peptide hình thành khi nhóm carboxyl của một amino acid liên kết với nhóm amin của amino acid tiếp theo, đồng thời giải phóng một phân tử nước. Một phân tử protein có thể chứa một hoặc nhiều chuỗi polypeptide cùng loại.
- Hơn 20 loại amino acid kết hợp theo nhiều cách khác nhau tạo ra hàng triệu loại protein khác nhau (ước tính có khoảng 10^14 đến 10^15 loại protein trong các cơ thể động vật và thực vật). Mỗi loại protein được đặc trưng bởi số lượng, thành phần và trình tự amino acid trong phân tử, giải thích sự đa dạng và đặc thù của các protein trong thiên nhiên.
STT | amino acid | Viết tắt (3 ký tự) | Viết tắt (1 ký tự) | Side-chain polarity | Side-chain charge (pH 7.4) | Hydropathy index | Độ hấp thụ λmax(nm) | ε at λmax (x10 M cm) |
---|---|---|---|---|---|---|---|---|
1 | Alanine | Ala | A | nonpolar | neutral | 1.8 | ||
2 | Arginine | Arg | R | Basic polar | positive | −4.5 | ||
3 | Asparagine | Asn | N | polar | neutral | −3.5 | ||
4 | Aspartic acid | Asp | D | acidic polar | negative | −3.5 | ||
5 | Cysteine | Cys | C | nonpolar | neutral | 2.5 | 250 | 0.3 |
6 | Glutamic acid | Glu | E | acidic polar | negative | −3.5 | ||
7 | Glutamine | Gln | Q | polar | neutral | −3.5 |
| |
8 | Glycine | Gly | G | nonpolar | neutral | −0.4 | ||
9 | Histidine | His | H | Basic polar | positive(10%)
neutral(90%) |
−3.2 | 211 | 5.9 |
10 | Isoleucine | Ile | I | nonpolar | neutral | 4.5 | ||
11 | Leucine | Leu | L | nonpolar | neutral | 3.8 | ||
12 | Lysine | Lys | K | Basic polar | positive | −3.9 | ||
13 | Methionine | Met | M | nonpolar | neutral | 1.9 | ||
14 | Phenylalanine | Phe | F | nonpolar | neutral | 2.8 | 257, 206, 188 | 0.2, 9.3, 60.0 |
15 | Proline | Pro | P | nonpolar | neutral | −1.6 | ||
16 | Serine | Ser | S | polar | neutral | −0.8 | ||
17 | Threonine | Thr | T | polar | neutral | −0.7 | ||
18 | Tryptophan | Trp | W | nonpolar | neutral | −0.9 | 280, 219 | 5.6, 47.0 |
19 | Tyrosine | Tyr | Y | polar | neutral | −1.3 | 274, 222, 193 | 1.4, 8.0, 48.0 |
20 | Valine | Val | V | nonpolar | neutral | 4.2 |
Cấu trúc không gian
Protein có bốn cấp độ cấu trúc cơ bản: 'Cấu trúc bậc 1: Các amino acid nối với nhau qua liên kết peptide để tạo thành chuỗi polypeptide. Đầu chuỗi là nhóm amin của amino acid đầu tiên và cuối chuỗi là nhóm carboxyl của amino acid cuối cùng. Cấu trúc bậc một của protein thể hiện trình tự các amino acid trong chuỗi polypeptide, điều này rất quan trọng vì nó ảnh hưởng đến sự tương tác giữa các phần của chuỗi, hình thành cấu trúc không gian của protein và quyết định tính chất cũng như chức năng của protein. Sự thay đổi trong trình tự amino acid có thể làm biến đổi cấu trúc và tính chất của protein.
Cấu trúc bậc 2 là sự sắp xếp đều đặn của các chuỗi polypeptide trong không gian. Các chuỗi polypeptide thường không thẳng mà cuộn lại, tạo nên cấu trúc xoắn α và nếp gấp β, được duy trì bởi các liên kết Hydro giữa các amino acid gần nhau. Các protein sợi như keratin và collagen (có trong lông, tóc, móng) chứa nhiều xoắn α, trong khi các protein hình cầu có nhiều nếp gấp β hơn.
Cấu trúc bậc 3: Các xoắn α và nếp gấp β có thể cuộn lại thành từng cấu trúc lập thể đặc trưng cho từng loại protein. Cấu trúc không gian này quyết định hoạt tính và chức năng của protein, phụ thuộc vào đặc điểm của nhóm -R trong các chuỗi polypeptide. Ví dụ, nhóm -R của cystein có thể tạo cầu disulfide (-S-S-), nhóm -R của prolin cản trở hình thành xoắn, ảnh hưởng đến điểm gấp, còn các nhóm -R ưa nước thì nằm ngoài phân tử, nhóm kị nước thì ở trong phân tử... Các liên kết yếu như liên kết Hydro và liên kết điện hóa trị thường nằm giữa các nhóm -R có điện tích trái dấu.
Cấu trúc bậc 4: Khi nhiều chuỗi polypeptide kết hợp với nhau, chúng tạo thành cấu trúc bậc 4 của protein. Các chuỗi polypeptide gắn kết với nhau nhờ các liên kết yếu như liên kết Hydro.
Liên kết peptide
Liên kết peptide (-CO-NH-) hình thành khi nhóm α-carboxyl của một amino acid kết hợp với nhóm α-amin của một amino acid khác, đồng thời loại bỏ một phân tử nước. Phản ứng này tạo ra dipeptide. Nếu ba, bốn, năm hoặc nhiều amino acid kết hợp, sẽ tạo thành tripeptide, tetrapeptide, pentapeptide, và polypeptide. Đầu trái của peptide là đầu C và đầu phải là đầu N. Phân tử protein bao gồm 20 loại L-α-amino acid và các amid tương ứng.
Một số peptide tự nhiên quan trọng:
- Glutathione (tripeptide): γ - glutamyl cysteine glycine. Glutathione hiện diện trong tất cả các sinh vật, tham gia vào các phản ứng oxy hóa khử.
- Carnosine (dipeptide): β - alanine histidine. Carnosine có mặt chủ yếu trong cơ của động vật có xương sống (trừ một số loài cá), vai trò sinh học chưa được hiểu rõ nhưng có thể hỗ trợ trong các quá trình sinh hóa khi cơ vận động.
- Oxytocin và Vasopressin: là các neuropeptide có cấu trúc hóa học được phát hiện sớm nhất và đã được tổng hợp. Oxytocin và vasopressin gồm 9 amino acid và có một cầu disulfide trong phân tử.
Ý nghĩa của cấu trúc bậc 1 protein
- Cấu trúc bậc 1 là bước đầu tiên quyết định cơ sở phân tử của hoạt tính sinh học và đặc tính hóa lý của protein. Nó phản ánh sự khác biệt rõ rệt giữa các protein.
- Cấu trúc bậc 1 cung cấp thông tin nền tảng để hiểu cấu trúc không gian của protein. Dựa vào cấu trúc bậc I và quy luật hình thành cấu trúc không gian, chúng ta có thể dự đoán các yếu tố như cầu disulfide và cấu trúc không gian của protein nghiên cứu từ các protein tương đồng.
- Cấu trúc bậc I là yếu tố quan trọng trong nghiên cứu bệnh lý phân tử. Nghiên cứu cho thấy sự thay đổi trong trình tự amino acid, thậm chí là một gốc amino acid, có thể làm thay đổi hoạt tính sinh học và chức năng của một cơ quan.
- Cấu trúc bậc I là phiên bản mã di truyền. Do đó, nó cung cấp thông tin về mối quan hệ họ hàng và lịch sử tiến hóa của thế giới sống.
- Xác định cấu trúc bậc I là cơ sở để tổng hợp protein nhân tạo bằng các phương pháp hóa học hoặc công nghệ sinh học.
Quá trình hình thành bốn bậc cấu trúc của protein
Cách các amino acid liên kết để tạo chuỗi polypeptide khiến cho đoạn –CO-NH-CH- lặp đi lặp lại trong mạch dài polypeptide. Mạch bên của các amino acid không tham gia vào việc tạo bộ khung chính của mạch mà nằm bên ngoài chuỗi polypeptide.
Nghiên cứu của Pauling và Cori (Linus Pauling, Robert Corey 1930) cùng các nhà nghiên cứu khác chỉ ra rằng nhóm peptide (–CO-NH-CH-) có cấu trúc phẳng và cứng.
Nhóm –NH- luôn ở trạng thái trans so với nhóm carboxyl –O. Tuy nhiên, cấu trúc của nhóm peptide là phẳng, nghĩa là tất cả các nguyên tử liên quan nằm trên cùng một mặt phẳng. Pauling và Cori đã đo khoảng cách giữa nguyên tử N và C trong liên kết đơn là 1,46 Å và khoảng cách giữa C và N trong liên kết đôi –C=N- là 1,27 Å. Do đó, liên kết peptide có một phần liên kết đôi và có thể hình thành dạng enol.
Vì vậy, liên kết peptide có tính chất 'cứng' và không có sự quay tự do xung quanh liên kết này. Ngược lại, khả năng quay tự do xung quanh các liên kết nối nhóm peptide với các carbon xung quanh (giữa C và Cα, giữa N và Cα) là rất lớn, khiến cho chuỗi peptide có xu hướng tạo thành cấu trúc xoắn.
Cấu trúc bậc một: chuỗi amino acid cơ bản
Các acid amin kết hợp với nhau qua liên kết peptide để hình thành chuỗi polypeptide: chi tiết
Chuỗi polypeptide là cơ sở của cấu trúc bậc I trong protein. Tuy nhiên, không phải tất cả các chuỗi polypeptide đều là protein bậc I. Nhiều chuỗi chỉ tồn tại dưới dạng tự do trong tế bào mà không tạo thành phân tử protein. Chỉ những chuỗi polypeptide với trật tự amino acid xác định mới hình thành phân tử protein. Cấu trúc bậc I của protein là trình tự các acid amin trong chuỗi polypeptide, điều này rất quan trọng vì nó tạo nền tảng cho việc hình thành cấu trúc không gian và quy định đặc tính của protein. Phân tử protein ở bậc I chưa có hoạt tính sinh học vì chưa hình thành các trung tâm hoạt động, chỉ mang đặc trưng về thành phần và trật tự của các amino acid trong chuỗi.
Trong tế bào, protein thường xuất hiện dưới dạng các cấu trúc không gian khác nhau. Sau khi chuỗi polypeptide ở cấp độ bậc I được tổng hợp tại ribosome, nó rời khỏi ribosome và tiếp tục hình thành cấu trúc không gian bậc II, III, IV trước khi di chuyển đến nơi thực hiện chức năng của nó.
Cấu trúc bậc hai: Cuộn gấp không gian
Theo nghiên cứu của Paulin và Cori (1951), có hai kiểu cấu trúc chính là xoắn α và phiến gấp β.
Cấu trúc xoắn α (α helix): Trong cấu trúc xoắn α, chuỗi polypeptide cuộn chặt lại, với các nhóm peptide (-CO-NH-) và Cα tạo thành lõi của xoắn, trong khi các nhóm bên (R) của các amino acid hướng ra ngoài. Mỗi amino acid được mã hóa bởi ba nucleotide. Cấu trúc xoắn α chủ yếu được duy trì nhờ các liên kết hydro, hình thành giữa nhóm carboxyl của một liên kết peptide với nhóm –NH của liên kết peptide kế tiếp (cách nhau ba amino acid) trên cùng một chuỗi polypeptide. Tất cả các nhóm –CO-, -NH- trong liên kết peptide của chuỗi polypeptide đều tạo liên kết hydro theo cách này.
Trong cấu trúc xoắn α, mỗi nhóm –CO-NH- có thể tạo ra hai liên kết hydro với hai nhóm –CO-NH- khác. Số lượng liên kết hydro tối đa này đảm bảo sự ổn định và độ bền của cấu trúc xoắn α.
Dựa trên mô hình của Paulin và Cori, trong cấu trúc xoắn, khoảng cách dọc theo trục xoắn giữa hai gốc amino acid liên tiếp là 1,5 Å và góc quay là 100°. Một vòng xoắn bao gồm 3,6 gốc amino acid, với chiều cao khoảng 5,4 Å. Vòng xoắn có thể xoắn phải (theo chiều kim đồng hồ) hoặc xoắn trái (ngược chiều kim đồng hồ). Trong protein, cấu trúc xoắn α thường là xoắn phải. Sự hình thành và độ bền của cấu trúc xoắn α phụ thuộc vào nhiều yếu tố, như thành phần và trình tự sắp xếp của amino acid trong chuỗi polypeptide, pH môi trường, v.v. Hiện nay, có một số quy luật cơ bản để dự đoán tỷ lệ xoắn α và vị trí của nó trong phân tử protein, dựa trên cấu trúc bậc I. Tỷ lệ xoắn α có thể thay đổi đáng kể giữa các protein khác nhau.
Chẳng hạn, tỷ lệ xoắn α trong hemoglobin và myoglobin là 75%, trong lysozyme là 35%, trong chymotrypsin hầu như không có xoắn α, chỉ có một đoạn xoắn rất ngắn ở đầu C.
Khi cấu trúc xoắn α hình thành, khả năng làm quay mặt phẳng ánh sáng phân cực sang bên phải tăng lên. Tính chất này có thể được sử dụng để xác định tỷ lệ xoắn α trong phân tử protein.
Cấu trúc phiến gấp β (β sheet): Cấu trúc phiến gấp β có thể được tìm thấy trong fiborin của tơ, và có một số điểm khác biệt so với xoắn α như sau:
- Chuỗi polypeptide trong cấu trúc phiến gấp β thường duỗi dài thay vì cuộn xoắn chặt như trong xoắn α. Khoảng cách giữa hai gốc amino acid kề nhau là 3,5 Å.
- Liên kết hydro được hình thành giữa các nhóm –NH- và –CO- trên hai chuỗi polypeptide khác nhau, có thể chạy cùng hướng hoặc ngược hướng với nhau.
- Trong nhiều protein hình cầu, cấu trúc 'quay-β' xuất hiện, trong đó chuỗi polypeptide bị đảo hướng đột ngột do liên kết hydro giữa nhóm –CO của liên kết peptide thứ n với nhóm –NH của liên kết peptide thứ n+2.
Cấu trúc 'xoắn collagen': Cấu trúc này đặc trưng cho phân tử collagen. Thành phần amino acid của collagen có sự khác biệt rõ rệt so với các protein khác: glycin chiếm 35% và prolin chiếm 12% tổng số amino acid. Collagen cũng chứa hai loại amino acid hiếm gặp là hydroxiproline và hydroxylizin. Đơn vị cấu trúc của collagen là tropocollagen, bao gồm ba chuỗi polypeptide quấn chặt vào nhau thành một 'dây cáp' siêu xoắn, với mỗi chuỗi có cấu trúc xoắn. Ba chuỗi polypeptide trong 'dây cáp' liên kết với nhau bằng các liên kết hydro.
Các liên kết hydro trong collagen được hình thành giữa nhóm –NH- của gốc glycin trên một chuỗi polypeptide với nhóm -CO- của liên kết peptide trên chuỗi polypeptide khác. Thêm vào đó, các nhóm hydroxyl của hydroxiproline cũng tham gia vào việc tạo liên kết hydro, làm tăng độ bền của cấu trúc siêu xoắn.
Ngoài các kiểu cấu trúc bậc II đã đề cập, nhiều protein hình cầu còn có những đoạn mạch không thuộc cấu trúc xoắn, phần vô định hoặc cuộn lộn xộn.
Cấu trúc bậc ba: Liên kết disulfid (-S-S-)
Cấu trúc bậc ba được củng cố bởi các cầu disulfide, tương tác Van der Waals, liên kết hydro và lực ion. Khi những liên kết này bị phá vỡ, phân tử sẽ duỗi ra và dẫn đến sự thay đổi trong tính chất của nó, đặc biệt là tính tan và hoạt tính xúc tác.
Cấu trúc bậc ba là dạng không gian của cấu trúc bậc hai, làm cho phân tử protein có hình dạng gọn gàng hơn trong không gian. Sự thu gọn này giúp phân tử protein duy trì sự ổn định trong môi trường sống. Cấu trúc bậc ba chủ yếu dựa vào liên kết disulfide, được hình thành giữa hai phân tử cysteine nằm xa nhau trên chuỗi peptide nhưng gần nhau trong cấu trúc không gian nhờ sự cuộn lại của chuỗi peptide. Đây là liên kết đồng hóa trị nên rất bền.
Cấu trúc bậc ba tạo ra trung tâm hoạt động cho hầu hết các loại enzym. Sự thay đổi trong cấu trúc bậc ba có thể làm thay đổi hướng xúc tác của enzym hoặc làm mất hoàn toàn khả năng xúc tác.
Ngoài liên kết disulfide, cấu trúc bậc ba còn được duy trì (bền vững) nhờ một số loại liên kết khác như:
- Liên kết hydro: liên kết này xuất hiện khi hai nhóm tích điện âm có nguyên tử hydro liên kết với nhau.
Một ví dụ về cấu trúc bậc ba là phân tử insulin, một polypeptide gồm 51 amino acid với chuỗi A có 21 gốc amino acid và chuỗi B có 30 gốc amino acid. Hai chuỗi này liên kết với nhau qua hai cầu disulfide: cầu thứ nhất nối gốc cysteine ở vị trí 20 của chuỗi A với vị trí 19 của chuỗi B, và cầu thứ hai nối gốc cysteine ở vị trí thứ 7 của cả hai chuỗi. Trong chuỗi A còn có một cầu disulfide giữa hai gốc cysteine ở vị trí 6 và 11. Insulin là hormone tuyến tụy giúp điều chỉnh lượng đường trong máu. Thiếu insulin dẫn đến tăng đường huyết, gây bệnh đái tháo đường, và insulin giúp hạ đường huyết bằng cách thúc đẩy tổng hợp glycogen từ glucose.
- Lực Van der Waals: là lực hút giữa hai chất hoặc hai nhóm hóa học nằm gần nhau, ở khoảng cách từ 1 đến 2 lần đường kính phân tử.
Lực liên kết giữa các nhóm kỵ nước, chẳng hạn như nhóm không phân cực (-CH2; -CH3) trong valine, leucine, isoleucine, phenylalanine... Nước trong tế bào đẩy các gốc này lại gần nhau, tạo ra lực hút tương hỗ và hình thành các đuôi kỵ nước trong phân tử protein. Nhờ cấu trúc bậc ba, protein có hình dạng đặc trưng và phù hợp với chức năng của chúng. Trong các protein chức năng như enzyme và kháng thể, hoặc protein trong hệ thống đông máu, cấu trúc bậc ba tạo ra các trung tâm hoạt động để thực hiện các chức năng của protein.
Domain cấu trúc (Structural domain) đã được nghiên cứu từ năm 1976, và hiện tại người ta cho rằng sự hình thành domain là rất phổ biến ở các chuỗi peptide dài. Domain cấu trúc có thể được định nghĩa là các phần của phân tử protein được cuộn gấp trong không gian như một phân tử protein nhỏ hoàn chỉnh và thường là nơi thực hiện các chức năng liên kết và lắp ráp của phân tử protein trong quá trình hoạt động của nó. Trong nhiều protein, domain liên kết với chức năng đặc hiệu và ở nhiều enzyme, các trung tâm hoạt động thường nằm ở biên giới của hai hoặc nhiều domain. Sự hình thành các domain tạo ra khả năng tương tác linh hoạt giữa các đại phân tử và sự cơ động trong quá trình thực hiện chức năng sinh học. Các protein có nguồn gốc khác nhau nhưng chức năng tương tự thường có domain với cấu trúc tương đối giống nhau.
Cấu trúc bậc bốn: Tổ hợp các tiểu phần
Các phân tử protein với cấu trúc bậc IV có khả năng phân ly thuận nghịch thành các tiểu phần đơn lẻ. Khi phân ly, hoạt tính sinh học của chúng có thể bị thay đổi hoặc thậm chí mất hoàn toàn. Sự tồn tại của các tương tác giữa các tiểu phần đơn vị nghĩa là khi kết hợp với một phân tử nào đó, dù là nhỏ, cũng sẽ gây ra những biến đổi trong cấu trúc không gian của chúng.
Đây là trạng thái tổ hợp được hình thành từ nhiều tiểu phần protein đã đạt cấu trúc bậc ba hoàn chỉnh. Một số protein có xu hướng kết hợp với nhau để tạo thành các phức hợp lớn hơn mà không làm thay đổi hoạt tính sinh học của chúng.
Nhiều protein cần phải tổ hợp lại mới có hoạt tính sinh học. Trong những trường hợp này, cấu trúc bậc bốn là yếu tố quyết định để protein có thể thực hiện các chức năng mới.
Ví dụ về cấu trúc bậc bốn:
- Hemoglobin (huyết sắc tố) bao gồm 4 tiểu phần protein: hai tiểu phần α và hai tiểu phần β. Nếu các tiểu phần tách rời nhau, mỗi tiểu phần không thể vận chuyển oxy. Khi các tiểu phần kết hợp lại thành trạng thái tetramer gần như hình tứ diện, chúng mới có khả năng gắn kết và vận chuyển oxy. Một phân tử hemoglobin có khả năng vận chuyển 4 phân tử oxy.
- Enzyme glycogen phosphorylase (ở cơ và gan) xúc tác quá trình phân giải glycogen thành glucose.
- Ở trạng thái không hoạt động, enzyme này tồn tại dưới dạng 'b' (hai dimer tách rời).
- Ở trạng thái hoạt động (khi có tín hiệu cần glucose), hai dimer kết hợp thành tetramer (dạng 'a'). Khi nhu cầu giải phóng glucose giảm, tetramer lại phân ly thành hai dimer, enzyme trở lại dạng không hoạt động.
Số lượng monomer trong một phân tử protein có thể dao động từ 2 đến 8, với 4 và 6 là những con số phổ biến nhất, tuy nhiên, cũng có thể lên đến hơn 50 monomer trong những trường hợp đặc biệt.
Sự hình thành cấu trúc bậc bốn giúp tinh chỉnh và chính xác hóa quá trình điều tiết sinh học, tạo điều kiện cho các chức năng sinh học trở nên phức tạp và hiệu quả hơn.