Nhân đôi DNA (chữ Anh: DNA replication), hoặc gọi Phục chế DNA, Sao in DNA, là quá trình trong đó một tế bào tạo ra các bản sao chính xác của phân tử DNA của chính nó.[1][2][3][4] Quá trình này diễn ra ở mọi sinh vật và đóng vai trò thiết yếu trong việc duy trì di truyền sinh học, phân chia tế bào, cũng như chỉnh sửa các mô bị tổn thương. Nhờ có nhân đôi DNA, mỗi tế bào con được hình thành sau khi phân chia đều nhận được một bản sao hoàn chỉnh của toàn bộ vật chất di truyền.[5] Ở tế bào nhân thực, nhân đôi DNA diễn ra trong nhân tế bào, ngoài ra còn có thể xảy ra trong ti thể và lục lạp. Còn ở tế bào nhân sơ, quá trình này diễn ra trong bào tương.
DNA trong tự nhiên thường tồn tại ở dạng chuỗi đôi, gồm hai mạch bổ sung được giữ với nhau nhờ liên kết hydro giữa các cặp base nucleotide của từng nucleotide tương ứng. Hai mạch thẳng song song của phân tử DNA chuỗi đôi này thường xoắn quanh nhau tạo thành cấu trúc xoắn kép đặc trưng.[6] Trong quá trình nhân đôi, hai mạch của DNA tách rời nhau, và mỗi mạch đơn của DNA ban đầu sẽ đóng vai trò khuôn mẫu để tổng hợp nên một mạch bổ sung mới. Quá trình này được gọi là nhân đôi bán bảo tồn, bởi vì mỗi phân tử DNA con được tạo ra sẽ bao gồm một mạch cũ (từ phân tử mẹ) và một mạch mới được tổng hợp.[7] Các cơ chế kiểm tra và hiệu chỉnh lỗi trong tế bào bảo đảm cho quá trình sao chép DNA đạt độ chính xác gần như tuyệt đối.[8][9]
DNA nhân đôi lấy phân tử DNA mẹ làm khuôn mẫu, dùng deoxyribonucleoside triphosphate (dNTP) làm nguyên liệu, và cần sự tham gia của nhiều enzyme và yếu tố protein khác nhau, như: enzyme DNA polymerase (enzyme xúc tác tổng hợp DNA mạch mới), enzyme DNA primase (enzyme tổng hợp RNA primer), enzyme DNA ligase (enzyme khâu nối các đoạn DNA rời rạc), enzyme exonuclease (enzyme cắt bỏ nucleotide ở đầu chuỗi), enzyme topoisomerase (enzyme tháo xoắn DNA) và primosome (phức hợp khởi đầu tổng hợp).
Trong quá trình nhân đôi, hai mạch của DNA mẹ tách ra, mỗi mạch đóng vai trò làm khuôn để tổng hợp một mạch bổ sung mới theo nguyên tắc bổ sung A-T, G-C, từ đó hình thành hai phân tử DNA con giống hệt nhau. Nói cách khác, sự nhân đôi của DNA chính là sự nhân đôi của bộ gen, đóng vai trò nòng cốt cho sự tồn tại và tiến hoá của sự sống, bảo đảm tính ổn định và trung thực của thông tin di truyền qua các thế hệ tế bào.
Về cơ chế, quá trình nhân đôi DNA gồm ba giai đoạn: khởi đầu, kéo dài và kết thúc. Tại điểm khởi đầu sao chép, enzyme helicase tháo xoắn phân tử DNA chuỗi đôi, tạo ra các mạch đơn làm khuôn. Sau đó, từ đầu 3′-OH của RNA primer, enzyme DNA polymerase sẽ gắn các nucleotide mới theo chiều 5′→3′, liên tục kéo dài chuỗi và hình thành một mạch DNA hoàn chỉnh thông qua liên kết cộng hoá trị giữa các nucleotide.
Nhân đôi DNA thường bắt đầu tại những vị trí đặc định trên bộ gen được gọi là điểm khởi đầu sao chép.[10][11] Khi DNA được tháo xoắn tại các điểm này nhờ hoạt động của enzyme helicase, nĩa sao chép sẽ hình thành và mở rộng theo hai hướng ngược chiều nhau tính từ điểm khởi đầu. Nhiều protein chuyên biệt liên kết tại nĩa sao chép để hỗ trợ khởi động và duy trì quá trình tổng hợp DNA. Trong số đó, enzyme DNA polymerase đóng vai trò chủ đạo, có nhiệm vụ tổng hợp mạch mới bằng cách gắn kết các nucleotide tự do theo nguyên tắc bổ sung với nucleotide của mạch khuôn. Quá trình này diễn ra trong pha S (pha tổng hợp) của kì trung gian trong chu kì tế bào.[12]
Nhân đôi DNA cũng có thể được thực hiện trong điều kiện nhân tạo (in vitro), tức là bên ngoài tế bào.[13] Trong các thí nghiệm sinh học phân tử, enzyme DNA polymerase được tách chiết từ tế bào và các primer nhân tạo được sử dụng để khởi đầu tổng hợp DNA tại những vị trí có trình tự đã biết trên phân tử khuôn. Một số kĩ thuật phổ biến dựa trên nguyên tắc này gồm có phản ứng chuỗi polymerase (PCR), phản ứng chuỗi ligase (LCR) và khuếch đại qua trung gian phiên mã (TMA). Đáng chú ý, vào tháng 3 năm 2021, các nhà khoa học đã báo cáo bằng chứng cho thấy dạng sơ khai của RNA vận chuyển — vốn là thành phần thiết yếu trong quá trình dịch mã, tức tổng hợp protein theo mã di truyền — có thể từng đóng vai trò như một phân tử tự sao chép trong giai đoạn hình thành sự sống nguyên thuỷ ban đầu.[14][15] Phát hiện này góp phần mở rộng hiểu biết của nhân loại về nguồn gốc và tiến hoá sớm của sự sống trên Trái Đất.
Nhân đôi DNA mang ba đặc trưng cơ bản:
- Bán bảo tồn - mỗi DNA con gồm một mạch cũ và một mạch mới.
- Hai chiều - quá trình tổng hợp diễn ra theo hai hướng từ điểm khởi đầu.
- Bán gián đoạn - một mạch tổng hợp liên tục (mạch dẫn), mạch kia tổng hợp gián đoạn qua các đoạn ngắn Okazaki (mạch chậm).
Năm 1953, James Watson và Francis Crick đã đề xuất mô hình xoắn kép của DNA, mở đường cho sự hiểu biết hiện đại về di truyền học. Đến 1958, thí nghiệm Meselson-Stahl với đồng vị nitrogen đã chứng minh cơ chế nhân đôi bán bảo tồn của DNA, một trong những phát hiện kinh điển trong sinh học phân tử.
Về ý nghĩa sinh học, nhân đôi DNA là nền tảng cho sự di truyền và ổn định của thông tin di truyền, là “gốc rễ của sự sống” và “cội nguồn của tiến hoá”. Nhờ nghiên cứu cơ chế nhân đôi DNA, con người hiểu rõ hơn vai trò của quá trình này trong bệnh lí học, từ đó đưa ra các phương hướng chẩn đoán, điều trị và phòng ngừa bệnh tật. Ví dụ, lỗi trong quá trình nhân đôi DNA có thể gây đột biến gen, dẫn đến các bệnh di truyền như: Hội chứng Down (tam thể 21), điếc bẩm sinh, mù màu, bệnh máu khó đông hay bạch tạng.
Năm 1865, Gregor Mendel thông qua các thí nghiệm trên cây đậu Hà Lan đã khám phá ra định luật phân li gen và định luật tổ hợp tự do gen trong di truyền học - những nguyên lí đặt nền móng cho ngành di truyền học hiện đại. Khái niệm “nhân tố di truyền” mà ông đề cập chính là “gen” sau này.
Năm 1928, Frederick Griffith (1879-1941), nhà sinh học người Anh, thông qua thí nghiệm chuyển hoá ở phổi chuột bằng phế cầu khuẩn, đã phát hiện rằng trong tế bào phế cầu khuẩn có tồn tại một “nhân tố chuyển hoá” có khả năng biến đổi một chủng vi khuẩn không gây bệnh thành chủng gây bệnh.
Năm 1944, ba nhà vi sinh học người Mỹ là Oswald Avery (1877-1955), Colin MacLeod (1909-1972) và Maclyn McCarty (1911-2005) đã tiến hành thí nghiệm chuyển hoá in vitro (trong ống nghiệm) đối với phế cầu khuẩn, bằng cách kiểm soát chặt chẽ các biến số. Kết quả cho thấy DNA chính là yếu tố quyết định trong thí nghiệm chuyển hoá của Griffith, qua đó chứng minh DNA là vật chất di truyền có hoạt tính sinh học.
Tuy nhiên, kết quả của Avery ban đầu bị hoài nghi, do thí nghiệm của ông khó loại trừ hoàn toàn sự hiện diện của một lượng nhỏ tạp chất protein. Hơn nữa, vào thời điểm đó, giới khoa học vẫn tin rằng protein, với cấu trúc phức tạp và đa dạng hơn, mới là vật chất di truyền. Vì thế, phát hiện của Avery không được công nhận rộng rãi ngay lúc bấy giờ.
Đến năm 1952, hai nhà khoa học Alfred Hershey (1908-1997) và Martha Chase (1927-2003) đã tiến hành thí nghiệm đánh dấu đồng vị phóng xạ trên phage T2, chứng minh rằng chính DNA - chứ không phải protein - là vật chất di truyền. Từ đó, vai trò trung tâm của DNA trong việc mang thông tin di truyền được cộng đồng khoa học thừa nhận hoàn toàn.
Ngày 25 tháng 4 năm 1953, James Watson và Francis Crick công bố trên tạp chí Nature mô hình cấu trúc xoắn kép của DNA, đồng thời Rosalind Franklin và Maurice Wilkins thông qua nhiễu xạ tia X (en) đã chứng minh bản chất xoắn của DNA. Watson và Crick chỉ ra rằng trong mô hình xoắn kép của DNA, các base nucleotide (A, T, C, G) quay vào trong, còn khung phosphate - đường deoxyribose quay ra ngoài; A liên kết với T, C liên kết với G thông qua liên kết hydro, và DNA nhân đôi theo cơ chế bán bảo tồn. Phát hiện này được xem là bước ngoặt mang tính cách mạng trong lịch sử di truyền học, giúp Watson, Crick và Wilkins cùng được trao Giải Nobel Sinh lí học hoặc Y học năm 1962.
Năm 1956, Arthur Kornberg (1908-2007) sử dụng hệ thống chiết xuất từ vi khuẩn không có tế bào sống để chứng minh DNA có thể tự tổng hợp và tự sao chép. Sau đó, ông tiếp tục phát hiện rằng quá trình gắn kết các tiền chất của DNA đòi hỏi một loại enzyme chuyên biệt - DNA polymerase, và chứng minh DNA chính là khuôn mẫu trực tiếp cho việc tổng hợp chính nó.
Năm 1958, Matthew Meselson (1930-) và Frank Stahl (1929-) thực hiện thí nghiệm li tâm gradient - mật độ sử dụng đồng vị nitrogen 15N và 14N, qua đó chứng minh ở cấp độ phân tử rằng DNA nhân đôi theo cơ chế bán bảo tồn - mỗi phân tử DNA con gồm một mạch gốc và một mạch mới được tổng hợp.
Đến năm 1968, hai nhà khoa học Nhật Bản Reiji Okazaki và Tsuneko Okazaki sử dụng kĩ thuật đánh dấu đồng vị đã phát hiện các đoạn DNA ngắn chỉ dài khoảng 1.000-2.000 nucleotide, sau này gọi là “đoạn ngắn Okazaki”, đồng thời đề xuất mô hình sao chép bán gián đoạn cho mạch chậm trong quá trình nhân đôi DNA.
Từ thập niên 1970 đến nay, các hệ thống enzyme sao chép DNA đã được phân tích và làm sáng tỏ. Các nhà khoa học lần lượt xác định được chức năng của những enzyme chủ chốt như DNA polymerase (enzym xúc tác tổng hợp DNA chuỗi mới), helicase (enzym tháo xoắn DNA) và topoisomerase (enzym giải toả ứng suất xoắn), mở ra thời kì hiện đại của nghiên cứu cơ chế nhân đôi DNA trong sinh học phân tử.
DNA là một phân tử hai mạch, trong đó hai chuỗi xoắn lại với nhau tạo thành cấu trúc xoắn kép đặc trưng. Mỗi mạch đơn của DNA là một chuỗi các nucleotide — gồm bốn loại khác nhau. Mỗi nucleotide trong DNA được cấu tạo bởi ba thành phần chính: Đường deoxyribose (một loại đường năm carbon), nhóm phosphate và nucleobase. Bốn loại nucleotide tương ứng với bốn loại nucleobase cơ bản trong DNA: Adenine (A), cytosine (C), guanine (G) và thymine (T). Trong đó, adenine (A) và guanine (G) thuộc nhóm purine (có hai vòng nitrogen-carbon), còn cytosine (C) và thymine (T) thuộc nhóm pyrimidine (chỉ có một vòng). Các nucleotide nối liền với nhau bằng liên kết phosphodiester, hình thành nên khung xương phosphate-deoxyribose của DNA chuỗi xoắn đôi, trong khi các base nucleotide quay vào bên trong, hướng về phía chuỗi đối diện. Giữa hai mạch DNA, các base bổ sung bắt cặp với nhau thông qua liên kết hydro để tạo thành cặp base: Adenine (A) bắt cặp với Thymine (T) qua hai liên kết hydro, Guanine (G) bắt cặp với Cytosine (C) qua ba liên kết hydro.[16]
Mỗi chuỗi DNA đều có tính định hướng, với hai đầu được gọi là đầu 3′ và đầu 5′. Theo quy ước quốc tế, khi viết trình tự base, đầu 5′ nằm bên trái, còn đầu 3′ nằm bên phải. Hai mạch của chuỗi xoắn đôi song song ngược chiều với nhau: Một mạch chạy theo hướng 5′→3′, mạch đối diện chạy theo hướng 3′→5′. Cách gọi 5′ và 3′ dựa trên thứ tự đánh số nguyên tử carbon trong phân tử deoxyribose, và chỉ ra nguyên tử carbon nào liên kết với nhóm phosphate của nucleotide kế tiếp. Tính định hướng này mang ý nghĩa sinh học quan trọng, bởi enzyme DNA polymerase chỉ có thể tổng hợp DNA theo một chiều duy nhất — từ đầu 5′ về đầu 3′, tức là thêm nucleotide mới vào nhóm hydroxyl (-OH) tại carbon số 3.[17]
Việc bắt cặp base bổ sung thông qua liên kết hydro khiến thông tin di truyền trong mỗi mạch mang tính dư thừa — nghĩa là chỉ cần một mạch, người ta vẫn có thể tái tạo chính xác mạch còn lại. Tuy nhiên, liên kết phosphodiester (nội mạch) mạnh hơn nhiều so với liên kết hydro (liên mạch). Liên kết phosphodiester có vai trò kết nối nguyên tử carbon số 5 của một nucleotide với nguyên tử carbon số 3 của nucleotide kế tiếp, tạo nên bộ khung vững chắc của mạch DNA. Liên kết hydro, ngược lại, chỉ có nhiệm vụ giữ ổn định hai mạch DNA với nhau theo trục xoắn, nhưng không ngăn cản việc tách đôi hai mạch khi cần, chẳng hạn như trong quá trình nhân đôi hoặc phiên mã.[18] Chính đặc tính này giúp cho mỗi mạch đơn có thể được sử dụng làm khuôn mẫu để tổng hợp mạch bổ sung mới, đảm bảo sự chính xác và ổn định của quá trình sao chép di truyền trong mọi sinh vật sống.[19]
Deoxyribonucleoside triphosphate, viết tắt dNTP, là tên gọi chung của các hợp chất dATP, dGTP, dTTP và dCTP, trong đó N biểu thị cho base nitrogen (A, T, G, hoặc C). Các dNTP đóng vai trò nguyên liệu cơ bản trong quá trình tổng hợp DNA của sinh vật và trong các phản ứng PCR, bao gồm RT-PCR và Real-time PCR.
Mỗi dNTP gồm ba thành phần chính: Một nhóm phosphate, một đường deoxyribose và một base nitrogen.
Có bốn loại dNTP, được chia thành hai nhóm cấu trúc:
- Nhóm purine: dATP (deoxyadenosine-5'-triphosphate) và dGTP (deoxyguanosine-5'-triphosphate). Base purine gồm adenine (A) và guanine (G), đều có cấu trúc hai vòng.
- Nhóm pyrimidine: dTTP (deoxythymidine-5'-triphosphate) và dCTP (deoxycytidine-5'-triphosphate). Base pyrimidine gồm thymine (T) và cytosine (C), đều có cấu trúc một vòng.
dNTP là đơn vị cấu thành nên DNA. Nếu tưởng tượng DNA như một cái thang xoắn kép, thì: Hai bên thành thang là khung xương đường - phosphate — hình thành do sự xen kẽ của nhóm phosphate và đường deoxyribose; các bậc thang là các cặp base được liên kết bằng liên kết hydro. Hai chuỗi DNA song song ngược chiều được giữ với nhau nhờ liên kết hydro giữa các base bổ sung: A liên kết với T qua 2 liên kết hydro; G liên kết với C qua 3 liên kết hydro. Nguyên tắc bổ sung này do Erwin Chargaff (en) phát hiện. Ông chứng minh rằng: Tỉ lệ phần trăm A luôn bằng T, và G luôn bằng C. Tổng (A + T) + (G + C) = 100%. Phát hiện này là nền tảng giúp Watson, Crick, Franklin và Wilkins xác lập mô hình xoắn kép DNA.
Do G-C có ba liên kết hydro (vững chắc hơn) trong khi A-T chỉ có hai, nên DNA giàu G-C bền vững hơn DNA giàu A-T. Vì vậy, cần nhiệt năng cao hơn để phá vỡ liên kết và làm biến tính (en) DNA chứa nhiều G-C. Nguyên nhân là nguyên tử carbon số 2 trong adenine kém điện âm hơn, không tạo được điện tích âm đủ để hình thành thêm liên kết hydro với thymine.
Như đã trình bày ở trên, xương sống (khung chính) của phân tử DNA được hình thành từ sự luân phiên nối tiếp giữa các nhóm phosphate và các gốc đường deoxyribose. Giữa hai nucleotide liền kề nhau trên cùng một chuỗi DNA, tồn tại một liên kết hoá học đặc biệt gọi là liên kết phosphodiester. Liên kết này được hình thành khi nguyên tử carbon số 5′ hoặc số 3′ của phân tử đường deoxyribose liên kết với nguyên tử oxy trên nhóm phosphate của nucleotide kế tiếp. Quá trình tạo ra liên kết phosphodiester là một phản ứng ngưng tụ, trong đó một phân tử diphosphate (pyrophosphate) bị loại bỏ khỏi mỗi nucleotide tham gia phản ứng. Chính vì vậy, các nucleotide cấu thành nên DNA trong tự nhiên không còn là dạng triphosphate (dNTP), mà tồn tại dưới dạng monophosphate, được gọi là dNMPs (deoxyribonucleoside monophosphates - các đơn phân nucleotide chứa một nhóm phosphate).
dNTP được hoà tan trong dung dịch đệm NaOH pH = 7,0. Dung dịch gốc thường có nồng độ 10 mol/L, được chia nhỏ và bảo quản ở −20°C. Khi sử dụng, nồng độ làm việc thường nằm trong khoảng 20-200 μmol/L. Bốn loại dNTP phải được pha ở nồng độ bằng nhau để giảm sai lệch khi nhân đôi DNA.
Trong phản ứng PCR, việc sử dụng nồng độ dNTP thấp giúp: Giảm sai sót khi enzyme khởi đầu hoặc kéo dài ở vị trí phi đích; tăng độ chính xác của khuếch đại DNA. Ví dụ: Trong hệ phản ứng 100 μL, nếu dùng 4 loại dNTP với nồng độ 20 μmol/L, có thể tổng hợp được khoảng 2,6 μg DNA, tương đương với 10 pmol/L của trình tự dài 400 bp.
DNA polymerase là một họ enzyme đảm nhiệm mọi hình thức sao chép DNA. Nhìn chung, các enzyme DNA polymerase không thể khởi đầu quá trình tổng hợp mạch mới mà chỉ có thể kéo dài một mạch DNA hoặc RNA đã có sẵn, vốn đã được bắt cặp với mạch khuôn. Để bắt đầu quá trình tổng hợp, cần hình thành và ghép vào mạch DNA khuôn một đoạn RNA ngắn gọi là primer.
DNA polymerase kéo dài mạch DNA mới bằng cách mở rộng đầu 3′ của chuỗi nucleotide hiện có, gắn thêm từng nucleotide mới tương ứng với mạch khuôn, thông qua liên kết phosphodiester. Năng lượng cho quá trình trùng hợp DNA này đến từ phản ứng thuỷ phân các liên kết phosphoanhydride có năng lượng cao giữa ba nhóm phosphate gắn với mỗi base tự do chưa được gắn vào chuỗi. Các base tự do gắn với phân tử đường deoxyribose được gọi là nucleoside, và khi chúng gắn thêm một hoặc nhiều nhóm phosphate, chúng trở thành nucleotide; riêng nucleoside có ba nhóm phosphate được gọi là nucleoside triphosphate. Khi một nucleotide tự do được thêm vào chuỗi DNA đang kéo dài, liên kết phosphodiester hình thành giữa nhóm phosphate gần nhất của nucleotide tự do với phân tử deoxyribose của nucleotide trong chuỗi, đồng thời hai nhóm phosphate xa được giải phóng ra dưới dạng pyrophosphate. Quá trình thuỷ phân pyrophosphate thành phosphate vô cơ tiếp tục tiêu thụ thêm một liên kết phosphate năng lượng cao nữa, khiến phản ứng trở nên gần như không thể đảo ngược.
Nhìn chung, enzyme DNA polymerase có độ chính xác rất cao, với tỉ lệ sai sót nội tại nhỏ hơn 1 lỗi trên 107 nucleotide được thêm vào. Một số DNA polymerase còn có khả năng loại bỏ nucleotide ở đầu mạch đang phát triển nhằm sửa chữa các base ghép sai — cơ chế này gọi là hiệu chính. Sau cùng, các cơ chế sửa sai sau sao chép sẽ tiếp tục giám sát và phát hiện lỗi trong DNA, có thể phân biệt được mạch DNA mới tổng hợp với mạch khuôn gốc. Tổng hợp cả ba bước kiểm soát này giúp quá trình sao chép DNA đạt độ chính xác cực cao, với tỉ lệ lỗi dưới 1 sai sót trên 109 nucleotide.
Tốc độ sao chép DNA trong tế bào sống lần đầu tiên được đo khi quan sát tốc độ kéo dài DNA của phage T4 trong tế bào E. coli bị nhiễm phage. Trong giai đoạn tăng sinh DNA theo cấp số nhân ở nhiệt độ 37 °C, tốc độ này đạt 749 nucleotide mỗi giây. Tỉ lệ đột biến trên mỗi cặp base và mỗi lần sao chép trong quá trình tổng hợp DNA của phage T4 là 1,7 trên 108.
Nhân đôi DNA tồn tại ở sinh vật nhân sơ, sinh vật nhân thật và virus. Quá trình nhân đôi DNA ở cả ba nhóm này đều bao gồm ba giai đoạn chủ yếu: Khởi đầu, kéo dài và kết thúc. Dưới đây là mô tả chi tiết từng nhóm sinh vật.
Ở sinh vật nhân sơ (như Escherichia coli), quá trình nhân đôi DNA bắt đầu bằng sự hình thành primosome (en) - đây là dấu hiệu đánh dấu thời điểm bắt đầu nhân đôi DNA. Cấu trúc siêu xoắn tại vị trí khởi đầu sao chép được enzyme topoisomerase và helicase phối hợp tháo xoắn, làm cho chuỗi xoắn đôi DNA mở ra thành hai khuôn mẫu chuỗi đơn. Các chuỗi đơn này sau đó được protein liên kết DNA chuỗi đơn (SSB, en) bao phủ để ổn định và hình thành nĩa sao chép. Trên cơ sở đó, với sự tham gia của nhiều yếu tố protein như DnaA, DnaB, DnaC, enzyme primase nhận biết vị trí khởi đầu sao chép và lắp ráp thành primosome. Sau đó, DNA chuỗi đơn vừa được tách ra làm khuôn mẫu, và sử dụng nucleotide triphosphate (NTP) làm chất nền, enzyme primase xúc tác tổng hợp RNA primer một đoạn ngắn theo chiều 5′→3′, dài từ vài chục nucleotide. Đầu 3′-OH của RNA primer này cung cấp điểm khởi đầu cho DNA polymerase tiến hành kéo dài chuỗi mới. Vùng khởi đầu sao chép của DNA ở E. coli dài khoảng 245 cặp base, gồm ba cụm trình tự lặp lại liên tiếp (vùng nhận biết) và hai cặp trình tự lặp lại đảo ngược nhau (vùng giàu AT).
Sau khi primosome được hình thành và RNA primer được tổng hợp, quá trình kéo dài chuỗi DNA bắt đầu. Quá trình kéo dài chuỗi DNA là phản ứng trong đó nhóm α-phosphat của chất nền dNTP, dưới sự xúc tác của enzyme DNA polymerase, phản ứng với đầu 3′-OH của RNA primer. Sau khi phản ứng xảy ra, nucleotide vừa được thêm vào chuỗi sẽ mất hai nhóm phosphate ngoài (β và γ), chỉ còn lại một nhóm phosphate (α), và do đó trở thành dNMP. Lúc này, đầu 3′-OH của dNMP mới được gắn vào, trở thành đầu 3′ tự do của chuỗi, sẵn sàng phản ứng với phân tử dNTP kế tiếp để tiếp tục hình thành liên kết phosphodiester 3′,5′. Chiều tổng hợp của chuỗi mới (daughter) luôn diễn ra theo hướng 5′ → 3′. Chuỗi dẫn đầu (leading) được kéo dài liên tục theo hướng 5′ → 3′, trong khi chuỗi theo sau (lagging) được kéo dài không liên tục theo cùng hướng 5′ → 3′.
Trong quá trình kéo dài này, hai chuỗi đơn của DNA khuôn (được tách ra từ DNA xoắn kép ban đầu) đóng vai trò làm khuôn mẫu cho việc tổng hợp hai mạch bổ sung mới, theo nguyên tắc bổ sung giữa các base nucleotide (A liên kết với T, G liên kết với C), từ đó tạo ra hai phân tử DNA con dạng xoắn kép giống hệt nhau. Tại cùng một nĩa sao chép, cả hai mạch được tổng hợp dưới sự xúc tác của enzyme DNA polymerase III. Chuỗi dẫn đầu tiến hành kéo dài liên tục, còn chuỗi theo sau phải liên tục tổng hợp các RNA primer và đoạn ngắn Okazaki để tạo thành một chuỗi hoàn chỉnh theo cách phân đoạn và không liên tục. Trong suốt quá trình nhân đôi DNA, chuỗi dẫn đầu luôn được tổng hợp trước chuỗi theo sau.
Giai đoạn kết thúc của nhân đôi DNA bao gồm: Loại bỏ RNA primer, lấp đầy các khoảng trống còn lại sau khi primer bị thuỷ phân và nối liền các đoạn DNA. Vì chuỗi dẫn đầu được tổng hợp liên tục, còn chuỗi theo sau là tổng hợp không liên tục, nên quá trình này đòi hỏi enzyme DNA polymerase II tham gia chủ yếu. Khi đầu 3′-OH của đoạn ngắn Okazaki trước kéo dài đến sát đầu 5′-phosphate của đoạn ngắn Okazaki sau, enzyme DNA ligase xúc tác hình thành liên kết phosphodiester 3′-5′ giữa hai đầu đó, nối liền các đoạn rời rạc thành một chuỗi DNA liên tục.
Cơ chế nhân đôi DNA ở sinh vật nhân thực nhìn chung tương tự sinh vật nhân sơ, nhưng do hàm lượng DNA lớn, cấu trúc nucleosome, telomere và nhiều đặc điểm siêu cấu trúc, nên quá trình sao chép phức tạp hơn nhiều.
Sự khởi đầu nhân đôi DNA ở sinh vật nhân thực cũng chủ yếu bao gồm các bước: Xác định vị trí khởi đầu, tháo xoắn kép, hình thành primosome và tổng hợp RNA primer. Tuy nhiên, cơ chế phân tử chi tiết vẫn chưa được làm sáng tỏ hoàn toàn.
Quá trình này diễn ra theo hai bước: Chọn trình tự tự nhân đôi (ARS, en) và kích hoạt điểm khởi đầu nhân đôi. Đầu tiên, trong pha G1, phức hợp nhận biết điểm khởi đầu (ORC, en) gồm 6 protein, nhận biết và gắn vào ARS. Protein Cdc6 - một loại protein không bền chỉ được tổng hợp trong pha G1 - gắn với ORC, cho phép phức hợp Mcm2-7 (en) bao quanh DNA, hình thành phức hợp tiền nhân đôi (pre-RC) gồm ORC, Cdc6 và MCM. Tuy nhiên, pre-RC không thể khởi động sao chép trong pha G1, mà chỉ được kích hoạt trong pha S khi enzyme cyclin-dependent kinase (CDK, en) phosphoryl hoá các thành phần của nó. Khi nhân đôi bắt đầu, các protein Cdc6 và MCM bị thay thế, riêng Cdc6 bị phân giải nhanh chóng, nhằm ngăn chặn tái bắt đầu nhân đôi trên cùng một đoạn DNA.
Sau khi hình thành nĩa sao chép và tổng hợp primer, enzyme DNA polymerase δ (Pol δ), dưới sự hiệp đồng của protein PCNA (en), xúc tác tổng hợp liên tục chuỗi dẫn đầu từ đầu 3′-OH của RNA primer. Đoạn ngắn Okazaki cũng do enzyme DNA Pol δ xúc tác tổng hợp không liên tục. Các nghiên cứu cho thấy, chiều dài của mỗi đoạn ngắn Okazaki ở sinh vật nhân thực thường tương đương với kích thước của một nucleosome — khoảng 135 cặp base hoặc là bội số của nó. Khi chuỗi theo sau được tổng hợp đến kích thước tương đương một nucleosome, enzyme DNA Pol δ tách ra, và enzyme DNA Pol α sẽ tái khởi động tổng hợp primer mới, sau đó Pol δ lại tiếp tục xúc tác tổng hợp đoạn ngắn Okazaki kế tiếp. Một điểm khác biệt so với sinh vật nhân sơ là ở sinh vật nhân thực, primer trong quá trình nhân đôi có thể là RNA hoặc DNA, chứ không chỉ riêng RNA như ở vi khuẩn.
Trên thực tế, trong điều kiện sinh lí bình thường, đại đa số nhiễm sắc thể của sinh vật nhân thực vẫn có thể duy trì được độ dài vốn có của mình sau mỗi lần nhân đôi. Nguyên nhân là vì ở đầu tận cùng của nhiễm sắc thể tồn tại một cấu trúc đặc thù có chức năng bảo vệ và duy trì tính ổn định của chúng. Cấu trúc đặc thù này ở đầu mút của phân tử DNA dạng tuyến tính trong nhiễm sắc thể sinh vật nhân thực được gọi là telomere. Về mặt hình thái, telomere của nhiễm sắc thể có dạng phồng lên như hạt nhỏ, và khi DNA kết hợp chặt chẽ với các protein liên kết đặc hiệu, chúng cùng nhau tạo nên một cấu trúc giống như hai chiếc “mũ chụp” bảo vệ ở hai đầu nhiễm sắc thể, vì thế đôi khi người ta còn gọi đó là “mũ telomere”. Telomere có vai trò ngăn ngừa sự liên kết sai lệch giữa các đầu nhiễm sắc thể, đồng thời đền bù phần tkhoảng trống DNA ở đầu 5′ của mạch khi RNA primer bị loại bỏ sau quá trình nhân đôi. Nhờ vậy, telomere đóng vai trò vô cùng quan trọng trong việc duy trì tính ổn định của nhiễm sắc thể cũng như đảm bảo sự toàn vẹn của quá trình nhân đôi DNA. Cấu trúc của telomere gồm DNA và protein. Kết quả giải trình tự DNA cho thấy, vùng telomere có trình tự lặp lại giàu thymine (T) và guanine (G). Chẳng hạn, telomere ở người mang chuỗi lặp TTAGGG. Số lần lặp của trình tự lặp này có thể dao động từ vài chục đến vài nghìn lần, và các chuỗi lặp ấy có khả năng gấp khúc tạo thành những cấu trúc bậc hai ổn định, giúp tăng cường hơn nữa chức năng bảo vệ của telomere.
Virus DNA chuỗi đơn có thể được chia thành hai loại dựa trên thông tin di truyền mà chúng mang theo: DNA có nghĩa [(+)DNA] và DNA phản nghĩa [(-)DNA]. DNA có nghĩa [(+)DNA] là loại có trình tự nucleotide giống với mRNA, do đó không thể trực tiếp làm khuôn cho quá trình phiên mã. Để có thể tổng hợp mRNA, loại DNA này phải nhân đôi tạo ra một chuỗi DNA phản nghĩa [(-)DNA], và chính chuỗi phản nghĩa đó mới dùng làm khuôn mẫu cho quá trình phiên mã. Ngược lại, DNA phản nghĩa (-DNA) có trình tự bổ sung và ngược chiều với mRNA, vì vậy nó có thể trực tiếp được phiên mã để tổng hợp RNA. Ở nhóm parvovirus (en), quá trình tổng hợp chuỗi phản nghĩa và nhân đôi DNA đều diễn ra trong tế bào túc chủ. Virus mượn sự trợ giúp của các enzyme của tế bào túc chủ, bao gồm RNA polymerase và DNA polymerase, để đồng thời thực hiện cả phiên mã lẫn nhân đôi. Do đó, quá trình phiên mã và nhân đôi xảy ra gần như song song, giống như “một mũi tên trúng hai đích” trong hoạt động nhân đôi di truyền của virus. Bộ gen của parvovirus là (+)DNA, có trình tự đặc trưng từ 115 đến 300 nucleotide ở hai đầu, có khả năng tự gấp nếp và bắt cặp một phần với chính nó, hình thành nên cấu trúc “kẹp tóc”. Trong đó, đầu 3′ của cấu trúc kẹp tóc có thể đóng vai trò như primer để bắt đầu quá trình tổng hợp chuỗi DNA bổ sung. Sau đó, enzyme DNA ligase sẽ lấp đầy các khoảng trống, tạo nên phân tử DNA chuỗi đôi dạng vòng. Tiếp đó, các enzyme endonuclease đặc dị sẽ loại bỏ cấu trúc kẹp tóc, và trải qua một loạt bước phức tạp gồm tách chuỗi, nhân đôi và khâu nối, virus sẽ phục hồi các đoạn ngắn bị mất, kết quả là hình thành phân tử DNA chuỗi đôi dạng tuyến tính - chính là dạng DNA hoàn chỉnh của chúng.
Virus DNA chuỗi đôi (dsDNA, en) dựa trên hình dạng của bộ gen chia làm hai nhóm: DNA chuỗi đôi dạng vòng, ví dụ: Hepadnaviridae (virus viêm gan B); DNA chuỗi đôi tuyến tính, ví dụ: Adenoviridae, Herpesviridae. Virus DNA chuỗi đôi tuyến tính chia thành hai loại: Quá trình nhân đôi DNA trong nhân tế bào túc chủ; quá trình nhân đôi DNA hoàn toàn trong tế bào chất.
Ngay cả trong nhóm nhân đôi DNA trong nhân tế bào túc chủ, cơ chế cũng rất đa dạng:
- Adenovirus mang DNA chuỗi đôi có enzyme DNA polymerase riêng biệt, giúp tự tiến hành nhân đôi mà không cần hoàn toàn dựa vào enzyme của tế bào túc chủ.
- HBV nhân đôi DNA, phải thông qua enzyme DNA polymerase phiên mã ngược — tương tự như ở retrovirus — tức là DNA của virus được nhân đôi thông qua một giai đoạn trung gian RNA — đây là cơ chế lai tạp giữa virus DNA và retrovirus.
- Papillomavirus soạn mã một loại protein đặc định có khả năng kích hoạt DNA polymerase của tế bào túc chủ, nhờ đó thúc đẩy sự nhân đôi của bộ gen virus.
- Herpesvirus, mang DNA chuỗi đôi tuyến tính, có khả năng vòng hoá trong quá trình nhân đôi, hình thành một cấu trúc vòng khép kín giúp nhân đôi hiệu quả hơn.
- Simplexvirus (HSV) có ba điểm khởi đầu sao chép (Ori), trong khi cytomegalovirus (CMV) có thể có một hoặc nhiều Ori. Cả hai đều sử dụng cơ chế sao chép “vòng lăn” (en) — một phương thức nhân đôi liên tục, trong đó một chuỗi DNA được tổng hợp liên tiếp dựa trên khuôn của chuỗi kia, tương tự như một cuộn chỉ được kéo ra và quấn lại không ngừng.
Cấu trúc kẹp tóc hình thành ở hai đầu của DNA tuyến tính cũng đóng vai trò rất quan trọng, giúp ổn định đầu mút DNA và bảo đảm quá trình nhân đôi diễn ra chính xác.
Thông thường, trước khi quá trình nhân đôi DNA bắt đầu, bộ gen của những virus này sẽ được phiên mã sớm hơn, tạo ra các protein đặc định hoặc enzyme DNA polymerase cần thiết cho giai đoạn nhân đôi về sau. Sự phiên mã xảy ra trước nhân đôi DNA được gọi là phiên mã sớm — bước khởi đầu có tính quyết định, chuẩn bị toàn bộ bộ máy enzyme và năng lượng cho quá trình nhân đôi DNA. Sau khi DNA nhân đôi xong, một số gen khác mới được phiên mã — gọi là phiên mã muộn — để virus tổng hợp các protein cấu trúc (en) và lắp ráp virion thế hệ sau.
Dù là sinh vật nhân sơ hay sinh vật nhân thực, quá trình nhân đôi DNA đều tuân theo một số đặc điểm cơ bản sau đây:
- Nhân đôi bán bảo tồn
- Trong quá trình nhân đôi DNA, mỗi chuỗi đơn của phân tử DNA mẹ đóng vai trò khuôn mẫu, để tổng hợp nên hai phân tử DNA con chuỗi đôi. Mỗi phân tử DNA con đều chứa một chuỗi đơn của DNA mẹ và một chuỗi mới được tổng hợp. Hiện tượng này được gọi là nhân đôi bán bảo tồn.
- Mô hình xoắn kép (en) do nhà vật lí học người Mỹ James D. Watson và nhà sinh học người Anh Francis H. Crick đề xuất, đã đặt nền tảng lí thuyết vững chắc cho giả thuyết về cơ chế nhân đôi của DNA.
- Năm 1958, các nhà khoa học đã sử dụng phương pháp đánh dấu đồng vị kết hợp với phương pháp li tâm gradient mật độ Caesium chloride để chứng minh giả thuyết về nhân đôi bán bảo tồn của DNA là đúng đắn.
- Nhân đôi hai chiều
- Trong quá trình nhân đôi DNA, tại điểm khởi đầu nhân đôi, phân tử DNA xoắn kép được tách cục bộ thành hai chuỗi đơn riêng biệt. Mỗi chuỗi đơn đóng vai trò khuôn mẫu để tổng hợp nên chuỗi mới. Vùng mà hai chuỗi đơn được tách ra và vùng chưa tách vẫn ở dạng xoắn kép, tạo thành một cấu trúc hình chữ Y, gọi là nĩa sao chép.
- DNA luôn được tổng hợp bắt đầu từ điểm khởi đầu nhân đôi, hình thành hai nĩa sao chép di chuyển ngược chiều nhau. Phương thức nhân đôi này được gọi là nhân đôi hai chiều, giúp quá trình sao chép diễn ra nhanh và hiệu quả hơn.
- Nhân đôi bán gián đoạn
- Do hai chuỗi đôi trong cấu trúc xoắn kép của DNA có chiều ngược nhau — một chuỗi theo hướng 5' → 3', chuỗi còn lại theo hướng 3' → 5' — trong khi DNA polymerase chỉ có thể tổng hợp DNA theo hướng 5' → 3', nên quá trình tổng hợp xảy ra không đồng đều trên hai chuỗi.
- Chuỗi có chiều tổng hợp trùng với chiều tách xoắn được nhân đôi liên tục, gọi là chuỗi dẫn đầu.
- Chuỗi còn lại, có chiều tổng hợp ngược với chiều tách xoắn, không thể tổng hợp liên tục, mà chỉ được tổng hợp thành các đoạn ngắn rời rạc, nối tiếp nhau theo sau; những đoạn ngắn tổng hợp gián đoạn gọi là đoạn ngắn Okazaki; chuỗi này được gọi là chuỗi theo sau.
- Do sự khác biệt về hướng tổng hợp, chuỗi theo sau có tốc độ nhân đôi chậm hơn so với chuỗi dẫn đầu, nên quá trình sao chép DNA diễn ra bán gián đoạn - liên tục trên chuỗi dẫn đầu, nhưng gián đoạn trên chuỗi theo sau.
Quá trình nhân đôi DNA cần sự tham gia của nhiều yếu tố, bao gồm: Chất nền dNTP; khuôn mẫu; primer; hệ thống enzyme polymerase; nhiều enzyme và yếu tố protein khác.
Ở vi khuẩn Escherichia coli, ngoài DNA polymerase, quá trình nhân đôi còn đòi hỏi hơn 20 loại enzyme và protein khác nhau, tạo thành hệ thống enzyme nhân đôi DNA. Mỗi enzyme và protein đều đảm nhiệm một chức năng riêng biệt. Sự phức tạp của hệ thống này phản ánh tính chuẩn xác và ổn định cực cao mà cấu trúc DNA đòi hỏi. Dưới đây là một số enzyme và protein chủ yếu:
- DNA helicase: Để sử dụng DNA làm khuôn mẫu, chuỗi đôi trong xoắn kép phải được tách ra. Việc này được thực hiện bởi DNA helicase, một enzyme sử dụng năng lượng hoá học từ ATP để phá vỡ liên kết hydro giữa hai chuỗi DNA tại vùng nĩa sao chép, giúp tách rời hai chuỗi DNA mẹ.
- DNA topoisomerase: Trong quá trình nhân đôi và phiên mã DNA, sự tháo xoắn của DNA gây ra ứng suất xoắn ở phía trước nĩa sao chép. Enzyme topoisomerase giúp cắt tạm thời một hoặc cả hai chuỗi DNA, giải phóng ứng suất, loại bỏ siêu xoắn dương, rồi nối liền lại các đầu bị cắt, tái tạo thành chuỗi DNA hoàn chỉnh, đảm bảo quá trình diễn ra trơn tru.
- Protein gắn kết DNA chuỗi đơn (SSB): Các chuỗi DNA đã được tách rời sẽ không thể tồn tại ổn định nếu để nguyên trong môi trường tế bào, bởi chúng rất dễ bắt cặp lại với nhau hoặc bị enzyme nuclease phá huỷ. Để duy trì trạng thái ổn định này, các protein gắn kết DNA chuỗi đơn (SSB) sẽ bám vào các DNA chuỗi đơn ngay sau khi chúng được tách ra. Những protein SSB này liên kết chặt chẽ với các vùng chuỗi đơn được tạo ra khi enzym helicase di chuyển dọc theo nĩa sao chép. Mục đích của chúng là ngăn không cho các DNA chuỗi đơn mới hình thành tái bắt cặp với nhau để tạo thành xoắn kép trở lại, đồng thời bảo vệ DNA khỏi sự tấn công của các enzyme nuclease, vốn có thể cắt đứt hoặc phân huỷ các đoạn DNA trần.
- Primase: Trước khi enzyme DNA polymerase bắt đầu tổng hợp nên chuỗi DNA mới, một đoạn primer phải được gắn sẵn trên chuỗi khuôn mẫu. Thông thường, primer này là một đoạn ngắn RNA primer do enzyme primase tổng hợp nên. Không có primer, DNA polymerase dù có “vật liệu” (nucleotide) trong tay cũng không thể tự mình khởi công.
- DNA ligase: Sau khi RNA primer bị loại bỏ và khoảng trống được lấp đầy bằng DNA, các đoạn DNA riêng rẽ vẫn còn tồn tại những khe hở nhỏ giữa nhóm 5'-phosphate và 3'-hydroxyl của hai đoạn liền kề. DNA ligase xúc tác phản ứng tạo liên kết phosphodiester, nối liền các đoạn DNA, hoàn thiện chuỗi DNA liên tục.
- DNA polymerase: DNA polymerase đầu tiên được phát hiện ở E. coli vào năm 1955. Sau đó, các nhà khoa học đã phát hiện thêm: DNA polymerase II, có vai trò chủ yếu trong sửa chữa DNA; DNA polymerase III, là enzyme chủ yếu trong nhân đôi DNA; và đến thập niên 1990, còn phát hiện ra DNA polymerase IV và V, hai loại polymerase hiếm, tham gia đặc biệt vào các cơ chế sửa chữa DNA. Bảng so sánh chi tiết giữa các loại DNA polymerase của E. coli được trình bày dưới đây.
Tính ổn định di truyền của vật chất di truyền là yếu tố then chốt bảo đảm cho sinh vật duy trì thông tin gen và giữ vững sự ổn định của loài. Độ tinh xác của quá trình nhân đôi DNA, cơ chế chỉnh sửa sai sót trong phân bào, cùng với tính ổn định của cấu trúc nhiễm sắc thể, phối hợp với nhau để đảm bảo sự truyền đạt và duy trì bền vững của vật chất di truyền. Mỗi khi tế bào phân chia, DNA đều được nhân đôi, giúp tế bào con nhận được bộ thông tin gen giống hệt tế bào mẹ. Chính tính ổn định di truyền này tạo nền tảng cho sự sinh sản và tiến hoá của sinh vật.
Trước hết, độ tinh xác trong nhân đôi DNA là một trong những yếu tố chủ chốt bảo đảm tính ổn định di truyền. Quá trình nhân đôi DNA là cơ sở của phân bào và sinh sản. Trong quá trình này, chuỗi xoắn kép của DNA được tháo xoắn và tách thành hai chuỗi đơn bổ sung, mỗi chuỗi làm khuôn để tổng hợp chuỗi mới nhờ enzyme DNA polymerase. Tính tinh xác của quá trình nhân đôi phụ thuộc vào tính chọn lọc cao và cơ chế cam kết của enzyme DNA polymerase. DNA polymerase chỉ ghép cặp nucleotide đúng với khuôn, bảo đảm chuỗi DNA mới mang tính bổ sung chính xác với chuỗi gốc. Ngoài ra, còn có sự phối hợp của nhiều loại enzyme khác như enzyme phụ trợ, enzyme tổng hợp và enzyme sửa sai - tất cả đều tham gia phát hiện và khắc phục những lỗi phát sinh trong quá trình nhân đôi, từ đó duy trì độ tinh xác và ổn định của vật chất di truyền.
Thứ hai, cơ chế chỉnh sửa sai sót trong phân bào cũng đóng vai trò quan trọng đối với tính ổn định di truyền của vật chất di truyền. Trong khi tế bào phân chia, vật chất di truyền phải được nhân đôi và phân bố chính xác cho tế bào con. Quá trình này tiềm ẩn nhiều rủi ro như tổn thương DNA (en), trao đổi chéo hoặc sai sót khi tách nhiễm sắc thể. Để khắc phục, tế bào phát triển các cơ chế giám sát và sửa sai: Các điểm kiểm soát chu kì tế bào giúp phát hiện tổn thương DNA và ngăn tế bào không ổn định bước vào giai đoạn phân chia tiếp theo. Đồng thời, các hệ thống như sửa sai bắt cặp (en), tái tổ hợp nhiễm sắc thể dị nguyên và chỉnh sửa nhiễm sắc thể hoạt động để hiệu chính các lỗi trong quá trình tách và tái tổ hợp DNA, đảm bảo sự ổn định di truyền trong phân bào.
Cuối cùng, tính ổn định cấu trúc của nhiễm sắc thể cũng là nhân tố thiết yếu duy trì tính ổn định di truyền của vật chất di truyền. Nhiễm sắc thể là cấu trúc phức hợp do DNA và protein hợp thành, có chức năng lưu trữ và truyền đạt thông tin gen. Trong quá trình phân bào và sinh sản, nhiễm sắc thể phải trải qua nhiều biến đổi cấu trúc như tháo xoắn, chia tách, nhân đôi và tái cấu trúc. Vì vậy, tính ổn định của cấu trúc nhiễm sắc thể có ý nghĩa quyết định. Tính ổn định cấu trúc nhiễm sắc thể chịu ảnh hưởng của trình tự DNA, sự bảo tồn nucleosome, cùng các cơ chế điều tiết khống chế của tế bào. Tế bào sử dụng hàng loạt cơ chế bảo vệ - chẳng hạn sửa chữa kết nối đầu mút không đồng nguyên, phản ứng stress tế bào và trạm kiểm tra nhiễm sắc thể - để ngăn chặn các hiện tượng như đứt gãy, dính liền hoặc mất đoạn nhiễm sắc thể, qua đó bảo tồn sự ổn định của bộ gen.
Đột biến DNA là một trong những yếu tố then chốt của tiến hoá, đại biểu cho sự gia tăng đa dạng trong bộ gen và là nền tảng cho sự hình thành loài mới. Đột biến DNA được định nghĩa là sự sai cặp, chèn thêm, hoặc mất đoạn trong trình tự DNA, thường do lỗi nhân đôi, tác động môi trường hoặc bệnh lí di truyền gây ra. Những đột biến này có thể làm thay đổi chức năng, cấu trúc và biểu hiện của gen, từ đó thúc đẩy quá trình tiến hoá. Trong tiến trình này, đột biến không chỉ tạo ra kiểu gen và kiểu hình mới, mà còn ảnh hưởng sâu sắc đến phân hoá tính biệt (en) và đa dạng tính trạng sinh học. Áp lực của chọn lọc giới tính có thể làm gia tăng tần suất một số đột biến nhất định, dẫn đến phân hoá và hình thành loài. Ví dụ, ở nhiều loài, các đặc điểm của con đực do đột biến tạo nên (chẳng hạn màu sắc hay hành vi) có thể được con cái ưa thích trong quá trình giao phối, khiến những đột biến ấy được chọn lọc và củng cố qua nhiều thế hệ - từ đó thúc đẩy sự phân hoá và tiến hoá của loài. Ảnh hưởng của đột biến DNA không chỉ dừng ở cấp độ cá thể đơn mà còn mở rộng đến quần thể và loài. Trong quần thể, sự tích luỹ đột biến có thể tăng nguy cơ tuyệt chủng, đặc biệt là khi tính đa dạng di truyền suy giảm; tuy nhiên, chính sự tích luỹ này cũng giúp quần thể thích nghi với biến đổi môi trường. Ở cấp độ loài, đột biến DNA là nền tảng cho sự khởi nguyên, phân hóa, và tiến hoá thích ứng của các loài sinh vật. Tóm lại, đột biến DNA là động lực chủ yếu của quá trình tiến hoá loài, thông qua việc gia tăng tính đa dạng của bộ gen và biến đổi chức năng, cấu trúc, cùng biểu hiện gen.
Cần lưu ý rằng, mặc dù đột biến DNA thúc đẩy tiến hoá, song chúng cũng có thể gây ra hậu quả tiêu cực, đặc biệt là các bệnh di truyền ở người. Những bệnh này ảnh hưởng đến sự phát triển thể chất và trí tuệ của thế hệ sau, đồng thời gây tổn hại chức năng cơ thể. Vì vậy, việc dự phòng bệnh di truyền cần được chú trọng qua khám tiền hôn nhân (en), khám trước sinh và theo dõi thai kì. Khi phát hiện thai nhi mắc bệnh di truyền nghiêm trọng, có thể cần chấm dứt thai kì để ngăn di truyền tiếp. Hiện nay, bệnh di truyền ở người được chia thành bốn nhóm chính: Bệnh di truyền đơn gen, bệnh di truyền đa gen, bệnh di truyền bất thường nhiễm sắc thể và bệnh di truyền ti thể.
- Bệnh di truyền đơn gen - phát sinh do đột biến tại một gen duy nhất, gồm hai dạng:
- Di truyền trội: chỉ cần mang một gen đột biến là phát bệnh. Ví dụ: đa ngón, bạch tạng, máu khó đông, mù màu,...
- Di truyền lặn: chỉ phát bệnh khi mang hai gen đột biến giống nhau. Ví dụ: điếc bẩm sinh (en), thiểu năng trí tuệ di truyền,…
- Bệnh di truyền đa gen - do nhiều cặp gen cùng kiểm soát. Mỗi gen có ảnh hưởng nhỏ đến tính trạng di truyền, gọi là gen vi hiệu, song tác động cộng gộp tạo ra biểu hiện rõ rệt. Các bệnh này chịu ảnh hưởng của yếu tố di truyền và môi trường, thường có tính tập trung gia tộc, nhưng không biểu hiện kiểu di truyền rõ ràng như bệnh đơn gen. Tỉ lệ mắc trong cộng đồng khoảng 15-20%, bao gồm: Tăng huyết áp nguyên phát (en), bệnh động mạch vành, bệnh tim bẩm sinh, bệnh vô não (en) và tâm thần phân liệt.
- Bệnh di truyền do bất thường nhiễm sắc thể - phát sinh khi số lượng hoặc cấu trúc nhiễm sắc thể thay đổi, chia thành:
- Bất thường số lượng: thừa hoặc thiếu một nhiễm sắc thể. Ví dụ: Hội chứng Down.
- Bất thường cấu trúc: mất đoạn, đảo đoạn, hoặc chuyển đoạn nhiễm sắc thể. Ví dụ: Hội chứng tiếng mèo kêu (Cri-du-chat), hội chứng Turner, hội chứng Klinefelter, v.v.
- Bệnh di truyền ti thể - gây ra bởi đột biến gen ti thể hoặc bất thường số lượng ti thể. Ti thể là “nhà máy năng lượng” của tế bào, chịu trách nhiệm sản xuất ATP - nguồn năng lượng thiết yếu cho hoạt động sống; do đó, các bất thường này dẫn đến rối loạn chức năng chuyển hoá năng lượng, gây tổn thương đa cơ quan và đa hệ thống. Đến nay, hơn 100 bệnh lí đã được xác định có liên quan đến đột biến hoặc bất thường cấu trúc của ti thể, bao gồm các bệnh như bệnh tiểu đường và điếc di truyền theo dòng mẹ (MIDD), bệnh Parkinson, hội chứng Leigh, hội chứng thần kinh thị giác di truyền Leber, hội chứng Kearns-Sayre,...
Do số lượng và biểu hiện lâm sàng của các bệnh di truyền rất đa dạng, nhiều bệnh lại hiếm gặp, nên việc chẩn đoán nhầm hoặc bỏ sót là điều dễ xảy ra. Ngoại trừ một số ít bệnh có thể điều trị hiệu quả nếu can thiệp sớm, đa số vẫn chưa có phương pháp điều trị triệt để. Do đó, dự phòng, chẩn đoán và điều trị bệnh di truyền là thách thức lớn của y học hiện đại.
Sự ra đời và phát triển của các kĩ thuật chẩn đoán phân tử đã thay đổi sâu sắc phương thức chẩn đoán và điều trị, giúp cải thiện đáng kể khả năng phát hiện và quản lí bệnh di truyền. Các kĩ thuật này có thể chia thành hai nhóm: Nhóm kinh điển bao gồm PCR, lai huỳnh quang tại chỗ (FISH), phân tích vi mảng nhiễm sắc thể (CMA) và giải trình tự thế hệ thứ nhất (phương pháp Sanger); nhóm công nghệ mới gồm PCR kĩ thuật số, giải trình tự thế hệ thứ hai và thứ ba (NGS, TGS), kĩ thuật khuếch đại đầu dò nối đa mồi (MLPA), chip vi lưu (en), bản đồ quang học đơn phân tử (OGM), giải trình tự RNA (RNA-seq) và phổ khối acid nucleic.
Sự phổ cập và quản lí chuẩn hoá của các công nghệ này đã thúc đẩy mạnh mẽ nghiên cứu cơ chế bệnh học và phát triển liệu pháp điều trị. Vì đa số bệnh di truyền hiện chỉ có thể điều trị triệu chứng, nên việc hiểu rõ cơ chế phát bệnh ở mức phân tử là chìa khoá cho nghiên cứu và phát triển thuốc mới. Ứng dụng linh hoạt của công nghệ chẩn đoán phân tử, đặc biệt trong nghiên cứu đa tổ học, giúp giải thích rõ hơn tác động của đột biến gen lên cơ thể, mô và tế bào ở cấp độ phân tử. Đồng thời, nhờ sự phát triển của tin học sinh vật và phân tích big data, ngày càng nhiều thông tin hữu ích được khai thác và ứng dụng hiệu quả trong y học chính xác.
- Video mô phỏng cơ chế nhân đôi DNA trên YouTube trên YouTube, minh hoạ sinh động quá trình nhân đôi phân tử DNA, từ lúc chuỗi xoắn kép được tháo tách cho đến khi hình thành hai phân tử DNA mới hoàn chỉnh.
- Video mô phỏng cơ chế nhân đôi DNA (Phiên bản chi tiết nâng cao)Được lưu trữ ngày 26 tháng 1 năm 2018 tại Wayback Machine. Video này trình bày chuyên sâu hơn về các cơ chế phân tử, cấu trúc enzyme, và quy trình phối hợp giữa helicase, primase, DNA polymerase, topoisomerase, SSB và DNA ligase trong suốt quá trình nhân đôi DNA.
- Video hoạt hoạ 3D có phụ đề trên YouTube, minh hoạ quá trình nhân đôi DNA ở sinh vật nhân sơ trên YouTube. Tư liệu này đặc biệt hữu ích trong việc giúp người xem quan sát trực quan cách mà DNA của vi khuẩn được mở tách, nhân đôi và nối liền, thể hiện rõ sự khác biệt giữa cơ chế nhân đôi ở sinh vật nhân sơ và sinh vật nhân thực.