XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ GEN TY THỂ CỦA...
Transcript of XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ GEN TY THỂ CỦA...
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Bùi Anh Tuấn
XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ
GEN TY THỂ CỦA 6 GIỐNG LỢN BẢN ĐỊA TẠI MỘT SỐ
TỈNH MIỀN BẮC VIỆT NAM
LUẬN ÁN TIẾN SĨ SINH HỌC
Hà Nội - Năm 2020
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Bùi Anh Tuấn
XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ
GEN TY THỂ CỦA 6 GIỐNG LỢN BẢN ĐỊA TẠI MỘT SỐ
TỈNH MIỀN BẮC VIỆT NAM
Chuyên ngành: Công nghệ sinh học
Mã sỗ: 94 20 20 1
LUẬN ÁN TIẾN SĨ SINH HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. GS.TS. Nghiêm Ngọc Minh
2. PGS.TS. Võ Thị Bích Thủy
Hà Nội - Năm 2020
i
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình do chính tôi thực hiện và một số kết quả
cùng cộng tác với các đồng nghiệp khác. Các số liệu, kết quả nêu trong luận án là
trung thực, một phần đã được công bố trên các tạp chí khoa học chuyên ngành với
sự đồng ý và cho phép của các đồng tác giả. Phần nội dung còn lại chưa được ai
công bố trong bất kỳ công trình nào khác.
Hà Nội, ngày tháng năm 2020
Tác giả
Bùi Anh Tuấn
ii
LỜI CẢM ƠN
Tôi xin được bày tỏ lòng biết ơn sâu sắc tới GS. TS. Nghiêm Ngọc Minh - Phó
Viện trưởng Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam
- Người thầy đã gieo mầm, định hướng nghiên cứu, tận tình hướng dẫn, giúp đỡ tôi
tháo gỡ những khó khăn trong suốt quá trình nghiên cứu và làm luận án.
Tôi cũng xin được bày tỏ lòng biết ơn sâu sắc đến PGS. TS. Võ Thị Bích
Thủy - Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam -
Người thầy đã sát sao dìu dắt, truyền lại cho tôi phương pháp mới về nghiên cứu phân
tích trình tự hệ gen ty thể cũng như niềm say mê nghiên cứu về Hệ gen học.
Trong suốt quá trình thực hiện Đề tài nghiên cứu, tôi đã nhận được sự giúp
đỡ tận tình về chuyên môn của các nhà khoa học, các cán bộ nghiên cứu công tác
tại Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Bằng
những tình cảm chân thành nhất, tôi xin trân trọng cảm ơn những sự giúp đỡ quý
báu đó.
Nhân dịp này, tôi xin chân thành cảm ơn Ban Giám đốc, tập thể cán bộ Học
viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Lãnh
đạo Khoa Công nghệ sinh học và các phòng ban nghiệp vụ trong Học viện đã giúp đỡ,
tạo điều kiện thuận lợi nhất cho tôi trong suốt quá trình học tập và tham gia nghiên cứu
đề tài luận án.
Nhân đây, tôi xin bày tỏ lòng biết ơn sâu sắc tới lãnh đạo Viện Khoa học
hình sự - Bộ Công an; lãnh đạo, đồng nghiệp tại Trung tâm Giám định Sinh học -
Viện Khoa học hình sự đã hết sức tạo điều kiện thuận lợi, giúp đỡ tôi trong công
việc học tập và tham gia nghiên cứu để hoàn thành luận án này.
Tôi xin gửi lời cám ơn thân ái tới gia đình, những người thân và bạn bè đã
luôn bên cạnh, yêu thương, khích lệ và ủng hộ tôi trong suốt thời gian qua.
Hà Nội, ngày tháng năm 2020
Tác giả
Bùi Anh Tuấn
iii
MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................ iii
DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIỆT TẮT ........................................... v
DANH MỤC CÁC BẢNG ....................................................................................... vi
DANH MỤC CÁC HÌNH ....................................................................................... vii
MỞ ĐẦU .................................................................................................................... 1
Chương 1. TỔNG QUAN TÀI LIỆU ...................................................................... 4
1.1. Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà ................................. 4
1.1.1. Nguồn gốc ............................................................................................................... 4
1.1.2. Phân loại .................................................................................................................. 5
1.1.3. Quá trình thuần hóa ................................................................................................. 5
1.2. Đặc điểm và một số ứng dụng của hệ gen ty thể ........................................... 7
1.2.1. Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú ................................................ 7
1.2.2. Một số ứng dụng của hệ gen ty thể ........................................................................ 9
1.3. Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh chủng
loại phân tử ............................................................................................................ 11
1.3.1. Cây phát sinh chủng loại ...................................................................................... 11
1.3.2. Phân tích phát sinh chủng loại .............................................................................. 13
1.4. Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn ........................ 17
1.4.1. Nghiên cứu các giống lợn trên thế giới ............................................................... 17
1.4.2. Nghiên cứu giống lợn Việt Nam .......................................................................... 19
Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ....................... 25
2.1. Đối tượng và địa điểm nghiên cứu ............................................................... 25
2.1.1. Đối tượng ................................................................................................................ 25
2.1.2. Địa điểm .................................................................................................................. 25
2.2. Hóa chất và thiết bị ........................................................................................ 28
2.2.1. Hóa chất .................................................................................................................. 28
2.2.2. Thiết bị .................................................................................................................... 30
2.3. Phương pháp nghiên cứu .............................................................................. 30
2.3.2. Phương pháp tách chiết DNA tổng số ................................................................. 32
2.3.3. Khuếch đại mtDNA .............................................................................................. 33
2.3.4. Xác định trình tự hệ gen ty thể ............................................................................. 33
2.3.5. Nhóm phương pháp lắp ráp, dóng hàng trình tự, dự đoán và chú giải hệ gen .. 35
iv
2.3.6. Phân tích trình tự và phương pháp xác định mức độ tương đồng trình tự ........ 38
2.3.7. Phương pháp xây dựng cây và phân tích chủng loại phát sinh .......................... 39
Chương 3. KẾT QUẢ VÀ THẢO LUẬN ............................................................. 41
3.1. Chọn lựa, thu thập mẫu ................................................................................ 41
3.2. Trình tự hệ gen ty thể của 6 giống lợn bản địa ........................................... 45
3.2.1. Tách chiết DNA tổng số của 6 giống lợn nghiên cứu ........................................ 45
3.2.2. Khuếch đại phân đoạn hệ gen ty thể (mtDNA) của 6 giống lợn bằng PCR ..... 48
3.2.3. Xác định trình tự các phân đoạn DNA của hệ gen ty thể ................................... 49
3.3. Phân tích hệ gen ty thể .................................................................................. 53
3.3.1. Phân tích thành phần hệ gen ty thể ...................................................................... 53
3.3.2. Chú giải cấu trúc hệ gen ty thể ................................................................ 66
3.3.3. Cấu trúc thành phần của các gen RNA vận chuyển ........................................... 69
3.3.4. Phân tích cấu trúc bậc hai của các tRNA ............................................................ 70
3.4. So sánh đa hình trình tự ............................................................................... 82
3.4.1. Trình tự vùng D-loop ............................................................................................ 74
3.4.2. Trình tự vùng mã hóa hệ gen ty thể ..................................................................... 80
3.5. Phân tích về quan hệ phát sinh chủng loại .................................................. 86
3.5.1. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự vùng D-loop ........... 87
3.5.2. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh .............. 91
4.1. Kết luận .......................................................................................................... 99
4.2. Kiến nghị ........................................................................................................ 99
DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ .......................................... 100
TÀI LIỆU THAM KHẢO .................................................................................... 101
PHỤ LỤC ............................................................................................................... 110
Phụ lục 1 - Nguồn gốc, phân bố, đặc điểm ngoại hình, khả năng sinh
trưởng 6 giống lợn bản địa Việt Nam .................................................................... 110
Phụ lục 2 - Điện di đồ sản phẩm PCR sau tinh sạch của 6 giống lợn bản địa
Việt Nam ................................................................................................................ 113
Phụ lục 3 - Trình tự hoàn chỉnh hệ gen ty thể của 6 giống lợn bản địa Việt Nam ... 118
v
DANH MỤC CÁC CHỮ VIẾT TẮT
BLAST Basic local alignment search tool
DNA Deoxyribonucleic acid
HV1, HV2 Hypervariable Segment 1, hypervariable Segment 2
Indel Insertion or deletion
ITS Internal transcribed spacer.
MCMC Monte Carlo Markov Chain
mtDNA Mitochondrial DNA
NCBI National Center for Biotechnology Information
Nu Nucleotide
OTU Operational taxonomic unit
PCR Polymerase chain reaction
rDNA Ribosomal DNA
RNA Ribonucleic acid
rRNA Ribosome RNA
SD Standard deviation
SNPs Single nucleotide polymorphism
tRNA Transfer RNA
UPGMA Unweighted-pair group method with arithmetic mean
vi
DANH MỤC CÁC BẢNG
Bảng 1.1. Phân loại lợn nhà ........................................................................................ 5
Bảng 1.2. Các loại thay thế đơn phân trong phân tử DNA ....................................... 12
Bảng 1.3. Phân bố các giống lợn bản địa Việt Nam ................................................. 22
Bảng 2.1. Mã số truy cập dữ liệu trình tự hệ gen ty thể của các giống lợn Âu Á và
phân bố địa lý được sử dụng trong nghiên cứu ......................................................... 27
Bảng 2.2. Các cặp mồi được sử dụng cho PCR và vị trí các phân đoạn .................. 29
được khuếch đại ........................................................................................................ 29
Bảng 2.3. Thành phần phản ứng PCR ....................................................................... 33
Bảng 2.4. Thành phần phản ứng giải trình tự ........................................................... 34
Bảng 3.1. Kết quả khảo sát lông da của 6 giống lợn bản địa ................................... 43
Bảng 3.2. Kết quả khảo sát đặc khối lượng và kích thước của 6 giống lợn bản địa413
Bảng 3.3. Khảo sát đặc điểm hình dáng cơ thể của 6 giốn bản địa ......................... 43
Bảng 3.4. Kết quả định lượng và kiểm tra độ tinh sạch của DNA tổng số ............... 45
Bảng 3.5. Kết quả sau chỉnh sửa chuẩn bị cho lắp ráp ............................................. 50
Bảng 3.6. Kết quả lắp ráp hệ gen hoàn chỉnh 6 giống lợn bản địa Việt Nam .......... 51
Bảng 3.7. Tỷ lệ thành phần các loại base trong trình tự hệ gen ty thể của 6 giống
lợn bản địa Việt Nam. ............................................................................................... 53
Bảng 3.8. Thành phần trình tự của các nhóm lợn phân bố theo khu vực địa lý ....... 55
Bảng 3.9. Cấu trúc của hệ gen ty thể lợn Móng Cái ................................................. 59
Bảng 3.10. Cấu trúc của hệ gen ty thể lợn Mường Lay ............................................ 60
Bảng 3.11. Cấu trúc của hệ gen ty thể lợn Mường Khương ..................................... 70
Bảng 3.12. Cấu trúc của hệ gen ty thể lợn Hạ Lang ................................................. 62
Bảng 3.13 Cấu trúc của lợn Hương ........................................................................... 62
Bảng 3.14. Cấu trúc của hệ gen ty thể lợn Ỉ .............................................................. 64
Bảng 3.15. Thành phần nucleotide của 22 gen tRNA của hệ gen 6 giống lợn bản địa
Việt Nam ................................................................................................................... 69
Bảng 3.16. So sánh độ tương đồng giữa các trình tự vùng D-loop của 6 giống lợn
bản địa Việt Nam với các giống lợn trên thế giới ..................................................... 75
Bảng 3.17. Các vị trí SNP trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam 77
Bảng 3.18. So sánh tương đồng các trình tự vùng mã hóa hệ gen ty thể của 6
giống lợn Việt Nam với các giống lợn trên thế giới ................................................ 81
vii
DANH MỤC CÁC HÌNH
Hình 1.1. Nguồn gốc thuần hóa lợn nhà ..................................................................... 4
Hình 1.2. Cấu trúc hệ gen ty thể ở động vật có vú .................................................... 8
Hình 1.3. Mô tả phương pháp neighbor-joining ....................................................... 15
Hình 2.1. Bản đồ địa điểm thu mẫu .......................................................................... 26
Hình 2.2. Sáu giống lợn bản địa Việt Nam được sử dụng trong nghiên cứu ................ 27
Hình 2.3. Sơ đồ tổng quát các bước nghiên cứu ....................................................... 30
Hình 2.4. Các bước lắp ráp hệ gen ty thể .................................................................. 35
Hình 3.1. A. Điện di đồ DNA tổng số của giống lợn Ỉ và Hạ Lang ............................. 47
Hình 3.1. B. Điện di đồ DNA tổng số của giống lợn Mường Lay và Hương ......... 47
Hình 3.1. C. Điện di đồ DNA tổng số tách chiết từ giống lợn Móng Cái và
Mường Khương ......................................................................................................... 48
Hình 3.2. Sản phẩm PCR sau tinh sạch đối với giống lợn Hương .............................. 49
Hình 3.3.A.B. Cấu trúc dạng vòng của hệ gen ty thể lợn Móng Cái,
lợn Mường Lay được xây dựng bởi phần mềm GenomeVx. .................................... 66
Hình 3.3.C.D. Cấu trúc dạng vòng của hệ gen ty thể lợn Mường Khương,
Hạ Lang được xây dựng bởi phần mềm GenomeVx. ............................................... 67
Hình 3.3.E.F. Cấu trúc dạng vòng của hệ gen ty thể lợn Hương và Ỉ được
xây dựng bởi phần mềm GenomeVx. ....................................................................... 68
Hình 3.4.A,B,C,D,E,F. Cấu trúc bậc hai của 22 loại tRNA được mã hóa trên
hệ gen ty thể lợn Móng Cái (A), Mường Lay (B), Mường Khương (C), Hạ Lang
(D), Hương (E) và Ỉ (F). ............................................................................................ 73
Hình 3.5. Vị trí khác biệt trên trình tự vùng D-loop của các giống lợn bản địa
Việt Nam và các giống lợn đã được công bố sau khi dóng hàng đa trình tự ............ 78
Hình 3.6. Một phần trình tự D-loop của lợn Ỉ và các giống lợn đã được công bố
sau khi tiến hành sắp xếp. ......................................................................................... 79
Hình 3.7. Biến thể trình tự tại vị trí nucleotide 2250 vùng mã hóa hệ gen ty thể
các giống lợn ............................................................................................................. 82
Hình 3.8. Biến thể trình tự tại vị trí nucleotide 11318 trình tự vùng mã hóa
hệ gen ty thể các giống lợn........................................................................................ 83
Hình 3.9. Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được
công bố sau khi tiến hành sắp xếp. ............................................................................ 85
Hình 3.10. Cây phát sinh chủng loại vùng D-loop.................................................. 90
Hình 3.11. Cây phát sinh chủng loại của trình tự hoàn chỉnh ................................... 92
1
MỞ ĐẦU
Lợn nhà là loài vật có mối liên hệ lâu đời với con người, là một chi động vật
móng guốc có nguồn gốc ở đại lục Á - Âu. Ngành chăn nuôi lợn phát triển với
những xu hướng cải tạo năng suất, chất lượng của vật nuôi, nhiều giống lợn được
nhập nội để cải tiến các giống lợn địa phương cùng với việc khai thác theo kiểu tận
diệt đã tạo ra không ít áp lực đối với vấn đề bảo tồn nguồn gen bản địa. Bên cạnh
đó, hiện nay cũng có xu hướng quay lại chăn nuôi các giống lợn bản địa vì các ưu
điểm nổi trội: thịt ngon, ít bệnh tật, khả năng thích nghi cao, giá trị kinh tế lớn.
Việt Nam có khoảng 26 giống lợn bản địa, trong số đó có những giống thuộc
Danh mục nguồn gen vật nuôi quý hiếm cần được bảo tồn. Lợn Ỉ nguồn gốc ở tỉnh
Nam Định, ngày nay ít được nuôi do hiệu quả kinh tế không cao và đang đối diện
nguy cơ lớn tuyệt chủng. Đặc biệt, lợn Ỉ được đưa vào Danh mục nguồn gen vật
nuôi quý hiếm cần được bảo tồn. Lợn Móng Cái là giống lợn nội được hình thành
và phát triển lâu đời, xuất xứ từ thành phố Móng Cái, tỉnh Quảng Ninh, với khả
năng sinh sản khá cao. Lợn Mường Khương với ưu điểm thích ứng tốt trong điều
kiện tự nhiên, có chất lượng thịt thơm ngon và là một giống lợn gắn liền với đời
sống người H’Mông, thuộc tỉnh Lào Cai. Giống lợn Hương có lớp mỡ mang mùi
thơm tự nhiên, được nuôi rộng rãi ở địa bàn biên giới phía Bắc thuộc tỉnh Cao
Bằng. Lợn Mường Lay được chăn nuôi chủ yếu ở địa bàn thị xã Mường Lay, tỉnh
Điện Biên, đây là giống lợn phàm ăn, có tính kháng bệnh tốt. Lợn Hạ Lang cũng
phân bố ở tỉnh Cao Bằng, như các giống lợn bản địa khác, quần thể lợn Hạ Lang đang
ngày càng bị thu hẹp.
Hiện tại, các giống lợn bản địa đang giảm dần về số lượng, đang mất đi một
nguồn gen quý của địa phương và quốc gia. Để cứu vãn các giống lợn bản địa quý
hiếm, hiện các nhà khoa học đang cố gắng nỗ lực bảo tồn nguồn gen của chúng.
Đến nay, chưa có công trình nghiên cứu khoa học đầy đủ nào về hệ gen của các
giống lợn bản địa Việt Nam, nhằm làm sáng tỏ nguồn gốc và quan hệ phát sinh
chủng loại, phục vụ cho công tác bảo tồn nguồn tài nguyên quý hiếm này. Việc xây
dựng cơ sở dữ liệu phân tử về nguồn gen của các giống lợn này vẫn chưa được tiến
hành và khai thác một cách đầy đủ. Để giải quyết các vấn đề nêu trên, chúng tôi tiến
hành nghiên cứu đề tài: “Xác định và phân tích hoàn chỉnh trình tự hệ gen ty thể
2
của 6 giống lợn bản địa tại một số tỉnh Miền Bắc Việt Nam” với các mục tiêu và
nội dung sau:
Mục tiêu nghiên cứu:
- Thu được dữ liệu hoàn chỉnh hệ gen ty thể của sáu giống lợn bản địa Việt
Nam (lợn Ỉ, lợn Móng Cái, lợn Mường Lay, lợn Hương, lợn Mường Khương và lợn
Hạ Lang), đăng ký trên Ngân hàng gen.
- Xác định được thành phần, cấu trúc hệ gen ty thể, so sánh sự sai khác trình
tự, xác định đặc điểm di truyền đặc trưng của sáu giống lợn bản địa trên, qua đó
đóng góp vào cơ sở dữ liệu phục vụ công tác nhận dạng và bảo tồn.
- Xác định được mối quan hệ về di truyền, nhận định nguồn gốc, phát sinh
chủng loại của sáu giống lợn bản địa Việt Nam.
Nội dung nghiên cứu:
- Điều tra, khảo sát về giống, nơi cư trú, thu thập mẫu máu của của 6 giống
lợn bản địa nghiên cứu.
- Giải trình tự toàn bộ hệ gen ty thể của 6 giống lợn bản địa.
- Lắp ráp, xác định trình tự hoàn chỉnh toàn bộ hệ gen ty thể và chú giải.
- Phân tích thành phần, cấu trúc hệ gen.
- Nghiên cứu đa hình trình tự, so sánh trình tự hệ gen ty thể của 6 giống lợn
này với một số giống lợn ở Châu Á, Châu Âu.
- Xây dựng cây phát sinh chủng loại dựa trên trình tự vùng D-loop và trình tự
hoàn chỉnh của hệ gen ty thể, phân tích mối quan hệ nguồn gốc phát sinh chủng loại
giữa 6 giống lợn bản địa và một số giống lợn khác trên thế giới.
Đóng góp mới của luận án:
- Đã giải trình tự hoàn chỉnh hệ gen ty thể của sáu cá thể lợn bản địa Việt
Nam (lợn Ỉ, lợn Móng Cái, lợn Mường Khương, lợn Mường Lay, lợn Hương và lợn
Hạ Lang) dữ liệu đã công bố trên ngân hàng Genbank.
- Đã phân tích, chú giải, dự đoán cấu trúc chức năng hệ gen ty thể của sáu cá
thể lợn nghiên cứu.
- Xây dựng giả thuyết về nguồn gốc của giống lợn Hương và Hạ Lang có thể
là cùng một nguồn gốc.
Ý nghĩa khoa học và thực tiễn:
- Luận án có ý nghĩa thực tiễn trong việc xác định nguồn gốc di truyền của
3
sáu giống lợn bản địa sử dụng trong nghiên cứu. Kết quả của luận án là nguồn dữ
liệu quan trọng trong các nghiên cứu về phát sinh chủng loại, tiến hóa phân tử, cũng
như các nghiên cứu khác nhằm nhận diện, đánh giá và sử dụng giống lợn bản địa
Việt Nam, góp phần hiệu quả cho việc bảo tồn và sử dụng bền vững nguồn gen này.
- Các bài báo đăng tải trên các tạp chí khoa học - công nghệ quốc tế và trong
nước cùng với các trình tự hệ gen công bố trên Ngân hàng Gen (GenBank - NCBI)
là những tư liệu có giá trị tham khảo trong nghiên cứu và giảng dạy.
- Những kết quả của nghiên cứu đã đóng góp vào thư viện nguồn gen của
một số giống bản địa trong ngân hàng gen quốc gia và quốc tế. Luận án sẽ tạo tiền
đề cho phát triển các nghiên cứu tiếp theo trên các giống lợn bản địa, cũng như các
giống vật nuôi khác của Việt Nam.
4
Chương 1. TỔNG QUAN TÀI LIỆU
1.1. Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà
1.1.1. Nguồn gốc
Có quan điểm cho rằng giống lợn nhà hiện nay (S. scrofa) bắt nguồn từ hai
nhóm lợn rừng hoang dã là lợn rừng Châu Âu (S. scrofaferus) và lợn rừng Châu Á
(Sus orientalis, Sus cristatus, Sus vittatus), được con người thuần hoá trong thời
gian dài mà thành. Căn cứ vào hình dáng của tai, người ta chia cả hai nhóm lợn
nguyên thuỷ Châu Âu và Châu Á thành hai loại: Lợn tai dài và lợn tai ngắn. Các
giống lợn nhà nuôi hiện nay hình thành từ các giống lợn cổ đại trước kia thông qua
các phương pháp tạp giao khác nhau [1]. Nguồn gốc các giống lợn được tóm tắt ở
hình 1.1.
Hình 1.1. Nguồn gốc thuần hóa lợn nhà [2]
Lịch sử nguồn gốc của lợn nhà được cho là đã trải qua 5 sự kiện lớn: (1) Sự
hình thành loài Sus ở khu vực Đông Nam Á, (2) Quá trình phân ly thành hai dòng
Châu Âu và Châu Á, (3) Quá trình thuần hóa độc lập dẫn đến sự phân tách thành hai
nhánh Châu Âu và Châu Á, (4) Sự tạp giao giữa lợn nhà Châu Âu và Châu Á và (5)
là quá trình hình thành các giống lợn ngày nay [2].
Đang
tiếp tục
~ 200 năm
~ 10.000 năm
Phân chia ~ 1,2 triệu năm
Hình thành loài Sus ~ 4-2 triệu năm
5
1.1.2. Phân loại
Lợn nhà thường được cho là một phân loài từ tổ tiên hoang dã của chúng -
lợn rừng, chúng được đặt tên sinh học là S. scrofa domesticus [3]. Một số nhà phân
loại học lại cho rằng lợn nhà là một loài riêng và gọi tên chúng là Sus domesticus,
lợn rừng là S. scrofa [4]. Bảng 1.1 minh họa về cách phân loại khoa học lợn nhà thuộc
các đơn vị phân loại sau:
Bảng 1.1. Phân loại lợn nhà
Giới Động vật (Animalia)
Ngành Động vật có xương sống (Chordata)
Lớp Động vật có vú (Mammalia)
Bộ Guốc chẵn (Artiodactyla)
Họ Lợn (Suidae)
Chi Sus
Loài S. scrofa
Phân loài S. s. domesticus
Họ lợn bao gồm 3 họ phụ (Phacochoerinae warthogs, Suinae, Babyrouinae).
Các giống lợn được phân thành các giống lợn chính và phụ, có 25 giống lợn phụ và
4 giống lợn chính. 4 giống phụ trong 25 giống phụ đã được thuần hóa và đưa vào sử
dụng hiện nay đã cho thấy mối quan hệ họ hàng và nguồn gốc chung của các loại
giống lợn trên thế giới [5].
Trong loài Sus (bao gồm các chủng và thứ chủng) có nhiều đại diện rải rác
khắp các lục địa, chính là nguồn gốc trực tiếp của các giống lợn nguyên thủy còn
tồn tại cho đến ngày nay.
1.1.3. Quá trình thuần hóa
Tổ tiên xa xưa của lợn là lợn rừng, đã được săn bắn để cung cấp thực phẩm
cho cuộc sống của người nguyên thủy. Dần dần họ nhận ra thay vì săn bắn, việc
thuần hóa nuôi dưỡng lợn được tiến hành dễ dàng và thuận lợi hơn để cung cấp thực
phẩm cho con người. Quá trình thuần hóa và chăn nuôi lợn là quá trình phát triển
liên tục, phụ thuộc lớn vào sự lai tạo giữa lợn đã được thuần hóa với lợn rừng địa
phương, đặc biệt là lợn nái hoang dã. Nhiều loài lợn rừng tồn tại trên thế giới hiện nay
như loài lợn rừng Châu Phi (warthog) Phacochoreus africanus, lợn lùn (pigmy hog)
Porcula salvania và lợn nhỏ (pig-deer) Babyrousa babyrussa; nhưng chỉ có S.
6
scrofa (lợn rừng) là đã được thuần hóa. Do đó, tất cả các giống lợn hiện nay được coi
là các dạng của S. scrofa domestica [2].
Các bằng chứng về phát sinh chủng loại địa lý cho thấy quá trình thuần hóa
lợn diễn ra nhiều lần ở nhiều nơi trên thế giới. Về thời điểm thuần hóa, các nhà
khảo cổ học dựa vào những di chỉ khảo cổ (chủ yếu là xương sọ) đã cho rằng lợn
được thuần hóa vào khoảng 9000 năm về trước [6], thậm chí từ rất sớm vào khoảng
13.000 đến 12.700 năm trước Công nguyên ở Cận Đông [7]. Lợn nhà đã được xác
định có mặt ở đảo Síp từ khoảng 11.400 năm trước Công Nguyên, chúng được du
nhập từ đất liền, đồng nghĩa với việc chúng đã được thuần hóa trong đất liền
[8]. Cũng có nghiên cứu khẳng định sự thuần hóa lợn diễn ra một cách riêng biệt ở
Trung Quốc cách đây khoảng 8000 năm [1].
Về địa điểm thuần hóa, quá trình thuần hóa lợn diễn ra đầu tiên ở khu vực
Cận Đông và diễn ra lặp lại từ các quần thể lợn hoang dã ở từng khu vực khác nhau
trên thế giới [9]. Sau khi được thuần hóa, lợn được phân tán đến Châu Âu và đến
các vùng nội địa khác. Cũng có giả thuyết về sự thuần hóa lợn diễn ra ở một số
trung tâm thuần hóa lợn trên thế giới, đầu tiên có thể kể đến là lục địa Đông Nam
Á. Theo một nghiên cứu của Larson (2005), các giống lợn được thuần hóa bắt
nguồn từ các quần thể lợn hoang, tổ tiên của lợn ngày nay được xác định là lợn
rừng nguyên thủy và quê hương của chúng chính là vùng Đông Nam Á [10]. Sau
khi được thuần hóa ở Đông Nam Á, lợn theo con người đến các vùng khác
của lục địa Á Âu (Eurasia) và ra các đảo Thái Bình Dương [11]. Trong một nghiên
cứu khác, DNA của các giống lợn thuộc các hải đảo Thái Bình Dương và lợn không
lông ở Vanuatu đã được phân tích để khẳng định rằng, lợn tại các hải đảo này cũng
xuất phát và được thuần hóa từ lục địa Đông Nam Á (đặc biệt là từ Việt Nam)
khoảng 3000 năm trước đây [11]. Sau đó, chúng theo con người "di cư" ra khỏi lục
địa và đến các hải đảo như Vanuatu và Lưu Cầu.
Ở Trung Quốc, có công bố cho rằng những con lợn thuần hóa đầu tiên
tại vùng Jiahu ở thời kỳ Đồ đá mới [12]. Từ quá trình thuần hóa đầu tiên, lợn
đã trở thành vật nuôi chính ở Trung Quốc. Tập tục nuôi nhốt từ sớm của người
nông dân Trung Quốc làm cho quá trình thuần hóa lợn ở Trung Quốc diễn ra
nhanh hơn so với ở khu vực Tây Á, Châu Âu.
7
Nghiên cứu của Larson và cs (2007) cho rằng sự hiện diện tại Châu Âu của
lợn nhà có tổ tiên ở vùng Cận Đông vào thời kỳ Đồ đá mới [13]. Bằng chứng khảo
cổ học cũng chứng minh lợn nhà lần đầu được khai thác ở Bắc Âu vào khoảng 4100
năm trước Công Nguyên [14]. Ngay sau khi lợn có nguồn gốc Cận Đông được đưa
vào Châu Âu, những người nông dân đã kết hợp lợn rừng địa phương vào đàn lợn
của họ. Bắt đầu từ khoảng 7.000 năm trước, người Trung Á chuyển đến Châu Âu,
mang theo vật nuôi bản địa và cả cây trồng. Nhưng có thể cùng thời điểm ấy, lợn
rừng tại Châu Âu cũng được thuần hóa, khi đó lợn rừng bản địa Châu Âu nhanh
chóng thay thế sự có mặt của lợn nhà có nguồn gốc Cận Động trên phạm vi khắp
Châu Âu. Do đó, không phải con lợn nào có nguồn gốc Cận Đông cũng trở thành tổ
tiên của giống lợn Châu Âu ngày nay.
Công trình nghiên cứu dựa trên trình tự mtDNA của 48 giống lợn bản địa tại
Trung Quốc và Đông Nam Á cho thấy khoảng cách tiến hóa tương đương và tương
đối gần giữa lợn rừng Châu Âu với các giống lợn kiểu Âu và giống lợn kiểu Á, đưa
đến một luận điểm là lợn rừng Châu Âu có thể là tổ tiên của cả giống lợn nhà Châu
Âu và Châu Á [15]. Theo Kim và cs (2002), đa dạng di truyền ở lợn thương phẩm
lớn hơn trong các quần thể lợn rừng hiện nay. Các ghi chép lịch sử cho thấy lợn
Châu Á đã được đưa vào Châu Âu trong thế kỷ 18 và đầu thế kỷ 19 [15]. Thời điểm
này ở nước Anh, nhu cầu về thịt lợn tăng cao, các nhà lai tạo giống đã nhập khẩu
một số cá thể lợn của Trung Quốc và lai chúng với những con lợn Châu Âu. Đa
dạng di truyền lớn trong các giống lợn thương mại hiện nay là kết quả của phép lai
giữa lợn Châu Âu và lợn Trung Quốc trong khoảng 200 năm về trước. Các bằng
chứng phân tử về sự du nhập gen đã chỉ ra nguồn gốc lai của một số giống lợn Châu
Âu chính. Lợn thương phẩm của Châu Âu hiện đại có chứa DNA nguồn gốc từ lợn
Châu Á [15].
1.2. Đặc điểm và một số ứng dụng của hệ gen ty thể
1.2.1. Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú
Ty thể là một bào quan dạng hình gậy hoặc hình hạt nằm trong nguyên sinh
chất của tế bào, có hệ di truyền độc lập và di truyền theo dòng mẹ. Hệ gen ty thể
của động vật có vú có cấu tạo DNA mạch vòng với kích thước tổng thể khoảng 16,6
kb mã hóa 13 chuỗi polypeptide. Hai sợi trên mạch kép của mtDNA được phân biệt
thành chuỗi nặng (H) và chuỗi nhẹ (L) dựa theo tỷ lệ thành phần bất đối xứng của
8
Guanine và Cytosine [16]. Bên cạnh các gen mã hóa protein, mtDNA cũng mã hóa
cho 22 tRNA và 2 rRNA (12S và 16S rRNAs). Các rRNA và 14 trong số 22 tRNA
được mã hóa bởi các gen nằm trên chuỗi H [17]. Các gen không chứa intron và
ngoại trừ một số vùng điều hòa bao gồm các promoter và điểm khởi đầu sao chép
trên chuỗi H [18]. Sơ đồ cấu trúc hệ gen ty thể ở động vật có vú được trình bày tại
hình 1.2.
Hình 1.2. Cấu trúc hệ gen ty thể ở động vật có vú [19]
Trong nhiều trường hợp, một phần của bộ ba kết thúc tuy không được mã
hóa nhưng được tạo ra bởi quá trình gắn đuôi polyA sau phiên mã [20]. Mã di
truyền của mtDNA ở động vật có xương sống khác mã di truyền trong nhân. Cụ
thể, thay vì là một bộ ba kết thúc, bộ ba TGA mã hóa Tryptophan trong ty thể của
động vật có xương sống. Bộ ba ATA mã hóa Methinonine ở ty thể nhưng lại mã
hóa cho Isoleucine, và AGA hoặc AGG trong mã bộ ba của ty thể là bộ ba kết thúc
thay vì mã hóa Arginine [21].
So với hệ gen nhân, hệ gen ty thể chứa rất ít trình tự không mã hóa xen kẽ
với vùng mã hóa. Vùng D-loop nằm giữa gen tRNAPhe (gen MT-TK) và tRNAPro
(gen MT-TP) là vùng không mã hóa lớn nhất và có vai trò quan trọng trong điều
hòa quá trình sao chép và phiên mã của hệ gen ty thể, chứa promoter cho sự phiên
mã chuỗi H và chuỗi L, chứa điểm khởi đầu của quá trình sao chép. Hệ gen ty thể
sao chép độc lập với hệ gen nhân bằng một hệ thống riêng trong ty thể nhưng các
enzyme cho quá trình sao chép lại do hệ gen nhân mã hóa [18]. Quá trình phiên mã
Chuỗi H
Chuỗi L
mtDNA
genome
9
và dịch mã của DNA ty thể lại được điều khiển bởi gen nhân. Hệ gen ty thể đƣợc
phiên mã từ một điểm khởi đầu nằm trên vùng D-loop, bản phiên mã sau đó được
endonuclease phân cắt để hình thành nên phân tử rRNA 12S và 16S, tRNA và
mRNA tiền thân. Phân tử mRNA hoàn thiện của ty thể không được gắn mũ nhưng
có đuôi polyA [22].
Vùng D-loop của hệ gen ty thể ở động vật có vú có mức độ bảo thủ nhất định
ở các vùng promoter và ba vùng CSB (Conserved Sequence Blocks). Các vùng
CSB được cho là có liên quan đến quá trình sao chép của mtDNA, đặc biệt vùng
CSB-I nằm ngay vị trí khởi đầu tổng hợp chuỗi H DNA. Vùng D-loop không mã
hóa cho bất kì một protein nào và có tốc độ tiến hóa cao hơn nhiều so với các khu
vực khác của hệ gen ty thể. Phần chính của vùng D-loop bao gồm các trình tự
không mã hóa và các vùng siêu biến (HV1 và HV2). Mặc dù tỉ lệ đột biến chung
trong các vùng siêu biến là cao hơn hẳn so với phần còn lại của mtDNA, tuy nhiên
một số vị trí nucleotide được xem là những điểm nóng (hot-spot) cho sự biến đổi.
Hai vùng HV1 và HV2 tương ứng ở khoảng vị trí 16024-16383 và 57-372 [18].
mtDNA có độ bảo tồn cao, dễ khuếch đại bởi tồn tại nhiều bản sao trong tế
bào, trình tự hệ gen ty thể có sự bảo thủ nhất định giữa các loài động vật, với ít sự
trùng lặp, không chứa intron, các vùng intergenic ngắn [23]. Đây là những đặc điểm
giúp mtDNA được ứng dụng trong nhận dạng cá thể, phân loại, phát sinh chủng loại
và xác định nguồn gốc.
1.2.2. Một số ứng dụng của hệ gen ty thể
1.2.2.1. Ứng dụng trong phân loại học và định danh loài
Hệ gen ty thể mặc dù có kích thước nhỏ so với kích thước toàn bộ hệ gen của
sinh vật nhưng nó lại được coi là một chỉ thị phân tử phổ biến ở động vật. Đã có rất
nhiều những nhà di truyền học quần thể và hệ thống học áp dụng các trình tự trên hệ
gen ty thể trong nghiên cứu. Một số nghiên cứu đã sử dụng các gen ty thể như là
những marker phân tử (DNA barcode). Bên cạnh gen 16S rRNA, 12S rRNA,
Cytochrome b,.. nhiều nghiên cứu đã xác định rằng gen ty thể cytochrome c oxidase
subunit I [24] có thể đóng vai trò cốt lõi như một hệ thống xác định sinh học phân
loại động vật [25]. Sự tiến hóa của gen COI cho phép phân biệt không chỉ giữa các
loài gần nhau, mà còn trong cùng một loài [26]. Trong phân loại phân tử hoặc định
danh sinh vật, trình tự DNA được sử dụng như “barcodes”, dùng để phân loại
10
nhóm. Một nghiên cứu tiêu biểu sử dụng gen COI trong định danh loài bò, lợn, gia
cầm là công trình của Spychaj và cs (2016). Nghiên cứu này đã phát triển một
phương pháp tự thiết kế mồi để khuếch đại trình tự gen COI để nhận dạng sản phẩm
thịt từ 3 loài động vật trên [27]. Cũng sử dụng đoạn gen COI, nhưng nhóm tác giả
Dawnay sử dụng cặp mồi phổ dụng để phân định loài gia súc và gia cầm [28]. Các
nghiên cứu đã cho thấy mtDNA trở thành một công cụ hữu hiệu trong việc định
danh sinh vật ở cấp độ loài hoặc dưới loài.
1.2.2.2. Ứng dụng trong nghiên cứu phát sinh chủng loại, xác định nguồn gốc
mtDNA có độ đa dạng cao trong quần thể tự nhiên do tỷ lệ đột biến lớn, trở
thành các bằng chứng cho lịch sử phát triển của quần thể.
Các kĩ thuật phân tích trình tự mtDNA để xác định mối quan hệ về phát sinh
chủng loại đã được sử dụng phổ biến dựa trên nguyên lý: thông tin về quá trình tiến
hóa có thể thu được qua phân tích dữ liệu về trình tự. Một số tác giả đã tiến hành so
sánh sự đa hình các trình tự để xác định mối quan hệ về tiến hóa giữa những cá thể
trong cùng loài hoặc các loài có quan hệ gần, thời gian phân ly ngắn [29, 15, 30].
Bên cạnh đó, mức độ đa dạng và tiểu cấu trúc địa lý trong một nhóm hay giữa các
nhóm cá thể sinh vật cũng sẽ được làm sáng tỏ [31]. Hệ gen ty thể của lợn (S.
scrofa) được giải trình tự hoàn chỉnh đầu tiên vào năm 1998 [32], là tiền đề cho các
công trình khoa học được tiến hành dựa trên những dữ liệu hoàn chỉnh hệ gen ty thể
của các giống lợn nhà và lợn rừng.
Ở mtDNA, sự tiến hóa đa dạng hơn so với DNA nhân [33, 34]. Sự tiến hóa
của mtDNA ở động vật có vú diễn ra trước hết từ sự thay thế các cặp base đơn, hơn
là việc tái sắp xếp các phân đoạn lớn của trình tự [18]. mtDNA di truyền theo dòng
mẹ, đơn bội và không tái tổ hợp [35]. Những đặc điểm trên đây khiến mtDNA là
một trong những chỉ thị phổ biến nhất được sử dụng nhằm xác định mối quan hệ
giữa các cá thể trong cùng loài và giữa các loài có mối quan hệ gần, thời gian phân
ly ngắn.
Đối với hệ gen ty thể, vùng D-loop được cho là vùng có nhiều sự biến đổi
hơn các vùng khác [36]. Trong suốt nhiều thập kỷ qua, vùng D-loop của hệ gen ty
thể đã được sử dụng trong các phân tích chủng loại phát sinh. Hai vùng siêu biến
(HV1 và HV2) được sử dụng nhiều cho nghiên cứu tiến hóa, xác định quan hệ huyết
thống dòng mẹ ở sinh vật nhân thực Eukaryotes và đặc biệt ở người [37, 38]. Thông
11
qua phân tích hệ gen ty thể ở các loài động vật có vú, sự phân ly về trình tự mtDNA
được xác định cứ mỗi 2 triệu năm diễn ra khoảng 2%, tương đương với tốc độ thay
thế nucleotide là 1x10-8 sự thay thế/vịtrí/năm ở mỗi giống [34]. Ở các loài gia súc
nói riêng, tốc độ thay thế các nucleotide ở vùng D-loop được cho là khoảng 1,5.10-7/vị
trí/năm [39]. Một số công trình nghiên cứu dựa trên độ đa hình trình tự vùng D-loop
nhằm xác định khoảng thời gian từ lúc phân ly thành các nhánh lợn Châu Âu và
Châu Á, qua đó đưa ra những đánh giá về phát sinh chủng loại [15, 40].
Tất cả những đặc điểm, cấu trúc, đặc tính sinh học đã giúp hệ gen ty thể trở
thành một chỉ thị phân tử phổ biến được sử dụng trong nghiên cứu đa dạng sinh học
và quan hệ phát sinh chủng loại cũng như xác định nguồn gốc tiến hóa.
1.3. Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh
chủng loại phân tử
Nghiên cứu về phát sinh chủng loại có thể sử dụng các bằng chứng về hình
thái từ những loài đang sống và dữ liệu hóa thạch hoặc dựa trên lượng dữ liệu
khổng lồ về phân tử [41]. Trong ngành phát sinh chủng loại phân tử, người ta
nghiên cứu mối quan hệ giữa các loài sinh vật thông qua các bằng chứng phân
tử, cụ thể là trình tự DNA và protein. Như vậy, sự khác biệt giữa các trình tự quy
định sự phân ly di truyền, được coi là kết quả của tiến hóa phân tử theo tiến trình
thời gian. Các mối quan hệ về tiến hóa được suy luận ra, chúng thường được biểu
diễn dưới dạng cây tiến hóa, qua đó có thể cung cấp các giả thuyết về những sự
kiện sinh học xảy ra trong quá khứ [42]. Tất cả các dạng sống đều có chung một
nguồn gốc tổ tiên và là một phần của cây sự sống. Hơn 99% các loài từng sống sót
đã bị tuyệt chủng [43], do đó, suy luận phát sinh chủng loại là suy luận các dữ kiện
trong quá khứ. Suy luận phát sinh chủng loại sử dụng các đặc điểm chung giữa hai
loài (có thể là đặc điểm hình thái hoặc đặc điểm ở cấp độ nhiễm sắc thể, các trình tự
phân tử). Phát sinh chủng loại cũng giúp ước lượng khoảng thời gian phân ly giữa
các sinh vật tính từ thời điểm chúng cùng chia sẻ một tổ tiên chung cuối cùng.
1.3.1. Cây phát sinh chủng loại
Cây phát sinh chủng loại nêu lên một giả thuyết về các sinh vật trên cây đã
có quan hệ họ hàng với nhau như thế nào [42]. Mỗi nhóm loài có thể có nhiều dạng
phát sinh, phải lựa chọn dạng phát sinh nào được coi là đúng nhất. Cách lựa chọn
phụ thuộc vào các phương pháp suy luận chứ không phải là quan sát hoặc tiến
12
hành thí nghiệm bởi những sự kiện phân chia trong tiến hóa đã xảy ra. Việc xây
dựng cây chỉ mang tính suy luận, ở đó biểu diễn các sự kiện trong quá khứ. Các
cây mô tả một chuỗi các sự kiện tiến hóa được suy luận từ các dữ liệu sẵn có, dựa
trên một số mô hình [42].
Có hai thông tin chính trong cây phát sinh chủng loại: thông tin về hình học
tô-pô và chiều dài nhánh. Hình học tô-pô của một cây xác định các mối quan hệ của
các thực thể được đại diện trên cây phát sinh. Chiều dài nhánh phản ánh mức độ
quan hệ của các đối tượng trên cây. Cây phát sinh là một biểu đồ bao gồm các
nhánh và các nút. Chỉ duy nhất một nhánh là nối giữa hai nút. Các nút đại diện cho
các đơn vị phân loại (các taxon mà cụ thể ở đây là các trình tự DNA hoặc protein),
nút là giao điểm hay điểm tận cùng của hai hoặc nhiều nhánh [44]. Một đơn vị phân
loại hoạt động [44] là một taxon hiện có có mặt ở một nút ngoài cùng hay còn gọi là
lá. Ở đây, các OTU sẽ là các chuỗi nucleic acid hoặc protein đang được phân tích
trên cây đó. Các nút phía trong đại diện cho các trình tự tổ tiên mà chúng ta có thể
suy ra nhưng hiếm khi có thể quan sát được (ví dụ như trường hợp trình tự DNA từ
các cơ thể đã tuyệt chủng). Một số OTU có thể được đổi chỗ cho nhau (chuyển đổi
hoặc xoay vị trí) mà không thay đổi trạng thái hình học tô-pô của cây. Nhìn chung,
các OTU hoặc các nhánh chia sẻ một nút tổ tiên gần nhất có thể xoay ngay trên nút đó [42].
Chiều dài nhánh cần phải được xác định khi dựng cây. Ở một số cây, chiều dài
nhánh đại diện cho số thay đổi nucleotide hoặc amino acid xảy ra trong nhánh đó (số
khác biệt trên mỗi vị trí). Định dạng cây này (phylogram) cho phép khảo sát rõ ràng
các mối quan hệ của các OTU khác nhau trong cây đó. Một số cây lại được vẽ không
theo tỷ lệ với số lượng thay đổi, dạng cây này (cladogram) biểu diễn các OTU thẳng
hàng theo chiều dọc, được áp dụng khi cây đó có rất nhiều OTU [40].
Xây dựng cây từ dữ liệu trình tự DNA thực chất là nghiên cứu sự thay thế trong
DNA qua phép dóng hàng, chẳng hạn như sự thay thế từng nucleotide đơn, sự thay thế
liên tiếp và sự thay thế ngẫu nhiên (được thể hiện tại bảng 1.2).
Bảng 1.2. Các loại thay thế đơn phân trong phân tử DNA[42]
Trình tự
tổ tiên
Trình tự phân rẽ
1
Trình tự phân rẽ
2 Các loại thay thế
A A A AA Thay thế song song
G G C G C CC
T T T TT Thay thế đơn nhất
13
Trình tự
tổ tiên
Trình tự phân rẽ
1
Trình tự phân rẽ
2 Các loại thay thế
C C C G CG
C C C T A CA Thay thế liên tiếp
T T T TT
Thay thế ngẫu nhiên G G G GG
T T A T C AC
T T G T GT
C C G C T G GG Thay thế trùng hợp
hội tụ A A A AA
G G T G G GG Thay thế hồi quy
1.3.2. Phân tích phát sinh chủng loại
Phân tích phát sinh chủng loại phân tử được chia làm năm bước: 1- thu nhận,
chọn lựa các trình tự để phân tích; 2 - dóng hàng đa trình tự của các trình tự nucleic
acid hay protein tương đồng; 3 - lựa chọn mô hình thống kê cho tiến hóa của
nucleotide hoặc amino acid; 4 - xây dựng cây; và 5 - phân tích cây.
1.3.2.1. Thu nhận trình tự, lựa chọn trình tự
Có thể thu nhận trình tự từ cơ sở dữ liệu HomoloGene của NCBI bao gồm hàng
ngàn họ protein của sinh vật nhân thực, hay các kết quả từ công cụ BLAST giúp lựa
chọn được các họ protein, được quan sát trong NCBI Protein hoặc NCBI Nucleotide.
Các trình tự có thể thu được từ cơ sở dữ liệu Viện Công nghệ tin sinh học Châu Âu
hoặc Ensembl. Cũng có thể thu nhận trình tự từ các cơ sở dữ liệu rộng lớn với định
dạng đầu ra FASTA (hoặc dóng hàng đa trình tự). Với RNA, các cơ sở dữ liệu này bao
gồm Rfam và Ribosomal Database. Với protein các cơ sở dữ liệu gồm Pfam và
InterPro.
1.3.2.2. Dóng hàng đa trình tự
Một họ gen (hoặc protein) được xác định bởi phép dóng hàng đa trình tự của
một nhóm các trình tự tương đồng (homologous). Dóng hàng đa trình tự là một tập
hợp của ba hay nhiều trình tự protein (hoặc nucleic acid) được dóng hàng từng phần
hoặc toàn bộ. Các đơn phân tương đồng được dóng hàng theo cột dọc suốt chiều dài
của trình tự. Các đơn phân được dóng hàng này là tương đồng theo ý nghĩa tiến hóa:
chúng được thu về từ một tổ tiên chung. Đây là bước then chốt trong phân tích phát
sinh chủng loại. Để chuẩn bị dóng hàng đa trình tự phục vụ phân tích phát sinh
chủng loại, các trình tự phải có chung nguồn gốc và tương đồng.
1.3.2.3. Lựa chọn mô hình thay thế trong chuỗi DNA và amino acid
14
Phân tích phát sinh chủng loại dựa trên các mô hình của sự thay thế trong
chuỗi DNA hoặc amino acid. Mô hình Jukes-Cantor mô tả quá trình tiến hóa bởi
những sự thay đổi các đơn phân trong một phép dóng hàng trình tự. Mô hình này
giả định rằng mỗi loại nucleotide có khả năng như nhau để chuyển thành 3 loại
còn lại và bốn loại có mặt với tỷ lệ bằng nhau, tỷ lệ của đồng hoán bằng với tỷ lệ
dị hoán. Trong mô hình hai thông số Kimura cũng mô tả sự thay đổi các đơn
phân nhưng thường thì dị hoán sẽ được chú trọng hơn về tính khả dĩ. Ở mô hình
Tamura giải thích cho sự đa dạng trong thành phần GC, đây là điển hình cho một
mô hình phức tạp hơn của sự thay thế nucleotide.
Trước khi chuỗi dữ liệu được tính toán và phân tích, chúng phải trải qua
quá trình kiểm tra dò tìm mô hình tiến hóa thích hợp.
1.3.2.4. Xây dựng cây
Có bốn phương pháp chính để dựng cây: dựa vào khoảng cách, maximum
parsimony, maximum likelihood và suy luận Bayes. Một trong những phần mềm
tiên tiến hiện nay là MrBayes được phát triển bởi John Huelsenbeck và Fredrik
Ronquist [45]. Công cụ này giúp suy luận dựa trên việc xác lập một phương
pháp phân tích Bayes và các phương pháp dựa trên mô hình để phân tích phát
sinh chủng loại. MrBayes lượng giá một phân bố xác suất tiên nghiệm, là khả
năng mà một cây tạo ra thỏa mãn dữ liệu quan sát.
- Nhóm phương pháp dựa trên khoảng cách
Phương pháp này sử dụng khoảng cách tiến hóa giữa các OTU để suy
luận lịch sử phát sinh loài. Nếu khoảng cách phân tử giữa các loài có sự gia
tăng không đổi theo thời gian, thì cặp loài nào có khoảng cách ngắn nhất sẽ có
chung tổ tiên gần nhất. Các cá thể cùng có một tổ tiên chung gần thì có sự
tương đồng với nhau hơn là những cá thể có chung tổ tiên ở xa hơn (lâu đời
hơn). Do đó, ta có thể suy luận các mối quan hệ tiến hóa từ các kiểu tương
đồng trong số các cá thể.
+ Phương pháp dựa trên khoảng cách UPGMA (Unweighted-Pair Group
Method with Arithmetic mean) được giới thiệu bởi Sokal và Michener [46].
Trong phương pháp này, dựa trên việc gom cụm các trình tự, mỗi trình tự được
xem nằm trong cụm của chính nó. Thông qua ma trận khoảng cách, có thể xác
định được chiều dài khoảng cách giữa mỗi đối tượng. Các taxon có khoảng cách
gần nhất sẽ nối lại với nhau và đặt tên cho một nút phía trong là. Cứ thế, xác
15
định các khoảng cách gần nhất tương ứng giữa các taxon, cuối cùng tất cả các
trình tự được kết nối lại trong một cây có gốc.
+ Tạo cây bằng nhóm phương pháp dựa trên khoảng cách - neighbor
joining:
Hình 1.3. Mô tả phương pháp neighbor-joining [47]
Phương pháp này sử dụng thuật toán khoảng cách được minh họa trên hình 1.3:
(a) các OTU trước hết được gom cụm trong một cây hình sao. Các lân cận được xác
định là các OTU được liên kết bởi một nút duy nhất ở bên trong của cây phân nhánh
không gốc. (b) hai OTU gần nhất được xác định, chẳng hạn là OTU số 1 và 2. Hai lân
cận này được nối với các OTU khác thông qua nhánh nội là XY. OTU được chọn là lân
cận sao cho tổng chiều dài nhánh là nhỏ nhất. Quá trình này được lặp lại cho đến khi
toàn bộ cây được tạo ra.
- Nhóm phương pháp Maximum Parsimony
Phương pháp sử dụng nguyên lý suy luận phát sinh chủng loại dựa trên ít
nhất những biến đổi trong quá trình tiến hóa, nghĩa là cây tốt nhất là cây có chiều
dài nhánh ngắn nhất có thể [48].
- Phương pháp Maximum Likelihood
Đây là một phương pháp được thiết kế để xác định kiểu hình học tô-pô cho
cây và chiều dài nhánh có tính khả dĩ cao nhất đối với tập hợp dữ liệu quan sát
được. Tính khả dĩ được tính toán cho mỗi đơn phân (residue) trong một phép dóng
hàng, bao gồm một vài mô hình của quá trình thay thế nucleotide hoặc amino acid.
Đây là phương pháp phải sử dụng dung lượng máy tính nhiều nhất và cũng là nhóm
phương pháp linh động nhất [49].
- Nhóm phương pháp dựa trên lý thuyết Bayes
Suy luận Bayes thực chất là việc tính toán khả năng của một số dữ liệu đang
quan sát với một vài mô hình xác suất đã cho. Suy luận Bayes tìm kiếm xác suất của
một cây với điều kiện dựa trên những dữ liệu sẵn có (dựa trên sự quan sát một phép
16
dóng hàng đa trình tự nào đó) [50]. Ước lượng Bayes của phát sinh chủng loại được
chú trọng vào một đại lượng được gọi là phân bố xác suất tiên nghiệm của cây. Với
một cây đã cho, xác suất tiên nghiệm là xác suất để cây đúng, mục đích là tìm ra cây
có xác suất cao nhất. Suy luận Bayes trong nghiên cứu phát sinh chủng loại tương
tự như maximum likelihood bởi mỗi phương pháp đều tìm kiếm một đại lượng gọi
là tỷ lệ khả dĩ với dữ liệu điều kiện đang quan sát của cây. Khác biệt là việc xác
định các thông tin ban đầu và sử dụng thuật toán MCMC (Markov chain Monte
Carlo) để xác định phân phối xác suất hậu nghiệm. Nhóm phương pháp dựa trên
nguyên lý Bayes được coi là công cụ tiên tiến, khắc phục được một số hạn chế của
các phương pháp khác. Các nghiên cứu gần đây có xu hướng sử dụng phương pháp
Bayes nhiều hơn thay vì các phương pháp khác.
1.3.2.5. Hoàn thiện cây phát sinh chủng loại
- Phân tích giá trị bootstrap
Sau khi dựng được một cây phát sinh chủng loại, cần đánh giá mức độ chính
xác, tin cậy và hiệu quả. Tính chính xác của cây được đánh giá bằng phương pháp
phổ biến nhất là phân tích bootstrap [51, 52]. Bootstrap mô tả độ mạnh về hình học
tô-pô của cây. Nghĩa là, với một trật tự phân nhánh cụ thể nào đó, xác định mức độ
tin cậy của thuật toán được sử dụng để dựng cây, để tìm ra trật tự phân nhánh sử
dụng các phép hoán vị ngẫu nhiên đối với các dữ liệu nguồn. Phân tích bootstrap
cho phép suy luận mức độ biến thiên trong một phân phối chưa biết mà dữ liệu
được rút ra từ đó [52]. Bootstrap là kĩ thuật xử lí thống kê các phép đo lường về độ
chính xác với các khoảng ước lượng về mẫu nghiên cứu. Cho phép sự ước lượng
các giá trị khác biệt trong một phân bố các mẫu nghiên cứu, qua đó kiểm định giả
thuyết trong thống kê bằng số lần thử lại (resampling) với sự thay thế từ nguồn dữ
liệu gốc.
Con số phần trăm thể hiện trên nhóm nào đó thể hiện trên cây gốc được cung
cấp dựa trên mức độ ủng hộ của bootstrap đối với hình học tô-pô của cây gốc. Giá
trị bootstrap lớn hơn 70% cung cấp giá trị ủng hộ cho việc tạo nhóm. Nếu nhìn vào
một nhóm (một nhóm trình tự có cùng tổ tiên) có giá trị ủng hộ bootstrap là 100%,
nghĩa là trong tất cả 500 phép bootstrap lặp lại, nhánh đó vẫ duy trì trạng thái (số
lượng, thành phần các trình tự vẫn không thay đổi trong nhánh). Nếu một nhánh chỉ
nhận được giá trị bootstrap là 52% ủng hộ, nghĩa là khoảng một nửa cơ hội một
trình tự thuộc nhánh lân cận với nhóm có giá trị bootstrap 52% là có khả năng thuộc
17
nhóm này [51]. Tóm lại, nhìn vào giá trị bootstrap, có thể đánh giá được độ tin cậy
của mỗi nhánh trong một cây.
- Phân tích gốc của cây:
Để suy luận tổ tiên cho các nút trên một cây, thì điều quan trọng phải biết
gốc của cây nằm ở đâu, điều này cho phép đánh giá tổng thể chiều hướng biến đổi.
Có hai phương pháp thường được sử dụng để xác định gốc của cây.
Phương pháp xác định gốc của cây dựa vào trung điểm: đơn giản nhưng độ
chính xác không cao. Phương pháp này xác định gốc như là trung tâm tập hợp của
các nhánh và cách đều một cách tương đối với các đỉnh.
Phương pháp thứ hai dựa vào nhóm đối chứng (nhóm ngoại - outgroup) chính
xác hơn, nhưng không phải lúc nào cũng sử dụng được bởi yêu cầu một nhóm
ngoài, một taxon được phân tách từ cây từ trước cho tới hiện tại của tổ tiên chung
sau cùng của tất cả các taxon khác đang được nghiên cứu.
1.4. Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn
1.4.1. Nghiên cứu các giống lợn trên thế giới
Phương pháp mô hình hóa dữ liệu di truyền từ lợn nhà và lợn rừng đã được
áp dụng để giải quyết các quan điểm mâu thuẫn và làm sáng tỏ quá trình thuần hóa
lợn [53]. Dữ liệu cho thấy lợn nhà ngày nay là một thể khảm của các quần thể lợn
rừng khác nhau. Kết quả của các nghiên cứu này đã không ủng hộ giả thuyết trước
đó cho rằng có nhiều trung tâm thuần hóa lợn bên ngoài khu vực Tây Á và Trung
Quốc [10].
Đã có nhiều nhà di truyền học quần thể và hệ thống học sử dụng dữ liệu trình
tự của hệ gen ty thể trong các nghiên cứu về nguồn gốc các giống lợn. Trình tự hoàn
chỉnh hệ gen ty thể của lợn (S. scrofa) được công bố vào năm 1998 [32], đây là tiền
đề cho một loạt các công trình khoa học tiến hành nghiên cứu trên dữ liệu hệ gen ty
thể của các giống lợn nhà và lợn rừng. Kim và cs (2002) đã xác định quan hệ phát
sinh chủng loại của các giống lợn Châu Âu và Châu Á bằng sự đa hình trình tự
vùng D-loop với chiều dài 1036 bp của mtDNA [15]. Watanobe và cs (2003) đã
công bố cấu trúc quần thể của lợn rừng Nhật Bản và địa lý phát sinh chủng loại
thông qua phân tích biến thể trình tự mtDNA [54]. Công trình của Wang và cs
(2014) đã công bố dữ liệu của hệ gen ty thể ở giống lợn Duroc [55], … Bên cạnh
đó, có nhiều công trình nghiên cứu đã công bố những bằng chứng rõ ràng từ trình tự
18
mtDNA của các mẫu lợn hiện đại và cổ đại để chứng minh một số vùng được xem
là trung tâm thuần hóa lợn nhà từ các giống lợn rừng trên thế giới trải dài từ Âu
sang Á [10, 56]. Một số công trình nghiên cứu thông qua độ đa hình trình tự vùng
D-loop, xác định khoảng thời gian từ lúc phân rẽ thành nhánh lợn Châu Âu và Châu
Á đã được nghiên cứu đánh giá trong các phân tích về phát sinh chủng loại [15,
40]. Giuffra và cs đã tiến hành giải trình tự mtDNA và một số gen nhân tế bào từ
các giống lợn rừng, lợn nhà Châu Âu, Châu Á. Nhóm tác giả đã phát hiện sự đa
hình trình tự và sử dụng công thức tính toán đồng hồ phân tử, kết luận rằng lợn
nhà có nguồn gốc từ lợn rừng Âu Á (S. scrofa), các bằng chứng về sự thuần hóa
diễn ra độc lập từ các loài phụ của lợn hoang ở Châu Âu và Châu Á cũng được đưa ra [1].
Fernández đã tiến hành nghiên cứu mối quan hệ giữa đa hình mtDNA và chất
lượng thịt ở giống lợn Iberia. Kết quả đã phát hiện một số đa hình đóng vai trò như
các chỉ thị phân tử đóng góp vào quá trình chọn giống lợn này [57]. Công trình
nghiên cứu mối liên hệ của 4 haplotype mtDNA với các đặc điểm năng suất ở giống
lợn Landrace và khẳng định các kiểu gen đơn bội của mtDNA có mối liên hệ lớn tới
các tính trạng hình thái ở giống lợn này [58]. Trình tự hệ gen ty thể hoàn chỉnh của
giống lợn Visayan, lợn Java được xác định với kích thước 16.475 bp, hệ gen có cấu
trúc đặc trưng của 13 gen mã hóa protein, 2 gen rRNA, 22 gen tRNA và một vùng
điều khiển không mã hóa D-loop, đây là nguồn dữ liệu di truyền giúp nghiên cứu sâu
hơn về sự tiến hóa của lợn [59]. Việc nghiên cứu hoàn chỉnh trình tự vùng D-loop ty
thể của giống lợn trắng Pudong ở vùng Taihu - Trung Quốc, đã cho thấy không có sự
trao đổi di truyền giữa các quần thể và giống lợn này chỉ xuất hiện duy nhất tại đây.
Do vậy cần có những chính sách để bảo tồn nguồn gen bản địa quý hiếm này [60]. Sự
đa dạng di truyền trong hệ gen ty thể cũng đã được xác định trong 17 giống lợn bản
địa Trung Quốc và 3 giống lợn bản địa Châu Âu. Qua phân tích đa dạng nucleotide
cho thấy mức độ khác biệt di truyền rất lớn giữa các giống có nguồn gốc Châu Âu so
với Châu Á, tuy nhiên ít có sự biến động trong 17 giống bản địa của Trung Quốc
[61]. Nghiên cứu của Wu và cs (2007) đã khẳng định hai vị trí phát sinh chủng loại
của các giống lợn nhà và lợn rừng Châu Á nằm trên hai nhánh tách biệt, trong đó
giống lợn hoang Malaysia có sự tách biệt lớn nhất khi nằm ra ngoài khỏi nhánh lợn
lưu vực sông Mekong và Nam Trung Quốc nhưng giống lợn này vẫn là lợn kiểu Châu
Á [56]. Nghiên cứu về các giống lợn bản địa Trung Quốc, nhóm của Yu đã cho rằng
19
lợn Lanyu phân ly từ các giống lợn Trung Quốc khác và nằm tại nhánh phát sinh riêng
[30].
Từ các kết quả nghiên cứu, có thể thấy thông tin về quá trình tiến hóa có thể
thu được thông qua dữ liệu về trình tự. Qua việc so sánh mức độ đa hình các trình
tự, các mối quan hệ về tiến hóa giữa những cá thể trong cùng loài hoặc các loài có
quan hệ gần, thời gian phân ly ngắn, cũng như độ đa dạng và tiểu cấu trúc địa lý
trong một nhóm hay giữa các nhóm cá thể động vật sẽ được làm sáng tỏ [62, 29, 63, 31].
1.4.2. Nghiên cứu giống lợn Việt Nam
1.4.2.1. Tình hình nghiên cứu chung
Việt Nam được coi là một trong những nơi bắt nguồn của lợn nhà Châu Á
[64]. Tuy nhiên, đến nay còn khá ít các công trình nghiên cứu xác định nguồn gốc
phát sinh chủng loại và đa dạng di truyền sử dụng hệ gen ty thể trên đối tượng là các
giống lợn bản địa Việt Nam. Nguyễn Thị Phương Mai (2017) đã sử dụng dữ liệu
trình tự hệ gen ty thể để xác định vị trí phân loại của heo rừng bản địa khu vực Tây
Nguyên trong mối quan hệ phát sinh loài của heo rừng trên thế giới. Cùng với đó, 3
vị trí SNP mới của vùng D-loop và 3 vị trí SNP mới của gen cytochrome b của heo
rừng Tây Nguyên cũng được xác định, giúp phân biệt giữa heo rừng Tây Nguyên và
các nhóm heo rừng khác [65].
Công trình nghiên cứu của Trần Thị Thúy Nhiên (2016) đã công bố giải trình
tự hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái [66]. Trong nghiên cứu này,
trình tự hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái được công bố có chiều
dài 16.632 bp bao gồm vùng không mã hóa (D-loop), 2 gen rRNA, 13 gen mã hóa
protein và 22 gen tRNA. Cây phát sinh chủng loại cũng được tái dựng lên, sử dụng
phương pháp khoảng cách UPGMA với 162 trình tự hoàn chỉnh của hệ gen ty thể
của lợn. Qua phân tích phát sinh chủng loại, nhóm tác giả đã xác định được mối
quan hệ gần gũi giữa lợn Móng Cái của Việt Nam với giống lợn Bama miniature ở
Miền Nam Trung Quốc. Bên cạnh đó các số liệu phân tích về thành phần hệ gen của
giống lợn Móng Cái cũng được tác giả công bố. Ishihara và cs đã nghiên cứu mối
quan hệ di truyền trong số các giống lợn địa phương sử dụng các chỉ thị SNP [67].
Đại diện của 15 giống lợn địa phương trải dài từ Bắc, Trung và Nam đã được thu
thập. Qua phân tích các chỉ thị SNP cho thấy có sự đa hình cao trong các giống lợn
Việt Nam. Hầu hết các giống được gom nhánh đều tương quan với nguồn gốc địa lý
20
của chúng. Một số giống lợn Việt Nam khác lại được gom nhánh khi cùng liên quan
về mặt di truyền với giống lợn Landrace của Châu Âu.
Trái với công bố khoa học cho rằng một số giống lợn địa phương ở Việt Nam
có nguồn gốc từ Trung Quốc, qua phân tích di truyền sử dụng vùng kiểm soát của
hệ gen ty thể đã chứng minh rằng các giống lợn Việt Nam ở khu vực Đông Bắc có
thể có mối quan hệ với giống lợn ở Campuchia hoặc Lào [68]. Nghiên cứu của
Hongo và cs (2002) xác định mối liên hệ về mặt di truyền giữa giống lợn bản địa
Việt Nam với một số giống lợn trên thế giới [69]. Cụ thể, Hongo đã dựa vào hình
thái giải phẫu bộ xương để phân ra nhóm lợn to và nhóm lợn nhỏ, nhóm lợn rừng
to có mối quan hệ gần với giống lợn hoang Ryukyu ở miền Nam Nhật Bản, nhóm
lợn nhỏ có mối liên hệ gần nhất với một số giống lợn nhà tại khu vực Đông Á có
nguồn gốc từ lợn bản địa Trung Quốc [69]. Các nhà khoa học Trung Quốc cũng đã
có các công bố về nguồn gốc và sự khác biệt di truyền của giống lợn bản địa phía
Tây Nam Trung Quốc thông qua nghiên cứu đa hình mtDNA. Kết quả cho thấy,
mối quan hệ giữa lợn rừng và lợn Tứ Xuyên ở Trung Quốc là tương đối xa so với
lợn rừng Việt Nam dựa trên các điểm đột biến tồn tại trong hệ gen ty thể của lợn
[70]. Trong nghiên cứu về đa hình mtDNA, Lan và Shi (1993) cho rằng tồn tại
khoảng cách tiến hóa tương đối xa giữa lợn Vân Nam ở Trung Quốc với lợn Việt
Nam, mặc dù khu vực Đông Nam Trung Quốc và Việt Nam có vị trí địa lý khá
gần [70]. Các giống lợn tại Việt Nam có mức độ đa dạng di truyền cao. Hầu hết
kiểu gen đơn bội của nhóm lợn nhỏ Việt Nam có mối liên hệ gần với các nhóm
lợn nhà Đông Á. Điều này chứng tỏ nhóm lợn nhỏ Việt Nam là lợn nhà và là cơ sở
đề hình thành hai giả thuyết giải thích cho quá trình thuần hóa lợn nhà Việt Nam:
một là chúng được thuần hóa ngay tại Việt Nam, hai là chúng được di cư từ khu
vực lân cận như miền Tây Nam Trung Quốc. Lợn Việt Nam bao gồm quần thể lợn
hoang và lợn nhà có thể có cùng tổ tiên với các nhóm lợn Đông Á. Hai công trình
nghiên cứu được tiến hành độc lập vào năm 2006 và 2014, đã sử dụng chỉ thị
microsatelite khẳng định nhánh các giống lợn Việt Nam khác biệt với các nhánh lợn
nhà Châu Âu, giống Meishan của Trung Quốc và lợn rừng Châu Á, cho rằng các
giống lợn Việt Nam đã trải qua quá trình thuần hóa trong thời gian lịch sử dài [71,
72]. Mối quan hệ di truyền của lợn Việt Nam ở vùng Tây Nguyên thông qua việc
phân tích trình tự Cytochrome b đã được thực hiện trong công trình nghiên cứu của
21
Lê Thành Long và cs (2014) [73]. Kết quả cho thấy, nhóm lợn rừng Việt Nam I tách
biệt di truyền với nhóm lợn rừng châu Á và có sự đa dạng di truyền cao trong các
giống lợn rừng và lợn nhà ở Tây Nguyên. Trong một số nghiên cứu trước đây, các
nhà khoa học trong nước chủ yếu tập trung nghiên cứu đánh giá, phân tích về quá
trình sinh trưởng và phát triển, tiêu tốn thức ăn, chỉ tiêu sinh lý và sinh hóa, khả
năng sinh sản ở lợn. Một số tác giả như Nguyễn Văn Thiện và cs (1995) có các
đánh giá trên lợn Ỉ và lợn Móng Cái [74]; Lê Viết Ly và cs (1999) đánh giá ở 2
giống lợn bản địa khác là Ba Xuyên và Thuộc Nhiêu [75]; Trần Văn Do và cs
(2005) nghiên cứu trên lợn Lang, lợn Móng Cái và lợn Vân Pa [76]; Trần Thanh
Vân và Đinh Thu Hà (2005) có các nghiên cứu trên lợn Mẹo [77].
Tính đến nay, những nghiên cứu về sinh học phân tử đối với các giống lợn
nội ở Việt Nam, phần lớn mới chỉ dừng ở mức kiểm tra sự biểu hiện của một số gen
liên quan đến tính trạng sinh trưởng, sinh sản và phòng chống bệnh. Lê Thị Thúy và
cs (2004) đã tiến hành nghiên cứu đa hình kiểu gen leptin liên quan trên một số
giống lợn nuôi tại Việt Nam [78]. Nghiên cứu phát hiện đa hình gen mã hóa
Mannan-Binding lectin serine protease 1 (MASP1) ở lợn do Đỗ Võ Anh Khoa và cs
tiến hành [79]. Trần Xuân Hoàn và cs (2013) đã xác định các chỉ thị phân tử trong
chọn lọc lợn giống thuần chủng đạt năng suất và chất lượng thịt cao, bao gồm 4 chỉ
thị phân tử DNA liên quan với tốc độ tăng trọng, 4 chỉ thị phân tử DNA liên quan
với chất lượng thịt, 4 chỉ thị phân tử DNA liên quan với số con sơ sinh sống của lợn
bố mẹ Yorkshire, Móng Cái và giải trình tự gen Mc4R của lợn Móng Cái nhưng
không phát hiện được sai khác đặc thù [80]. Kiểu gen halothan của lợn cũng được
xác định bằng phân tích DNA nhằm chọn lọc những cá thể có kiểu gen kháng stress
(CC và CT) do nhóm tác giả Đặng Vũ Bình và cs 2012 [81]. Nguyễn Thị Diệu Thúy
và cs (2004) đã xác định đa hình di truyền gen hormone sinh trưởng ở giống lợn
Móng Cái bằng phương pháp PCR-RFLP với mục đích ứng dụng các kết quả của di
truyền chất lượng vào công tác chọn tạo đàn giống lợn nội kinh tế phổ biến ở Miền
Bắc Việt Nam [82]. Nguyễn Thị Hoa (2013) sử dụng phương pháp PCR-RFLP để
phân tích đa hình một số gen liên quan đến chất lượng thịt lợn [83]. Cụ thể là xác
định các biến thể DNA của gen H-FABP và Lpin1 nhằm hỗ trợ công tác chọn giống.
Lê Thị Thu Phương (2003) cũng đã công bố kết quả trong nghiên cứu xác định tần
số kiểu gen và phân tích ảnh hưởng của kiểu gen halothan cũng như kiểu gen thụ
22
thể estrogen đến năng suất sinh sản của heo nái [84]. Nguyễn Văn Cường và cs
(2009) đã có các nghiên cứu phân tích đa hình DNA trong một số gen kháng bệnh ở
lợn nuôi Việt Nam và phát triển chỉ thị di truyền phân tử hỗ trợ chọn giống lợn kháng
bệnh [85].
Đối với các giống lợn bản địa Việt Nam, những nghiên cứu tổng thể về hệ
gen, đặc biệt là giải mã toàn bộ hệ gen ty thể của lợn nhằm xác định nguồn gốc,
đánh giá các đặc tính di truyền chưa được nhiều tác giả Việt Nam nghiên cứu. Đây
là một khía cạnh khoa học cần nghiên cứu sâu hơn, làm cơ sở nền tảng cho công tác
bảo tồn nguồn gen và chọn tạo giống lâu dài.
1.4.2.2. Đặc điểm ngoại hình một số giống lợn bản địa Việt Nam
Tại Việt Nam có các giống lợn bản địa đặc trưng đại diện cho mỗi vùng miền.
Theo định nghĩa về giống của FAO: “Một giống hoặc một nhóm giống trong loài có
đặc điểm bên ngoài có thể ghi nhận và phân biệt mà nó có thể cho phép tách biệt
bởi hình thức bên ngoài với các nhóm khác thì được gọi là một giống". Bên cạnh đó
cũng theo quy ước của FAO: "Các nhóm có ngoại hình giống nhau có thể được xem
là giống khác nhau nếu như xa nhau về địa lý" [5]. Trên cơ sở đó tính đến nay, các
giống lợn bản địa của Việt Nam được xác định có khoảng 26 giống, được nuôi chủ
yếu ở vùng nông thôn miền núi, vùng sâu, vùng xa. Danh sách các giống lợn bản
địa và đặc điểm phân bố được liệt kê ở bảng 1.3:
Bảng 1.3. Phân bố các giống lợn bản địa Việt Nam [5]
STT Tên giống Phân bố
Tỉnh Vùng
1. Lợn Táp Ná
Cao Bằng
Trung du miền núi phía Bắc
2. Lợn Hạ Lang
3. Lợn Hương
4. Lợn Lũng Pù Hà Giang
5. Lợn Hung
6. Lợn Mường Lay Điện Biên
7. Lợn Đen Mường Tè Lai Châu
8. Lợn Hung Sìn Hồ
9. Lợn Mường Khương Lào Cai
10. Lợn Lửng Phú Thọ
11. Lợn Lang Hồng* Bắc Giang
12. Lợn Bản Hòa Bình, Sơn La
23
13. Lợn Móng Cái Quảng Ninh
Đồng bằng Bắc bộ và Bắc Trung bộ
14. Lợn Ỉ Thanh Hóa
15. Lợn Mẹo Nghệ An
16. Lợn Khùa Quảng Bình
17. Lợn Vân Pa Quảng Trị
Trung và Nam Trung bộ
18. Lợn Cỏ A Lưới Thừa Thiên Huế
19. Lợn Cỏ Quảng Nam Quảng Nam
20. Lợn Kiềng Sắt Quảng Ngãi
21. Lợn Trắng Phú Khánh* Phú Yên, Khánh Hòa
22. Lợn Sóc Các tỉnh thuộc Tây Nguyên (Đắc Lắc) Tây Nguyên
23. Lợn Chư-Prông Gia Lai
24. Lợn Ba Xuyên Sóc Trăng Đồng bằng sông Cửu Long
25. Lợn Ô Lâm An Giang, Kiên Giang
26. Lợn Thuộc Nhiêu* Kiên Giang
Ghi chú: * Các giống hiện nay không còn tìm thấy con có đặc điểm ngoại hình đặc trưng.
Có thể thấy, các giống lợn bản địa Việt Nam được phân bố rải rác ở các tỉnh
vùng xa theo chiều dài đất nước, càng về các tỉnh miền xuôi thì sự đa dạng về đặc
điểm ngoại hình của các giống càng giảm [5].
Phân tích các đặc điểm ngoại hình thường dựa vào một số các chỉ tiêu, trong
đó có đặc điểm màu sắc lông da là một tính trạng chất lượng có ý nghĩa trong việc
chọn giống. Nhiều dấu hiệu màu sắc của lông da đặc trưng cho nòi giống. Mỗi một
giống vật nuôi có một màu sắc lông da đặc trưng, từ đó có thể dựa vào màu sắc bộ
lông mà phát hiện được sự lẫn gen hoặc nhầm lẫn khi xác định phả hệ, nguồn gốc
[5]. Qua nghiên cứu điều tra, các giống lợn bản địa có các đặc điểm ngoại hình đa
dạng. Hiện trạng của 6 giống lợn bản địa (lợn Ỉ, lợn Móng Cái, lợn Hương, lợn Hạ
Lang, lợn Mường Khương và lợn Mường Lay) như sau [5, 86]:
a. Giống lợn Ỉ
Giống lợn Ỉ hiện đang có nguy cơ cao tuyệt chủng do số lượng lợn sinh sản
còn quá ít, lợn bị suy thoái đồng huyết. Hiện nay chỉ còn sót lại ở một số xã của tỉnh
Thanh Hóa và Viện Chăn nuôi. Từ con số hai triệu con năm 1969, tới nay số lợn Ỉ
trên toàn quốc còn không được bao nhiêu, tại Viện Chăn Nuôi và tỉnh Thanh Hóa
cũng chỉ còn chưa đến 100 con giống.
24
b. Giống lợn Móng Cái
Giống lợn Móng Cái là giống lợn nội phổ biến nhất ở Việt Nam. Có nguồn
gốc ở vùng Móng Cái, Đầm Hà, Hà Cối, Đông Triều, tỉnh Quảng Ninh. Giống này
có tính ưu việt là mắn đẻ, tầm vóc lớn hơn lợn Ỉ, tăng trọng khá, số con đẻ ra/lứa
nhiều, do đó đã làm cho lợn Móng Cái phát triển nhanh chóng ra khắp các tỉnh đồng
bằng Sông Hồng, Trung Du và miền núi phía Bắc, miền Trung, Tây Nguyên và cả ở
miền Nam. Hiện nay do chăn nuôi lợn nhập nội theo hướng trang trại ngày càng
phát triển, nên số lượng lợn Móng Cái đang có xu hướng giảm.
c. Giống lợn Hạ Lang
Giống có nguồn gốc từ huyện Hạ Lang, tỉnh Cao Bằng, qua phỏng vấn người
chăn nuôi trực tiếp và tài liệu thu thập được, lợn Hạ Lang được du nhập từ Trung
Quốc từ hàng ngàn năm trước, thông qua giao lưu buôn bán giữa hai tỉnh giáp biên
giới Việt Nam - Trung Quốc. Hiện nay số lượng lợn nái Hạ Lang giảm đáng kể, tính
đến tháng 10/2012, tổng đàn nái Hạ Lang còn khoảng 500-1000 con.
d. Giống lợn Mường Lay (14 vú)
Là giống lợn được nuôi dưỡng lâu đời theo hình thức thả rông. Đến nay vẫn
chưa xác định chính xác giống lợn Mường Lay có nguồn gốc từ đâu. Giống lợn này
có đặc điểm chịu đựng tốt với điều kiện hoàn cảnh nông hộ nghèo, không đòi hỏi
thức ăn dinh dưỡng cao, ít bệnh tật, khả năng đẻ con tốt và thịt thơm ngon. Lợn
Mường Lay 14 vú đã được Viện Chăn Nuôi đề nghị nhà nước đưa vào danh sách
bảo tồn.
e. Giống lợn Mường Khương
Là giống lợn địa phương, có từ lâu đời được các dân tộc ít người nuôi trên
vùng núi cao hiểm trở của huyện Mường Khương, tỉnh Lào Cai. Đây là giống dễ
nuôi vì phàm ăn, chịu dịch bệnh tốt, thịt thơm ngon, nhiều nạc. Lợn Mường
Khương hiện có khoảng trên 1000 con sống chủ yếu tại vùng núi cao, hiểm trở.
f. Giống lợn Hương
Lợn Hương là giống lợn được nuôi phổ biến ở các huyện biên giới Việt
Nam - Trung Quốc thuộc tỉnh Cao Bằng gồm Bảo Lạc, Bảo Lâm, Hạ Lang… Đây
là một nguồn gen quý, được bảo tồn ở Việt Nam từ năm 2008 và ngày càng phát
triển về số lượng ở Cao Bằng. So với các giống lợn bản địa khác, thịt lợn Hương có
mùi thơm đặc trưng riêng nên được người dân địa phương gọi là “lợn Hương” từ xưa [5].
25
Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Đối tượng và địa điểm nghiên cứu
2.1.1. Đối tượng:
Các cá thể lợn được lựa chọn ngẫu nhiên trong các đàn lợn, thuộc 6 giống
lợn bản địa Việt Nam (Ỉ, Móng Cái, Mường Khương, Mường Lay, Hương và Hạ
Lang). Riêng đối với quần thể lợn Ỉ thu tại tỉnh Thanh Hóa, do không còn tìm thấy
cá thể nào mang đặc điểm tương ứng của nhóm lợn Ỉ Mỡ nên toàn bộ cá thể khảo
sát và thu mẫu thuộc nhóm lợn Ỉ Pha. Đối tượng nghiên cứu được chọn lựa dựa trên
điều tra khảo sát các đặc điểm ngoại hình đặc trưng, thông tin về phả hệ, địa lý phân
bố của Viện Chăn nuôi Quốc gia và Trung tâm Giống vật nuôi - Sở Nông nghiệp và
phát triển nông thôn tại một số địa phương: Điện Biên, Lào Cai, Cao Bằng, Hải
Phòng và Thanh Hóa.
2.1.2. Địa điểm:
- Khảo sát, phân tích các chỉ tiêu về ngoại hình của 6 giống lợn nghiên cứu
được nuôi tại các hộ dân, triển khai nuôi nhân thuần tại một số địa phương sau :
+ Lợn Ỉ - tại tỉnh Thanh Hóa: thành phố Thanh Hóa (xã Hoằng Long);
huyện Hoằng Hóa (xã Hoằng Đức); huyện Thiệu Hóa; huyện Yên Định; thị xã Bỉm
Sơn; huyện Đông Sơn.
+ Lợn Móng Cái - tại thành phố Hải Phòng: Trung tâm Giống Tràng Duệ
thuộc Công ty Cổ phần Đầu tư và Phát triển Nông nghiệp, huyện An Dương.
+ Lợn Mường Lay - tại tỉnh Điện Biên: Thị xã Mường Lay (phường La
Nay, phường Sông Đà, Xã Lay Nưa).
+ Lợn Hương và lợn Hạ Lang - tại tỉnh Cao Bằng: Trung tâm giống cây
trồng, vật nuôi, thủy sản Cao Bằng, xã Bạch Đằng, huyện Hoà An.
+ Lợn Mường Khương - tại tỉnh Lào Cai: huyện Mường Khương, xã Tả
Gia Khâu (thôn Lao Chải, thôn Sảng Chải, thôn Sín Pao Chải).
Ngoại hình các cá thể từ 6 giống lợn bản địa và địa điểm thu mẫu được trình
bày ở hình 2.1 và 2.2.
26
Hình 2.1. Bản đồ địa điểm thu mẫu
Hình 2.1. Bản đồ địa điểm thu mẫu
LÀO
TRUNG QUỐC
Móng Cái
Ỉ
Mường Lay
Mường Khương
Hạ Lang
Hương
Lợn Mường Lay Lợn Ỉ
Lợn Móng Cái Lợn Hương
27
Hình 2.2. Sáu giống lợn bản địa Việt Nam được sử dụng trong nghiên cứu
Trình tự hệ gen ty thể của các giống lợn Châu Âu, Châu Á được tải từ GenBank
(NCBI) cùng với các mã số truy cập được xếp vào 6 khu vực địa lý chính: Đông Bắc
Á, Khu vực Mekong, Lưu vực sông Hoàng Hà, Nam Trung Quốc, Lưu vực sông
Dương Tử và các quốc gia Châu Âu được thể hiện ở bảng 2.1.
Bảng 2.1. Mã số truy cập dữ liệu trình tự hệ gen ty thể của các giống lợn Âu Á và
phân bố địa lý được sử dụng trong nghiên cứu
Khu vực địa lý Các giống lợn Mã số truy cập
GenBank (NCBI) Tên Tiếng Việt Tên Tiếng Anh
Đông Bắc Á
Lợn rừng Hàn Quốc WB-Korea AY574047.1
Lợn rừng Đông Bắc
Trung Quốc
WB-China
northeast EU333163.1
Khu vực Mê Kông
Lợn rừng Việt Nam WB -Vietnam EF545584.1
Ban-na mi-ni Banna mini GQ220328.1
Lợn Đa-hê Dahe GQ220329.1
Lợn rừng Malaysia WB-Malaysia EF545592.1
Lợn rừng Vân Nam WB-Yunnan EF545573.1
Nam Trung Quốc
Lợn rừng Phúc Kiến WB-Fujian EF545569.1
Lợn rừng Hải Nam WB-Hainan EF545572.1
Lang-tan Lantang KC250274
Lợn La-ny-u Lanyu DQ518915.2
Lưu vực sông
Dương Tử
A-ba Aba EF545578.1
Lợn rừng Jiangxi WB- Jiangxi EF545579.1
Lợn Kim Hoa Jinhua KC469586
Lợn Xi-ang Xiangg KC250273
Lợn Hạ Lang Lợn Mường Khương
28
Khu vực địa lý Các giống lợn Mã số truy cập
GenBank (NCBI) Tên Tiếng Việt Tên Tiếng Anh
Lợn Bi-hu Bihu EF545591.1
Wei Wei EF545577.1
Lưu vực sông
Hoàng Hà
Ba-mây Bamei EF545583.1
Hu-du Huzu EF545588.1
Các nước Châu Âu
Béc-sai Berkshire AY574045.1
Đu - rốc (Heo bò) Duroc AY337045.1
Lợn đen I-bê-ria Iberian FJ236994.1
Ham-p-shơ Hampshire AY574046.1
Đại Bạch Large-white KC250275
Lan-đờ-rát Landrace AF034253.1
Pi-ê-tờ-ranh Pietrain KC469587
Lợn rừng Châu Âu WB-European FJ237000.1
- Các thí nghiệm về sinh học phân tử được tiến hành tại Phòng thí nghiệm của
Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam.
2.2. Hóa chất và thiết bị
2.2.1. Hóa chất
Các hóa chất được sử dụng trong thí nghiệm đều ở dạng tinh khiết, các bộ kít
thương mại. Hóa chất để tách DNA tổng số và kiểm tra sản phẩm sau tách chiết:
phenol - chloroform - isoamyl alcohol (tỷ lệ: 25: 24: 1), EDTA, proteinase K,
Rnase, agarose, ethidium bromide, ... của các hãng Sigma, Invitrogen, Merk; thang
chuẩn DNA của hãng Thermo Fisher (Mỹ).
Các bộ kít được sử dụng trong nghiên cứu gồm: Phản ứng PCR được tiến
hành sử dụng bộ kít GoTaq® Green Master Mix (hãng Promega - Mỹ), bộ kít tinh
sạch sản phẩm PCR QIAquick® PCR Purification Kit (hãng Qiagen - Mỹ), bộ kít
giải trình tự nucleotide (Bigdye® 3.1 terminator) của hãng Thermo Fisher - Mỹ.
Ba mươi cặp mồi được sử dụng để khuếch đại trình tự các phân đoạn
mtDNA được thể hiện tại bảng 2.2. Mồi được kế thừa và hiệu chỉnh dựa trên trình
tự 30 cặp mồi công bố bởi Yu và cs (2013) [63].
29
Bảng 2.2. Các cặp mồi được sử dụng cho PCR và vị trí các phân đoạn được khuếch đại
TT Trình tự mồi (5’-3’) Ta
(oC) Vị trí
Mồi xuôi Mồi ngược
D-loop AGGAGACTAACTCCGCCAT GCGGATACTTGCATGTGT 54 16556-1306
1 ACTAAGTCAATGCCTATTCTG CAAATGTATGAAACCTCAG 54 16298-548
2 CTACACAATAACCTCCCATA TGGCACGAGATTTACCAACT 54 1107-1490
3 GCTCATAACGCCTTGCTC ATTCTTTCATCTTTCCCTT 54 1377-2415
4 CACAACCATGCAAGAAGAGACA ACAACCAGCTATCACCAGGC 54 2141-2634
5 CCGTAAGGGAAAGATGAAAG TATGGTTATTTTGACTGGT 54 2393-3493
6 CCGTGCAAAGGTAGCATA CCAACATCGAGGTCGTAA 55 3189-3606
7 TGGGGTGACCTCGGAGTAC AATATGGCGAAAGGTCCGG 54 3423-4589
8 CGAGCAGTAGCCCAAACA GGTCGTATCGGAATCGTG 55 4321-4771
9 GTATCAGGCTTTAACGTAGA TGGTAATACTGCTGTCATTC 55 4543-5671
10 CACAGAAGCAGCCACAAA ATGGGATAGGGATAAAGT 55 5242-5782
11 ACATAGGATGAATGACAGC TGGTGGAAGTAGTCAGAAAC 55 5643-6831
12 GCACTGCCTTGAGCCTAC GTGTTCAGGTTGCGGTCT 55 6599-7160
13 CCCATTATGATTGGGGGTTT TGCTGTGTATGCGTCAGGAT 55 6724-7857
14 CACTTTGTAATCATATTCGTAG TAGTTGGAAAGGGTAAGC 53 7747-8223
15 TTCATCTCACTAACAGCAG TTGAGTTCGGTTGATTCTG 55 7885-9086
16 GCTTCATGCCCATTGTAC TTATAGCGGAATCCTGTG 55 8816-9478
17 GCAAGCCCAGAATCAACCG CGAGGAGGATTGAGGTGTT 55 9061-10214
18 ATACCACATAGTAAACCCAA CCTGTAGCCACAAAGAAA 55 9820-10404
19 CTAAACACCTCAATCCTCC TTGGACGTAATCGGTACCG 55 10193-11341
20 CCTTGCAGGGTTACTTAT TTCGGGTTGTGGTTTCTT 53 11113-11632
21 CGGTACCGATTACGTCCAA CCGATTAGATTGATGGATG 55 11323-12488
22 ACCAGCTCTATCTGCTTA GAGGCTTTGATGTTGTTA 55 12172-12644
23 ATGATGACTAATAGCAAGCC GGGATGTAGTCCGAATTG 55 12429-13627
24 CATCGGAGACATTGGATT AGTTGGCTTGAAGTTGAG 55 13462-13863
25 CCTACTCCTAGCTGCAGCAG ATTATGGAGATTACTCGTGG 55 13579-14765
26 TCCGCATCATCATTACTA TTTATGGTGGACTTGGGT 55 14576-15187
27 TAATTACCACGAGTAATCTC TTCTACGAGGTCTGTTCCG 55 14740-15827
28 GGAGCATCCATATTCTTT GGTGTAGTTGTCTGGGTCT 53 15597-16112
29 TCGTAGAATGAATCTGAGG GGTGATACGCATGTTGACTG 55 15820-301
30
Trình tự nucleotide hoàn chỉnh hệ gen ty thể của lợn (S. scrofa) với mã số
truy cập GenBank: NC000845.1 được sử dụng làm trình tự tham khảo, để thiết kế,
hiệu chỉnh các cặp mồi và thực hiện các phép dóng hàng trình tự.
2.2.2. Thiết bị
Thiết bị lấy mẫu và bảo quản mẫu máu: Phích lạnh, đá khô, quần áo bảo hộ,
khẩu trang, găng tay, ủng, giấy tờ ghi chép. Dụng cụ lấy mẫu đều được tiệt trùng.
Ống đựng mẫu máu có bổ sung chất chống đông (EDTA).
Các thiết bị thí nghiệm được sử dụng trong nghiên cứu bao gồm: Máy giải
trình tự ABI 3500 Genetic Analyzer, Máy luân nhiệt GeneAmp® PCR System 9700
(Thermo Fisher, Mỹ). Tủ lạnh sâu (Sanyo, Nhật), máy soi DNA Mini -
transllumminator (hãng Biorad, Mỹ), máy voltex (Minishaker, IKA, Đức), máy ly
tâm Eppendorf, máy định lượng DNA Nanodrop Spectrophotomer (Thermo Fisher,
Mỹ), pipetman các loại (Gilson, Pháp),...
2.3. Phương pháp nghiên cứu
Các thí nghiệm, tiến trình nghiên cứu được tiến hành theo sơ đồ tổng quát
mô tả ở hình 2.3.
Hình 2.3. Sơ đồ tổng quát các bước nghiên cứu
Thu mẫu, tách chiết DNA
Khuếch đại, giải trình tự
Dóng hàng đa trình tự, xác
định mô hình tiến hóa
Phân tích tương đồng, đa
hình trình tự
Xây dựng cây phát sinh
chủng loại
Khảo sát điều tra các giống
lợn
Đánh giá cây và phân tích
phát sinh chủng loại
Lắp ráp, phân tích, chú giải
hệ gen
31
2.3.1. Phương pháp điều tra dựa trên đặc điểm ngoại hình lợn
Ngoại hình của các cá thể giới tính cái thuộc 6 giống lợn bản địa: Ỉ, Móng
Cái, Hương, Hạ Lang, Mường Khương và Mường Lay được đánh giá thông qua
quan sát bên ngoài con vật bởi các nhóm chỉ tiêu màu sắc lông, da và nhóm chỉ tiêu
đánh giá về hình dạng, đặc điểm của các bộ phận trên cơ thể lợn, đo đạc các chỉ tiêu
về tầm vóc, khối lượng.
Các giống lợn nghiên cứu được nuôi trong các trại giống và hộ nông dân có
điều kiện chăn nuôi cơ bản tương đồng nhau, toàn bộ các giống lợn được nuôi nhốt
hoàn toàn trong chuồng xây, nền xi măng, mái lợp phi-brô xi măng. Lợn được ăn
với tiêu chuẩn dinh dưỡng tương đương nhau ở các điểm thu mẫu.
Tiến hành phỏng vấn các hộ chăn nuôi theo các câu hỏi đã đặt sẵn trên cơ sở
tìm hiểu trước về thông tin từ trại giống, các hộ chăn nuôi, thông tin về phả hệ của
Viện Chăn nuôi Quốc gia và Trung tâm giống vật nuôi - Sở Nông nghiệp và phát
triển nông thôn tại một số địa phương.
Lập phiếu điều tra, ghi chép số liệu và dùng máy chụp ảnh ghi lại hình ảnh
các giống lợn bản địa đang nuôi của từng hộ, ̣trại giống cu ̣thể. Đánh giá sơ bô ̣về
nguồn gốc, chất lượng từng giống lợn đang nuôi.
Đối với việc khảo sát nhóm chỉ tiêu về kích thước, lợn được cố định bằng
dây thừng và đo các chỉ số: dài thân, vòng ngực và cao vai bằng thước dây theo đơn
vị cm.
- Cao vai: Đo khoảng cách từ mặt đất đến u vai (đo bằng thước gậy, thước
dây).
- Dài thân: Đo khoảng cách từ điểm nối hai tai đến khâu đuôi theo chiều cong
của lưng (thước dây).
- Vòng ngực: đo chu vi lồng ngực sau bả vai (thước dây).
- Khối lượng: sử dụng cân bàn.
Tiêu chí đánh giá là dựa vào đặc điểm ngoại hình đã được nghiên cứu và
công bố (theo Át lát Các giống vật nuôi ở Việt Nam và Chuyên khảo Bảo tồn và
khai thác nguồn gen vật Nuôi Việt Nam - Phụ lục 1) [5, 86].
32
Phương pháp thu mẫu máu
Phương pháp lấy mẫu máu lợn vô trùng, có chất chống đông theo Quy chuẩn
kỹ thuật quốc gia về bệnh động vật - Yêu cầu chung lấy mẫu bệnh phẩm, bảo quản
và vận chuyển (QCVN 01 - 83: 2011/BNNPTNT) [87]. Cụ thể như sau:
- Lấy 5 ml máu ở vị trí tĩnh mạch cổ, động mạch đuôi, tĩnh mạch tai.
- Trước khi lấy máu vị trí lấy sẽ được sát trùng bằng bông cồn ethanol 70%
rồi dùng bơm kim tiêm vô trùng lấy từ 3 ml đến 5 ml máu. Máu lấy ra được chứa
trong bơm tiêm, rồi chuyển nhẹ nhàng mẫu vào ống đựng máu có chứa chất chống
đông. Đảo nhẹ ống đựng mẫu để chất chống đông được trộn đều với máu, tránh lắc
mạnh các thành phần trong máu sẽ bị vỡ làm máu có màu đỏ đậm.
- Ghi ký hiệu mẫu trên ống nghiệm, dùng giấy parafin quấn chặt nắp ống
tránh mẫu bị đổ ra ngoài trong quá trình vận chuyển.
- Bảo quản mẫu ở điều kiện 10oC trong quá trình chuyển mẫu về phòng thí
nghiệm. Tại phòng thí nghiệm các mẫu máu sẽ được chuyển vào bảo quản ở tủ -
200C, cho đến khi tiến hành các thí nghiệm sinh học phân tử tiếp theo.
2.3.2. Phương pháp tách chiết DNA tổng số
DNA được chiết tách theo phương pháp mô tả bởi Sambrook và cs [88]:
- Ủ tan máu ở 370C/15 phút
- Bổ sung 1000 µl PBS; votex đều; đặt trong đá 30 phút; ly tâm ở 10000
rpm/10 phút/40C, loại bỏ pha trên.
- Bổ sung 1000 µl PBS hòa tan lớp dưới trong ống eppendorf; ly tâm ở 6000
rpm/10 phút/40C - Lặp lại bước 3 đến khi hồng cầu bị dung giải hết.
- Bổ sung 900 µl dung dịch Lysis Buffer; trộn đều bằng pipet; ủ ở 370C trong 1 giờ.
- Bổ sung 20 µl Proteinase K (2,5mg/ml) vào dung dịch; trộn đều; ủ ở 650C/2 giờ.
- Thêm 450 µl P:C:I (25:24:1) vào các ống eppendorf; trộn đều; ly tâm ở
12000 rpm/15 phút/40C. Thu pha trên.
- Thêm 450 µl P:C:I (25:24:1) vào các ống eppendorf; trộn đều; ly tâm ở
12000 rpm/15 phút/40C. Thu pha trên.
- Bổ sung 1000 µl EtOH 100% + 50 µl CH3COONa 3M, pH 5,2 vào ống
eppendorf; trộn đều.
- Ly tâm 12000 rpm/15 phút/40C
- Hòa tan cặn trong 1000 µl EtOH 10%; ly tâm ở 12000rpm/10 phút/4oC.
33
- Để khô DNA tự nhiên (hoặc sử dụng máy làm khô Speedvac). Hòa tan
DNA trong 100µl dH2O.
DNA tổng số tách chiết được sau đó được pha loãng về nồng độ 20 ng/ml.
Chất lượng và nồng độ DNA tổng số được kiểm tra bằng máy đo quang phổ
Nanodrop (Thermo Fisher, Mỹ) và điện di trên gel agarose 1 %, nhuộm ethidium
bromide.
2.3.3. Khuếch đại mtDNA
Kĩ thuật PCR sử dụng DNA polymerase chịu nhiệt để tổng hợp (in vitro) các
đoạn DNA từ mạch khuôn trong môi trường có các dNTPs và cặp mồi đặc hiệu.
Toàn bộ phân đoạn mtDNA được khuếch đại bằng phản ứng PCR sử dụng 30 cặp
mồi (bảng 2.2). Các đoạn DNA mới được tạo thành lại được sử dụng làm khuôn.
Sau nhiều chu kỳ, số đoạn DNA khuôn được nhân lên gấp bội, nhờ vậy đủ nguyên
liệu để phục vụ cho các nghiên cứu tiếp theo.
Tổng thể tích PCR sử dụng bộ kít GoTaq® Green Master Mix (hãng Promega,
Madison, WI, USA), với tổng thể tích 25 µl cho mỗi phản ứng khuếch đại theo tỷ lệ
khuyến cáo của nhà sản xuất, thành phần phản ứng được liệt kê tại bảng 2.3:
Bảng 2.3. Thành phần phản ứng PCR
Thành phần Thể tích Nồng độ cuối
GoTaq® Green Master Mix 2X 12,5 µl 1X
Mồi xuôi 0,25-2,5 µl 0,1-1,0 µM
Mồi ngược 0,25-2,5 µl 0,1-1,0 µM
DNA khuôn 1-5 µl <250 ng
ddH2O (thêm tới đủ thể tích) 25 µl
- Phản ứng PCR được tiến hành với chu trình nhiệt: 95oC trong 7 phút, 25
chu kì (95oC, 30 giây; 50-65oC tùy theo mồi, 30 giây; 72oC, 15 giây); 72oC, 7 phút
và cuối cùng giữ ở 4oC.
- Kiểm tra sản phẩm PCR bằng cách điện di trên agarose 1%.
- Tinh sạch sản phẩm PCR bằng kit QIAquick PCR Purification Kit
(Qiagen).
2.3.4. Xác định trình tự hệ gen ty thể
Các cá thể thuộc 6 giống lợn bản địa Việt Nam sau khi được sàng lọc có
34
các đặc điểm ngoại hình đặc trưng của giống sẽ được lựa chọn mỗi giống một cá
thể đem đi giải trình tự hệ gen ty thể. Giải trình tự hệ gen ty thể bằng phương
pháp giải trình tự phân đoạn (shotgun) theo nguyên lý của Sanger [89]. DNA
polymerase xúc tác gắn các deoxynucleotide vào mạch đơn DNA đang tổng hợp
vào đầu 3'-OH, khi gặp dideoxynucleotide đánh dấu huỳnh quang không có
nhóm 3'-OH, phản ứng tổng hợp sẽ dừng lại. Nồng độ của mỗi
dideoxynucleotide được xác định thận trọng để đảm bảo sự gắn hỗn hợp các
chuỗi đang tổng hợp tại mỗi vị trí có thể và không gắn ở vị trí đầu tiên của
nucleotide bổ trợ của khuôn. Kết quả là hỗn hợp sản phẩm sau phản ứng bao gồm
các polynucleotide có kích thước hơn kém nhau một nucleotide.
Quy trình được tiến hành trên máy ABI - 3500 (Thermo Fisher) theo khuyến
cáo của nhà sản xuất:
- Chuẩn bị thành phần phản ứng được trình bày tại bảng 2.4:
Bảng 2.4. Thành phần phản ứng giải trình tự
Thành phần Lượng
BigDye® Terminator v3.1 4 l
BigDye® Sequencing Buffer 2 l
Mồi 3,2 pmol
Khuôn 5-20 ng
Nước Thêm tới 20 l
- Chạy phản ứng với chu trình nhiệt: 96oC trong 1 phút, 25 chu kì (96oC,
10 giây; 50oC, 5 giây; 60oC, 4 phút); sau đó giữ ở 4oC.
- Tinh sạch sản phẩm
+ Bổ sung 5 l EDTA 125 mM.
+ Bổ sung 60 l ethanol 100%.
+ Trộn đều, ủ 15 phút ở nhiệt độ phòng.
+ Ly tâm 12000 vòng/phút trong 15 phút tại 4oC.
+ Loại bỏ phần dịch.
+ Bổ sung 60 l ethanol 70%.
+ Ly tâm 12000 vòng/phút trong 5 phút tại 4oC.
35
+ Loại bỏ phần dịch.
+ Làm khô và bảo quản ở 4oC
- Biến tính
+ Bổ sung 20 l Hi-DiTM.
- Trộn đều.
+ Biến tính ở 95oC trong 5 phút.
- Điện di mao quản
+ Chuyển mẫu sang plate.
+ Đặt chương trình cho máy đọc trình tự.
- Xử lí thô kết quả
2.3.5. Nhóm phương pháp lắp ráp, dóng hàng trình tự, dự đoán và chú giải
hệ gen
2.3.5.1. Lắp ráp hệ gen
Các bước lắp ráp hệ gen ty thể được tóm tắt ở hình 2.4.
Hình 2.4. Các bước lắp ráp hệ gen ty thể
- Lắp ráp (phần mềm EditSeq và DNADragon)
- Lưu dưới dạng đuôi .fasta
Dữ liệu thô (tệp tin định dạng .ab1)
- Đánh giá, chỉnh sửa trình tự (phần mềm Bioedit)
- Lưu dưới dạng đuôi .fasta
Dữ liệu đã được tinh sạch
Các contigs
- Ghép nối các contigs (phần mềm DNA Dragon) - Lưu dưới dạng đuôi .fasta
Trình tự hoàn chỉnh hệ gen (dạng fasta)
36
Dữ liệu trình tự đọc được từ hệ thống giải trình tự ABI3500 được kết xuất
tệp tin với định dạng ".ab1" bao gồm hai loại thông tin: trình tự nucleic acid và
cường độ của tín hiệu mà hệ thống ghi nhận được. Dữ liệu sau đó sẽ được đánh giá
và chỉnh sửa trên phần mềm BioEdit v7.2.5. Thông qua độ mạnh yếu của tín hiệu
thu được, chúng tôi có thể xác định một cách tương đối chất lượng của đoạn trình tự
đã đọc được. Từ đó, tiến hành cắt bỏ đoạn trình tự có chất lượng thấp, nhằm làm
tăng độ tin cậy cho đoạn trình tự thu được để tạo ra các contig.
Các đoạn contig thu được từ quá trình cắt gọt sẽ được ghép nối lại dựa trên
phần trình tự gối lên nhau ở hai đầu mỗi đoạn. Công cụ được sử dụng để nhận diện
và ghép nối các phần trùng nhau của trình tự vùng D-loop và vùng mã hóa là
phần mềm DNA Dragon v1.6.0 (SequentiX, Đức, http://www.dna-dragon.com/) và
phần mềm EditSeq (DNASTAR Inc., Madison, WI, Mỹ) [90].
Như vậy, trình tự các phân đoạn tương ứng với 30 cặp mồi sau khi dóng hàng
sẽ được ghép nối để tạo ra trình tự hoàn chỉnh liền mạch khép vòng của hệ gen ty thể.
Trình tự cuối cùng thu được chính là trình tự hoàn chỉnh của hệ gen ty thể. Trình tự
này được lưu dưới định dạng .fasta phù hợp với các phần mềm phân tích sau đó.
2.3.5.2. Dóng hàng đa trình tự
Trước khi tiến hành dóng hàng đa trình tự, các trình tự vùng D-loop và trình tự
vùng mã hóa của hệ gen ty thể vừa lắp ráp sẽ được tách riêng bằng cách sử dụng trình
tự D-loop tham chiếu được tải về từ Genbank - NCBI. Các đoạn trình tự lặp ngắn trước
sau: 5' -CGTGCGTACA-3' được xác định số lượng đơn vị lặp và loại bỏ khỏi dữ liệu
phân tích. Số lượng đoạn lặp này ở nghiên cứu đã công bố trước đây [91] khi so sánh
giữa các cá thể là khá đa dạng, chứng tỏ có một tỷ lệ heteroplasmy cao, do đó các đoạn
trình tự này không có ý nghĩa trong nghiên cứu phát sinh chủng loại.
Trình tự D-loop và trình tự hoàn chỉnh của toàn bộ hệ gen ty thể của 6 giống
lợn bản địa Việt Nam, cùng với các giống lợn Châu Âu và giống lợn Châu Á được
dóng hàng đa trình tự, sử dụng thuật toán MUSCLE trong phần mềm MEGA7
(http://www.megasoftware.net/) nhằm xác định các vị trí tương đồng [92, 93]. Khi
có tệp tin dữ liệu đầu ra của phép dóng hàng đa trình tự, sẽ là nguồn dữ liệu
đầu vào để xác định mô hình tiến hóa thích hợp nhất bằng phần mềm MEGA7
[93]. Dựa trên trình tự đã bắt cặp, các mô hình tiền nghiệm ban đầu phù hợp nhất
cho trình tự bắt cặp vùng D-loop và toàn bộ hệ gen cũng được xác định.
37
2.3.5.3. Phân tích, chú giải hệ gen
Công cụ Mitos là một webserver dùng để chú giải tự động hệ gen ty thể của các
sinh vật đa bào. Mitos còn cho phép chú giải các protein và các RNA không mã hóa.
Phân tích và chú giải hệ gen của các giống lợn bản địa Việt Nam bằng công cụ trực
tuyến Dogma và Mitos Web Server [94, 95]. Tất cả các chú giải được kiểm tra bằng
công cụ BLAST trên GenBank [96, 97]. Toàn bộ 22 gen tRNA được dự đoán cấu trúc
bậc hai sử dụng công cụ trực tuyến MITOS Web Server.
Hai công cụ phân tích trực tuyến song song là Mitos (http://Mitos.bioinf.uni-
leipzig.de) và Dogma (https://dogma.ccbb.utexas.edu/) [98] dựa trên ngân hàng dữ
liệu có sẵn giúp tìm ra các vùng gen có sự tương đồng, từ đó dự đoán vị trí của các
gen này trên trình tự.
- Mitos:
Quá trình phân tích diễn ra theo các bước sau: tìm kiếm các vùng mã hóa cho
protein thông qua công cụ Blastx hệ gen ty thể lên NCBI RefSeq, bước phân tích sau
đó sẽ xác định bộ ba khởi đầu và kết thúc, các đoạn lặp, các vùng tương đồng và các
đoạn trình tự tham chiếu tìm được.
Các bước phân tích được tiến hành như sau:
+ Đầu tiên, tìm kiếm các vùng mã hóa cho protein thông qua công cụ Blastx
hệ gen ty thể lên NCBI RefSeq.
+ Tiếp theo, các gen ứng viên mã hóa protein được tìm thấy qua việc phát
hiện sự tương đồng trong kết quả của tìm kiếm Blastx đối với các trình tự amino
acid của các protein được chú giải của hệ gen ty thể của các sinh vật đa bào được
tìm thấy trong NCBI RefSeq.
+ Sau đó là bước phát hiện các codon khởi đầu và kết thúc, các bản sao và
các tương đồng thuộc cùng một bản sao, ví dụ: thay đổi khung hoặc ghép nối.
+ Các tRNA được chú giải sử dụng MITFI, tức là các mô hình hiệp phương sai
dựa trên cấu trúc mới được mô tả bởi Jühling [99]. Phương pháp này được chứng minh
là có độ nhạy chưa từng có (độ chính xác vượt trội hơn các công cụ ARWEN và
tRNAscan-SE).
+ Chú thích rRNA được thực hiện bằng cách sử dụng các mô hình hiệp
phương sai dựa trên cấu trúc đã được phát triển tương tự như các mô hình
tRNA. Dự đoán cấu trúc được cải thiện thông qua dự đoán đầu 5 'và 3' của rRNA.
38
+ Bước cuối cùng, phân tích kết quả, so sánh sự không đồng nhất và kết xuất
dữ liệu.
- Dogma
Dogma (Dual Organellar Genome Annotator) là công cụ dựa trên nền tảng
web sử dụng để chú giải hệ gen ty thể ở động vật và lạp thể ở thực vật được phát
triển bởi Stacia Wyman từ năm 2004 [98]. Công cụ cho phép sử dụng công cụ tìm
kiếm BLAST đối với một cơ sở dữ liệu tùy ý và sự bắt cặp các base trong cấu trúc
bậc hai của các gen tRNA của hệ gen ty thể động vật nhằm mục đích nhận dạng và
chú giải gen [98]. Dogma cũng cho phép người dùng trích xuất các trình tự phụ của
hệ gen (bao gồm các vùng không mã hóa giữa các gen (intergenic regions), intron,
trình tự amino acid của gen mã hóa protein, ...) cho các phân tích tiếp theo.
Tệp tin đầu vào bao gồm trình tự hoàn chỉnh của các nucleotide được chuẩn bị ở
dạng FASTA. Dữ liệu hệ gen đưa vào dưới dạng một contig, trình tự bao gồm 4 loại
nucleotide A, T, G, C ở dạng kí tự viết in hoa. Với các gen mã hóa protein, hệ gen được
dịch mã trong tất cả 6 khung đọc và được truy vấn với dữ liệu trình tự amino acid sử
dụng BLAST [100]. RNA ribosome (rRNAs) và RNA vận chuyển (tRNAs) được truy
vấn với một cơ sở dữ liệu trình tự nucleotide. Bởi việc xác định vị trí các gen bằng sự
tương đồng trình tự với các gen ở các hệ gen khác và bởi kết quả BLAST không cho
biết vị trí chính xác của bộ ba khởi đầu, bộ ba kết thúc của các gen mã hóa protein, nên
tác giả phải tự xác định, lựa chọn vị trí của bộ ba khởi đầu và bộ ba kết thúc, vị trí khởi
đầu và kết thúc của mỗi tRNA và rRNA cũng cần được xác định.
2.3.6. Phân tích trình tự và phương pháp xác định mức độ tương đồng trình tự
Với trình tự thu được, chúng tôi tiến hành phân tích các chỉ số cơ bản về tỷ lệ
bất đối xứng của các loại nucleotide như phần trăm của các loại nucleotide sử dụng
phần mềm DAMBE v6.3.17 (http://dambe.bio.uottawa.ca/), cùng với đó là hai chỉ
số độ lệch: GC skew và AT skew được tính toán dựa theo công thức sau [101]:
Các đoạn lặp ngắn trước sau 5'-CGTGCGTACA-3' được xác định số đợn vị
lặp và loại bỏ khỏi dữ liệu phân tích. Các vị trí đa hình, vị trí SNP trên trình tự vùng
39
D-loop và trình tự vùng mã hóa của hệ ge ty thể của các giống lợn cũng được xác
định nhờ sử dụng phần mềm DnaSP v.6 và SeqMan v.7.1.0 (DNASTAR Inc.,
Madison, WI, Mỹ) [102].
2.3.7. Phương pháp xây dựng cây và phân tích chủng loại phát sinh
2.3.7.1. Ước lượng khoảng cách tiến hóa
Khoảng cách tiến hóa có thể ước lượng thông qua tính toán khoảng cánh cặp
trình tự - khoảng cách p (pairwise distance, p-distance), khoảng cách p là thước đo
sự khác biệt di truyền giữa các loài hoặc giữa các quần thể trong một loài. Khoảng
cách p giữa các cặp trình tự được tính toán sử dụng thuật toán hai thông số của
Kimura trong phần mềm MEGA [93]. Khoảng cách này là tỷ lệ (p) của các vị trí
nucleotide mà tại đó hai trình tự được so sánh là khác nhau. Nó được xác định bằng
cách chia số nucleotide khác nhau cho tổng số nucleotide được so sánh [103].
2.3.7.2. Phân tích phát sinh chủng loại
Trình tự của vùng Dloop và trình tự hoàn chỉnh của hệ gen ty thể được sử
dụng riêng biệt làm dữ liệu đầu vào để dựng cây phát sinh chủng loại. Cây được vẽ
theo tỷ lệ với chiều dài nhánh được đo bằng số lượng thay đổi trên mỗi vị trí,
dựa trên phương pháp suy luận Bayes. Phương pháp suy luận Bayes được phát
triển bởi John Huelsenbeck và Fredrik Ronquist [45], suy luận dựa trên việc xác
lập một phương pháp phân tích Bayes và các phương pháp mô hình hóa để phân
tích phát sinh chủng loại. Phương pháp này lượng giá một phân bố xác suất tiên
nghiệm, là khả năng mà một cây tạo ra thỏa mãn dữ liệu quan sát.
Suy luận Bayes thực chất là việc tính toán khả năng của một số dữ liệu đang
quan sát với một vài mô hình xác suất đã cho, nghĩa là: xác suất của dữ liệu với điều
kiện dựa trên mô hình đó. Suy luận Bayes thay vì tìm kiếm xác suất của một cây với
điều kiện dựa trên những dữ liệu sẵn có (dựa trên sự quan sát một phép dóng hàng
đa trình tự nào đó).
Ước lượng Bayes của phát sinh chủng loại được chú trọng vào một đại lượng
được gọi là phân bố xác suất tiên nghiệm của cây. Với một cây đã cho, xác suất tiên
nghiệm là xác suất để cây đúng, mục đích là tìm ra cây có xác suất cao nhất. Suy
luận Bayes trong nghiên cứu phát sinh chủng loại tương tự như khả dĩ tối đa
(maximum likelihood) bởi mỗi phương pháp đều tìm kiếm một đại lượng gọi là tỷ
lệ khả dĩ với dữ liệu điều kiện đang quan sát của cây. Khác biệt là việc xác định các
40
thông tin ban đầu và sử dụng thuật toán MCMC (Markov chain Monte Carlo) để
xác định phân phối xác suất hậu nghiệm.
Phân tích phát sinh chủng loại phân tử được tiến hành dựa trên dữ liệu rời
rạc sử dụng phương pháp suy luận Bayes. Thuật toán phân tích Bayesian được sử
dụng trong nghiên cứu này được phát triển trên phần mềm BEAST v1.8.3
(http://beast.bio.ed.ac.uk) [104] với thiết lập ban đầu Yule process và MCMC
10000000 được sử dụng để tính toán xác suất hậu nghiệm [45]. Sau đó, cây tốt nhất
sẽ được tìm ra bằng phần mềm Tree Annotater v.1.8.4.
Gốc của cây phát sinh chủng loại được xác định bằng phương pháp sử dụng
nhóm đối chứng (out - group). Trong luận án này, chúng tôi sử dụng trình tự tương
đồng đối chứng của lợn hoang Malaysia (Sus barbatus) để xác định gốc cho cây.
Trình tự của giống lợn hoang Malaysia (WB-Malaysia) được chọn lựa là nhóm đối
chứng bởi được biết đến là giống có trình tự mtDNA khác biệt với nhóm lợn hoang
Châu Âu và Châu Á và nhóm đối chứng này thường được sử dụng trong các nghiên
cứu trước đây về phát sinh chủng loại ở lợn [63, 56].
Sau đó, cây sẽ được kiểm tra thứ tự phân nhánh và tính chính xác bằng phân
tích giá trị bootstrap sau 1000 lần lặp lại sử dụng công cụ MEGA.
Cuối cùng, phần mềm Figure Tree v1.4.2 [105] được sử dụng để đọc tệp tin
kết xuất ra và xây dựng cây phát sinh chủng loại.
41
Chương 3. KẾT QUẢ VÀ THẢO LUẬN
3.1. Chọn lựa, thu thập mẫu
Tính đến nay tại Việt Nam, để nhận diện các giống lợn bản địa các nhà chọn
giống chưa có cơ sở dữ liệu phân tử nào mà chủ yếu căn cứ vào bộ chỉ tiêu các đặc
điểm hình thái đã được công bố và phê chuẩn bởi Bộ Nông nghiệp và Phát triển
nông thôn (Át lát các giống vật nuôi ở Việt Nam và Chuyên khảo Bảo tồn và khai
thác nguồn gen vật nuôi Việt Nam) [5, 86]. Để đảm bảo độ tin cậy trong việc thu
mẫu phục vụ nghiên cứu, chúng tôi đã tiến hành khảo sát các đặc điểm ngoại hình
của 6 giống lợn bản địa Việt Nam. Bộ chỉ tiêu nhận dạng giống trong Át lát giống
vật nuôi ở Việt Nam, cùng với những thông tin phả hệ, thông tin địa lý phân bố của
Viện Chăn nuôi Quốc gia và Trung tâm Giống vật nuôi - Sở Nông nghiệp và Phát
triển nông thôn tại một số địa phương cũng đã được sử dụng để tiến hành khảo sát.
Việc khảo sát ngoại hình 6 giống lợn bản địa dựa trên 3 nhóm chỉ tiêu là: (1) Đặc
điểm lông, da; (2) tầm vóc, khối lượng và (3) hình dáng cơ thể, số lượng núm vú.
Trong 3 nhóm chỉ tiêu, nhóm hình thái lông da luôn được ưu tiên và có ý nghĩa
quyết định hơn trong việc khẳng định tính đặc trưng của giống, được quan sát, ghi
nhận để sàng lọc trước. Tiếp đến là nhóm chỉ tiêu về khối lượng và tầm vóc được
sàng lọc sau, cuối cùng là nhóm chỉ tiêu về đặc điểm hình dáng bộ phận cơ thể.
Như vậy, việc khảo sát được tiến hành liên tiếp qua 3 cấp độ hình thái dựa trên
3 nhóm chỉ tiêu kể trên. Ở mỗi nhóm chỉ tiêu, số lượng các cá thể được quan sát,
đưa vào thống kê sẽ được sử dụng để sàng lọc ở các nhóm chỉ tiêu tiếp theo. Chúng
tôi đã thu được một số kết quả khảo sát về đặc điểm ngoại hình của các cá thể đại
diện cho 6 giống lợn bản địa bao gồm Ỉ, Móng Cái, Hương, Hạ Lang, Mường
Khương và Mường Lay như sau:
a. Nhóm chỉ tiêu đặc điểm lông da
Quan sát các đặc điểm lông da của các cá thể ở 6 giống lợn, kết quả khảo sát
được trình bày ở bảng 3.1. Ở giống Mường Lay, qua quan sát thấy sự phân bố màu
sắc lông da thường kèm theo với một số chỉ tiêu ngoại hình để tạo thành phân nhóm
nhỏ hơn (gọi tên: nhóm A+). Số lượng các cá thể lợn được quan sát màu sắc lông da
được phân vào các nhóm A+, A và B theo thứ tự giảm dần các chỉ tiêu đặc trưng
của giống. Chỉ những cá thể nào có đầy đủ chỉ tiêu của giống (nhóm A hoặc A+)
mới được chọn lựa để sàng lọc ở các nhóm chỉ tiêu tiếp theo.
42
Bảng 3.1. Kết quả khảo sát đặc điểm lông, da của 6 giống lợn bản địa
Đặc điểm về màu sắc lông da Tổng số N Nhóm %
Lợn Ỉ
Lông thưa, thô. Lông, da đen nhưng không bóng 9 9 A 100
Lợn Móng Cái
- Thân lang đen trắng, đầu đen, tiếp giáp giữa
lông đen và trắng có khoảng mờ
100
82 B 82,0
- Thân lang đen trắng, đầu đen giữa trán có
đốm trắng, tiếp giáp giữa lông đen và trắng có
khoảng mờ
18 A 18,0
Lợn Mường Khương
- Màu sắc lông da đen tuyền. Lông thưa và mềm.
100
77 B 77,0
- Màu sắc lông da đen tuyền hoặc đen có đốm
trắng ở đầu đuôi và chân, lông thưa mềm. 23 A 23,0
Lợn Hương
- Thân và 4 chân trắng, có mảng lông da màu
đen ở mông và da đầu. Phần tiếp giáp giữa đen
và trắng rộng khoảng 2-3 cm, trên đó da đen,
lông trắng 38
22 B 57,8
- Có thêm đặc điểm: giữa trán có một điểm
trắng, bốn chân có mầu trắng. 16 A 42,1
Lợn Hạ Lang
- Bụng trắng và có dải trắng vắt vai có dải đen
gần giống yên ngựa. 41
13 B 31,7
- Có thêm đặc điểm: Giữa trán có điểm trắng
gần giống hình nêm 28 A 68,3
Lợn Mường Lay
- Đen tuyền, lưng thẳng, đầu núm vú cách mặt
đất 10-15cm
70
35 B 50,0
- Có thêm đốm trắng ở chân, trán, đuôi, lưng
thẳng, đầu núm vú cách mặt 10-15 cm 8 A
11,4
2
- Có thêm lưng hơi võng, bụng hơi sệ, đầu
núm vú đều không sa sệ. 27 A+ 38,5
(N: Số cá thể được lựa chọn có đặc điểm màu sắc lông da phù hợp với Át lát;
%: phần trăm cá thể có đặc điểm phù hợp trên tổng số cá thể quan sát)
43
Các kết quả khảo sát về đặc điểm lông da cho thấy, các cá thể đều mang
những đặc điểm đặc trưng cho từng giống. Mặc dù trong một số giống có sự
phân ly về đặc điểm lông da tạo thành các nhóm cá thể nhưng vẫn mang những
đặc điểm chung của giống. Tuy nhiên để đảm bảo mức độ tin cậy cao nhất cho
nghiên cứu, chỉ những cá thể ở nhóm A và A+ sẽ được chọn lựa để tiến hành khảo
sát ở nhóm tiêu chí về tầm vóc, khối lượng.
b. Đặc điểm về kích thước các chiều đo và khối lượng
Ở hầu hết các giống lợn, khi lợn đạt 8 tháng tuổi, các đặc điểm ngoại hình đặc
trưng của giống được thể hiện hầu hết, đây cũng là thời điểm để xây dựng tiêu chí
tầm vóc của mỗi giống lợn thể hiện trong Át lát các giống vật nuôi. Kết quả khảo
sát về một số chiều đo ngoại hình và khối lượng cũng được lựa chọn lúc lợn đạt 8
tháng tuổi của 6 giống lợn nghiên cứu được trình bày ở bảng 3.2.
Bảng 3.2. Kết quả khảo sát khối lượng và kích thước của 6 giống lợn bản địa
Giống lợn N Khối lượng Dài thân Vòng ngực Cao vai
± SD ± SD ± SD ± SD
Ỉ 9 40,34 ± 0,92 85,76 ± 1,32 83,93 ± 1,44 39,58 ± 0,91
Móng Cái 18 51,47 ± 0,32 92,41 ± 1,35 90,77 ± 1,46 45,25 ± 0,93
Hương 16 40,55 ± 0,22 86,73 ± 1,33 81,31 ± 1,42 42,56 ±0,36
Hạ Lang 28 42,68 ± 042 87,12 ± 1,33 84,34 ± 1,43 43,68 ±0,98
Mường Khương 23 52,64 ± 0,92 93,94 ± 1,32 90,52 ± 1,46 46,14 ±0,96
Mường Lay 27 40,43 ± 0,95 85,71 ± 1,38 83,97 ± 1,46 43,25±0,94
(ĐVT: Khối lượng: Kg; kích thước: cm) N: số cá thể quan sát; : Trị số trung bình
± SD: độ lêch chuẩn
So sánh chỉ tiêu khối lượng và một số chiều đo khảo sát được của từng giống
với các chỉ tiêu trong Át lát các giống vật nuôi ở Việt Nam cho thấy đều có sự
tương đồng hoặc biến động tương đối nhỏ. 100% các cá thể được khảo sát về nhóm
chỉ tiêu tầm vóc và kích thước cơ thể đều mang những đặc điểm đặc trưng của từng
giống.
c. Khảo sát trên nhóm chỉ tiêu hình dáng cơ thể
Với số lượng cá thể chọn lựa được qua hai nhóm chỉ tiêu đặc điểm lông da và
tầm vóc, khối lượng sẽ được sàng lọc tiếp theo ở nhóm chỉ tiêu thứ ba là đặc điểm
44
hình dáng cơ thể, kết quả được trình bày tại bảng 3.3.
Bảng 3.3. Khảo sát đặc điểm hình dáng cơ thể của 6 giống lợn bản địa
Đặc điểm hình dáng cơ thể (số lượng núm vú) Tổng
số N %
Lợn Ỉ
- Đầu to vừa phải, trán gần phẳng, mặt nhăn, nọng cổ và
má chảy sệ khi béo, mõm ngắn,
- Bụng ít sệ, thân, chân dài và cao hơn so với lợn Ỉ Mỡ
9 9 100
Lợn Móng Cái
- Đầu to, mõm nhỏ và dài, tai nhỏ và nhọn, có nếp nhăn to
và ngắn ở miệng.
- Cổ to ngắn, ngực nở và sâu, lưng dài, hơi võng, bụng hơi
sệ, mông rộng và xuôi.
18 15 83,3
Lợn Mường Khương
- Mõm dài thẳng hoặc hơi cong. Trán nhẵn, tai tô cúp rủ về
phía trước.
- Bốn chân to cao, vũng chắc. Lưng hơi cong, bụng to
nhưng không sệ tới sát đất, mông hơi dốc.
23 20 86,9
Lợn Hương
- Đầu đen và thô, giữa trán có một điểm trắng.
- Chân to, bụng to vừa phải và không chạm đất, lưng võng
nhưng không gãy, bốn chân có mầu trắng, mông dốc, vai
nở, ngực sâu.
16 10 62,5
Lợn Hạ Lang
- Mõm ngắn, mặt nhăn to.
- Chân to ngắn. Lưng võng, bụng không chạm đất 28 25 89,2
Lợn Mường Lay
- Mõm thẳng, dài vừa phải, trán có nếp nhăn, tai to và dày cụp.
- Mình thuôn dài, lưng hơi võng, chân to và cao vừa phải,
đi bằng bàn.
- Núm vú đều, khi mang thai và nuôi con, núm vú không
sa sệ, không chạm đất.
27 13 48,1
(N: Số cá thể được lựa chọn có đặc điểm hình dáng cơ thể phù hợp với Át lát;
%: phần trăm cá thể có đặc điểm phù hợp trên tổng số cá thể quan sát)
45
Riêng với giống lợn Ỉ, do số lượng cá thể trong đàn còn quá ít, chỉ có 9 cá thể,
việc chọn lựa các cá thể chủ yếu chỉ dựa trên quan sát bằng mắt thường các đặc
điểm ngoại hình, giới tính, thông tin hồ sơ phả hệ, bỏ qua yếu tố tuổi lợn.
Số cá thể thuộc 6 giống lợn sau khi được chọn lựa qua 3 nhóm chỉ tiêu về
ngoại hình đã đạt đầy đủ các tiêu chí đặc trưng của từng giống. Mẫu máu của những
cá thể này được lựa chọn ngẫu nhiên mỗi giống 6 mẫu đem tách chiết DNA tổng số
phục vụ nghiên cứu.
Đặc điểm ngoại hình của giống vật nuôi vừa thể hiện tính đặc trưng cho mỗi
giống, vừa thể hiện hướng sản xuất của vật nuôi và là yếu tố rất quan trọng trong
công tác chọn giống và chăn nuôi. Kết quả điều tra, khảo sát đặc điểm ngoại hình
của các giống lợn bản địa, cùng các thông tin về phả hệ, cũng như hướng dẫn của
Viện Chăn nuôi Quốc gia và trung tâm Giống vật nuôi - sở Nông nghiệp và Phát
triển nông thôn tại một số địa phương, đã giúp chúng tôi thu thập được các mẫu
máu từ các cá thể đặc trưng cho từng giống, đảm bảo tính chính xác và đại diện,
phục vụ cho các thí nghiệm tiếp theo.
3.1.1. Thu thập mẫu máu
Mẫu máu sau khi thu thập từ các cá thể đặc trưng cho mỗi giống, được bảo
quản lạnh và chuyển về Phòng thí nghiệm của Viện Nghiên cứu hệ gen, lưu giữ ở
nhiệt độ - 20oC. Tất cả các mẫu máu thu được đều đạt tiêu chuẩn vô trùng, không
đông. Các mẫu máu đều đạt chất lượng cho việc tách chiết DNA phục vụ nghiên
cứu sinh học phân tử. Với lượng mẫu thu về, 6 mẫu ngẫu nhiên được lựa chọn từ
mỗi giống để tách chiết DNA tổng số và khuếch đại bằng PCR.
3.2. Trình tự hệ gen ty thể của 6 giống lợn bản địa
3.2.1. Tách chiết DNA tổng số của 6 giống lợn nghiên cứu
DNA tổng số sau tách chiết được kiểm tra độ tinh sạch và nồng độ bằng máy
đo quang phổ. Kết quả được trình bày tại bảng 3.4.
Bảng 3.4. Kết quả định lượng và kiểm tra độ tinh sạch của DNA tổng số
Giống lợn Tên mẫu Nồng độ (ng/µl) Độ tinh sạch OD
260/280 nm
Ỉ
I1 72,28 1,92 I2 51,25 1,98
I3 62,57 1,80
I4 73,13 1,88
I5 92,15 1,84
I6 52,03 2,03
46
Giống lợn Tên mẫu Nồng độ (ng/µl) Độ tinh sạch OD
260/280 nm
Hương
H1 51,24 1,95
H2 84,28 1,81
H3 82,18 1,92
H4 72,97 1,97
H5 63,18 2,14
H6 82,04 1,84
Móng Cái
MC1 93,21 1,72
MC2 172,23 1,72
MC3 151,88 2,02
MC4 164,08 2,02
MC5 162,56 1,99
MC6 82,22 1,94
Mường Khương
MK1 52,65 1,84
MK2 73,86 1,83
MK3 81,28 1,94
MK4 95,04 2,53
MK5 72,27 1,88
MK6 82,68 1,71
Mường Lay
ML1 192,37 1,94
ML2 172,23 1,97
ML3 82,45 1,92
ML4 91,58 1,96
ML5 73,16 1,84
ML6 72,46 1,83
Hạ Lang
HL1 73,45 1,97
HL2 72,93 1,82
HL3 91,87 1,94
HL4 72,11 1,99
HL5 62,44 1,84
HL6 82,78 1,83
I1-I6: Các mẫu thuộc giống lợn Ỉ; H1-H6: Các mẫu thuộc giống lợn Hương; MC1-MC6: Các mẫu thuộc giống lợn Móng Cái; MK1-MK6: Các mẫu thuộc giống lợn Mường Khương; ML1-ML6: Các mẫu thuộc giống lợn Mường Lay; HL1-HL6: Các mẫu thuộc giống lợn Hạ Lang.
Các mẫu DNA tổng số được tách chiết từ máu của 6 giống lợn bản địa sau
khi kiểm tra bằng máy đo quang phổ đều có chỉ số OD 260/280 đạt từ 1,7 - 2,1,
nồng độ đạt từ 51,24 - 192,37 ng/µl, như vậy mẫu DNA tách chiết được khá tinh
khiết, không bị tạp nhiễm protein.
Các mẫu DNA tổng số tiếp tục được kiểm tra bằng phương pháp điện di trên
gel agarose 1% để xác định chất lượng, mức độ đứt gãy và độ tinh sạch. Kết quả
được trình bày tại hình 3.1. A, B, C.
47
Hình 3.1. A. Điện di đồ DNA tổng số của giống lợn Ỉ và Hạ Lang
Số thứ tự của giếng từ 1 - 6 tương ứng với số thứ tự của mẫu, M: Marker 1kb
Hình 3.1. B. Điện di đồ DNA tổng số của giống lợn Mường Lay và Hương
Số thứ tự của giếng từ 1 - 6 tương ứng với số thứ tự của mẫu, M: Marker 1kb
M(bp) 1 2 3 4 5 6
Ỉ Hạ Lang
1 2 3 4 5 6
M(bp) 1 2 3 4 5 6
Mường Lay Hương
1 2 3 4 5 6
48
Hình 3.1. C. Điện di đồ DNA tổng số tách chiết từ giống lợn Móng Cái và
Mường Khương
Số thứ tự của giếng từ 1 - 6 tương ứng với số thứ tự của mẫu, M: Marker 1kb
Như vậy, qua kết quả điện di đồ trình bày tại hình 3.1 A, B, C cho thấy ở
tất cả các giếng, băng DNA tổng số đều hiển thị rõ, không bị đứt gãy, các mẫu
này là đạt yêu cầu cho các thí nghiệm tiếp theo.
Toàn bộ sản phẩm DNA tổng số sau tách chiết được bảo quản ở nhiệt độ -
20oC để sử dụng cho các thí nghiệm tiếp theo.
3.2.2. Khuếch đại phân đoạn hệ gen ty thể (mtDNA) của 6 giống lợn bằng PCR
Ba mươi cặp mồi liệt kê ở bảng 2.2 đã được sử dụng để tiến hành khuếch
đại trình tự toàn bộ hệ gen ty thể bằng các phản ứng PCR.
Sản phẩm PCR sau khi đạt đủ lượng, được kiểm tra kích thước đặc hiệu và
tinh sạch nhằm thu lượng DNA tinh khiết nhất. Toàn bộ sản phẩm PCR sau tinh
sạch của 6 giống lợn bản địa một lần nữa được kiểm tra chất lượng và kích thước trên
gel điện di agarose. Kết quả kiểm tra sản phẩm PCR sau tinh sạch đối với giống lợn
Hương được minh chứng tại hình 3.2, Kết quả đối với các giống còn lại được trình bày
ở phần Phụ lục 2.
M 1 2 3 4 5 6 (bp)
1 2 3 4 5 6
Móng Cái Mường Khương
49
Hình 3.2. Sản phẩm PCR sau tinh sạch trên gel agarose 1% đối với giống
lợn Hương
Số thứ tự của giếng tương ứng với số thứ tự của mồi được trình bày tại bảng 2.2, M: Marker1 kb, Neg: đối chứng âm.
Điện di đồ sản phẩm PCR sau tinh sạch cho thấy các băng rõ nét, chuẩn
kích thước, không xuất hiện băng phụ, chứng tỏ độ tinh sạch đã được đảm bảo,
sản phẩm cho ra đúng yêu cầu, không bị thất thoát hay nhiễm tạp trong quá trình
tinh sạch.
3.2.3. Xác định trình tự các phân đoạn DNA của hệ gen ty thể
Các sản phẩm PCR sau khi tinh sạch được giải trình tự. Quá trình giải trình
tự được thực hiện theo phương pháp Sanger trên hệ thống giải trình tự gen ABI-
3500. Với những phân đoạn DNA dài, phản ứng xác định trình tự được tiến hành
theo cả hai chiều xuôi và ngược.
Kết quả giải trình tự được thể hiện dưới dạng biểu đồ các peak và chuỗi ký
tự. Những đoạn trình tự được lựa chọn là những đoạn biểu đồ với hình thái các peak
có cường độ phù hợp, điển hình, rõ ràng và không hề xuất hiện các tín hiệu phụ hay
các tín hiệu chồng chéo. Từ đó có thể đảm bảo rằng chất lượng giải trình tự các
10000 bp
250 bp
M Neg 1 2 3 4 5 6 7 8 9 10
Neg 21 22 23 24 25 26 27 28 29 30 M
11 12 13 14 15 16 17 18 19 20 Neg M
10000 bp
250 bp
10000 bp
250 bp
50
phân đoạn là tốt, dữ liệu trình tự hệ gen ty thể thu được của các giống lợn nghiên
cứu đáng tin cậy.
Ba mươi phân đoạn trình tự DNA của hệ gen ty thể của 6 giống lợn được giải
trình tự một cách độc lập, trình tự của mỗi phân đoạn sẽ được kết xuất ra dưới dạng
tệp tin dữ liệu thô. Một số phần mềm tin sinh đã được sử dụng để phân tích kết
quả. Đầu tiên, dữ liệu trình tự được đọc và tiến hành chỉnh sửa trên phần mềm
BioEdit v7.2.5. Thông qua độ mạnh yếu của tín hiệu thu được, chất lượng của
đoạn trình tự đã đọc được có thể xác định một cách tương đối. Tiếp đến, các
đoạn trình tự có chất lượng thấp sẽ được tiến hành cắt bỏ, nhằm làm tăng độ tin
cậy cho đoạn trình tự thu được. Đồng thời trình tự này được lưu dưới dạng file
FASTA phù hợp với các phần mềm phân tích sau đó.
3.2.4. Lắp ráp các phân đoạn DNA của hệ gen ty thể
Công cụ được sử dụng để nhận diện và ghép nối tạo các contig từ các
phân đoạn trình tự là phần mềm DNA Dragon v1.6.0. Kết quả của quá trình cắt
gọt trình tự, chuẩn bị cho dữ liệu đầu vào của quá trình lắp ráp được trình bày tại
bảng 3.5.
Các đoạn contig thu được từ quá trình cắt gọt sẽ được ghép nối lại dựa
trên phần trình tự gối lên nhau ở hai đầu mỗi đoạn để dựng nên trình tự hoàn
chỉnh của hệ gen.
Bảng 3.5. Kết quả quá trình chỉnh sửa trình tự chuẩn bị cho lắp ráp
hệ gen hoàn chỉnh
Giống lợn Ỉ Móng
Cái
Mường
Khương
Mường
Lay Hương
Hạ
Lang
Số lượng trình tự
cần lắp ráp 46 46 46 46 46 46
Chiều dài trung
bình các trình tự
trước lắp ráp (bp)
870,8 869,7 869,9 871,0 871,1 870,2
Chiều dài đoạn
gối lên nhau tối
thiểu (bp)
30 31 30 30 32 30
Số đoạn gối lên
nhau 47 47 47 47 47 47
51
Trình tự cuối cùng thu được của quá trình lắp ráp chính là trình tự hoàn
chỉnh của hệ gen ty thể và được lưu dưới dạng file FASTA. Trình tự hoàn chỉnh
hệ gen ty thể của 6 giống lợn bản địa gồm Ỉ, Móng Cái, Mường Khương, Mường
Lay, Hương và Hạ Lang đã được xác định và công bố trên GenBank với các mã số
truy cập tương ứng (liệt kê tại phần Phụ lục 3).
Kích thước hoàn chỉnh hệ gen ty thể cùng với thông số về các vùng trình tự
gối lên nhau giữa các gen thuộc hệ gen ty thể của 6 giống lợn bản địa Việt Nam
được trình bày ở bảng 3.6. :
Bảng 3.6. Kết quả lắp ráp hệ gen hoàn chỉnh 6 giống lợn bản địa Việt Nam
Giống lợn (Genbank
ID)
Kích thước genome
(bp)
Số lượng vùng gối giữa các
gen
Các vùng gối gen và kích thước (bp)
Tổng chiều dài các đoạn gối
(bp)
Ỉ
(KX094894) 16731 7
nd1- tRNAIle (2)
tRNAIle-tRNAGln (3)
nd2-tRNATrp (2)
atp8-atp6 (43)
nd4L-nd4 (7)
nd5-nd6 (17)
tRNAThr-tRNAPro (1)
75
Móng Cái (KX147100)
16711 10
nd1- tRNAIle (2)
tRNAIle-tRNAGln (3)
nd2-tRNATrp (2)
atp8-atp6 (43)
atp6-cox3 (1)
cox3- tRNAGly (1)
nd4L-nd4 (7) nd5-nd6 (14)
nd6-tRNAGlu (3)
tRNAThr-tRNAPro (1)
77
Mường Khương
(KY432578) 16679 8
nd1- tRNAIle (2)
tRNAIle-tRNAGln (3)
nd2-tRNATrp (2)
atp8-atp6 (43)
atp6-cox3 (1)
nd4L-nd4 (7)
nd5-nd6 (17)
tRNAThr-tRNAPro (1)
76
Mường Lay (KX147101)
16740 7
12srRNA-tRNAVal (1)
tRNAVal-16SrRNA (2)
tRNAIle-tRNAGln (3)
atp8-atp6 (34)
50
52
nd4L-nd4 (4)
nd5-nd6 (5)
tRNAThr-tRNAPro (1)
Hương (KY964306)
16753 10
12srRNA-tRNAVal (1)
tRNAVal-16SrRNA (2)
nd1- tRNAIle (2)
tRNAIle-tRNAGln (3)
nd2-tRNATrp (2)
atp8-atp6 (43)
atp6-cox3 (1)
nd4L-nd4 (7)
nd5-nd6 (17)
tRNAThr-tRNAPro (1)
79
Hạ Lang (KY800118)
16722 11
12srRNA-tRNAVal (1)
tRNAVal-16SrRNA (2)
nd1- tRNAIle (2)
tRNAIle-tRNAGln (3)
nd2-tRNATrp (2)
atp8-atp6 (43)
atp6-cox3 (1)
nd4L-nd4 (7)
nd5-nd6 (14)
nd6-tRNAGlu (3)
tRNAThr-tRNAPro (1)
78
Cùng thời điểm chúng tôi công bố dữ liệu trình tự hoàn chỉnh hệ gen ty thể
giống lợn bản địa Móng Cái của Việt Nam, công trình của nhóm tác giả Tran Thi
Thuy Nhien và cộng sự (2016) tiến hành nghiên cứu độc lập cũng công bố trình tự
hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái (mã số truy cập GenBank:
KU556691) [66]. Trình tự hệ gen ty thể trong nghiên cứu này được xác định từ mẫu
mô tai đông lạnh của một cá thể lợn Móng Cái thu tại tỉnh Sơn La. Kích thước hệ
gen của lợn Móng Cái do nhóm tác giả này công bố là 16.632 bp, ngắn hơn so với
trình tự trong kết quả nghiên cứu của chúng tôi là 79 bp. Tiến hành dóng hàng theo
cặp, so sánh trình tự mtDNA genome của giống lợn Móng Cái giữa công bố của
nhóm tác giả nêu trên với kết quả của chúng tôi, nhận thấy sự khác biệt chủ yếu chỉ
nằm trong vùng D-loop. Trong đó, số motif lặp ‘CGTGCGTACA' là 26 đoạn so
với công bố của luận án này là 23 đoạn, đây là nhân tố gây nên hiện tượng
herteroplasmy thường gặp giữa các cá thể trong cùng một giống. Ngoài ra, khi tiến
hành dóng hàng đa trình tự giữa trình tự được công bố bởi Tran Thi Thuy Nhien,
53
trình tự các giống lợn bản địa của luận án và các trình tự của một số giống lợn khác
trên thế giới, cho thấy trình tự của nhóm tác giả Tran Thi Thuy Nhien khác với hầu
hết các công bố khác là thiếu đi đoạn trình tự từ nucleotide thứ 951 đến 1038. Có
thể thấy sự khác biệt này chủ yếu là khác biệt về kích thước của trình tự ở vùng D-
loop. Tuy nhiên các công bố đều là kết quả từ những nghiên cứu độc lập, nên vẫn
cần có thêm những kiểm chứng đề làm sáng tỏ sự khác biệt.
3.3. Phân tích hệ gen ty thể
3.3.1. Phân tích thành phần hệ gen ty thể
Sau khi thu được trình tự hệ gen hoàn chỉnh, để có những đánh giá về thành
phần, cấu trúc của hệ gen ty thể của các giống lợn bản địa Việt Nam so sánh với các
giống lợn khác trên thế giới, chúng tôi tiến hành phân tích các chỉ số cơ bản nhất,
góp phần là cơ sở giúp đưa ra các nhận định về nguồn gốc và tiến hóa.
Các chỉ số cơ bản về thành phần hệ gen như phần trăm của các nucleotide A,
C, G, và T, chỉ số độ lệch các loại base: GC skew và AT skew, trong thành phần hệ
gen của 6 giống lợn được tiến hành phân tích bằng phần mềm DAMBE v.6.3.17
(http://dambe.bio.uottawa.ca/). Tỷ lệ thành phần các loại nucleotide A, C, G và T
được liệt kê tại bảng 3.7.
Bảng 3.7. Tỷ lệ thành phần các loại base trong trình tự hệ gen ty thể của 6
giống lợn bản địa Việt Nam.
Giống lợn A(%) C(%) G(%) T(%) G+C(%)
Ỉ 34,64 26,24 13,33 25,75 39,57
Móng Cái 34,70 26,20 13,30 25,79 39,50
Mường Khương 34,68 26,19 13,31 25,81 39,50
Hạ Lang 34,67 26,20 13,32 25,78 39,55
Hương 34,65 26,22 13,352 25,78 39,57
Mường Lay 34,70 26,19 13,32 25,79 39,51
Kết quả từ bảng 3.7 cho thấy, độ lệch thành phần các nucleotide hệ gen ty thể
của các giống lợn bản địa Việt Nam theo hướng giàu A+T (60,43 - 60,50%). Độ
lệch theo hướng giàu A+T có tác động tới sự khởi đầu của quá trình sao chép và
54
phiên mã, độ lệch tương tự cũng được quan sát thấy trong thành phần nucleotide hệ
gen ty thể của nhiều giống lợn Châu Á [55].
Bên cạnh đó, để phân tích sâu hơn tìm ra các đặc điểm đặc trưng trong thành
phần hệ gen ty thể, chúng tôi sử dụng hai chỉ số về độ lệch số lượng nucleotide (GC
skew và AT skew). Trong nghiên cứu này, hai chỉ số GC skew và AT skew được
tính toán dựa theo công thức đã trình bày ở phần phương pháp nghiên cứu [101].
Chỉ số GC skew và AT skew phản ánh sự bất tương xứng trong tỉ lệ thành phần
nucleotide của trình tự hệ gen ty thể. Tức là khi xét trên một vùng trình tự nào
đó, số lượng nucleotide có một sự biến thiên nhất định.
Sueoka (1995) đã sử dụng hai chỉ số này để đưa ra giả thuyết về sự thay thế
không cân bằng giữa hai sợi DNA [106]. Trong điều kiện cân bằng, không có sự tác
động của quá trình đột biến, áp lực của chọn lọc và có sự phân bố một cách ngẫu
nhiên trong toàn hệ gen, thì thành phần các Pirimidine và Purine (trong 4 loại base:
A, T, G, C) trên cả hai sợi của phân tử DNA sẽ bằng nhau. Nghĩa là, nếu cho rằng
khi không xảy ra đột biến và thay thế trong mỗi sợi DNA, tần số xuất hiện của base
loại T sẽ bằng với tần số xuất hiện của base loại A và tần số xuất hiện của base loại
G sẽ bằng với tần số xuất hiện của base loại C. Bất cứ sai lệch nào làm mất đi tỉ lệ
cân xứng thành phần các loại base ở hai chuỗi (chuỗi nhanh và chuỗi chậm) trong
phân tử DNA được gọi là AT skew và GC skew [107].
Độ lệch thành phần nucleotide nằm trong khoảng giá trị từ (-1) khi G = 0
hoặc A = 0 đến (+1) khi T = 0 hoặc C = 0. Do đó, trị số GC skew đạt giá trị dương
phản ánh số lượng G giàu hơn so với C, ngược lại GC skew đạt giá trị âm phản ánh
số lượng C giàu hơn so với G.
Một số chỉ số đặc trưng cho trình tự hệ gen ty thể có thể kể đến là tỷ lệ
phần trăm base loại G và loại C (% GC), độ lệch GC và AT (GC skew và AT
skew) được liệt kê nhằm phân tích và so sánh giữa các giống lợn bản địa Việt
Nam với các giống lợn khác trên thế giới, kết quả được trình bày tại bảng 3.8.
55
Bảng 3.8. Thành phần trình tự của các nhóm lợn phân bố theo khu vực địa lý
Khu vực Giống lợn Genbank ID
Trình tự hoàn chỉnh Trình tự D-loop
%GC GC
skew
AT
skew %GC
GC
skew
AT
skew
Lợn bản địa
Việt Nam
Ỉ KX094894 39,35 -0,33 0,15 39,91 -0,32 0,16
Móng Cái KX147100 39,23 -0,33 0,15 38,77 -0,33 0,16
Hạ Lang KY800118 39,24 -0,33 0,15 38,47 -0,34 0,16
Hương KY964306 39,25 -0,33 0,15 39,25 -0,30 0,14
Mường Khương KY432578 39,25 -0,33 0,15 38,79 -0,33 0,16
Mường Lay KX147101 39,29 -0,33 0,15 39,59 -0,31 0,16
Đông Bắc Á
Jeju AY879785.1 - - - 38,55 -0,35 0,17
Korean native
pig AY879794.1 - - - 38,76 -0,35 0,15
WB-China
northeast EU333163.1 39,25 -0,33 0,15 38,2 -0,34 0,15
WB-Japan AB015085.1 - - - 39,09 -0,33 0,16
WB-Korea AY574047.1 39,19 -0,33 0,15 38,59 -0,33 0,16
Lưu vực
sông Hoàng
Hà
Bamei EF545583.1 39,21 -0,33 0,15 38,69 -0,34 0,16
Huzu EF545588.1 39,2 -0,33 0,15 38,69 -0,34 0,16
Khu vực các
nước Châu
Âu
Berkshire AY574045.1 39,28 -0,33 0,15 38,47 -0,34 0,16
Duroc AY337045.1 39,32 -0,33 0,15 38,66 -0,35 0,16
Hampshire AY574046.1 39,33 -0,33 0,15 38,27 -0,36 0,16
Iberian FJ236994.1 39,29 -0,34 0,15 38,37 -0,35 0,16
Landrace AF034253.1 39,28 -0,33 0,15 38,47 -0,35 0,15
Large White KC250275 39,27 -0,33 0,15 38,47 -0,35 0,16
Pietrain KC469587 39,28 -0,34 0,15 38,52 -0,35 0,16
WB-European FJ237000.1 39,28 -0,34 0,15 38,56 -0,35 0,17
Lưu vực
sông Mê
Kông
Banna mini GQ220328.1 39,28 -0,33 0,15 39,16 -0,34 0,16
Dahe GQ220329.1 39,24 -0,33 0,15 38,92 -0,33 0,16
Thailand
indigenous pig FM244493.1 - - - 38,7 -0,33 0,16
WB-Malaysia EF545592.1 39,18 -0,33 0,15 38,59 -0,38 0,19
WB-Vietnam EF545584.1 39,26 -0,33 0,15 38,69 -0,34 0,16
56
Khu vực Giống lợn Genbank ID
Trình tự hoàn chỉnh Trình tự D-loop
%GC GC
skew
AT
skew %GC
GC
skew
AT
skew
WB-Yunnan EF545573.1 39,28 -0,33 0,15 39,27 -0,31 0,15
Khu vực
Nam Trung
Quốc
Lantang KC250274 39,22 -0,33 0,15 38,57 -0,34 0,16
Lanyu DQ518915.2 39,25 -0,30 0,12 38,55 -0,34 0,16
WB-Fujian EF545569.1 39,19 -0,33 0,15 38,71 -0,33 0,16
WB-Hainan EF545572.1 39,19 -0,33 0,15 38,68 -0,33 0,15
Lưu vực
sông Trường
Giang
Aba EF545578.1 39,21 -0,33 0,15 38,69 -0,34 0,16
Bihu EF545591.1 39,81 -0,31 0,14 38,69 -0,34 0,16
Jinhua KC469586 39,22 -0,33 0,15 38,46 -0,34 0,16
Kele EF536857.1 - - - 38,68 -0,34 0,16
Taoyuan AM040653.1 - - - 38,66 -0,34 0,16
WB-Jiangxi EF545579.1 39,22 -0,33 0,15 38,59 -0,34 0,16
Wei EF545577.1 39,2 -0,33 0,15 38,69 -0,34 0,16
Xiang pig KC250273 39,18 -0,33 0,15 38,59 -0,33 0,16
"-" : Trình tự hoàn chỉnh chưa được công bố.
Kết quả ở bảng 3.8. cho thấy, các chỉ số GC skew đối với các giống lợn đều
mang giá trị âm, AT skew đều mang giá trị dương ở cả hai vùng trình tự. Như vậy,
xét về mặt tiến hóa, xu hướng thay đổi thành phần nucleotide giữa các giống lợn là
không có khác biệt lớn. Nếu so sánh giữa vùng trình tự D-loop và trình tự hoàn
chỉnh, có thể thấy vùng D-loop ở đa phần các giống lợn đều có chỉ số AT skew cao
hơn, tức là có mức độ biến đổi thành phần nucleotide loại A và T cao hơn so với
trình tự toàn bộ hệ gen ty thể. Giá trị trung bình cộng của trị số GC skew đối với các
giống lợn bản địa Việt Nam (-0,32) cao hơn so với giá trị trung bình cộng của các
giống lợn khác trên thế giới (-0,34). Nhưng ngược lại đối với trị số AT skew các
giống lợn bản địa Việt Nam lại có giá trị trung bình (0,156) thấp hơn so với các
giống lợn khác (0,160).
Tiến hành so sánh mức độ biến đổi GC hay AT được thể hiện qua giá trị tuyệt
đối của các giá trị GC skew và AT skew tương ứng giữa các giống lợn, kết quả so sánh
các chỉ số đối với tất cả các giống đã thể hiện một số khác biệt đáng chú ý sau:
Đối với trình tự hoàn chỉnh, toàn bộ sáu giống lợn bản địa Việt Nam giống
nhau về trị số GC skew và AT skew. Giống lợn Lanyu và Bihu là hai giống lợn ít có
57
sự biến đổi về thành phần GC nhất (tương ứng là 0,30 và 0,31) đây cũng là hai
giống có sự biến đổi thành phần AT thấp nhất (0,12 và 0,14).
Đối với trình tự vùng D-loop, hai giống lợn bản địa của Việt Nam là Hương
và Mường Lay cùng với giống WB-Yunnan của Trung Quốc có trình tự hoàn chỉnh
ít có sự chênh lệch nhất giữa C và G tương ứng là 0,30 và 0,31. Bên cạnh đó, giống
lợn Hương cũng là giống có độ lệch giữa hai loại nucleotide A và T thấp nhất
(0,14). Ngược lại giống lợn có mức độ khác biệt giữa C và G trên trình tự vùng D-
loop cao nhất là giống WB-Malaysia (0,38) sau đó là giống Hampshire (0,36), đồng
thời cũng có chỉ số AT skew của trình tự hoàn chỉnh là cao nhất (0,19 và 0,16) khi so
sánh giữa các trình tự ở vùng D-loop với nhau.
Dấu của giá trị AT skew và GC skew đại diện cho xu hướng lệch của thành
phần nucleotide tương ứng. Các trị số AT skew của các giống lợn trên thế giới được
chọn lựa cho khảo sát trong nghiên cứu này đều đồng thời nhận giá trị dương và trị
số GC skew đều nhận giá trị âm, do đó hệ gen ty thể của các giống lợn này đều có
hàm lượng C và A cao hơn G và T. Kết quả này cho thấy, các giá trị của các chỉ số
AT skew và GC skew ở cùng một loài có thể có sự liên hệ mật thiết với nhau, giống
nào có độ biến đổi GC cao thì mức độ AT cũng sẽ cao.
Những biến đổi thành phần base thể hiện qua hai chỉ số độ lệch GC hoặc độ
lệch AT, các chỉ số này đã được sử dụng trong các nghiên cứu về thành phần
nucleotide của hệ gen ty thể và kết quả cho thấy chúng có mối liên hệ với quá trình
phát sinh chủng loại [108-110]. Đối với 6 giống lợn bản địa Việt Nam là đối tượng
nghiên cứu trong luận án này có sự đồng nhất trong thành phần trình tự hoàn chỉnh
hệ gen ty thể về hai trị số AT skew (0,15) và GC skew (-0,33), bên cạnh đó các
giống cũng có sự tương đồng về phân bố địa lý khi cùng thuộc khu vực phía Bắc
Việt Nam. Về lý thuyết, các chỉ số độ lệch này cũng cho phép đánh giá một phần độ
đa dạng di truyền và gián tiếp xác định các mối quan hệ về phát sinh chủng loại.
Tuy nhiên sự khác biệt là chưa đủ lớn giữa các đối tượng nghiên cứu, nên chưa thể
đưa ra suy luận khoa học cụ thể nào theo hai hướng trên từ các chỉ số GC skew và
AT skew.
So sánh các trình tự lặp trước sau theo motif 5'-tacacgtgcg-3' ở vùng D-
loop của hệ gen ty thể nhóm lợn bản địa Việt Nam so sánh với các giống lợn
khác trên thế giới cho thấy có những khác biệt nhất định. Cụ thể ở giống lợn Ỉ
58
(18 đoạn lặp), Hương (27 đoạn lặp), Hạ Lang (23 đoạn lặp), Mường Khương (20
đoạn lặp), lợn Móng Cái (22 đoạn lặp), Mường Lay (17 đoạn lặp) khác biệt lớn
so với các giống lợn nhóm Châu Âu: Duroc (10 đoạn), Landrace (13 đoạn),
Large-white (6 đoạn) hay các giống lợn Châu Á: Lợn rừng Nhật Bản (1 đoạn
lặp), và giống lợn rừng Ryukyu (1 đoạn lặp). Sự đa dạng trong cấu trúc lặp này
có thể được lý giải bởi đặc tính lặp lại và tự bổ sung của trình tự, điều này có
khuynh hướng làm bắt cặp sai dẫn tới sự trượt đi trong quá trình sao chép. Số
lượng motif lặp càng lớn thì càng có nhiều cơ hội cho việc hình thành cấu trúc
kẹp tóc là nguyên nhân gây ra lỗi trong quá trình sao chép. Đặc điểm đoạn lặp
này xuất hiện trong hệ gen của các giống lợn là sự xen kẽ chuỗi Purine-
Pirimidine tự nhiên dài nhất [91]. Mặc dù vậy, cấu trúc lặp này được coi là có
thể gây nên hiện tượng heteroplasmy nên được xem là không có ý nghĩa trong
nghiên cứu quan hệ phát sinh chủng loại [91].
3.3.2. Chú giải cấu trúc hệ gen ty thể
Giống như các loài động vật có xương sống khác, thứ tự sắp xếp và thành
phần cấu trúc của mtDNA của các giống lợn bản địa có sự tương đồng khá cao. Các
gen mã hóa chủ yếu nằm trên chuỗi H ngoại trừ gen ND6 và 8 gen tRNA được mã
hóa trên chuỗi L. Kết quả chú giải cấu trúc cho thấy: Hệ gen ty thể của các giống
lợn nghiên cứu đều bao 37 gen, trong đó có 2 gen mã hóa RNA ribosome, 13 gen
mã hóa protein, 22 gen mã hóa RNA vận chuyển và một vùng kiểm soát D-loop,
phân bố trên cả hai chuỗi H và L của ty thể. Vùng D-loop nằm giữa hai gen mã
hóa tRNA Phe và tRNA Pro. Ngoài ra còn có 12 vùng không mã hóa nằm rải rác
trên khắp hệ gen ty thể. Mã bộ ba kết thúc của các gen này đều là TAG hoặc
TAA hoặc AGA. Bên cạnh đó có một số gen mang bộ ba kết thúc không hoàn
chỉnh T--, theo giả định sẽ hình thành một bộ ba kết thúc TAA sau khi trải qua
quá trình gắn đuôi poly A trong quá trình biến đổi sau phiên mã. Cấu trúc hệ gen
ty thể của các giống lợn nghiên cứu được chú thích rõ tại các bảng 3.9 - 3.14.
59
Bảng 3.9. Cấu trúc của hệ gen ty thể lợn Móng Cái
Tên gen
Chuỗi
Vị trí Kích
thước
Bộ ba
AT/GC skew Khởi đầu
Kết thúc
Khởi đầu
Kết thúc
Đối mã
D-loop H 1 1275 1275
tRNA Phe H 1276 1345 70 GAA
12s rRNA H 1346 2305 960
tRNA Val H 2307 2374 68 TAC
16S rRNA H 2375 3944 1570
tRNA Leu2 H 3945 4019 75 TAA
ND1 H 4022 4978 957 ATG TAG -0,40/0,13
tRNA Ile H 4977 5045 69 GAT
tRNA Gln L 5043 5115 73 TTG
tRNA Met H 5117 5186 70 CAT
ND2 H 5187 6230 1044 ATA TAG -0,49/0,24
tRNA Trp H 6229 6296 68 TCA
tRNA Ala L 6303 6370 68 TGC
tRNA Asn L 6372 6446 75 GTT
tRNA Cys L 6479 6544 66 GCA
tRNA Tyr L 6545 6609 65 GTA
COX1 H 6611 8155 1545 ATG TAA -0,20/0,00
tRNA Ser2 L 8159 8227 69 TGA
tRNA Asp H 8235 8302 68 GTC
COX2 H 8303 8990 688 ATG T-- -0,31/0,12
tRNA Lys H 8991 9057 67 TTT
ATPase8 H 9059 9262 204 ATG TAA -0,55/0,20
ATPase6 H 9220 9900 681 ATG TAA -0,46/0,11
COX3 H 9900 10684 785 ATG TA- -0,32/0,05
tRNA Gly H 10684 10752 69 TCC
ND3 H 10753 11099 347 ATA TA- -0,49/0,17
tRNA Arg H 11100 11168 69 TCG
ND4l H 11169 11465 297 GTG TAA -0,35/0,02
ND4 H 11459 12836 1378 ATG T-- -0,50/0,14
tRNA His H 12837 12905 69 GTG
tRNA Ser1 H 12906 12964 59 GCT
tRNA Leu1 H 12965 13034 70 TAG
ND5 H 13035 14855 1821 ATA TAA -0,46/0,15
ND6 L 14842 15369 528 ATG TAA -0,56/0,35
tRNA Glu L 15367 15435 69 TTC
Cytb H 15440 16579 1140 ATG AGA -0,38/0,09
tRNA Thr H 16580 16647 68 TGT
tRNA Pro L 16647 16711 65 TGG
60
Bảng 3.10. Cấu trúc của hệ gen ty thể lợn Mường Lay
Tên gen Chuỗi
Vị trí Kích thước
(bp)
Bộ ba AT skew/ GC skew Khởi đầu Kết thúc
khởi đầu
kết thúc
đối mã
Dloop 1 1304 1304
tRNA Phe H 1305 1374 70 GAA
12s rRNA H 1375 2336 962
tRNA Val H 2336 2403 68 TAC
16S rRNA H 2402 3972 1571
tRNA Leu2 H 3973 4047 75 TAA
ND1 H 4056 5000 945 ATG TAG 0,14/-0,41
tRNA Ile H 5005 5073 69 GAT
tRNA Gln L 5071 5143 73 TTG
tRNA Met H 5145 5214 70 CAT
ND2 H 5215 6253 1044 ATT TAG 0,17/-0,43
tRNA Trp H 6258 6325 68 TCA
tRNA Ala L 6332 6399 68 TGC
tRNA Asn L 6401 6475 75 GTT
tRNA Cys L 6508 6573 66 GCA
tRNA Tyr L 6574 6638 65 GTA
COX1 H 6640 8178 1539 ATG TAA 0,08/-0,27
tRNA Ser2 L 8188 8256 69 TGA
tRNA Asp H 8264 8331 68 GTC
COX2 H 8332 9012 681 ATG T- - 0,15/-0,34
tRNA Lys H 9020 9086 67 TTT
ATPase8 H 9088 9282 195 ATG TAA 0,23/-0,57
ATPase6 H 9249 9923 675 ATG TAA 0,08/-0,43
COX3 H 9929 10711 783 ATG TA- 0,008/-0,28
tRNA Gly H 10713 10782 70 TCC
ND3 H 10783 11127 345 ATA TA 0,09/-0,41
tRNA Arg H 11130 11198 69 TCG
ND4l H 11214 11492 279 GTG TAA 0,11/-0,42
ND4 H 11489 12856 1368 ATG T-- 0,07/-0,45
tRNA His H 12867 12935 69 GTG
tRNA Ser1 H 12936 12994 59 GCT
tRNA Leu1 H 12995 13064 70 TAG
ND5 H 13065 14880 1800 ATA TAA 0,10/-0,42
ND6 L 14876 15391 516 ATG TAA 0,48/-0,25
tRNA Glu L 15398 15466 69 TTC
Cytb H 15471 16604 1134 ATG AGA 0,04/-0,34
tRNA Thr H 16611 16678 68 TGT
tRNA Pro L 16678 16742 65 TGG
61
Bảng 3.11. Cấu trúc của hệ gen ty thể lợn Mường Khương
Tên gen
Chuỗi
Vị trí Kích
thước
Bộ ba AT/GC
skew Khởi đầu
Kết thúc
Khởi đầu
Kết thúc
Đối mã
D-loop H 1 1244 1244
tRNA Phe H 1245 1314 70 GAA
12s rRNA H 1315 2274 960
tRNA Val H 2276 2343 68 TAC
16S rRNA H 2344 3912 1569
tRNA Leu2 H 3913 3987 75 TAA
ND1 H 3990 4946 957 ATG TAG 0,13/-0,40
tRNA Ile H 4945 5013 69 GAT
tRNA Gln L 5011 5083 73 TTG
tRNA Met H 5085 5154 70 CAT
ND2 H 5155 6198 1044 ATA TAG 0,24/-0,48
tRNA Trp H 6197 6264 68 TCA
tRNA Ala L 6271 6338 68 TGC
tRNA Asn L 6340 6414 75 GTT
tRNA Cys L 6447 6512 66 GCA
tRNA Tyr L 6513 6577 65 GTA
COX1 H 6579 8123 1545 ATG TAA -0,003/-0,19
tRNA Ser2 L 8127 8195 69 TGA
tRNA Asp H 8203 8270 68 GTC
COX2 H 8271 8958 688 ATG T-- 0,11/-0,31
tRNA Lys H 8959 9025 67 TTT
ATPase8 H 9027 9230 204 ATG TAA 0,19/-0,55
ATPase6 H 9188 9868 681 ATG TAA 0,10/-0,45
COX3 H 9868 10651 784 ATG T-- 0,05/-0,31
tRNA Gly H 10652 10720 69 TCC
ND3 H 10721 11066 346 ATA T-- 0,16/-0,48
tRNA Arg H 11068 11136 69 TCG
ND4l H 11137 11433 297 GTG TAA 0,01/-0,35
ND4 H 11427 12804 1378 ATG T-- 0,14/-0,49
tRNA His H 12805 12873 69 GTG
tRNA Ser1 H 12874 12932 59 GCT
tRNA Leu1 H 12933 13002 70 TAG
ND5 H 13003 14823 1821 ATA TAA 0,14/-0,46
ND6 L 14807 15334 528 ATG TAA -0,36/0,55
tRNA Glu L 15335 15403 69 TTC
Cytb H 15408 16547 1140 ATG AGA 0,08/-0,38
tRNA Thr H 16548 16615 68 TGT
tRNA Pro L 16615 16679 65 TGG
62
Bảng 3.12. Cấu trúc của hệ gen ty thể lợn Hạ Lang
Gen Chuỗi Vị trí Kích thước
(bp)
Bộ ba
AT/GC skew
Khởi đầu
Kết thúc
Khởi đầu
Kết thúc
Đối mã
D-loop H 1 1285 1285
tRNA Phe H 1286 1355 70 GAA
12S rRNA H 1356 2318 963
tRNA Val H 2318 2385 68 TAC
16S rRNA H 2384 3955 1572
tRNA Leu2 H 3956 4030 75 TAA
ND1 H 4033 4989 957 ATG TAG 0,13/-0,40
tRNA Ile H 4988 5056 69 GAT
tRNA Gln L 5054 5126 73 TTG
tRNA Met H 5128 5197 70 CAT
ND2 H 5198 6241 1044 ATA TAG 0,24/-0,48
tRNA Trp H 6240 6307 68 TCA
tRNA Ala L 6314 6381 68 TGC
tRNA Asn L 6383 6457 75 GTT
tRNA Cys L 6490 6555 66 GCA
tRNA Tyr L 6556 6620 65 GTA
COX1 H 6622 8166 1545 ATG TAA 0,00/-0,19
tRNA Ser2 L 8170 8238 69 TGA
tRNA Asp H 8246 8313 68 GTC
COX2 H 8314 9001 688 ATG T-- 0,11/-0,31
tRNA Lys H 9002 9068 67 TTT
ATPase8 H 9070 9273 204 ATG TAA 0,19/-0,55
ATPase6 H 9231 9911 681 ATG TAA 0,10/-0,45
COX3 H 9911 10694 784 ATG T-- 0,05/-0,31
tRNA Gly H 10695 10763 69 TCC
ND3 H 10764 11109 346 ATA T-- 0,16/-0,48
tRNA Arg H 11111 11179 69 TCG
ND4l H 11180 11476 297 GTG TAA 0,01/-0,35
ND4 H 11470 12847 1378 ATG T-- 0,14/-0,49
tRNA His H 12848 12916 69 GTG
tRNA Ser1 H 12917 12975 59 GCT
tRNA Leu1 H 12976 13045 70 TAG
ND5 H 13046 14866 1821 ATA TAA 0,15/-0,46
ND6 L 14853 15380 528 ATG TAA 0,36/-0,56
tRNA Glu L 15378 15446 69 TTC
Cytb H 15451 16590 1140 ATG AGA 0,08/-0,39
tRNA Thr H 16591 16658 68 TGT
tRNA Pro L 16658 16722 65 TGG
63
Bảng 3.13. Cấu trúc của hệ gen ty thể lợn Hương
Tên gen Chuỗi
Vị Trí Kích thước
(bp)
Bộ ba AT/GC
skew Khởi đầu
Kết thúc
Khởi đầu
Kết thúc
Đối mã
D-loop H 1 1315 1315
tRNA Phe H 1316 1385 70 GAA
12S rRNA H 1386 2349 964
tRNA Val H 2349 2416 68 TAC
16S rRNA H 2415 3986 1572
tRNA Leu2 H 3987 4061 75 TAA
ND1 H 4064 5020 957 ATG TAG 0,13/-0,40
tRNA Ile H 5019 5087 69 GAT
tRNA Gln L 5085 5157 73 TTG
tRNA Met H 5159 5228 70 CAT
ND2 H 5229 6272 1044 ATA TAG 0,24/-0,48
tRNA Trp H 6271 6338 68 TCA
tRNA Ala L 6345 6412 68 TGC
tRNA Asn L 6414 6488 75 GTT
tRNA Cys L 6521 6586 66 GCA
tRNA Tyr L 6587 6651 65 GTA
COX1 H 6653 8197 1545 ATG TAA -0,004/-0,19
tRNA Ser2 L 8201 8269 69 TGA
tRNA Asp H 8277 8344 68 GTC
COX2 H 8345 9032 68 ATG T-- 0,11/-0,31
tRNA Lys H 9033 9099 67 TTT
ATPase8 H 9101 9304 204 ATG TAA 0,19/-0,55
ATPase6 H 9262 9942 681 ATG TAA
COX3 H 9942 10725 784 ATG T-- 0,05/-0,31
tRNA Gly H 10726 10794 69 TCC
ND3 H 10795 11140 346 ATA T-- 0,16/-0,48
tRNA Arg H 11142 11210 69 TCG
ND4L H 11211 11507 297 GTG TAA
ND4 H 11501 12878 1378 ATG T-- 0,14/-0,49
tRNA His H 12879 12947 69 GTG
tRNA Ser1 H 12948 13006 59 GCT
tRNA Leu1 H 13007 13076 70 TAG
ND5 H 13077 14897 1821 ATA TAA 0,14/-0,46
ND6 L 14881 15408 528 ATG TAA -0,37/0,56
tRNA Glu L 15409 15477 69 TTC
Cytb H 15482 16621 1140 ATG AGA
tRNA Thr H 16622 16689 68 TGT
tRNA Pro L 16689 16753 65 TGG
64
Bảng 3.14. Cấu trúc của hệ gen ty thể lợn Ỉ
Gen Chuỗi
Vị trí Kích thước
(bp)
Bộ ba AT
skew
GC
skew Khởi đầu
Kết thúc
Khởi đầu
Kết thúc
Đối mã
D-loop H 1 1295 1295
tRNA Phe H 1296 1365 70 GAA
12S rRNA H 1366 2325 960 -0,15 /0,25
tRNA Val H 2327 2394 68 TAC
16S rRNA H 2395 3964 1570 -0,11 /0,24
tRNA Leu2 H 3965 4039 75 TAA
ND1 H 4042 4998 957 ATG TAG -0,40 /0,13
tRNA Ile H 4997 5065 69 GAT
tRNA Gln L 5063 5135 73 TTG
tRNA Met H 5137 5206 70 CAT
ND2 H 5207 6250 1044 ATA TAG -0,49 /0,24
tRNA Trp H 6249 6316 68 TCA
tRNA Ala L 6323 6390 68 TGC
tRNA Asn L 6392 6466 75 GTT
tRNA Cys L 6499 6564 66 GCA
tRNA Tyr L 6565 6629 65 GTA
COX1 H 6631 8175 1545 ATG TAA -0,20 /0,00
tRNA Ser2 L 8179 8247 69 TGA
tRNA Asp H 8255 8322 68 GTC
COX2 H 8323 9010 688 ATG T-- -0,31 /0,12
tRNA Lys H 9011 9077 67 TTT
ATPase8 H 9079 9282 204 ATG TAA -0,55 /0,20
ATPase6 H 9240 9920 681 ATG TAA -0,46 /0,11
COX3 H 9920 10703 784 ATG T-- -0,32 /0,05
tRNA Gly H 10704 10772 69 TCC
ND3 H 10773 11118 346 ATA T-- -0,47 /0,16
tRNA Arg H 11120 11188 69 TCG
ND4L H 11189 11485 297 GTG TAA -0,32 /0,01
ND4 H 11479 12856 1378 ATG T-- -0,49 /0,14
tRNA His H 12857 12925 69 GTG
tRNA Ser1 H 12926 12984 59 GCT
tRNA Leu1 H 12985 13054 70 TAG
ND5 H 13055 14875 1821 ATA TAA -0,46 /0,15
ND6 L 14859 15386 528 ATG TAA 0,56 /-0,35
tRNA Glu L 15387 15455 69 TTC
Cytb H 15460 16599 1140 ATG AGA -0,38 /0,09
tRNA Thr H 16600 16667 68 TGT
tRNA Pro L 16667 16731 65 TGG
65
Chú thích Quy ước tên gen:
- rRNA: ribosomal RNA; 16S rRNA: rRNA tiểu phần lớn; 12S rRNA: rRNA tiểu phần nhỏ; tRNA:
RNA vận chuyển và các từ in nghiêng là mã của các amino acid; ND1-6 và ND4l: gen mã hóa nicotinamide
dinucleotide dehydrogenase các tiểu phần 1 đến 6 và 4l; ATPase6 và 8: các gen mã hóa adenosine
triphosphatase tiểu phần 6 và 8; COX1 đến 3: các gen mã hóa các tiểu phẩn cytochrome c oxidase I đến III;
Cytb: gen mã hóa cytochrome b. T-- thể hiện ở bộ ba tận cùng không hoàn thiện; H(+), L(-): tương ứng là
chuỗi nặng và chuỗi nhẹ.
- D-loop: non-coding control region; tRNA Phe: transfer RNA Phenylalanime; tRNA Lys: transfer
RNA Lysine; tRNA Val: transfer RNA Valine; tRNA Leu2: transfer RNA Leucine 2; tRNA Gly: transfer
RNA Glycine; tRNA Ile: transfer RNA Isoleucine; tRNA Arg: transfer RNA Arginine; tRNA Gln: transfer
RNA Glutamine; tRNA Met: transfer RNA Methionine; tRNA His: transfer RNA Histidine; tRNA Trp:
transfer RNA Tryptophan; tRNA Ser1: transfer RNA Serine 1; tRNA Ala: transfer RNA Alanine; tRNA
Leu1: transfer RNA Leucine 1; tRNA Asn: transfer RNA Asparagine; tRNA Cys: transfer RNA Cysteine;
tRNA Tyr: transfer RNA Tyrosine; tRNA Glu: transfer RNA Glutamic acid; tRNA Ser2: transfer RNA
Serine2; tRNA Thr: transfer RNA Threonine; tRNA Asp: transfer RNA Aspartic acid; tRNA Pro: transfer
RNA Prolin.
Các kết quả bảng 3.9 - 3.14 cho thấy ở hệ gen ty thể của 6 giống lợn bản địa,
hầu hết các gen mã hóa protein và rRNA đều nằm trên chuỗi H. Hệ gen ty thể của
5/6 giống mang các gen này có GC skew mang giá trị âm và AT skew mang giá trị
dương, giống lợn Ỉ là giống duy nhất có các gen mã hóa protein và rRNA mang giá
trị GC skew dương, AT skew âm. Các gen mã hóa protein và rRNA là những nhân
tố có vai trò quyết định trong quá trình tiến hóa, do đó có thể giả định mức độ biến
thiên lớn trong thành phần nucleotide ở các gen này xuất phát từ quá trình tích lũy
các đột biến, chọn lọc trong lịch sử tiến hóa và phát sinh chủng loại.
Hệ gen ty thể của 6 giống lợn bản địa Việt Nam cũng được dự đoán cấu
trúc mạch vòng sử dụng công cụ trực tuyến GenomeVx [111]. Các giống lợn bản
địa Việt Nam có hệ gen ty thể cấu trúc mạch kép, khép vòng, với kích thước lần
lượt là: lợn Móng Cái: 16.711 bp (hình 3.3.A), lợn Mường Lay: 16.740 bp (hình
3.3.B), lợn Mường Khương: 16.679 bp (hình 3.3.C), lợn Hạ Lang:16.722 bp
(hình 3.3.D), lợn Hương:16.753 bp (hình 3.3.E) và lợn Ỉ có kích thước hệ gen ty
thể là: 16.731 bp (hình 3.3.F). Chiều dài trình tự vùng D-loop của lợn Hạ Lang,
Hương, Mường Lay, Móng Cái, Ỉ, Mường Khương lần lượt là: 1284, 1314, 1303,
1294, 1274, 1243 bp và đều nằm xen giữa hai trình tự của gen tRNAPhe và
tRNAPro. Tuy nhiên có thể coi các kích thước này không đặc trưng cho giống
bởi sự có mặt của trình tự lặp 5'-CGTGCGTACA tạo nên hiện tượng
heteroplasmy trong vùng D-loop trong các cá thể thuộc cùng một giống [112].
66
Biểu đồ hình tròn hệ gen ty thể cho biết vị trí các gen, biểu thị tỷ lệ về
kích thước tương đối của các phân đoạn DNA trong hệ gen, tương ứng với các
phân đoạn có màu sắc khác nhau thể hiện trên biểu đồ trong hình 3.3 (A, B, C,
D, E và F):
A
B
Hình 3.3.A.B. Cấu trúc dạng vòng của hệ gen ty thể lợn Móng Cái, lợn
Mường Lay được xây dựng bởi phần mềm GenomeVx.
67
C
D
Hình 3.3.C.D. Cấu trúc dạng vòng của hệ gen ty thể lợn Mường Khương, Hạ
Lang được xây dựng bởi phần mềm GenomeVx.
68
E
F
Hình 3.3.E.F. Cấu trúc dạng vòng của hệ gen ty thể lợn Hương và Ỉ được xây
dựng bởi phần mềm GenomeVx.
Kết quả phân tích cấu trúc, tổ chức hệ gen ty thể của các giống lợn cho thấy
có sự tương đồng với cấu trúc hệ gen ty thể của các loài động vật có vú khác. Thành
phần các loại base có trong hệ gen ty thể của cả 6 giống lợn đều theo hướng giàu
69
A+T (trên 60%), tương đồng với các nhóm lợn Châu Á khác [55]. Sự phân bố của
hầu hết các gen đều nằm trên chuỗi H, ngoại trừ gen ND6 và tám gen tRNA nằm
trên chuỗi L.
3.3.3. Cấu trúc thành phần của các gen RNA vận chuyển
22 gen tRNA trải khắp chiều dài của hệ gen ty thể, trong đó có hai gen tRNA
Leucine (tRNALeu(TTA) và tRNALeu(CTA)) và hai gen serine-tRNA
(tRNASer(AGC) và tRNASer(TCA)).
Kích thước tổng thể của 22 tRNA là 1509 bp và chiều dài trung bình là 68,6
bp, nằm trong khoảng từ 59 bp (tRNAPro) đến 75 bp tRNALeu(CTA). Thành phần
nucleotide của toàn bộ 22 gen tRNA đều theo hướng độ lệch thiên về hàm lượng
AT với tỉ lệ các loại nucleotide là: 32,2% A, 30,6% T, 19,6% G và 17,5% C, theo
thứ tự A > T > G >C. Thông tin về cấu trúc thành phần của các gen tRNA được liệt
kê ở bảng 3.15.
Bảng 3.15. Thành phần nucleotide của 22 gen tRNA của hệ gen 6 giống lợn
bản địa Việt Nam
STT Tên gen Sợi
(+/-)
Chiều dài
(bp)
Thành phần Nucleotide GC skew AT skew
A G C T
1. tRNA Phe + 70 26 13 16 15 -0,10 0,27
2. tRNA Val + 68 26 10 14 18 -0,17 0,18
3. tRNA
Leu2 + 75 23 14 17 21 -0,10 0,05
4. tRNA Ile + 69 28 11 8 22 0,16 0,12
5. tRNA Gln - 73 16 20 8 29 0,43 -0,29
6. tRNA Met + 70 20 13 20 17 -0,21 0,08
7. tRNA Trp + 68 26 12 14 16 -0,08 0,24
8. tRNA Ala - 68 19 15 8 26 0,30 -0,16
9. tRNA Asn - 75 21 18 11 25 0,24 -0,09
10. tRNA Cys - 66 18 16 12 20 0,14 -0,05
11. tRNA Tyr - 65 21 15 11 18 0,15 0,08
12. tRNA Ser2 - 69 17 20 11 21 0,29 -0,11
13. tRNA Asp + 68 23 12 9 24 0,14 -0,02
14. tRNA Lys + 67 20 14 16 17 -0,07 0,08
15. tRNA Gly + 69 25 10 13 21 -0,13 0,09
16. tRNA Arg + 69 29 6 9 25 -0,20 0,07
17. tRNA His + 69 29 8 8 24 0,00 0,09
70
STT Tên gen Sợi
(+/-)
Chiều dài
(bp)
Thành phần Nucleotide GC skew AT skew
A G C T
18. tRNA Ser1 + 59 20 9 12 18 -0,14 0,05
19. tRNA
Leu1 + 70 27 13 11 19 0,08 0,17
20. tRNA Glu - 69 17 17 8 27 0,36 -0,23
21. tRNA Thr + 68 22 12 18 16 -0,20 0,16
22. tRNA Pro - 65 13 19 10 23 0,31 -0,28
Tổng chiều dài
khi kết nối
1509 486 297 264 462
Giá trị Trung
bình
68,59 22,09 13,50 12,00 21,00 0,06 0,02
Kết quả phân tích thành phần các loại nucleotide của các gen tRNA, giá trị chỉ số
GC skew trong 22 gen có 10 gen mang giá trị âm (chiếm 0,45%), 8 gen tRNA có chỉ số
AT skew âm (chiếm 36%) và giá trị trung bình chỉ số AT skew, GC skew đều mang giá
trị dương (0,06 và 0,02 %). Điều này chứng tỏ rằng sự hiện diện của nucleotide loại A
trên các sợi DNA nhiều hơn T ở đa số các gen tRNA và tỉ lệ chênh lệch G, C gần như
tương đương nhau trong số 22 gen tRNA của hệ gen ty thể các giống lợn bản địa Việt
Nam. Duy nhất chỉ có gen tRNA His có tần số G bằng C với chỉ số GS skew bằng 0.
3.3.4. Phân tích cấu trúc bậc hai của các tRNA
Dựa trên trình tự vùng gen đã dự đoán, cấu trúc bậc hai của các tRNA được xây
dựng và mô tả bằng đồ họa bởi công cụ MITOS. Toàn bộ 22 gen tRNA của cả 6 giống
bản địa chung cấu trúc bậc hai với các gen tRNA có chiều dài từ 59 đến 75 bp. Kết
quả dự đoán cấu trúc bậc hai cho thấy, cấu trúc của 21 tRNA ngoại trừ tRNASer-1
đều có dạng cỏ ba lá điển hình được tạo thành từ ba thùy dihydrouridine DHU,
pseudouridin (TψC) và anti-codon. Riêng tRNA Ser-1 do có kích thước gen ngắn,
do đó có phần thùy dihydrouridine (DHU) không hình thành được cấu trúc bền
vững. Cấu trúc bậc hai của các tRNA ở 6 giống lợn bản địa Việt Nam được trình
bày tại hình 3.4.A, B, C, D, E và F.
71
A
B
72
C
D
73
E
F
Hình 3.4.A,B,C,D,E,F. Cấu trúc bậc hai của 22 loại tRNA được mã hóa trên hệ
gen ty thể lợn Móng Cái (A), Mường Lay (B), Mường Khương (C), Hạ Lang (D),
Hương (E) và Ỉ (F).
74
tRNA Ser-1 do có kích thước gen ngắn, chỉ có 59 bp, với việc không có thùy
DHU trong cấu trúc bậc hai ở tRNA Ser-1 được xem là một điều kiện phổ biến ở
hệ gen của động vật đa bào [113] [114]. Phân tích so sánh tổng thể cấu trúc bậc hai
của 22 tRNA cho thấy, có tới 21 tRNA có chiều dài của các gốc nhánh gắn amino
acid (amino acid acceptor) và gốc nhánh bộ ba đối mã tương ứng đều là 7 bp và 5
bp, ngoại trừ tRNA Ser-1 có chiều dài gốc nhánh bộ ba đối mã là 6 bp. Cấu trúc bất
thường của tRNA Ser-1 này gặp ở hầu hết các động vật có vú.
Kết quả dự đoán cấu trúc bậc hai của tRNA của 6 giống lợn bản địa mặc dù
chưa thấy có sự khác biệt nào so với các giống lợn khác trên thế giới, tuy nhiên đây
vẫn là nguồn dữ liệu cho những nghiên cứu tiếp theo trên các tRNA của hệ gen ty
thể ở các giống lợn bản địa Việt Nam.
3.4. So sánh đa hình trình tự
Để phân tích đa hình trình tự, phép dóng hàng theo cặp và dóng hàng đa trình
tự được tiến hành giữa các trình tự mtDNA của các giống lợn bản địa Việt Nam với
trình tự của các giống lợn Á, Âu trên thế giới sử dụng thuật toán MUSCLE. Hệ gen
ty thể bao gồm vùng trình tự không mã hóa (vùng D-loop) có cấu trúc DNA riêng
đặc trưng cho các cá thể trong một nhóm cá thể có nguồn gốc theo dòng mẹ, cũng là
vùng trình tự có biến đổi nhiều hơn và nhanh hơn so với vùng mã hóa còn lại. Do có
sự khác biệt về đặc điểm cấu trúc và vai trò trong tiến hóa giữa hai vùng này, nên
kết quả phân tích đa hình trình tự được thể hiện ở hai nhóm kết quả: đa hình vùng
D-loop và đa hình vùng mã hóa.
3.4.1. Trình tự vùng D-loop
3.4.1.1. Mức độ tương đồng
Sử dụng dữ liệu trình tự vùng D-loop để so sánh mức độ tương đồng giữa các
giống lợn, kết quả hệ số tương đồng được trình bày tại bảng 3.16. Hệ số tương đồng
nằm trong khoảng giá trị từ 0 - 1, hệ số tương đồng càng tiệm cận giá trị 1 cho thấy
hai trình tự có độ tương đồng càng cao, ngược lại càng gần về 0, nghĩa là hai trình
tự có độ khác biệt càng lớn.
..
75
Bảng 3.16. So sánh độ tương đồng giữa các trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam với các giống lợn trên thế giới
..33 TT
Trình tự giống
lợn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 Aba ID
2 Bamei 0.998 ID
3 Banna_mini 0.991 0.993 ID
4 Berkshire 0.992 0.994 0.989 ID
5 Bihu 0.996 0.998 0.993 0.996 ID
6 Dahe 0.959 0.959 0.954 0.955 0.959 ID
7 Duroc 0.971 0.969 0.966 0.967 0.971 0.952 ID
8 Halang 0.984 0.984 0.979 0.98 0.984 0.95 0.96 ID
9 Hampshire 0.969 0.967 0.964 0.967 0.969 0.949 0.993 0.958 ID
10 Huong 0.985 0.985 0.98 0.981 0.985 0.951 0.961 0.999 0.959 ID
11 Huzu 0.998 0.998 0.993 0.992 0.996 0.96 0.971 0.986 0.969 0.987 ID
12 Iberian 0.973 0.971 0.968 0.971 0.973 0.954 0.996 0.962 0.995 0.963 0.973 ID
13 I 0.919 0.921 0.927 0.917 0.921 0.951 0.912 0.909 0.909 0.91 0.921 0.913 ID
14 Jinhua 0.995 0.995 0.99 0.995 0.997 0.958 0.97 0.983 0.97 0.984 0.995 0.974 0.918 ID
15 Landrace 0.969 0.967 0.964 0.965 0.969 0.95 0.994 0.958 0.991 0.959 0.969 0.994 0.91 0.968 ID
16 Lantang 0.984 0.986 0.981 0.982 0.986 0.95 0.96 0.998 0.958 0.999 0.986 0.962 0.911 0.983 0.958 ID
17 Lanyu 0.937 0.937 0.932 0.937 0.939 0.933 0.938 0.927 0.941 0.928 0.937 0.94 0.894 0.94 0.936 0.927 ID
18 Large_white 0.972 0.97 0.965 0.968 0.972 0.951 0.995 0.959 0.994 0.96 0.97 0.995 0.911 0.971 0.993 0.959 0.941 ID
19 Mong cai 0.975 0.977 0.972 0.973 0.977 0.958 0.967 0.988 0.964 0.989 0.977 0.969 0.92 0.974 0.965 0.99 0.935 0.966 ID
20 Muong Khuong 0.986 0.988 0.981 0.984 0.988 0.967 0.977 0.975 0.974 0.976 0.986 0.978 0.928 0.985 0.975 0.977 0.945 0.977 0.986 ID
21 Muong Lay 0.917 0.919 0.912 0.915 0.919 0.949 0.909 0.907 0.906 0.908 0.917 0.911 0.974 0.916 0.907 0.909 0.891 0.91 0.917 0.927
22 Pietrain 0.972 0.97 0.967 0.968 0.972 0.953 0.997 0.961 0.994 0.962 0.972 0.997 0.913 0.973 0.995 0.961 0.939 0.996 0.968 0.978
23 WB-China 0.983 0.983 0.978 0.981 0.983 0.948 0.979 0.974 0.977 0.975 0.985 0.981 0.907 0.984 0.976 0.974 0.929 0.977 0.964 0.974 0.905..33
76
Qua bảng so sánh độ tương đồng cho thấy hệ số tương đồng trình tự ở vùng D-
loop đạt mức thấp nhất ở giống lợn Ỉ (< 0,951), tiếp đến là giống lợn Mường Lay
(<0,971), điều này phản ánh nét đặc trưng khác biệt về mặt di truyền của hai giống
lợn bản địa của Việt Nam so với các giống lợn khác.
Bên cạnh đó, có thể thấy mức độ tương đồng cao về trình tự giữa hai giống lợn
Hương và Hạ Lang (chỉ số tương đồng cao nhất đạt: 0,999). So sánh độ tương đồng
ở nhóm lợn Lang của Việt Nam (Hương, Hạ Lang và Móng Cái) với nhau cho thấy
có mức độ tương đồng cao hơn trong nội bộ nhóm so với các giống lợn bản địa Việt
Nam khác và các giống lợn trên thế giới. Các kết quả so sánh mức độ tương đồng
cũng phản ánh những nét gần gũi về kiểu hình giữa các giống lợn với nhau.
Giống lợn rừng Malaysia có độ tương đồng thấp với các giống lợn khác, qua
đó được tái khẳng định mức độ khác biệt lớn về di truyền nên thường được sử dụng
là nhóm ngoại (out group) trong các nghiên cứu phát sinh chủng loại.
3.4.1.2. Mức độ khác biệt
Trình tự DNA vùng D-loop của hệ gen ty thể các giống lợn Việt Nam được so
sánh với nhau và so sánh với các giống lợn khác cho thấy có một số điểm khác biệt
về trình tự đáng lưu ý, cụ thể là các biến thể đa hình nucleotide đơn. Mức độ khác
biệt về di truyền đối với trình tự vùng D-loop của các giống lợn được sử dụng trong
nghiên cứu này có 25 vị trí đa hình trên tổng số 1184 vị trí (chiều dài contig), trong
đó có 5 vị trí có mặt ít nhất 2 biến thể (Ỉ với 3 vị trí, Hạ Lang và Hương mỗi giống
có 1 vị trí) (bảng 3.17). Kết quả so sánh trình tự tương đồng cho thấy độ tương đồng
cao về trình tự D-loop giữa giống Hạ Lang và giống Hương (hai giống bản địa có
cùng nơi cư trú tại địa bàn tỉnh Cao Bằng). Đây là cơ sở để xây dựng giả thuyết
nguồn gốc giống giữa hai giống lợn Hạ Lang và Hương có phải có chung nguồn gốc
hoặc thực chất chỉ là một giống. Để khẳng định điều này cần có các nghiên cứu dựa
trên các chỉ thị di truyền khác cũng như các nghiên cứu về đặc điểm hình thái học.
77
Bảng 3.17. Các vị trí SNP trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam
STT Giống
Vị trí Ỉ
Mường
Khương
Mường
Lay
Móng
Cái Hạ
Lang Hương
1 24 G/A - - - - -
2 183 T/C - - - - -
3 215 T/C - - - - -
4 242 T/C T/C T/C T/C - -
5 280 - C/T C/T - - -
6 407 - - - T/C T/C T/C
7 454 - C/T C/T C/T C/T C/T
8 503 A/G - - - - -
9 562 T/C - - - - -
10 706 G G - G - -
11 714 A - A - - -
12 736 - - A - - -
13 734 G/G/A - - - - -
14 744 A - - - - -
15 746 - - A - - -
16 754 G/G/A - - - - -
17 756 - - A - - -
18 764 G/G/A - - - - -
19 766 - - A - - -
20 774 A - - - - -
21 776 - - A - - -
22 791 C - - - - -
23 813 - T/T/C - - - -
24 1032 A/G - - - - -
25 1165 - - - - A/C/A A/C/A
"T/C": Vị trí có 1 biến thể thay thế nucleotide; "G/G/A": Vị trí có mặt ít nhất 2 biến
thể; "-": Vị trí không có đa hình.
Khi so sánh khác biệt trình tự vùng D-loop của nhóm lợn bản địa Việt Nam
với các nhóm lợn khác trên thế giới có thể thấy tại vị trí nucleotide thứ 454 (hình
3.5.) tất cả các nhóm lợn Việt Nam trừ lợn Ỉ khác biệt với hầu hết các giống lợn còn
lại ở biến thể này (C/T). Dóng hàng đa trình tự vùng D-loop cho thấy, vùng trình tự
này của giống lợn Ỉ mang khá nhiều các điểm khác biệt với 5 giống lợn bản địa Việt
78
Nam còn lại, trong đó có một số điểm có sự khác biệt với hầu hết các giống lợn
khác trên thế giới. Kết quả này cũng phù hợp với kết quả phân tích chỉ số tương
đồng khi giống lợn Ỉ là giống có chỉ số tương đồng thấp nhất, so với 5 giống lợn bản
địa Việt Nam còn lại.
Hình 3.5. Vị trí khác biệt trên trình tự vùng D-loop của các giống lợn bản địa
Việt Nam và các giống lợn đã được công bố sau khi dóng hàng đa trình tự
Đa phần các khác biệt trình tự vùng D-loop của lợn Ỉ với các giống lợn khác
này là đơn nucleotide. Với đoạn trình tự so sánh từ nucleotide thứ 151 tới vị trí
nucleotide thứ 200 được thể hiện ở hình 3.6.
79
Hình 3.6. Một phần trình tự D-loop của lợn Ỉ và các giống lợn đã được công
bố sau khi tiến hành sắp xếp.
Kết quả tại hình 3.6 cho thấy tại các vị trí 154 (T/C), 159 (G/A), 182 (C/T) hay
tại các vị trí khác như 295 (G/A), 307 (T/C),… (phần này không được thể hiện trên
hình) trình tự lợn Ỉ có sự khác biệt với các giống lợn Duroc, Hampshire, Iberian,
Landrace, Large White, Pietrain, WB-European thuộc Châu Âu; giống lợn Jeju,
giống lợn bản địa Hàn Quốc, giống lợn hoang WB-China northeast thuộc Châu Á.
Bên cạnh đó ở các giống WB-Korea, WB-Malaysia cũng có các khác biệt với lợn Ỉ
tại vị trí nucleotide thứ 182 (C/T). Vị trí nucleotide thứ 183, ngoại trừ các giống lợn
Banna mini và Wei có trình tự tương đồng là C, các giống lợn còn lại đều có trình
tự chung là T. Ngoài ra còn có các vị trí khác không được thể hiện trên hình như
nucleotide thứ 215, 242, 503, … cũng là các điểm mà trình tự lợn Ỉ khác biệt với
hầu hết các giống lợn khác, đa phần là các giống lợn Châu Âu.
80
3.4.2. Trình tự vùng mã hóa hệ gen ty thể
3.4.2.1. Mức độ tương đồng
Trình tự hệ gen ty thể của các giống lợn nghiên cứu sau khi đã được loại bỏ
vùng D-loop, so sánh mức độ tương đồng, kết quả thu được hệ số tương đồng được
thể hiện tại bảng 3.18.
Các giống lợn trong nhóm lợn Lang của Việt Nam (Hạ Lang, Hương và Móng
Cái) có mức độ tương đồng với nhau khá cao. Hai giống bản địa tại tỉnh Cao Bằng
(Hương và Hạ Lang) thể hiện mức độ gần gũi về di truyền khi so sánh trình tự vùng
mã hóa với chỉ số tương đồng cao (0,999). So với vùng D-loop, trình tự vùng mã
hóa của giống Ỉ không thể hiện mức độ đặc trưng cao. Có thể thấy sự khác biệt của
giống lợn Ỉ so với các giống lợn khác chủ yếu tập trung ở vùng kiểm soát của hệ
gen ty thể.
Kết quả so sánh tương đồng cũng cho thấy ngoài giống lợn rừng Malaysia,
giống lợn Lanyu của Trung Quốc cũng có độ tương đồng thấp nhất so với các giống
còn lại.
81
Bảng 3.18. So sánh tương đồng các trình tự vùng mã hóa hệ gen ty thể của 6 giống lợn Việt Nam với các giống lợn trên thế giới
TT Các giống lợn1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 Aba ID
2 Xiang 0.996 ID
3 Bamei 0.996 0.998 ID
4 Huzu 0.996 0.999 0.999 ID
5 Bihu199 0.963 0.965 0.966 0.966 ID
6 Wei 0.996 0.998 0.999 0.999 0.966 ID
7 WBJiangxi 0.996 0.998 0.998 0.999 0.966 0.998 ID
8 WBFuijan 0.995 0.997 0.997 0.998 0.964 0.997 0.997 ID
9 WBYunnan 0.991 0.994 0.994 0.994 0.961 0.994 0.994 0.993 ID
10 WBVietnam 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.994 ID
11 Dahe 0.993 0.996 0.996 0.996 0.963 0.996 0.996 0.997 0.991 0.996 ID
12 Halang 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.992 0.996 0.994 ID
13 Huong 0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.993 0.997 0.995 0.999 ID
14 Lantang 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.997 0.995 0.998 0.998 ID
15 Mongcai 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.992 0.996 0.995 0.998 0.998 0.998 ID
16 WBHainan 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.996 0.994 0.998 0.995 0.996 0.996 0.997 0.996 ID
17 Banna_Mini 0.995 0.997 0.997 0.998 0.965 0.997 0.997 0.996 0.993 0.998 0.995 0.996 0.996 0.997 0.995 0.997 ID
18 I 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.988 0.993 0.994 0.992 0.992 0.991 0.992 0.992 0.994 ID
19 Muongkhuong0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.993 0.996 0.996 0.997 0.997 0.996 0.997 0.996 0.996 0.993 ID
20 Muonglay 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.987 0.991 0.994 0.992 0.992 0.991 0.992 0.991 0.991 0.995 0.994 ID
21 Jinhua 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.998 0.995 0.996 0.996 0.997 0.996 0.997 0.997 0.991 0.996 0.991
..33
.. 33
82
3.4.2.2. Mức độ khác biệt
So sánh sự khác biệt trình tự mã hóa cho phép tìm kiếm sự sai khác trình tự
của hệ gen ty thể ngoại trừ vùng trình tự D-loop với sự đa dạng cao đã được so sánh
riêng. Kết quả, các vùng có mức độ khác biệt thường rơi vào các vùng gen mã hóa
cho protein và tRNA, trong khi các vùng còn lại khá bảo thủ. Bên cạnh đó, trong số
các biến thể SNP đáng chú ý có biến thể tại vị trí 2250 nằm trên gen mã hóa 12S
rRNA. Tất cả các giống bản địa Việt Nam ngoại trừ giống Ỉ không có biến thể (C/T)
nằm ở vùng này, trong khi hầu hết các giống lợn khác đều có, kết quả này được
minh chứng ở hình 3.7.
So sánh một số vùng trình tự khác trong nội bộ các giống lợn Châu Âu và
Châu Á cho thấy sự tương đồng cao, nhưng khi so sánh giữa hai vùng địa lý Á, Âu
này lại thấy tồn tại sự khác biệt tại một số vị trí nucleotide thứ 4365 và 4386 (G/A)
hay 6857 (A/T) và 6884 (G/A). Các giống lợn Châu Âu ngoại trừ Duroc và
Landraces có thêm vị trí khác biệt tại 4398 (T/C). Tại các vị trí biến đổi khác như:
1560 (C/T), 1913 (A/G), 1988 (C/T), … thuộc vùng gen 12S rRNA; 2539 (T/C),
2990 (T/C), … thuộc vùng gen 16S rRNA, cũng như: 15652 (C/T), 15688 (T/C), …
thuộc vùng gen Cytb và những điểm nằm phân bố trên một số gen mã hóa cho
protein khác, cho thấy trình tự của các giống lợn Châu Âu khác biệt so với các
giống lợn bản địa Việt Nam.
Hình 3.7. Biến thể trình tự tại vị trí nucleotide 2250 vùng mã hóa hệ gen ty thể
các giống lợn
Tại hình 3.8 cũng minh họa một sự khác biệt về trình tự, biến thể xuất hiện
tại vị trí nucleotide 11318 thuộc vùng gen ND5, trong đó sự thay thế nucleotide C/T
83
xảy ra hầu hết ở các giống lợn nhà và lợn rừng khác trên thế giới. Sáu giống lợn bản
địa Việt Nam không có biến thể này, ngoại trừ giống lợn Ỉ.
Kết quả so sánh biến thể trình tự này thể hiện có sự tương đồng giữa giống
lợn Ỉ với giống Banamini (ở lưu vực sông Mekong); giữa nhóm 5 giống lợn Việt
Nam (Hương, Móng Cái, Mường Lay, Mường Khương và Hạ Lang) với giống lợn
Lantang (ở khu vực miền nam Trung Quốc) cho phép đưa ra những dự đoán về
những mối liên hệ gần gũi trong quá trình phát sinh chủng loài giữa các giống lợn
này. Điều này sẽ được kiểm chứng trong kết quả phân tích về phát sinh chủng loại
được trình bày ở phần sau.
Hình 3.8. Biến thể trình tự tại vị trí nucleotide 11318 trình tự vùng mã hóa hệ
gen ty thể các giống lợn
Tương tự như khi so sánh trình tự vùng D-loop, trong số nhóm các giống lợn
bản địa Việt Nam, trình tự mã hóa của giống lợn Ỉ có sự khác biệt lớn nhất so với
các giống còn lại. Cụ thể, so sánh trình tự hệ gen ty thể của lợn Ỉ với các giống lợn
khác, thấy nhiều điểm khác biệt. Hình 3.9 thể hiện các khác biệt cho các vùng gen
đó, vùng được lựa chọn làm đại diện là hai đoạn trình tự nhỏ lần lượt thuộc các gen
ND1 (hình 3.9.A) và COX1 (hình 3.9.B). Trong các đoạn này, giữa các giống lợn
Châu Âu cho thấy sự tương đồng cao, và giữa các giống Châu Á và cả lợn Ỉ cũng có
độ tương đồng trình tự cao nhưng giữa hai vùng địa lý này lại tồn tại sự khác biệt về
84
trình tự như tại vị trí nucleotide thứ 4365 và 4386 (G/A) hay 6857 (A/T) và 6884
(G/A), các giống lợn Châu Âu ngoại trừ Duroc và Landraces có thêm vị trí khác
biệt tại 4398 (T/C). Ngoài ra, một số giống Châu Á như Lanyu hay WB-China
northeast cũng cho thấy một số sự đồng khác biệt với giống Châu Âu tại một số
điểm như tại vị trí 4386 (G/A) và vị trí 6884 của Lanyu chuyển G thành A. Lanyu
cũng có sự biến đổi tại vị trí 6857 nhưng nucleotide biến đổi là G. WB-China
northeast cũng có thêm một vị trí biến đổi tại 6876 (G/A). Giống lợn WB-Malaysia
có ba vị trí biến đổi tại 4371, 4374 và 6889. Bihu có một vị trí khác biệt tại 4356
(A/G) và Dahe có một vị trí khác biệt tại 6890 (T/C).
85
Hình 3.9. Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được
công bố sau khi tiến hành sắp xếp.
A. Một phần trình tự gen ND1, B. Một phần trình tự gen COX1
Kết quả so sánh đa hình trình tự mtDNA giữa các giống lợn nhằm tìm ra các
điểm tương đồng và khác biệt, qua đó đã phần nào giải thích được mức độ đa dạng
di truyền trong nội bộ các giống lợn Việt Nam và một số giống lợn khác trên thế
giới. Kết quả so sánh ở hai vùng trình tự của hệ gen ty thể cũng cho thấy mức độ
tương đồng cao trong nội bộ các giống lợn Châu Âu và Châu Á. Mặt khác, những
thay thế đơn phân trong chuỗi trình tự của các giống lợn bản địa Việt Nam có xu
hướng tương đồng hơn với các giống lợn Châu Á so với các giống Châu Âu. Các
biến thể trình tự của nhóm lợn Việt Nam tại các vị trí chưa được liệt kê ở trên chủ
yếu là khác biệt đối với các giống lợn Châu Âu.
Có thể thấy, các giống lợn bản địa Việt Nam có điểm chung là trong hệ gen
ty thể phần lớn các vị trí biến thể có sự khác biệt lớn với nhóm lợn Châu Âu. Điều
này giúp đưa ra hai nhận định, thứ nhất là có mức độ tương đồng tương đối cao về
trình tự mtDNA giữa các giống lợn Châu Âu với nhau và giữa các giống Châu Á
với nhau. Nhận định này phù hợp với quan điểm của Yu và cs (2013) khi cho rằng
86
các giống lợn nhà Châu Âu có mối liên hệ gần theo dòng mẹ, tồn tại một khoảng
cách p gần như bằng nhau giữa giống lợn rừng Châu Âu với các giống lợn kiểu Âu
(0,0168) và với các giống lợn kiểu Á (0,0181) [30]. Thứ hai, các giống lợn bản địa
Việt Nam có xu hướng tương đồng hơn với nhau về trình tự mtDNA so với các
giống lợn Châu Á khác. Những đặc điểm khác biệt trong trình tự hệ gen ty thể các
giống lợn bản địa tạo nên những nét đặc trưng về mặt di truyền, góp phần vào việc
bảo tồn các giống lợn bản địa Việt Nam.
3.5. Phân tích về quan hệ phát sinh chủng loại
Quan hệ phát sinh chủng loại của 6 giống lợn bản địa Việt Nam và 17
giống lợn nhà và lợn rừng Á - Âu được xác định thông qua việc phân tích tính đa
hình vùng D-loop và trình tự hoàn chỉnh hệ gen ty thể các giống lợn. Để tăng
cường độ tin cậy về nguồn gốc và quan hệ phát sinh chủng loại, dữ liệu vùng D-
loop và dữ liệu trình tự hoàn chỉnh được phân tích một cách độc lập để xây dựng
các cây phát sinh chủng loại riêng biệt. Đối với giống lợn Móng Cái ngoài kết
quả trình tự của luận án, chúng tôi còn sử dụng trình tự của nhóm tác giả Tran
Thi Thuy Nhien (2016) [66] (kí hiệu trên cây phát sinh chủng loại là
MongCai_TN) để xây dựng cây phát sinh chủng loại, cũng như phân tích về
quan hệ tiến hóa.
Các trình tự hệ gen ty thể của các giống lợn cũng được dóng hàng thông
qua thuật toán MUSCLE của phần mềm MEGA nhằm xác định các vị trí tương
đồng. Từ kết quả đó, các mô hình thay thế nucleotide phù hợp nhất cho trình tự
D-loop và trình tự hoàn chỉnh cũng được xác định lần lượt là HKY+G và
TN93+I. Phân tích phát sinh chủng loại phân tử được tiến hành dựa trên dữ liệu
rời rạc bằng phương pháp suy luận Bayes, thuật toán phân tích Bayes trên phần
mềm BEAST v1.8.3 với thiết lập ban đầu Yule process. Chuỗi Markov Chain
Monte Carlo (MCMC) [45] 10.000.000 được sử dụng để tính toán xác suất hậu
nghiệm của cây. Sau đó, cây phát sinh chủng loại sẽ được dựng bằng phần mềm
Tree Annotater v.1.8.4. thông qua việc sử dụng kết quả tính toán.
Cây được xác định gốc nhờ sử dụng trình tự tương đồng đối chứng của giống
lợn hoang Malaysia (WB Malasia - Sus barbatus). Trình tự của giống lợn hoang
Malaysia được chọn lựa là nhóm ngoại (outgroup) bởi nó được biết đến là có sự
khác biệt với nhóm lợn hoang Châu Âu và Châu Á, thường được sử dụng trong các
87
nghiên cứu trước đây về phát sinh chủng loại ở lợn [63, 56].
3.5.1. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự vùng D-loop
Cây phát sinh chủng loại được xây dựng dựa trên trình tự vùng D-loop của 6
giống lợn bản địa Việt Nam, cùng với các giống lợn nhà, các giống lợn hoang dã
thuộc nhóm lợn Châu Âu (như giống lợn Duroc, Landraces, Hampshire, Pietrain,
Iberian, Đại Bạch, lợn hoang Châu Âu) và lợn Châu Á (thuộc khu vực sông Mekong,
khu vực Đông Bắc Á, khu vực sông Trường Giang, khu vực sông Hoàng Hà, Nam
Trung Quốc). Kết quả xây dựng cây phát sinh chủng loại vùng D-loop của các giống
lợn được trình bày ở hình 3.10.
Cây phát sinh chủng loại cho thấy có sự phân nhánh giữa các giống lợn Châu
Á và Châu Âu (giá trị bootstrap là 77%). Ước lượng khoảng cách tiến hóa thông
qua tính toán khoảng cách p theo cặp được thực hiện theo phương pháp tính khả
dĩ thành phần tối đa (maximum composite likelihood) bằng phần mềm MEGA7.
Khoảng cách p giữa hai nhóm này là 0,0136 - 0,019. Hai giống Lanyu và WB-
Malaysia là nhóm ngoại với khoảng cách tiến hóa với nhóm còn lại lần lượt nằm
trong khoảng 0,0243 - 0,0296 và 0,0329 - 0,0482. Giống lợn rừng Bắc Trung Quốc
(WB-China northeast) cho thấy có mối quan hệ gần gũi với các giống lợn Châu Âu.
Nhóm lợn Châu Á có sự phân tách để tạo thành năm nhánh tách biệt nhau, là nhóm
Đông Bắc Châu Á (North East Asia), thung lũng sông Hoàng Hà (Yellow River
Valley), nhóm sông Mê Kông (Mekong River), nhóm Nam Trung Quốc (South
China) và nhóm sông Trường Giang (Yangtze River Region).
Giống lợn Ỉ của Việt Nam ở cùng nhánh với giống lợn Banna Mini (thuộc
vùng sông Mê Kông, với khoảng cách p là 0,0006, giá trị bootstrap đạt 99%).
Điều thú vị là 3 giống lợn bản địa tại vùng Đông Bắc Bộ (lợn Móng Cái, Hạ
Lang, và Hương) đều có cùng cặp taxon chị em với giống lợn Lantang (thuộc
vùng Nam Trung Quốc, khoảng cách p từ 0,0006 - 0,0016. Đặc biệt, giống lợn
Móng Cái có quan hệ gần nhất với lợn Lantang khi là các taxon chị em trong
cùng nhánh phụ), mặc dù giá trị bootstrap ủng hộ chỉ đạt 52% trên cây D-loop
(hình 3.10) nhưng đạt 88% bootstrap trên cây sử dụng trình tự hệ gen hoàn chỉnh
(hình 3.11). Đối với giống lợn Móng Cái, taxon MongCai_TN có trình tự
mtDNA được công bố bởi Tran Thi Thuy Nhien và cs khác biệt khá lớn về kích
thước và đoạn lặp so với các giống lợn khác nên nằm ở nhánh tách biệt với hầu
88
hết các giống lợn Châu Á khác và nằm rất xa với taxon từ kết quả nghiên cứu
của chúng tôi. Hai giống lợn bản địa thuộc khu vực Tây Bắc Bộ (gồm lợn
Mường Khương và lợn Mường Lay) có quan hệ di truyền gần gũi với giống lợn
Bamei (thuộc khu vực lưu vực sông Hoàng Hà với khoảng cách p là 0,0012).
Kết quả về phát sinh chủng loại thể hiện trên cây phù hợp với dự đoán về sự gần
gũi giữa hai giống lợn bản địa của Việt Nam là Hương và Hạ Lang khi chúng có
những sự tương đồng về hình thái và phân bố địa lý. Giá trị xác suất bootstrap
tương đối thấp đối với các nút trong của nhánh các giống lợn ở khu vực miền núi
phía bắc Việt Nam (Hương, Hạ Lang và Móng Cái). Điều này có thể được giải
thích bởi có ít các vị trí cung cấp thông tin có mặt trong các trình tự được phân
tích, khi mà chỉ có một hoặc hai vị trí nucleotide hỗ trợ cho việc tạo nút [15].
Có thể thấy trên cây chủng loại phát sinh, một giống lợn bản địa nổi tiếng
của Việt Nam là lợn Ỉ, cùng với Banna mini và WB Korea nằm ở nhánh khá tách
biệt với các giống lợn còn lại thuộc Châu Á. Trong đó, giống lợn Ỉ có vị trí tách
biệt với 5 giống lợn bản địa Việt Nam khác. Ở phía ngoài cùng trên nhánh còn lại
là hai giống lợn thuộc khu vực Mekong là Dahe và WB-Yunnan.
Các giống lợn Châu Âu cho thấy mối quan hệ khá gần gũi, nằm trong
cùng nhóm này là cặp taxon chị em WB-European và Iberian, khoảng cách p
giữa hai giống này là 0,0004, có khoảng cách p xa hơn tới cặp này lần lượt là
Pietrain (0,0004), Large White (0,0006), Hampshire (0,0019), Landraces
(0,0021), Duroc (0,0035). Nhánh ngoài cùng của nhóm này lại là một giống lợn
Châu Á WB-China northeast (0,0085).
Nhánh phát sinh của nhóm lợn Châu Á cho thấy một sự phân nhánh khá đa
dạng. Giống lợn Châu Âu Berkshire nằm ở các nhánh lân cận với các giống Châu
Á. Kết quả này tương đồng với công bố trước đây về hai giống Large White và
Berkshire có liên quan đến nguồn gốc Châu Á. Các nghiên cứu trước đã thông báo
có 2 haplotype riêng biệt của mtDNA (Châu Á và Châu Âu) của lợn LargeWhite,
cho thấy đã có sự lai chéo giữa giống lợn Châu Âu và lợn Châu Á xảy ra trong suốt
quá trình hình thành giống này [115, 116]. Tương tự với giống Berkshire, các
nghiên cứu cũng chỉ ra rằng một số giống lợn Trung Quốc đóng góp đáng kể vào sự
phát triển của giống Berkshire [115].
Các giống lợn thuộc vùng sông Trường Giang là Wei, Bihu (0,0008) và
Jinhua (0,0012) nằm khá gần nhau. Một giống lợn khác cũng thuộc khu vực sông
89
Trường Giang là WB-Jiangxi lại có quan hệ gần gũi với hai giống lợn Nam Trung
Quốc là Lantang (0,001) và WB-Fuijan (0,0012). Hai đại diện duy nhất của khu vực
sông Hoàng Hà là Bamei và Huzu lần lượt tạo thành nhóm với giống lợn Aba
(0,0006) và Xiang (0,0008) đều thuộc khu vực sông Trường Giang.
Kết quả tính toán khoảng cách p cũng cho thấy, khoảng cách trung bình
tương đối gần trong nhóm các con lợn Việt Nam là 0,0039±0,00112 (trị số trung
bình ± độ lệch chuẩn) so với khoảng cách p trung bình chung của nhóm lợn Việt
Nam với các giống lợn Châu Âu, Châu Á là 0,01279±0,00196. Phân tích khoảng
cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có khoảng cách gần nhất
với lợn Bamei (0,00104) của Trung Quốc. Lợn Hương có khoảng cách p lớn nhất
với nhóm lợn Châu Âu khi phân tích khoảng cách p ở vùng D-loop và vùng mã
hóa tương ứng là 0,0120 và 0,0144. Lợn Hương và Hạ Lang có khoảng cách p
bằng 0,0000 (có sự đồng nhất 100% về trình tự). Lợn Hạ Lang và Hương có
khoảng cách tiến hóa ngắn nhất với lợn Lantang (khoảng cách p = 0,00104).
Khoảng cách tiến hóa của giống lợn Ỉ là xa nhất so với 5 giống lợn bản địa Việt
Nam còn lại, cụ thể là giống lợn Ỉ có khoảng cách p với Hương và Hạ Lang là
0,0081; khoảng cách với 3 giống Móng Cái, Mường Khương và Mường Lay là
0,00782. Quan hệ giữa các giống lợn này được thể hiện rõ trên cây phát sinh
chủng loại ở phần kết quả dưới đây, khi giống lợn Ỉ nằm ở phân nhánh xa hơn so
với nhánh các giống còn lại của Việt Nam.
90
Hình 3.10. Cây phát sinh chủng loại vùng D-loop: Quan hệ phát sinh chủng loại được phân tích sử dụng phương pháp suy luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree Annotator,
thông qua việc so sánh các trình tự ở vùng D-loop của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn Châu Âu, Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết quả của
Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]).
WB-China
99
52
47
54
44
54
100
88
98
77
72
64
25
46
11 34
65 36
66
100
86
99
44
64
54
51
26
52
74
91
3.5.2. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh
Sau khi trình tự hoàn chỉnh của các giống lợn Châu Âu, Châu Á được tải về
từ ngân hàng gen (GenBank-NCBI), từ dữ liệu dóng hàng đa trình tự của 27 giống
lợn nhà và lợn rừng Châu Âu và Châu Á, chúng tôi tiến hành xây dựng cây phát
sinh chủng loại. Ở cây này, các giống lợn vẫn được phân chia một cách rõ ràng
thành 2 nhánh chính: nhánh Châu Á (bao gồm cả giống Berkshire, điều này đã được
lý giải bằng việc đưa ra nhận định có sự lai chéo giữa nhóm lợn Châu Âu và Châu
Á diễn ra trong quá trình hình thành giống Bershire [116, 1]; nhánh Châu Âu (bao
gồm cả giống lợn hoang phía Bắc Trung Quốc - WB China northest, với khoảng
cách p chỉ là 0,007). Quan hệ phát sinh chủng loại của nhóm lợn Lang Việt Nam
(Hương, Hạ Lang và Móng Cái) một lần nữa được khẳng định ở cây dựa trên trình
tự hoàn chỉnh so với cây dựa trên trình tự vùng D-loop. Tuy nhiên đối với taxon
MongCai_TN đã trở thành taxon chị em với taxon MongCai thu được từ kết quả
nghiên cứu của chúng tôi. Điều này phù hợp với sự tương đồng về trình tự ở toàn bộ
vùng mã hóa của hệ gen ty thể giữa hai công bố khoa học về dữ liệu trình tự hệ gen
ty thể của các cá thể lợn Móng Cái. Bên cạnh đó, cả hai cây có sự tương đồng cao ở
nhánh phát sinh này, cùng với những tương đồng về đặc điểm hình thái giữa giống
lợn Hương và giống Lantang ở tỉnh Quảng Đông, miền nam Trung Quốc, điều này
đã được nhắc tới trong nghiên cứu của Rothschild và Ruvinsky [87, 118]. Từ quan
hệ phát sinh này có thể đưa ra giả thiết về nguồn gốc chung của nhóm lợn bản địa
Việt Nam với lợn Lantang xuất phát từ hoạt động giao thương trong quá khứ từ
hàng ngàn năm trước giữa tỉnh Quảng Đông Trung Quốc với các tỉnh biên giới
miền núi phía bắc Việt Nam.
Cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh hệ gen ty thể
cũng cho thấy một số các hướng phân chia lớn. Đầu tiên, hai giống lợn là Lanyu và
lợn hoang WB - Malaysia có sự tách biệt hẳn với những giống lợn còn lại. Chúng
nằm tại các nhánh riêng biệt và xa nhất của cây với khoảng cách p lần lượt tới nhóm
bên trong lần lượt là 0,0185 và 0,0303.
92
Hình 3.11. Cây phát sinh chủng loại của trình tự hoàn chỉnh: Quan hệ phát sinh chủng loại được phân tích sử dụng phương pháp suy luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree
Annotator, thông qua việc so sánh các trình tự hoàn chỉnh của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn Châu Âu, Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết
quả của Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]).
94
44
46
35
41
56
92
84 97
36
74
54
97
99
66
100
42
54
100
95
100
64
55
55
86
39
56
93
Khoảng cách tiến hóa trung bình xác định được là tương đối gần trong nhóm
các con lợn bản địa Việt Nam (0,00209) thuộc nghiên cứu này, lớn hơn khi so sánh
với nhóm lợn Châu Á (0,00694) và đặc biệt có khoảng cách rất xa với nhóm lợn
Châu Âu (0,01734). Khoảng cách tiến hóa gần trong nhóm lợn Lang của Việt Nam
được ước lượng thông qua khoảng cách cặp giữa các trình tự đối với nhóm lợn
(Hương, Hạ Lang, Móng Cái) đạt giá trị khoảng cách p trung bình ± độ lệch chuẩn
là: 0,00445 ± 0,00198 trong nội bộ nhóm, cho thấy chúng có mối quan hệ gần theo
dòng mẹ. Nhưng khi so sánh với các nhóm Châu Á, Châu Âu thì cho thấy sự khác
biệt, khoảng cách p trung bình là (0,01743 ± 0,00179, giữa các nhóm).
Phân tích khoảng cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có
khoảng cách gần nhất với lợn Mường Khương (0,00104), lợn Hương và Hạ Lang có
khoảng cách p bằng 0,0000 (có sự đồng nhất 100% về trình tự), trật tự phân nhánh
với giá trị bootstrap ủng hộ là 100%. Lợn Hạ lang và Hương có khoảng cách tiến
hóa ngắn nhất với lợn Lantang (0,00104). Hai giống lợn đều có khoảng cách tiến
hóa xa nhất với lợn hoang Malaysia (0,03673 và 0,03562) rồi sau đó là giống Lanyu
(0,02471 và 0,02361).
Phân tích về phát sinh chủng loại của trình tự vùng D-loop (hình 3.10) và
trình tự mtDNA hoàn chỉnh (hình 3.11) đều cho thấy tồn tại 3 nhánh chính riêng
biệt: một nhánh Châu Âu và hai nhánh Châu Á. Nhánh Châu Âu bao gồm các
giống lợn kiểu Âu như: Berkshire, Duroc, Hampshire, Landrace, Pietrain, Large
White, Iberian, WB-European. Nhánh Châu Á thứ nhất gồm chủ yếu các con lợn
nhà Trung Quốc, nhánh Châu Á thứ hai là tập hợp chủ yếu các giống lợn hoang
Châu Á. Kết quả xây dựng cả hai cây phát sinh chủng loại đều cho thấy 4 giống
lợn bản địa Việt Nam bao gồm: Ỉ, Móng Cái, Hạ Lang và Hương có sự tương đồng
về trật tự phân nhánh. Bên cạnh đó, cũng có sự khác biệt khác về trật tự phân
nhánh giữa 2 cây phát sinh chủng loại. Cụ thể là ở cây D-loop, giống lợn Mường
Khương cùng nhánh phụ với giống Bamei ở lưu vực sông Hoàng Hà, Trung Quốc.
Trật tự phân nhánh đối với nhánh phụ này không đảm bảo độ tin cậy cao (khi giá
trị bootstrap thấp chỉ đạt 25%), khác biệt với cây sử dụng hệ gen hoàn chỉnh khi
Mường Khương và Mường Lay lại nằm cùng nhánh phụ (với giá trị bootstrap cao
tuyệt đối là 100%).
94
Hongo cho rằng một số loài phụ của lợn rừng cư trú ở vùng Đông Á được
thuần hóa diễn ra lặp lại trong khoảng thời gian từ 6000 - 9000 năm trước [119]. Cả
hai cây phát sinh chủng loại của luận án đều cho thấy sự tách biệt rõ ràng giữa hai
nhánh lợn Châu Âu và Châu Á, hai nhánh đã có sự phân ly từ thời gian khá lâu
(khoảng 746.000 năm trước) [1], so với thời điểm các giống lợn nhà được thuần hóa
là khoảng 9.000 năm trước đây. Đặc điểm phát sinh trên hai cây phân loài cũng có
sự tương đồng với các luận điểm khoa học của các nghiên cứu trước đây về các
giống lợn nhà và lợn rừng trên thế giới. Guanghui Yu (2013) đã tìm ra rằng các
giống lợn bản địa ở Trung Quốc, Hàn Quốc và Nhật Bản, bao gồm cả những giống
lợn rừng ở các khu vực này có mối quan hệ gần với nhau và khác xa các giống lợn
Châu Âu nếu xét theo quan hệ huyết thống dòng mẹ [63]. Gui-Sheng Wu (2007) đã
nghiên cứu các trình tự vùng kiểm soát hệ gen ty thể (670 bp) của 567 cá thể lợn
nhà và 155 các thể lợn rừng trải khắp khu vực Châu Á, Đông Nam Á và Ấn Độ, đã
khẳng định một lần nữa sự phát sinh chủng loại từ một tổ tiên chung (monophyletic)
của các giống lợn nhà và lợn rừng Đông Á [56]. Tác giả Kim (2002) cũng đã làm
sáng tỏ luận điểm mặc dù có sự cách biệt về mặt địa lý, các quần thể lợn ở Trung
Quốc, Hàn Quốc và Nhật bản đều có sự tương đồng về mặt di truyền với nhau [15].
Kết quả phân tích phát sinh chủng loại vùng D-loop và trình tự hệ gen hoàn chỉnh
cho thấy sự có mặt của giống lợn rừng Trung Quốc WB- China Northeast trong
nhánh Châu Âu, tương tự với công bố khoa học khác, đã một lần nữa chứng tỏ luận
điểm cho rằng sự du nhập của vật liệu di truyền Châu Á vào các giống vật nuôi ở
Châu Âu diễn ra từ thế kỉ thứ 18 cho đến thế kỉ thứ 19 [120]. Như vậy, khi đối chiếu
với các kết quả nghiên cứu của một số tác giả trên thế giới, các cây phát sinh chủng
loại của luận án có những sự tương đồng, qua đó khẳng định độ tin cậy trong trật tự
phát sinh nhánh trên cây.
Kết quả xác định khoảng cách tiến hóa và phân tích quan hệ phát sinh chủng
loại cho thấy sự tương đồng với các nghiên cứu khác về nguồn gốc của lợn bản địa
Việt Nam có liên quan đến lợn Châu Á, đặc biệt là lợn Trung Quốc trong suốt quá
trình phát triển giống vật nuôi từ các dạng tổ tiên có quan hệ gần theo dòng mẹ [1].
Quan điểm này tương đồng với kết luận trong nghiên cứu của Kim (2002) khi cho
rằng rất nhiều các giống lợn ở Đại lục (Trung Quốc) có nguồn gốc ở khu vực Đông
Nam Á, trong đó có Việt Nam [15]. Ở Việt Nam và Trung Quốc, các giống bản địa
95
nổi tiếng như Ỉ, Móng Cái, Meishan và Jinhua đều đã được đưa vào sử dụng như
những nguồn gen trực tiếp để phát triển các giống lợn [116, 70]. Như vậy, các giống
lợn bản địa Việt Nam đều có mối quan hệ theo dòng mẹ gần với nhau, vị trí xuất
hiện trên cây phân loại của các giống lợn bản địa Việt Nam đều nằm tương đối gần
nhau và nằm trong nhánh Châu Á. Cây phát sinh cũng chỉ ra các giống lợn bản địa
của Việt Nam ở cùng các nhánh phụ với các giống lợn Nam Trung Quốc và lưu vực
sông Hoàng Hà với khoảng cách tiến hóa tương đối gần. Cả hai cây phát sinh chủng
loại đều cho phản ánh chung về mối quan hệ phát sinh chủng loại và trật tự phân
nhánh như sau: thứ nhất là, sự gần gũi về mặt di truyền giữa lợn Ỉ và Banna mini
(một giống lợn vùng Mekong); thứ hai là tồn tại một phân nhánh gồm: lợn Móng
Cái, lợn Hạ Lang, lợn Hương với lợn Bihu, Wei và lợn Bamei; thứ ba, các giống
lợn Mường Khương, lợn Mường Lay với lợn Lantang (một giống lợn Nam Trung
Quốc) là các taxon chị em trong cùng một phân nhánh; thứ tư là, nhánh lợn hoang
bao gồm lợn hoang Việt Nam và một số giống lợn hoang Châu Á khác. Tuy nhiên,
các nhóm lợn kể trên lại nằm ở nhánh lớn riêng biệt với các giống lợn Châu Á khác
có vị trí địa lý thuộc khu vực Đông Bắc Á (như giống lợn của Hàn Quốc, Nhật
Bản). Các kết quả nêu trên khẳng định thêm quan điểm khoa học cho rằng Việt
Nam thuộc một trong những trung tâm thuần hóa lợn nhà vào loại sớm của thế giới
[121]. Nhận định này được củng cố bằng kết quả nghiên cứu trong công trình của
Watanabe (2003) cho rằng nguồn gốc của lợn rừng nhật bản được di cư từ khu vực
Đông Nam Á sanng khu vực Đông Bắc Á ở kỷ Pleistocene.
Các giống lợn bản địa (Hương, Hạ Lang, Mường Khương) có nguồn gốc ở
các tỉnh Miền núi phía Bắc Việt Nam, nơi có vị trí địa lý thuận lợi cho các hoạt
động giao thương lâu đời với các tỉnh phía Nam Trung Quốc. Nhóm lợn Lang Việt
Nam bao gồm lợn Móng Cái, Hương và Hạ Lang nằm cùng một nhánh phụ (giá trị
bootstrap 95%) với khoảng cách tiến hóa gần, điều này phù hợp với sự tương đồng
về đặc điểm địa lý phân bố và đặc điểm về hình thái học. Ba giống lợn Móng Cái,
Hương, và Hạ Lang đều có mối quan hệ gần gũi về mặt di truyền và cùng một lớp
với giống lợn Lantang (thuộc khu vực Nam Trung Quốc) với khoảng cách p giữa
các giống lần lượt là 0,0004 (lợn Móng Cái), 0,0004 (lợn Hương), 0,0006 (lợn Hạ
Lang). Tương đồng về các đặc điểm hình thái của bốn giống này là đều có đầu đen,
giữa trán có một điểm trắng hình tam giác kéo dài, có cổ khoang chia thân lợn ra
96
làm hai phần, nửa trước màu đen kéo dài đến mắt, nửa sau màu trắng kéo dài đến
vai làm thành một vành trắng kéo dài đến bụng và bốn chân. Lưng và mông màu
đen, mảng đen ở hông kéo dài xuống nửa bụng bịt kín mông và hông có hình yên
ngựa. Đường ranh giới giữa khoang đen và trắng rộng 3 - 4 cm, trên có da đen, còn
lông thì trắng. Ngoài ra, cả 3 giống lợn bản địa của Việt Nam đều tập trung nuôi
dưỡng và bảo tồn ở vùng Đông Bắc Bộ, và cũng gần với tỉnh Quảng Châu, Trung
Quốc (là nơi khởi nguồn và tồn tại của giống lợn Lantang). Như vậy, có thể trong
quá trình giao thương buôn bán hàng trăm năm trước giữa các vùng miền núi giáp
biên giới giữa hai nước, các giống lợn đã được trao đổi dưới dạng hàng hóa, lâu dần
được thuần hóa thành các giống bản địa. Do vậy, có thể giống lợn Lantang (Trung
Quốc) và 3 giống lợn bản địa tại vùng Đông Bắc bộ (Việt Nam) có chung một
nguồn gốc. Tuy nhiên để xác nhận điều này, cần có các nghiên cứu sâu hơn về di
truyền học phân tử.
Lợn Mường Lay và Mường Khương ở các nhánh chị em có khoảng cách
tiến hóa rất gần (khoảng cách p = 0,0005). Từ cây phát sinh chủng loại có thể
thấy, hai giống lợn bản địa Hương và Hạ Lang cùng nhóm với lợn Lantang ở miền
nam Trung Quốc. Giống Mường Lay cùng nhánh phụ với giống Bamei ở lưu vực
sông Hoàng Hà, Trung Quốc. Như dự đoán, có khoảng cách lớn giữa lợn Vịêt
nam, Trung quốc với nhóm lợn Châu Âu tương đồng với sự phân bố khá xa của
các nhóm lợn theo vùng địa lý. Giống lợn Ỉ có khoảng cách xa nhất với các giống
lợn bản địa Việt Nam còn lại và có khoảng cách tiến hóa gần nhất với lợn
Banamini (giá trị bootstrap cho nhánh này là 99%).
Hai giống bản địa của tỉnh Cao Bằng là Hạ Lang và Hương có độ tương đồng
cao về trình tự D-loop, phù hợp với một số đặc điểm tương đồng giữa hai giống lợn
về hình thái, bên cạnh đó đã có một số tài liệu đề cập đến nguồn gốc gần gũi hoặc
có chung nguồn gốc của hai giống lợn này [122, 123]. Trên cây phát sinh chủng loại
hai giống Hương và Hạ Lang nằm trên hai nhánh chị em với giá trị bootstrap ủng hộ
là 97%. Thông qua phân tích phát sinh chủng loại có thể nhận định rằng hai giống
Hạ Lang và Hương có chung nguồn gốc tổ tiên, phân ly ở cùng một thời điểm tiến
hóa. Tuy nhiên, cần có những nghiên cứu sâu hơn về tiến hóa, có thể sử dụng thêm
các chỉ thị di truyền khác để làm sáng tỏ và khẳng định vững chắc luận điểm trên.
97
Sự thuần hóa động vật nói chung, lợn nhà nói riêng có liên quan mật thiết
đến tập tính lao động sản xuất nông nghiệp. Nhiều bằng chứng về phát sinh chủng
loại địa lý cho thấy quá trình thuần hóa lợn diễn ra nhiều lần và độc lập ở nhiều nơi
trên thế giới, từ Châu Á, Đông Nam Á, Ấn Độ, Châu Âu, và Châu Phi. Có quan
điểm về thuần hóa lợn nhà cho rằng các giống lợn được thuần hóa bắt nguồn từ các
quần thể lợn hoang ở nhiều khu vực địa lý trên thế giới. Bán đảo Ðông Dương,
trong đó có Việt Nam, một nơi thuần hóa, nơi xuất phát của nhiều nhóm gia súc là
kết quả của quá trình lao động sáng tạo của tổ tiên chúng ta. Trong một nghiên cứu,
DNA của các giống lợn thuộc các hải đảo Thái Bình Dương đã được phân tích giúp
các tác giả đưa ra đã khẳng định rằng lợn tại các hải đảo này cũng xuất phát và được
thuần hóa từ lục địa Đông Nam Á (đặc biệt là từ Việt Nam) khoảng 3000 năm trước
đây [11]. Lan và Shi (1993) cho rằng Lợn Việt Nam bao gồm quần thể lợn hoang và
lợn nhà có thể có cùng tổ tiên với các nhóm lợn Đông Á [70]. Ước tính về thời điểm
thuần hóa và di cư của lợn nêu trên khá phù hợp với các di chỉ khảo cổ tìm thấy ở
Việt Nam. Theo các di chỉ này thì nghề chăn nuôi lợn ở Việt Nam khá phát triển
vào thời Hùng Vương. Các di chỉ khảo cổ học thuộc thời kì hậu Đồ Đá Mới (tức
khoảng 8000 đến 3000 năm trước đây) ở khu vực Phùng Nguyên, Đồng Đậu và Hoa
Lộc có nhiều xương cốt các con vật nuôi trong nhà như lợn, chó, trâu bò nuôi, gà,
vịt... Tại di chỉ Đồng Đậu, tỉ lệ xương lợn trong tầng văn hóa ở đây cao hơn xương
lợn rừng và các gia cầm [122]. Từ những dữ kiện nêu trên và kết quả phân tích phát
sinh chủng loại của luận án có thể nhận định hai giả thuyết giải thích cho quá trình
thuần hóa lợn nhà Việt Nam: thứ nhất là chúng có thể được thuần hóa ngay tại Việt
Nam, hai là tổ tiên chúng có mặt ở khu vực lân cận như Miền tây nam Trung Quốc
rồi được đưa vào lãnh thổ Việt Nam [70]. Tuy nhiên vẫn có những quan điểm trái
chiều về nguồn gốc của lợn bản địa Việt Nam, chẳng hạn như trong nghiên cứu của
Hongo và cs (2002) khi tiến hành so sánh trình tự mtDNA của lợn Việt Nam với các
cá thể lợn nhà và lợn rừng Châu Á, đã cho rằng một số giống lợn nhà Việt Nam có
quan hệ gần gũi với giống lợn rừng và có quan hệ tách biệt về mặt di truyền với với
các nhóm lợn Đông Á. Do đó, cần có thêm những nghiên để khẳng định vững chắc
hơn về nguồn gốc các giống lợn bản địa Việt Nam.
Hiện nay không chỉ Việt Nam mà trên toàn thế giới, ngày càng nhiều giống
lợn bản địa đang ở mức bị đe dọa xóa khỏi bản đồ vật nuôi. Nguyên nhân chủ yếu là
98
do sức ép của quá trình sản xuất lợn với quy mô toàn cầu, buộc người nông dân
phải chọn lựa nuôi những giống lợn lai, nhập nội [6]. Đã có những bằng chứng cho
thấy sự đa dạng di truyền ở tất cả các giống lợn hiện đại ngày nay đang giảm dần
khi tiến hành lai tạo các dòng thương mại. Một số quốc gia đã nhận ra được vấn đề
này và đang bắt đầu hỗ trợ việc duy trì liên tục các giống phi thương mại như một
nguồn gen cho tương lai. Kết quả của luận án bao gồm các dữ liệu về thông tin di
truyền thu được giúp nhận định nguồn gốc giống, đánh giá đặc trưng di truyền của
những giống lợn bản địa nghiên cứu, được coi là những nguồn gen vật nuôi bản địa
đang bị thất thoát tại Việt Nam. Những kết quả nghiên cứu cũng đóng góp vào thư
viện nguồn gen của một số giống bản địa trong Ngân hàng gen Quốc gia, phục vụ
cho mục tiêu bảo tồn, phát triển và khai thác có hiệu quả nguồn gen quý của sáu
giống lợn bản địa. Đề tài luận án tạo tiền đề cho phát triển các nghiên cứu tiếp theo
trên các giống vật nuôi bản địa khác của Việt Nam.
99
Chương 4. KẾT LUẬN VÀ KIẾN NGHỊ
4.1. Kết luận
1. Đã giải trình tự hoàn chỉnh hệ gen ty thể của 6 cá thể lợn bản địa Việt
Nam (lợn Ỉ, lợn Móng Cái, lợn Mường Khương, lợn Mường Lay, lợn Hương và lợn
Hạ Lang) dữ liệu đã công bố trên ngân hàng Genbank tương ứng với các mã số
KX094894, KU556691, KY432578, KX147101, KY964306 và KY800118.
2. Đã phân tích, chú giải, dự đoán cấu trúc chức năng hệ gen ty thể của 6 cá
thể lợn nghiên cứu. Xác định được độ đa hình trình tự hệ gen ty thể của 6 cá thể lợn
nghiên cứu. Chỉ số tương đồng trình tự hệ gen ty thể của vùng D-loop ở giống lợn Ỉ
là thấp nhất so với 5 giống còn lại. Xác định được 25 vị trí đa hình trong vùng D-
loop của 6 cá thể lợn nghiên cứu.
3. Xác định được khoảng cách tiến hóa, mối quan hệ phát sinh chủng loại
giữa 6 cá thể lợn nghiên cứu với một số giống lợn nhà và lợn rừng khác trên thế
giới. Nguồn gốc của 6 giống lợn bản địa Việt Nam gần gũi với nhóm lợn Châu Á,
đặc biệt là các giống lợn bản địa Nam Trung Quốc và khác xa với nhóm lợn Châu
Âu. Xây dựng được giả thuyết về nguồn gốc chung của giống lợn Hương và Hạ
Lang có thể là cùng một nguồn gốc.
4.2. Kiến nghị
1. Cần tiến hành nghiên cứu các loại chỉ thị phân tử khác, kết hợp với dữ liệu
về hệ gen ty thể của các giống lợn bản địa nghiên cứu để sử dụng như một công cụ
nhận dạng giống.
2. Cần tiến hành các nghiên cứu tiếp theo trên khoảng 20 giống lợn bản địa
khác của Việt Nam, từ đó tạo nguồn dữ liệu di truyền đóng góp cho ngân hàng dữ
liệu gen quốc gia và sử dụng những nguồn gen này cho nhiệm vụ bảo tồn các giống
vật nuôi quý hiếm.
100
DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ
1. Nguyen HD, Bui TA, Nguyen PT, Kim OT, Vo TT. The complete
mitochondrial genome sequence of the indigenous I pig (S. scrofa) in
Vietnam. Asian - Australia Journal of Animal Sciences. 2017; 30(7): 930–
937.
2. Thuy Thi Bich Vo, Hieu Duc Nguyen, Tuan Anh Bui, Minh Ngoc Nghiem,
Eui Bae Jeung. Phylogenomic analysis of mitochondrial DNA in the Huong
pig: an indigenous pig of Vietnam. Global Journal of Animal Breeding and
Genetics. 2017. 5 (4), pp. 389-397.
3. Hieu Duc Nguyen, Linh Thuy Pham, Tuan Anh Bui, Minh Ngoc Nghiem,
Thuy Thi Bich Vo. The Complete Sequence of Mitochondrial Genome of
Muong Khuong Pig (S. scrofa). International Journal of Research Studies in
Biosciences. 5, (7), 2017, pp. 1-3.
4. Thuy Thi Bich Vo, Tuan Anh Bui, Hieu Duc Nguyen, Hanh Hong Ha and
Eui Bae Jeung. The Mitochondrial Genome and Phylogenetic Relationships
of Muong Lay Black Pig (S. scrofa) in Vietnam. Approaches in Poultry,
Dairy & Veterinary Sciences (2018) 5:1-7.
5. Tuan Anh Bui, Hieu Duc Nguyen and Thuy Thị Bich Vo. Complete
mitochondrial genome sequence and phylogenetic status of Halang pig (S.
scrofa). Asian Journal of Biology, 6(3): 1-8, 2018; Article no.AJOB.41995.
6. Thuy Thi Bich Vo, Hieu Duc Nguyen, Tuan Anh Bui, Binh Thi Nguyen Le,
Minh Ngoc Nghiem and Hai Van Nong. Phylogenomic analysis and gene
organisation of mitogenome from Mong Cai pig in Vietnam. Current
Science. Vol. 116, No. 9, 10. 2019, p 1566-1571.
Doi:10.18520/cs/v116/i9/1566-1571.
7. Bùi Anh Tuấn, Nguyễn Đức Hiếu, Nghiêm Ngọc Minh, Võ Thị Bích Thủy.
Phân tích đa dạng di truyền hệ gen ty thể và nguồn gốc tiến hóa của sáu
giống lợn bản địa Việt Nam. Tạp chí Khoa học và Công nghệ Việt Nam.
2018. 60(7), tr. 53-60.
101
TÀI LIỆU THAM KHẢO
1. E. Giuffra, J.M. Kijas, V. Amarger, et al., The origin of the domestic pig: independent domestication and subsequent introgression. Genetics, 2000, 154 (4), 1785-91.
2. M. Bosse, A Genomics Perspective on Pig Domestication, Animal Domestication. Fabrice Teletchea, IntechOpen, 2018.
3. A. Gentry, J. Clutton-Brock, C. P Groves, The naming of wild animal species and their domestic derivates, 2004, Vol, 31.Elsevier, Journal of Archaeological Science, 645-651.
4. S. Solari,R.J. Baker, Mammal Species of the World: A Taxonomic and Geographic Reference by D. E. Wilson; D. M. Reeder. Journal of Mammalogy, 2007, 88 (3), 824-830.
5. Tạ Thị Bích Duyên, Đặng Hoàng Biên, Nguyễn Văn Trung, et al., Một số giống lợn bản địa Việt Nam. Chuyên khảo Bảo tồn và khai thác nguồn gen vật nuôi Việt Nam, 2013, Nhà xuất bản Khoa học tự nhiên và công nghệ, 52-93.
6. B.M. Epstein J, Pig. In: Mason, I.L, Evolution of Domesticated Animals, 1986, John Wiley & Sons, Incorporated, 145-162.
7. S.M. Nelson, Ancestors for the Pigs: Pigs in Prehistory, 1998, University of Pennsylvania Press, Incorporated, 532.
8. J.D. Vigne, A. Zazzo, J.F. Saliege, et al., Pre-Neolithic wild boar management and introduction to Cyprus more than 11,400 years ago. Proceedings of the National Academy of Sciences U S A, 2009, 106 (38), 16135-8.
9. S. Bökönyi, History of domestic mammals in central and eastern Europe, 1974, Akadémiai Kiadó, Budapest, 89.
10. G. Larson, K. Dobney, U. Albarella, et al., Worldwide phylogeography of wild boar reveals multiple centers of pig domestication. Science, 2005, 307 (5715), 1618-21.
11. J.K. Lum, J.K. McIntyre, D.L. Greger, et al., Recent Southeast Asian domestication and Lapita dispersal of sacred male pseudohermaphroditic “tuskers” and hairless pigs of Vanuatu. Proceedings of the National Academy of Sciences of the United States of America, 2006, 103 (46), 17190-17195.
12. K.K. Hirst, The Domestication of Pigs: Sus Scrofa's Two Distinct Histories. ThoughtCo, Jun. Thoughtco.com/the-domestication-of-pigs-170665., 2018.
13. G. Larson, U. Albarella, K. Dobney, et al., Ancient DNA, pig domestication, and the spread of the Neolithic into Europe. Proceedings of the National Academy of Sciences, 2007, 104 (39), 15276-15281.
102
14. P. Rowley-Conwy, Westward Ho! The Spread of Agriculturalism from Central Europe to the Atlantic. Current Anthropology, 2011, 52 (S4), 431-451.
15. K.I. Kim, J.H. Lee, K. Li, et al., Phylogenetic relationships of Asian and European pig breeds determined by mitochondrial DNA D-loop sequence polymorphism. Animal Genetic, 2002, 33 (1), 19-25.
16. H Kasamatsu,J. Vinograd, Replication of Circular DNA in Eukaryotic Cells. Annual Review of Biochemistry, 1974, 43 (1), 695-719.
17. A. Chomyn, W.J.C. Michael, C.I. Ragan, et al., URF6, Last Unidentified Reading Frame of Human mtDNA, Codes for an NADH Dehydrogenase Subunit. Science, 1986, 234 (4776), 614-618.
18. D.R. Wolstenholme, Animal mitochondrial DNA: structure and evolution. International Review of Cytology, 1992, 141, 173-216.
19. H. Chial,J. Craig, mtDNA and mitochondrial diseases. Nature Education, 2008, 1 (1), 217.
20. D. Ojala, J. Montoya, G. Attardi, tRNA punctuation model of RNA processing in human mitochondria. Nature, 1981, 290 (5806), 470-4.
21. R. Richter, S. Pajak A Fau - Dennerlein, A. Dennerlein S Fau - Rozanska, et al., Translation termination in human mitochondrial ribosomes. (1470-8752 (Electronic)).
22. J. Blasiak, S. Glowacki, A. Kauppinen, et al., Mitochondrial and nuclear DNA damage and repair in age-related macular degeneration. International journal of molecular sciences, 2013, 14 (2), 2996-3010.
23. C. Gissi, F. Iannelli, G. Pesole, Evolution of the mitochondrial genome of Metazoa as exemplified by comparison of congeneric species. Heredity, 2008, 101, 301.
24. V. Dominguez Del Angel, E. Hjerde, L. Sterck, et al., Ten steps to get started in Genome Assembly and Annotation. F1000Research, 2018, 7, ELIXIR-148.
25. P.D. Hebert, A. Cywinska, S.L. Ball, et al., Biological identifications through DNA barcodes. Proceedings of the Royal Society B: Biological Sciences, 2003, 270 (1512), 313-21.
26. A.J. Cox,P.D. Hebert, Colonization, extinction, and phylogeographic patterning in a freshwater crustacean. Molecular Ecology, 2001, 10 (2), 371-86.
27. A. Spychaj, M. Szalata, R. Słomski, et al., Identification of Bovine, Pig and Duck Meat Species in Mixtures and in Meat Products on the Basis of the mtDNA Cytochrome Oxidase Subunit I (COI) Gene Sequence. Polish Journal of Food and Nutrition Sciences, 2016, 66 (1), 31-36.
28. N. Dawnay, R. Ogden R Fau - McEwing, G.R. McEwing R Fau - Carvalho, et al., Validation of the barcoding gene COI for use in forensic genetic species identification. (1872-6283 (Electronic)).
103
29. C. Wu, Y. Jiang, H. Chu, et al., The type I Lanyu pig has a maternal genetic lineage distinct from Asian and European pigs. Animal genetics, 2007, 38 (5), 499-505.
30. G. Yu, H. Xiang, J. Wang, et al., The phylogenetic status of typical Chinese native pigs: analyzed by Asian and European pig mitochondrial genome sequences. Journal of Animal Science and Biotechnology, 2013, 4 (1), 9.
31. R.G. Harrison, Animal mitochondrial DNA as a genetic marker in population and evolutionary biology. Trends in Ecology & Evolution, 1989, 4 (1), 6-11.
32. B. M. Ursing,U. Arnason, The Complete Mitochondrial DNA Sequence of the Pig (Sus scrofa), 1998, Vol, 47. 302-6.
33. G. Luikart, L. Gielly, L. Excoffier, et al., Multiple maternal origins and weak phylogeographic structure in domestic goats. Proceedings of the National Academy of Sciences, 2001, 98 (10), 5927-5932.
34. W.M. Brown, M. George, Jr., A.C. Wilson, Rapid evolution of animal mitochondrial DNA. Proceedings of the National Academy of Sciences U S A, 1979, 76 (4), 1967-71.
35. R.E. Giles, H. Blanc, H.M. Cann, et al., Maternal inheritance of human mitochondrial DNA. Proceedings of the National Academy of Sciences, 1980, 77 (11), 6715-6719.
36. R.L. Cann, W.M. Brown, A.C. Wilson, Polymorphic sites and the mechanism of evolution in human mitochondrial DNA. Genetics, 1984, 106 (3), 479-99.
37. L.B. Jorde, W.S. Watkins, M.J. Bamshad, et al., The distribution of human genetic diversity: a comparison of mitochondrial, autosomal, and Y-chromosome data. American Journal of Human Genetics, 2000, 66 (3), 979-88.
38. B.F. Lang, M.W. Gray, G. Burger, Mitochondrial genome evolution and the origin of eukaryotes. Annual Review of Genetics, 1999, 33, 351-97.
39. D.G. Bradley, D.E. MacHugh, P. Cunningham, et al., Mitochondrial diversity and the origins of African and European cattle. Proceedings of the National Academy of Sciences U S A, 1996, 93 (10), 5131-5.
40. H. Mannen, S. Tsuji, R.T. Loftus, et al., Mitochondrial DNA variation and evolution of Japanese black cattle (Bos taurus). Genetics, 1998, 150 (3), 1169-75.
41. E. Mayr, The Growth of Biological Thought: Diversity, Evolution and Inheritance. 1982, (Belknap Press, Cambridge, MA).
42. J. Pevsner, Bioinformatics and functional genomics, 2015, John Wiley & Sons Inc., New York, United States.
43. A.L. Clarke, The Diversity of Life Politics and the Life Sciences, 2016, 13 (1), 129-130.
104
44. J. Hein,J. Støvlbæk, Combined DNA and protein alignment. Methods in enzymology, 1996, 266, 402-418.
45. J.P. Huelsenbeck,F. Ronquist, MRBAYES: Bayesian inference of phylogenetic trees. Bioinformatics, 2001, 17 (8), 754-755.
46. R.R. Sokal,C.D. Michener, A statistical method for evaluating systematic relationships. University of Kansas Scientific Bulletin, 1958, 28, 1409-1438.
47. N. Saitou,M. Nei, The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution, 1987, 4 (4), 406-25.
48. J. Czelusniak, M. Goodman, N.D. Moncrief, et al., Maximum parsimony approach to construction of evolutionary trees from aligned homologous sequences. Methods Enzymol, 1990, 183, 601-15.
49. J. Felsenstein, Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution, 1981, 17 (6), 368-76.
50. J.P. Huelsenbeck, B. Larget, R.E. Miller, et al., Potential applications and pitfalls of Bayesian inference of phylogeny. Systematic Biology, 2002, 51 (5), 673-88.
51. D. Hillis,J. J. Bull, An Empirical Test of Bootstrapping as a Method for Assessing Confidence in Phylogenetic Analysis, 1993, Vol, 42. 182-192.
52. J. Felsenstein, Confidence limits on phylogenies: An approach using the bootstrap. Evolution, 1985, 39 (4), 783-791.
53. L.A.F. Frantz, J.G. Schraiber, O. Madsen, et al., Evidence of long-term gene flow and selection during domestication from analyses of Eurasian wild and domestic pig genomes. Nature Genetics, 2015, 47, 1141.
54. T. Watanobe, N. Ishiguro, M. Nakano, Phylogeography and population structure of the Japanese wild boar Sus scrofa leucomystax: mitochondrial DNA variation. Zoological Science, 2003, 20 (12), 1477-89.
55. L.Y. Wang, Y.L. Chai, H.M. Ma, The complete sequence of the mitochondrial genome of Duroc pig (Sus Scrofa). Mitochondrial DNA A DNA Mapp Seq Anal, 2016, 27 (1), 3-4.
56. G.S. Wu, Y.G. Yao, K.X. Qu, et al., Population phylogenomic analysis of mitochondrial DNA in wild boars and domestic pigs revealed multiple domestication events in East Asia. Genome Biology, 2007, 8 (11), R245.
57. A.I. Fernandez, E. Alves, A. Fernandez, et al., Mitochondrial genome polymorphisms associated with longissimus muscle composition in Iberian pigs. Journal of Animal Science, 2008, 86 (6), 1283-90.
58. M.A. Kolosova, L.V. Getmantseva, S.Y. Bakoev, et al., Associations of mtDNA haplotypes with productive traits in pigs. Rendiconti Lincei. Scienze Fisiche e Naturali, 2019, 30 (4), 807-813.
59. F. Liu, H.X. Tang, Y.G. Liu, et al., The complete mitochondrial genome of Sus cebifrons (Sus, Suidae). Mitochondrial DNA, 2015, 26 (3), 483-4.
105
60. M. Wang, Z. Sheng, X. Wu, et al., Mitochondrial DNA-based genetic structure analysis of Pudong White pigs. Biochemical genetics, 2010, 48 (11-12), 924-37.
61. J. Yang, J. Wang, J. Kijas, et al., Genetic diversity present within the near-complete mtDNA genome of 17 breeds of indigenous Chinese pigs. J Hered, 2003, 94 (5), 381-5.
62. K.I. Kim, J.H. Lee, K. Li, et al., Phylogenetic relationships of Asian and European pig breeds determined by mitochondrial DNA D loop sequence polymorphism. International Society for Animal Genetics, 2002, 33 (Animal Genetics), 19-25.
63. G. Yu, H. Xiang, J. Wang, et al., The phylogenetic status of typical Chinese native pigs: analyzed by Asian and European pig mitochondrial genome sequences. Animal Science and Biotechnology, 2013, 4-9.
64. Y. Kurosawa, Electrophoretic variations of serum amylase-1 (Am-1) in native domestic pigs of Vietnam. Rep. Soc. Res. Native Livestock, 1998, 16, 85-90.
65. Nguyễn Thị Phương Mai, Nghiên cứu một số đặc điểm sinh học và di truyền của heo rừng Tây Nguyên, Luận án Tiến sĩ. 2017, Học viện Khoa học và Công nghệ - Viện Hàn Lâm Khoa học và Công nghệ Việt Nam
66. Tran Thi Thuy Nhien, P. Ni, J. Chen, et al., The complete mitochondrial genome of Mong Cai pig (Sus scrofa) in Vietnam. Mitochondrial DNA Part B, 2016, 1 (1), 226-227.
67. S. Ishihara, A. Arakawa, M. Taniguchi, et al., Genetic relationships among Vietnamese local pigs investigated using genome-wide SNP markers. Animal Genetic, 2018, 49 (1), 86-89.
68. K. Tanaka, Y. Iwaki, T. Takizawa, et al., Mitochondrial diversity of native pigs in the mainland South and South‐east Asian countries and its relationships between local wild boars, 2008, Vol, 79. 417-434.
69. H. Hongo, N. Ishiguro, T. Watanobe, et al., Variation in mitochondrial DNA of Vietnamese pigs: relationships with Asian domestic pigs and Ryukyu wild boars. Zoological Science, 2002, 19 (11), 1329-35.
70. H. Lan, L. Shi, The origin and genetic differentiation of native breeds of pigs in southwest China: an approach from mitochondrial DNA polymorphism. Biochemical Genetics, 1993, 31 (1-2), 51-60.
71. Pham Doan Lan, Do Ngoc Duy, Le Quang Nam, et al., Molecular genetic diversity and genetic structure of Vietnamese indigenous pig populations. Journal of Animal Breeding and Genetics, 2014, 131 (5), 379-386.
72. N.T. Thuy, E. Melchinger-Wild, A.W. Kuss, et al., Comparison of Vietnamese and European pig breeds using microsatellites. Journal of Animal Science, 2006, 84 (10), 2601-8.
106
73. Le Thanh Long, Thi Phuong Mai, N.D. Chung, et al., The Genetic Relationship of Vietnamese Pigs in Central Highlands Assessed by Cytochrome b, 2014, Vol, 4. 362-369.
74. Nguyễn Văn Thiện,Đinh Hồng Luận, Một số đặc điểm di truyền về năng suất của hai giống lợn nội Ỉ và Móng Cái (Sus vittatus). Kết quả bước đầu bảo tồn nguồn gene vật nuôi ở Việt Nam. 1994.
75. Lê Viết Ly, Hoàng Kim Giao, Mai Văn Sánh, et al., Bảo tồn nguồn gen vật nuôi ở Việt Nam. Sách chuyên khảo, 1999, Tập 1, 23-78.
76. Trần Văn Do, Trương Thị Quỳnh, T.H. Hải, Sinh trưởng phát triển của lợn Vân Pa tại Đakrông, Hướng Hóa, tỉnh Quảng Trị. Báo cáo tóm tắt đề tài nghiên cứu khoa học, 2005.
77. Trần Thanh Vân,Đinh Thu Hà, Khảo sát một số chỉ tiêu sản xuất của lợn Mẹo nuôi tại huyện Phú Sa tỉnh Sơn La. Tạp chí Chăn nuôi, 2005, 1.
78. Lê Thị Thúy, Lưu Quang Minh, Trần Thu Thủy, et al., Đa hình kiểu gen Leptin liên quan đến tính trạng kinh tế của một số giống lợn nuôi tại Việt Nam. Tạp chí Di truyền học và Ứng dụng, 2004, Số 4, 34-40.
79. Đỗ Võ Anh Khoa, Klaus Wimmers, Đặc điểm gen mã hóa Mannan-Binding lectin serine protease 1 ở lợn. Tạp chí Công nghệ Sinh học, 2012, Tập 10 (Số 3/2012), 65.
80. Trần Xuân Hoàn, Nghiên cứu xác định các chỉ thị phân tử trong chọn lọc lợn giống thuần chủng đạt năng suất và chất lượng thịt cao. Chương trình trọng điểm ứng dụng công nghệ sinh học trong nông nghiệp từ 2006- 2010, 2009-2013.
81. Đặng Vũ Bình, Nhân giống thuần chủng và đánh giá khả năng phát triển của đàn lợn Piétrain kháng stress Bỉ nuôi tại Việt Nam. Đề tài cấp Bộ (Bộ Giáo dục và Đào tạo) trong khuôn khổ của Chương trình hợp tác giữa Trường Đại học Nông nghiệp Hà Nội và Cộng đồng các trường Đại học pháp ngữ (Vương quốc Bỉ), 2012.
82. Nguyễn Thị Diệu Thúy, Nguyễn Thu Thúy, Nguyễn Văn Cường, Đa hình di truyền gen hormone sinh trưởng ở lợn Móng Cái. Tạp chí Công nghệ Sinh học, 2004, 2 (1), 4-6.
83. Nguyễn Thị Hoa, Phân tích đa hình một số gen liên quan đến chất lượng thịt lợn bằng phương pháp PCR – RFLP. Luận văn Thạc sỹ, 2013.
84. Lê Thị Thu Phương, Phát hiện gen halothan, gen thụ thể estrogen và mối liên quan giữa hai gen này đến năng suất sinh sản của heo nái. Luận văn thạc sỹ, 2003.
85. Nguyễn Văn Cường, Phân tích đa hình ADN trong một số ứng gen kháng bệnh ở lợn nội Việt Nam và phát triển chỉ thị di truyền phân tử hỗ trợ chọn giống lợn kháng bệnh. 2009, Đề tài NCCB trong khoa học tự nhiên được Quỹ phát triển khoa học và công nghệ quốc gia tài trợ.
86. Võ Văn Sự, Phạm Công Thiếu, Át lát các giống vật nuôi ở Việt Nam, 2016, NXB Nông Nghiệp, 37-55.
107
87. Quy chuẩn kĩ thuật quốc gia về bệnh động vật - Yêu cầu chung lấy mẫu bệnh phẩm, bảo quản và vận chuyển - QCVN 01- 83:2011/BNNPTNT
88. J. Sambrook,D. Russell, Molecular Cloning: A Laboratory Manual. 2001, Cold Spring Harbor: Cold Spring Harbor Laboratory Press, 317-332.
89. F. Sanger, S. Nicklen, A.R. Coulson, DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences U S A, 1977, 74 (12), 5463-7.
90. J. Hein,J. Stovlbaek, Combined DNA and protein alignment. Methods Enzymol, 1996, 266, 402-18.
91. S.C. Ghivizzani, S.L. Mackay, C.S. Madsen, et al., Transcribed heteroplasmic repeated sequences in the porcine mitochondrial DNA D-loop region. Journal of molecular evolution, 1993, 37 (1), 36-47.
92. W.L.S. Li,A.J. Drummond, Model averaging and Bayes factor calculation of relaxed molecular clocks in Bayesian phylogenetics. Molecular biology and evolution, 2012, 29 (2), 751-761.
93. S. Kumar, G. Stecher, K. Tamura, MEGA7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets. Molecular Biology and Evolution, 2016, 33 (7), 1870-4.
94. M. Bernt, A. Donath, F. Jühling, et al., MITOS: Improved de novo metazoan mitochondrial genome annotation. Molecular phylogenetics and evolution, 2013, 69 (2), 313-319.
95. T. Seemann, Prokka: rapid prokaryotic genome annotation. Bioinformatics, 2014, btu153.
96. S.F. Altschul, T.L. Madden, A.A. Schäffer, et al., Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic acids research, 1997, 25 (17), 3389-3402.
97. D.A. Benson, M. Cavanaugh, K. Clark, et al., GenBank. Nucleic acids research, 2013, 41 (D1), D36-D42.
98. S.K. Wyman, R.K. Jansen, J.L. Boore, Automatic annotation of organellar genomes with DOGMA. Bioinformatics, 2004, 20 (17), 3252-5.
99. F. Jühling, J. Pütz, M. Bernt, et al., Improved systematic tRNA gene annotation allows new insights into the evolution of mitochondrial tRNA structures and into the mechanisms of mitochondrial genome rearrangements. Nucleic Acids Research, 2012, 40 (7), 2833-2845.
100. S.F. Altschul, W. Gish, W. Miller, et al., Basic local alignment search tool. Journal of Molecular Biology, 1990, 215 (3), 403-410.
101. J.R. Lobry, Asymmetric substitution patterns in the two DNA strands of bacteria. Molecular Biology and Evolution, 1996, 13 (5), 660-5.
102. J. Rozas, A. Ferrer-Mata, J.C. Sanchez-DelBarrio, et al., DnaSP 6: DNA Sequence Polymorphism Analysis of Large Data Sets. Molecular Biology and Evolution, 2017, 34 (12), 3299-3302.
108
103. M. Nei,S. Kumar, Molecular Evolution and Phylogenetics, 2000, Oxford University Press.
104. A.J. Drummond, M.A. Suchard, D. Xie, et al., Bayesian phylogenetics with BEAUti and the BEAST 1.7. Molecular Biology and Evolution, 2012, 29 (8), 1969-73.
105. FigureTree, Tree Figure Drawing Tool, A. Rambaut, Editor. 2014, Institute of Evolutionary Biology, University of Edinburgh., Institute of Evolutionary Biology, University of Edinburgh.
106. N. Sueoka, Intrastrand parity rules of DNA base composition and usage biases of synonymous codons. Journal of Molecular Evolution, 1995, 40 (3), 318-25.
107. J.R. Lobry, Properties of a general model of DNA evolution under no-strand-bias conditions. Journal of Molecular Evolution, 1995, 40 (3), 326-30.
108. A. Hassanin, N. Leger, J. Deutsch, Evidence for multiple reversals of asymmetric mutational constraints during the evolution of the mitochondrial genome of metazoa, and consequences for phylogenetic inferences. Systematic Biology, 2005, 54 (2), 277-98.
109. S.J. Wei, M. Shi, X.X. Chen, et al., New views on strand asymmetry in insect mitochondrial genomes. PLoS One, 2010, 5 (9), e12708.
110. K.B. Yoon,Y.C. Park, Secondary structure and feature of mitochondrial tRNA genes of the Ussurian tube-nosed bat Murina ussuriensis (Chiroptera: Vespertilionidae). Genomics Data, 2015, 5, 213-217.
111. G.C. Conant,K.H. Wolfe, GenomeVx: simple web-based creation of editable circular chromosome maps. Bioinformatics, 2008, 24 (6), 861-2.
112. C.S. Lin, Y.L. Sun, C.Y. Liu, et al., Complete nucleotide sequence of pig (Sus scrofa) mitochondrial genome and dating evolutionary divergence within Artiodactyla. Gene, 1999, 236 (1), 107-14.
113. D.V. Lavrov, W.M. Brown, J.L. Boore, A novel type of RNA editing occurs in the mitochondrial tRNAs of the centipede Lithobius forficatus. Proceedings of the National Academy of Sciences U S A, 2000, 97 (25), 13738-42.
114. F. Kilpert,L. Podsiadlowski, The complete mitochondrial genome of the common sea slater, Ligia oceanica (Crustacea, Isopoda) bears a novel gene order and unusual control region features. BMC Genomics, 2006, 7, 241.
115. N. Okumura, Y. Kurosawa, E. Kobayashi, et al., Genetic relationship amongst the major non‐coding regions of mitochondrial DNAs in wild boars and several breeds of domesticated pigs. Animal genetics, 2001, 32 (3), 139-147.
116. T. Watanabe, Y. Hayashi, J. Kimura, et al., Pig mitochondrial DNA: polymorphism, restriction map orientation, and sequence data. Biochemical genetics, 1986, 24 (5), 385-396.
109
117. A.J. Drummond, M.A. Suchard, D. Xie, et al., Bayesian phylogenetics with BEAUti and the BEAST 1.7. Molecular Biology and Evolution, 2012, 29 (8), 1969-73.
118. M.F. Rothchild,A. Ruvinsky, The Genetics of the Pig. CAB International, Wallingford, Oxon, UK, . Journal of Animal Breeding and Genetics, 2001, 118 (5), 354-355.
119. H. Hongo, Ishiguro, N. Watanobe, T. Nobuo Shigehara, Tomoko Anezaki, Vu The Long, Dang Vu Binh, Nguyen Trong Tien, and Nguyen Huu Nam, Variation in mitochondrial DNA of Vietnamese pigs: relationships with Asian domestic pigs and Ryukyu wild boars. Zoological Science, 2002, 19 (11), 1329-1335.
120. J.M. Kijas,L. Andersson, A phylogenetic study of the origin of the domestic pig estimated from the near-complete mtDNA genome. Journal of Molecular Evolution, 2001, 52 (3), 302-8.
121. P.J. Piper, H. Matsumura, D. Bulbeck, New perspectives in Southeast Asian and Pacific prehistory. Acton, The Australian National University Press, 2017, online resource.
122. Đoàn Thị Năm, Nuôi thử nghiệm giống lợn hương quý hiếm của Trung Quốc tại Cao Bằng. http://khcncaobang.gov.vn, 2005, (Trung tâm ứng dụng tiến bộ KHCN Cao Bằng, Sở Khoa học và Công nghệ tỉnh Cao Bằng).
123. Lê Xuân Diệm, Hoàng Xuân Chinh, Di chỉ khảo cổ học Đồng Đậu, 1983, Khoa học xã hội, Hà Nội, 166.
110
PHỤ LỤC
1. Phụ lục 1 - Nguồn gốc, phân bố, đặc điểm ngoại hình, khả năng sinh
trưởng 6 giống lợn bản địa Việt Nam (theo Át lát Các giống vật nuôi ở Việt Nam
và Chuyên khảo Bảo tồn và khai thác nguồn gen vật Nuôi Việt Nam - Phụ lục 1) [5, 86]
a. Giống lợn Ỉ pha:
- Nguồn gốc: Thanh Hóa, Nam Định
- Phân bố: Từng có ở các tỉnh Nam Định, Thanh Hóa, Hà Nội và một số tỉnh
miền Bắc.
Màu sắc lông
da, hình dáng
bên ngoài
- Lông thưa, thô. Lông, da đen nhưng không bóng như lợn Ỉ
Mỡ.
- Đầu to vừa phải, trán gần phẳng, mặt nhăn, nọng cổ và má
chảy sệ khi béo, mõm ngắn, bụng ít sệ, thân, chân dài và cao
hơn so với lợn Ỉ Mỡ
Tầm vóc Trung bình
Khả năng sinh
trưởng
- Khối lượng sơ sinh 420 g/con
- Khối lượng 2 tháng tuổi: 4-4,5 kg/con
- Khối lượng 9 tháng tuổi: 40-55 kg/con
- Khối lượng 2-3 năm tuổi: 60-70 kg/con
b. Giống lợn Móng Cái:
- Nguồn gốc: huyện Đông Triều, tỉnh Quảng Ninh
- Phân bố: Các tỉnh phía Bắc và miền Trung
Màu sắc lông
da, hình dáng
bên ngoài
- Toàn thân màu lang đen trắng hình yên ngựa, đầu đen giữa
trán có một đốm trắng hình tam giác hoặc hình thoi. Mõm
trắng, có vành trắng vắt qua vai kéo xuống bụng và 4 chân
trắng. Ở chỗ tiếp giáp giữa lông đen và trắng có khoảng mờ
rộng 2-3 cm trên đó da đen lông trắng. Da mỏng mịn, lông
thưa và thô.
- Đầu to, mõm nhỏ và dài, tai nhỏ và nhọn, có nếp nhăn to và
ngắn ở miệng. Cổ to ngắn, ngực nở và sâu, lưng dài, hơi
võng, bụng hơi sệ, mông rộng và xuôi.
111
Tầm vóc Tương đối lớn, hướng mỡ
Khả năng sinh
trưởng
- Khối lượng sơ sinh 450-500 g/con
- Khối lượng 2 tháng tuổi: 5-7 kg/con
- Khối lượng 8 tháng tuổi: 50-55 kg/con
c. Giống lợn Mường Khương:
- Nguồn gốc: Huyện Mường Khương, tỉnh Lào Cai
- Phân bố: Chủ yếu ở 3 xã Cao Sơn, Tả Thàng, La Pau Tẩn, huyện Mường
Khương, tỉnh Lào Cai.
Màu sắc lông
da, hình dáng
bên ngoài.
- Màu sắc lông da đen tuyền hoặc đen có đốm trắng ở đầu,
đuôi và chân. Lông thưa và mềm.
- Bốn chân to cao, vũng chắc. Lưng hơi cong, bụng to nhưng
không sệ tới sát đất, mông hơi dốc.
- Mõm dài thẳng hoặc hơi cong. Trán nhẵn, tai tô cúp rủ về
phía trước.
Tầm vóc To nhưng lép người.
Khả năng sinh
trưởng
- Khối lượng so sinh: 600 g/con
- Khối lượng 2 tháng tuổi: 4-4,5 kg/con
- Khối lượng 8 tháng tuổi: 45-50 kg/con
- Khối lượng lúc trưởng thành: 90 -120 kg/con
d. Giống lợn Hương:
- Nguồn gốc: Cao Bằng
- Phân bố: Cao Bằng, Quảng Ninh, Hà Nội
Màu sắc lông
da, hình dáng
bên ngoài.
- Phần thân và 4 chân trắng, có mảng lông da màu đen ở mông và
da đầu. Phần tiếp giáp giữa đen và trắng rộng khoảng 2-3 cm,
trên đó da đen, lông trắng.
- Đầu đen và thô, giữa trán có một điểm trắng, chân to, bụng to
vừa phải và không chạm đất, lưng võng nhưng không gãy, bốn
chân có mầu trắng, mông dốc, vai nở, ngực sâu.
Tầm vóc Trung bình
Khả năng
sinh trưởng
- Sinh trưởng chậm
- Khối lượng 8 tháng tuổi: 35-40 kg/con
112
e. Giống lợn Hạ Lang:
- Nguồn gốc: huyện Hạ Lang, Cao Bằng
- Phân bố: huyện Hạ Lang, Bảo Lâm, tỉnh Cao Bằng
Màu sắc lông
da, hình dáng
bên ngoài.
- Bụng trắng và có dải trắng vắt vai, một số con có dải đen này
gần giống yên ngựa.
- Mõm ngắn, mặt nhăn to, chân to ngắn. Lưng võng, bụng không
chạm đất và giữa trán có điểm trắng, một số con điểm trắng này
gần giống hình nêm.
Tầm vóc Lớn, hướng mỡ
Khả năng
sinh trưởng
- Khối lượng 2 tháng tuổi: 4,5-5,5 kg/con
- Khối lượng 8 tháng tuổi: 40-50 kg/con
f. Giống lợn Mường Lay:
- Nguồn gốc: tỉnh Điện Biên
- Phân bố: Chủ yếu ở huyện Mường Lay, tỉnh Điện Biên.
Màu sắc lông
da, hình dáng
bên ngoài.
- Lông da, đen toàn thân, đốm trắng bốn chân, chóp đuôi và trán,
lông thưa và hơi cứng.
- Mõm thẳng, dài vừa phải, trán có nếp nhăn, mình dài, lưng
phẳng hoặc hơi võng.
- Mình thuôn dài, tai to và dày cụp, lưng hơi võng, chân to và cao
vừa phải, đi bằng bàn.
- Núm vú đều, khi mang thai và nuôi con, núm vú không sa sệ,
không chạm đất.
Tầm vóc Trung bình
Khả năng
sinh trưởng
- Khối lượng sơ sinh: 450-550 g/con
- Khối lượng 2 tháng tuổi: 4-5 kg/con
- Khối lượng 8 tháng tuổi: 30-40 kg/con
- Khối lượng lúc trưởng thành: 80-120 kg/con
113
2. Phụ lục 2 - Điện di đồ sản phẩm PCR sau tinh sạch của 6 giống lợn bản địa
Việt Nam
2.1. Điện di đồ sản phẩm PCR của Gống lợn Ỉ:
(A) Số thứ tự của giếng từ 1 - 10 tương ứng với thứ tự các cặp mồi 1 -10
(B) Số thứ tự của giếng từ 11 - 20 tương ứng với thứ tự các cặp mồi 11 -20
(C) Số thứ tự của giếng từ 21 - 30 tương ứng với thứ tự các cặp mồi 21 -30
Neg: đối chứng âm. , M: Marker 1kb
11 12 13 14 15 16 17 18 19 20 Neg M
Neg 21 22 23 24 25 26 27 28 29 30 M
A
B
C
1 2 3 4 5 6 M 7 8 9 10 Neg
10000 bp 1500 bp
1000 bp 750 bp 500 bp
250 bp
114
Điện di đồ sản phẩm PCR lại của giống lợn Ỉ
(sau khi đã thay đổi nhiệt độ gắn mồi).
Số thứ tự của giếng tương ứng với số thứ tự của mồi được trình bày tại bảng 2.2
Phản ứng diễn ra với nhiệt độ gắn mồi 53oC (hình A, B, C), 51oC (hình D).
Neg: đối chứng âm. , M: Marker 1kb
3 4 Neg M 21 23 28 29 30 M Neg
15 16 M Neg
A B
Neg 21 29 M
D C
10000 bp 1500 bp 1000 bp
750 bp 500 bp
250
115
2.2. Điện di đồ sản phẩm PCR của giống lợn Mường Khương
Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở
bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.
2.3. Điện di đồ sản phẩm PCR của Giống lợn Móng Cái
Điện di đồ sản phẩm PCR của lợn Móng Cái với 30 cặp mồi
Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.
250 bp
750
bp
1000 bp
10000 bp
1500 bp
500 bp
M 1 2 3 4 5 6 7 8 9 10
1000 bp
10000 bp
750 bp 500 bp 250
1500 bp
116
2.4. Điện di đồ sản phẩm PCR của Giống lợn Mường Lay
Sản phẩm PCR của lợn Mường Lay với 30 cặp mồi
Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.
1000 bp 1500 bp
250 bp
10000 bp
750 bp 500 bp
117
2.5. Điện di đồ sản phẩm PCR của Giống lợn Hạ Lang
Điện di đồ sản phẩm khuếch đại trình tự hệ gen ty thể của lợn Hạ Lang với 30 cặp mồi
Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.
7 8 9 Neg M
10000 bp
1500 bp
250 bp 500 bp 750 bp 1000 bp
118
2.6. Điện di đồ sản phẩm PCR của Giống lợn Hương
Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở
bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.
3. Phụ lục 3 - Trình tự hoàn chỉnh hệ gen ty thể của 6 giống lợn bản địa Việt
Nam
Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Mường Khương: >VNpig4 [organism=S. scrofa] [breed=Muong Khuong black pig] [country=Vietnam] S. scrofa breed Muong Khuong Black pig mitochondrion, complete genome CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC
ACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATATTATAGCCCTATGTACGTCGTGCATTAACTGC
TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATCATTATTGATCGTACATAGCACATATCATGTCAAATA
ATTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT
TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTATTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC
CCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAATGACTAATCAGCCCATGCTCACACATAACTGAGGTTTCATACATTTGGTATTTT
TTAATTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAATCAATTGTAGCTGGACTTCATGGAACTCATGAT
CCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTA
CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC
ACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATA
AGCAGGTAAAYTATTAGCTCATTCAAACCCCCCTTACCCCCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAA
CAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACACTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTACTTAA
ATACGTGCTACGAAAGCAGGCACCTACCCCCCTAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAA
AATATAAGCACCTATTTAAGCATACGCCCACAATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGC
CTAGATGGGCCTCACAGCCCCATAAACACACAGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCC
CCGGTGAGAATGCCCTCCAGATCCTAAAGATCAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCAC
ACCCCCACGGGAAACAGCAGTGATAAAAATTAAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAG
M Neg 1 2 3 4 5 6 7 8 9 10
M 15 Neg 11 12 13 14 15 16 17 18 19 20 M
21 22 23 24 2 5 26 27 28 29 30 Neg M
10000 bp
1500 bp
1000 bp 750 bp 500 bp
250 bp
119 CCACCGCGGTCATACGATTAACCCAAATTAATAGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAAC
TAAGCTGTAAAAAGCCCTAGTTAAAATAAAATAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGAT
TAGATACCCCACTATGCCTAGCCCTAAACCCAAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAA
GGACTTGGCGGTGCTTTACATCCACCTAGAGGAGCCTGTTCTATAATCGATAAACCCCGATAGACCTCACCAACCCTTGCCAATTCAGCCTA
TATACCGCCATCTTCAGCAAACCCTAAAAAGGAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGG
TTGGAAAGAAATGGGCTACATTTTCTACATAAGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTA
AATCAAGAATAGAGTGCTTGATTGAATAAGGCCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACC
TATATTCAATTACACAACCATGCAAGAAGAGACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTA
AACTAAAGCACCTAGTTTACACCTAGAAGATCCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAA
TACACCAAAATAAAATAAAACATTCACCTAACATTAAAGTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGG
AAAGATGAAAGAATAAAATAAAAGTAAAAAAAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAA
AGAGAACTTTAGCTAGATACCCCGAAACCAGACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAA
GACTTGTAGGTAGAGGTGAAAAGCCTAACGAGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAA
AACCCTAAATTCCAATGTATTTTTAAGAGATAGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTA
ATACTACCATAGTAGGCCTAAAAGCAGCCATCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACA
AACTCCTAGCCCAATACCGGACTAATCTATTGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTT
ACATCAGTAACTAATAATATACTGATAATTAACAATCAATAAACCAAAACAACACTAAAGCGTTCATTAATTATATTGTTAACCCAACACA
GGAGTGCACCAAGGAAAGATTAAAAGAAGTAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTA
CTAGTATTAGAGGCAATGCCTGCCCAGTGACACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAA
ATAAGGACTTGTATGAATGGCCACACGAGGGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAA
AAAATAAGACGAGAAGACCCTATGGAGCTTTAATTAACTATTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACAT
GGACTAGCAATTTCGGTTGGGGTGACCTCGGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATACAT
CACTTATTGATCCAAAATTTTGATCAACGGAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTT
TACGACCTCGATGTTGGATCAGGACACCCAAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGT
TCAGACCGGAGCAATCCAGGTCGGTTTCTATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGC
GTCTCAGAGATAATTAATGATATAATCTTAACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCG
GTAATTGCGTAAAACTTAAACCTTTATTACCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCC
TATCCTACTGGCCGTAGCATTCCTCACCCTAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCT
ACGGCCTACTCCAACCCATCGCCGATGCCCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATT
GCACCAATCCTAGCCTTATCCCTAGCACTAACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATT
CATGCTAGCCATGTCAAGCCTAGCAGTCTATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAG
CAGTAGCCCAAACAATTTCATATGAAGTAACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACCCTATCCACCCTA
ATCACAACACAAGAGCACATTTGAATAATCTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGC
CCCGTTCGACCTTACAGAAGGAGAGTCAGAACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAG
AATATGCCAACATCATCATAATAAATGCATTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATC
AACTTCGTACTAAAAACACTCGCATTAACAATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTT
ACTATGAAAAAGCTTCCTGCCCCTAACACTAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCAT
AGAAATATGTCTGATAAAAGAGTTACTTTGATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAA
GCCTGAGAATTCAAAATTCTCCGTGCTACCAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAA
AATGTTGGTTCATACCCTTCCCATACTAATAAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAAT
CAGCTCACACTGACTACTCATCTGAATCGGATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCA
CAGAAGCAGCCACAAAATATTTCCTAACACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAA
TGGACCATTACAAAAATATTTAACCCAGTAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTG
AGTCCCAGAAGTAACCCAAGGCATTTCACTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAA
ATCTCACAATCAATCAACCCAAACCTAATATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAAC
TTCGAAAAATCATAGCATATTCATCAATCGCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCT
ACTAATTTACATCACAACAACACTAGCAATATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACA
AGATACCCATCATCACAAGCCTAATAATAGTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATC
ATTCAAGAAATAACAAAAAATGAAAGCATCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAG
CCTACTCCTCCTCACTGACTATGTTCCCATCCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCC
ACAATAATTGTATTATCGACACTAATCCTACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCT
TCAAAGCTCTAAGTAAGTACAAAGTACTTAACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACAC
TTTAATTAAGCTAAATCCTCACTAGATTGGTGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAA
TCTACTTCTCCCGCCGCAGGAAAAAAAAGGCGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTC
ACCACGGAACTGGCAAAAAGAGGGCTTAACCTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTT
GACTATACTCAACAAACCACAAAGACATCGGCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACT
AATTCGCGCTGAACTAGGTCAGCCCGGAACCCTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCT
TCTTTATAGTAATACCCATTATGATTGGGGGTTTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAA
ACAACATAAGTTTCTGACTACTTCCACCATCCTTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTA
TACCCACCTTTAGCTGGAAACTTAGCCCATGCAGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTA
120 GGGGCTATTAATTTCATTACCACAATTATTAACATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATC
ACAGCCGTACTACTTCTACTATCCCTGCCAGTTCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGAT
CCAGCAGGTGGTGGAGACCCTATCCTTTATCAACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGA
ATAATCTCCCACATTGTAACCTACTATTCAGGTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTT
AGGTTTTATCGTATGGGCTCACCACATATTCACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTA
TTCCCACTGGAGTAAAAGTATTTAGTTGATTAGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTC
ATCTTCCTATTCACCGTAGGAGGTCTAACGGGCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCA
CACTTCCACTATGTCTTATCTATAGGAGCAGTGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAAC
CAAGCATGAGCAAAAATTCACTTTGTAATTATATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACC
TCGACGATACTCCGATTATCCTGACGCATACACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAA
TAATCTTCATTATCTGAGAAGCATTTGCATCAAAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATG
TCCTCCTCCCTATCACACATTTGAAGAACCAACATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTT
CAAGCCAACGTCATAACCACTATGTCTTTCTCGATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAA
GCCCTATATGCCTCTATGGCTTACCCTTTCCAACTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCAC
ACCTTAATAATTGTATTCTTAATCAGCTCTTTAGTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGAT
GCCCAAGAAGTAGAAACAATTTGAACAATCCTACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGAC
GAAATTAATAACCCAGCCTTAACCGTAAAAACCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTG
ACTCATATATAATCCCCACATCAGATCTTAAACCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAAC
AATCCGAATATTAGTGTCCTCTGAAGACGTACTACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAA
ACCAAACAACTCTAATATCCACACGACCTGGCCTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTA
CTTGAACTTGTCCCATTAAAGTACTTCGAAAAATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGT
TAGAGATCGGGAGCCTAAATCTCCCCTCAATGGTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACAT
TATTTATTTTATTCCAACTAAAAATCTCAAACTACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCT
TGAGAAATAAAATGAACGAAAATCTATTTGCCTCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAA
GCTTACTATTCCCAACACCCAAACGACTCATTAATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATA
GCTATTCACAACCAAAAAGGCCAAACCTGATCACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACC
ACACTCATTCACACCCACCACACAACTATCAATAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATA
AAACCAAAACATCACTAGCCCACTTTCTACCACAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTT
ATTCAACCAGTAGCCCTAGCCGTACGACTGACAGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCAC
TACTCAACATCAGCACTATGACAGCTTTTATCACATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTT
ATGTGTTTACACTGCTAGTAAGCTTATACCTACACGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCAT
GACCACTTACCGGAGCCCTATCAGCCCTTTTAATAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGAC
TATTAACCAATACTTTGACAATATACCAATGGTGACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAA
AGGCTTACGATACGGTATAATTTTATTTATTATTTCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCA
ACACCCGAATTAGGAGGTTGCTGACCACCAACAGGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGC
CTCAGGAGTATCCATTACCTGAGCCCATCACAGCCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTA
GGCGTATACTTCACCCTCCTCCAAGCCTCAGAATATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCT
ACAGGATTTCACGGGTTGCACGTAATCATCGGATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCA
CCACTTCGGCTTTGAAGCCGCAGCCTGATACTGACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTA
CTCTTTTAGTATTAAGCAGTACAATTGACTTCCAATCAATCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTC
ACAAACGTAACCCTAGCCTCCCTACTCGTACTAATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATG
TGGATTTGACCCCATAGGATCAGCACGCCTCCCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGC
CCTCCTCCTTCCCCTACCATGAGCATCCCAAACAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAA
GCCTAGCATACGAATGAACCCAAAAAGGCCTAGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGAC
TATGATTTACTTCATAATTATCAAGTGCCATTAGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGA
TCTCACTTAATATCTTCACTACTATGCCTAGAAGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACC
CTAGCTAACATAATACCCATTATTTTACTAGTGTTTGCAGCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATA
CGGTACCGATTACGTCCAAAACTTAAACCTCTTACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAA
ACACAACATAATCTGAATCAATGCAACAGTACATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCC
TTAATTTTTCCTTAACATTCTTCTCCGACTCACTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCA
ATCCCACCTATCAAAAGAAACCACAACCCGAAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCG
CCACCGAACTAATCTTATTCTATATCCTATTCGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACG
ACTCAATGCAGGACTTTATTTCCTATTCTACACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACTACAGGCTC
ACTAAACTTCTTAATTATCCATTACTGATCCCACCCATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCAT
AGTAAAAATACCTCTATACGGACTCCATCTTTGACTGCCAAAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTAC
TGCTAAAACTCGGAGGCTATGGCATAATACGAATCACTACTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCC
ATATGAGGTATAATCATAACCAGCTCTATCTGCTTACGTCAAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTT
GTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTCATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATT
CTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACA
TGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATG
121 ATCCAACATCACAATTATTCTCATAGGAATAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAAT
ACACCCACCACATTAACAACATCAAACCCTCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTA
AACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCT
TATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCG
TTGGTCTTAGGAACCAAAAAATTGGTGCAACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAAC
CATCCCAATTATAATATCCAACTCAAACATCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCA
GCCTAGTCCCCTTACTAATATTTATACACACAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCT
CTTAGCTTTAAAATAGACTATTTCTCAGTAATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATA
CACTCAGACCCCTTCATCAACCGATTCTTTAAATACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAA
CTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTCCTGCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTAC
AAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTCCTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAA
ATCTTTATACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCC
CTGATTGCCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCC
GCTTCTACCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCA
ATCACACAAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCC
ACCTAGCATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAAC
AAGACATCCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCC
TTATCTCACAGGATTCTACTCAAAAGACCTTATTATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTG
CCACATCCCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAA
ATAACCCCCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAG
TACCAAACACAACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACAC
AACCTACTACCTGAAATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAA
CATACCACAACCTGTCTATAAGCCAAAAATCCGCATCATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTC
ATCCAAATAAAAATATCAATTATAGTATCAAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCAT
AATACTATTTAATTACCACGAGTAATCTCCATAATAACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCAT
AACTATATAAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAAC
TTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGT
CTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAA
AACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATGCCACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAA
TAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATG
GAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTA
ATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTA
ATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGA
CGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATGTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTAT
ACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTG
CCCTGAGGACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAAT
CTGAGGGGGCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGT
ACATCTCCTATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTA
TTAAAGACATTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTAC
ACCCCAGCAAACCCACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAA
ACTAGGTGGAGTGCTAGCTCTAATAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTC
GACCACTAAGTCAATGCCTATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATC
ATCATCGGCCAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGA
AGAGTCTTTGTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCC
GCCATCAGCACCCAAAGCTGAAATTCTAACTAAACTATTCCCTG
Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Hạ Lang:
>VNpig5 [organism=S. scrofa] [breed=Ha Lang pig] [country=Vietnam] S. scrofa breed Ha Lang pig
mitochondrion, complete genome
CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC
ACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATATTATAGCCCTATGTACGTCGTGCATTAACTGC
TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATTATTATTGATCGTACATAGCACATATCATGTCAAATA
ACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT
TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTACTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC
CCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAATGACTAATCAGCCCATGCTCACACATAACTGAGGTTTCATACATTTGGTATTTT
TTAATTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAATCAATTGTAGCTGGACTTCATGGAACTCATGAT
CCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTA
122 CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC
ACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACA
CGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCCCTTACCCCCCATTAAACTTATGCTCTACAC
ACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACACTAAACAACATTTAACAACACAA
ACCACCATATCTTATAAAACACTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGGCACCTACCCCCCTAGATTTTTACGCCAATCT
ACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCCCACMATCTGAATATAGCTTATA
GTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAACACACAGGTTTGGTCCTGGCCTTT
CTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAAAGATCAAAAGGAGCAGGTATCA
AGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAAAAATTAAGCCATGAACGAAAGTT
TGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAAATTAATAGATCCACGGCGTAAAGA
GTGTTTAAGAAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAATAAAATAACCCACGAAAGTGAC
TCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTAAACCCAAATAGTTACATAACAA
AACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTCACATCCACCTAGAGGAGCCTGTTCTATAATCG
ATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAAAAAGGAACAATAGTAAGCACA
ATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTACATAAGAATACCCACCATACG
AAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAATAAGGCCATGAAGCACGCACA
CACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGAAGAGACAAGTCGTAACAAGG
TAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGAAGATCCCATAATATATGGGT
ACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCACCTAACATTAAAGTATAGGAG
ATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATAAAATAAAAGTAAAAAAAAGCAAAGATTACCC
CTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAACCAGACGAGCTACCTATGAG
CAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTAACGAGCCTGGTGATAGCTGG
TTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGAGATAGTCTAAAAAGGTACAG
CTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAGCCATCAATTGAGAAAGCGTT
AAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATCTATTGAAACATAGAAGCAAT
AATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATAATTAACAATCAATAAACCAA
AACAACACTAAAGCGTTTATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGAAGTAAAAGGAACTCGGCAA
ACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGTGACACCAGTTTAACGGCCGC
GGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACGAGGGTTTTACTGTCTCTTACT
TCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGAGCTTTAATTAACTACTCCAAA
AGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGACCTCGGAGTACAAAAAACCCTC
CGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATAACATCACTTATTGATCCAAAATTTTGATCAACGGAACAAGTTACCCTAGGG
ATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGACACCCAAATGGTGCAACCGCTAT
TAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGTTTCTATCTATTATAAATTTCTCC
CAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAATCTTAACCTAATTAACTCATAAT
AAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTTATTACCAGAGGTTCAACTCCTCT
CCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTCACCCTAGTAGAACGAAAAGTACT
AGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCGATGCCCTAAAACTATTCACCAAA
GAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTAGCCTTATCCCTAGCACTAACAATATGAGTTCCACTA
CCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCAGTCTATTCTATCCTATGATCAGG
ATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAAACAATTTCATATGAAGTAACACTGGCAATCATCCTA
CTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACAAGAGCACATTTGAATAATCTTTACATCCTGACCCCT
AGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAGTCAGAACTTGTATCAGGCTTT
AACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAATGCATTCACAGCAATTCTCTT
CCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCATTAACAATCACCTTCCTATGAA
TCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTAACACTAGCTCTATGTATATGA
CACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTACTTTGATAGAGTAAAAAATAG
AGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTCAAAATTCTCCGTGCTACCAAAATACACCACATTCT
ACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACTAATAAATCCCATTATCTACAC
TACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAATCGGATTCGAAATAAACCTAT
TAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCTAACACAAGCCACAGCCTCCAT
GATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTACAAAAATATTTAACCCAGTAGCAATAACAATAATAA
CCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAGTAACCCAAGGCATTTCACTACAAGCAGGCCTACTA
TTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCTAATATTAACTATGGCCATATT
ATCAATTTTAATCGGAGGGTGAGGGGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCAATCGCACACATAGGATGAATG
ACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAGCAATATTCATACTATTAATCCA
CAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATAATAGTAACCCTACTCTCAATAG
GAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAAGCATCATCATGCCAACACTCAT
AGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCCCATCCACCAATAACATAAAAA
TAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCAACACTAATCCTACCTATAACACCAGCCCTC
123 TCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGTACTTAACTCCTGAAAACCTAAG
GACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGATTGGTGGGATTACATACCCACG
AAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAAAAGGCGGGAGAAGTCCCGGCA
GAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCTTAACCTCTGTCTTTAGATTTAC
AGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGACATCGGCACCCTGTACCTACTAT
TTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGGAACCCTACTTGGCGATGATCA
AATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGGGGGTTTTGGTAACTGACTCGT
ACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCACCATCCTTCCTATTACTACTGGC
ATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCGCCTTTAGCTGGAAACTTAGCCCATGCAGGAGCTTCAGTTGAT
CTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATTATTAACATAAAACCTCCCGCA
ATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTGCCAGTTCTAGCAGCTGGCATT
ACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCTTTATCAACACTTGTTCTGATTT
TTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTATTCAGGTAAAAAAGAACCATT
TGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACATATTCACCGTAGGAATAGACG
TGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGTTGATTAGCTACCCTGCACGGC
GGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCTAACGGGCATTGTACTAGCTAA
CTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGGAGCAGTGTTTGCCATTATAGG
GGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGTAATCATATTCGTAGGAGTAA
ATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCCGATTATCCTGACGCATACACAGCATGAAATACT
ATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTGCATCAAAACGAGAAGTATC
TGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGAACCAACATATATCAACCTA
AAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTCTTTCTCGATAATCGAGGTA
TTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCTTTCCAACTAGGCTTCCAAG
ACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGCTCTTTAGTGTTATATATCA
TTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAACAATCCTACCCGCTATTATT
TTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGTAAAAACCATAGGACATCA
ATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGATCTTAAACCTGGAGAAATAC
GACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAGACGTACTACACTCATGAGCT
GTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGACCTGGCCTTTATTACGGACA
GTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTCGAAAAATGGTCAACATCAA
TATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCTCAATGGTATGCCACAACTA
GATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTCAAACTACTCATACCCAGCA
AGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTATTTGCCTCTTTCATTGCCCC
TACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGACTCATTAATAACCGCACAAT
CTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATGGCTATTCACAACCAAAAAGGCCAAACCTGATCACTAATACTTATA
TCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAACTATCAATAAACCTGGGTAT
AGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTTCTACCACAAGGAACACCC
GCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACGACTGACAGCCAACATTACA
GCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATAACAGCTTTTATCACATTTACTATCCT
CATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATACCTACACGACAATACATA
ATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCCTTTTAATAACATCAGGCCT
AATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACCAATGGTGACGAGACATTAT
TCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTTATTATTTCCGAGGTTCTGT
TCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCACCAACAGGAATTCACCCA
CTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCATCACAGCCTAATAGAAGG
GGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCTCAGAATATTACGAAGCAC
CATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATCATCGGATCTACTTTCCTAG
CAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTGATACTGACACTTCGTAGAT
GTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTGACTTCCAATCAATCAGTTT
CGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTCGTACTAATCGCATTCTGAC
TACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCACGCCTCCCATTCTCAATAAA
ATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATCCCAAACAAACAATCTAAA
AACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAAGGCCTAGAATGAACAGAA
TATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTGCCATTAGTATACATAAAC
ATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGCCTAGAAGGAATGATATTA
TCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTACTAGTGTTTGCAGCCTGC
GAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTACGTCCAAAACTTAAACCTCTTACAATGCTAAAA
ATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAACAGTACATAGTCTCCTCAT
TAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGACTCACTATCAGCACCCCT
ACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAACCCGAAAAAAACTATATA
124 TTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCCTATTCGAAGCAACACTAG
TACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTCTACACCCTAGCAGGATCC
CTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTTAATTATCCATTACTGATCCCACCCATTATCCAAC
TCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTATACGGACTCCATCTTTGACTGCCAAAAGCC
CATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAATGCGAATCACTACTATTCT
AAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATAATCATAACCAGCTCTATCTGCTTACGTCAAACCG
ACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTCATAGGA
GCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCGAACCAT
AATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCCCCATCC
ATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAATAAACATAATAATTAC
AGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACATTAACAACATCAAASCCTCATTCACACGAGAAA
ACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATAGTTTAA
TAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCTTCCACA
CTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGAACCAAAAAATTGGTGCAACTCCAAATAAAAGTAA
TAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAATATCCAACTCAAACATCTACAAAACTAACCTTT
ACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATATTKATACACACAGGCCAAGAAATAATC
ATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCAGTAATATTCATTCCCGTAGCA
CTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTTAAATACCTACTACTATTC
TTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTCCTCCTAATC
GGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTCCTATCCA
TAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTA
CTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACT
ACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACAC
TATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACACAAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGC
CAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGCATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACT
ATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACATCCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACA
ACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTCACAGGATTCTACTCAAAAGACCTTATCATTGAAGCAGCAA
ACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATCCCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCAT
TCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCCCCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGC
ATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAACACAACAATACCCCTTTACATAAAAATAACAGCCCTAAT
CGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCTGAAATTTAAATACCCATCACAAACATACAAATTTT
CCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACCTGTCTATAAGCCAAAAATCCGCATCATCATTACTA
GACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAAATATCAATTATAGTATCAAATCAAAAAGGCCTAAT
CAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAATTACCACGAGTAATCTCCATAATAACAACAACTCCA
ATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATRAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTG
AATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATAC
AAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGT
AGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATACC
ACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAAT
AGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATGGAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAA
CTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTAATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAA
CATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTAATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATC
AGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGACGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCAT
CCATRTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTATACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCC
TACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAGGACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTA
CTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGGGCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGC
CTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCTATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAAT
CTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACATTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCT
TGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAAACCCACTAAACACCCCACCCCATATTAAACCAGAATGA
TATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCTAGCTCTAATAGCCTCCATCCTAATCCTAATTTTA
ATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAATGCCTATTCTGAATACTAGTAGCAGACCTCATTAC
ACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATT
GATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAG
GAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAAAGCTGAAATTCTAACTAAACTATTCCCTG
Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Hương: >VNpig6 [organism=S. scrofa] [breed=Huong pig] [country=Vietnam] S. scrofa breed Huong pig mitochondrion, complete genome CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC
ACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATATTATAGCCCTATGTACGTCGTGCATTAACTGC
125 TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATTATTATTGATCGTACATAGCACATATCATGTCAAATA
ACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT
TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTACTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC
CCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAATGACTAATCAGCCCATGCTCACACATAACTGAGGTTTCATACATTTGGTATTTT
TTAATTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAATCAATTGTAGCTGGACTTCATGGAACTCATGAT
CCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTA
CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC
ACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACA
CGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCC
CTTACCCCCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTA
ACTTACACTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGG
CACCTACCCCCCTAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAG
CATACGCCCACAATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCC
CCATAAACACACAGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCA
GATCCTAAAGATCAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCA
GTGATAAAAATTAAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTA
ACCCAAATTAATAGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCT
AGTTAAAATAAAATAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCCACTATGC
CTAGCCCTAAACCCAAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTC
ACATCCACCTAGAGGAGCCTGTTCTATAATCGATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAG
CAAACCCTAAAAAGGAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGC
TACATTTTCTACATAAGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTG
CTTGATTGAATAAGGCCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACA
ACCATGCAAGAAGAGACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAG
TTTACACCTAGAAGATCCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAA
TAAAACATTCACCTAACATTAAAGTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATA
AAATAAAAGTAAAAAAAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAG
ATACCCCGAAACCAGACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGG
TGAAAAGCCTAACGAGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAAT
GTATTTTTAAGAGATAGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAG
GCCTAAAAGCAGCCATCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAAT
ACCGGACTAATCTATTGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAAT
AATATACTGATAATTAACAATCAATAAACCAAAACAACACTAAAGCGTTTATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGA
AAGATTAAAAGAAGTAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAA
TGCCTGCCCAGTGACACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGA
ATGGCCACACGAGGGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAA
GACCCTATGGAGCTTTAATTAACTACTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCG
GTTGGGGTGACCTCGGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATAACATCACTTATTGATCCA
AAATTTTGATCAACGGAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGT
TGGATCAGGACACCCAAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCA
ATCCAGGTCGGTTTCTATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAA
TTAATGATATAATCTTAACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAA
ACTTAAACCTTTATTACCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCC
GTAGCATTCCTCACCCTAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCC
AACCCATCGCCGATGCCCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTA
GCCTTATCCCTAGCACTAACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCAT
GTCAAGCCTAGCAGTCTATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAA
ACAATTTCATATGAAGTAACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACA
AGAGCACATTTGAATAATCTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACC
TTACAGAAGGAGAGTCAGAACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAAC
ATCATCATAATAAATGCATTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACT
AAAAACACTCGCATTAACAATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAA
GCTTCCTGCCCCTAACACTAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCT
GATAAAAGAGTTACTTTGATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTC
AAAATTCTCCGTGCTACCAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCAT
ACCCTTCCCATACTAATAAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTG
ACTACTCATCTGAATCGGATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCC
ACAAAATATTTCCTAACACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTAC
AAAAATATTTAACCCAGTAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAG
TAACCCAAGGCATTTCACTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCA
126 ATCAACCCAAACCTAATATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGGGGACTAAACCAAACCCAACTTCGAAAAATCA
TAGCATATTCATCAATCGCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATC
ACAACAACACTAGCAATATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCAT
CACAAGCCTAATAATAGTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATA
ACAAAAAATGAAAGCATCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTC
ACTGACTATGTTCCCATCCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTA
TTATCAACACTAATCCTACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAA
GTAAGTACAAAGTACTTAACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTA
AATCCTCACTAGATTGGTGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCG
CCGCAGGAAAAAAAAGGCGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGG
CAAAAAGAGGGCTTAACCTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAAC
AAACCACAAAGACATCGGCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAA
CTAGGTCAGCCCGGAACCCTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATA
CCCATTATGATTGGGGGTTTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTT
CTGACTACTTCCACCATCCTTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCGCCTTTAG
CTGGAAACTTAGCCCATGCAGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATT
TCATTACCACAATTATTAACATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTA
CTTCTACTATCCCTGCCAGTTCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGT
GGAGACCCTATCCTTTATCAACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCAC
ATTGTAACCTACTATTCAGGTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGT
ATGGGCTCACCACATATTCACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAG
TAAAAGTATTTAGTTGATTAGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCA
CCGTAGGAGGTCTAACGGGCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTAT
GTCTTATCTATAGGAGCAGTGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCA
AAAATTCACTTTGTAATTATATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCC
GATTATCCTGACGCATACACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATC
TGAGAAGCATTTGCATCAAAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATC
ACACATTTGAAGAACCAACATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCA
TAACCACTATGTCTTTCTCGATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTC
TATGGCTTACCCTTTCCAACTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGT
ATTCTTAATCAGCTCTTTAGTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAG
AAACAATTTGAACAATCCTACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACC
CAGCCTTAACCGTAAAAACCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATC
CCCACATCAGATCTTAAACCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAG
TGTCCTCTGAAGACGTACTACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTA
ATATCCACACGACCTGGCCTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCC
ATTAAAGTACTTCGAAAAATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAG
CCTAAATCTCCCCTCAATGGTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTC
CAACTAAAAATCTCAAACTACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAAT
GAACGAAAATCTATTTGCCTCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCC
AACACCCAAACGACTCATTAATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATGGCTATTCACAAC
CAAAAAGGCCAAACCTGATCACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCAC
ACCCACCACACAACTATCAATAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACA
TCACTAGCCCACTTTCTACCACAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTA
GCCCTAGCCGTACGACTGACAGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCA
GCACTATAACAGCTTTTATCACATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACT
GCTAGTAAGCTTATACCTACACGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCG
GAGCCCTATCAGCCCTTTTAATAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATA
CTTTGACAATATACCAATGGTGACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATA
CGGTATAATTTTATTTATTATTTCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTA
GGAGGTTGCTGACCACCAACAGGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATC
CATTACCTGAGCCCATCACAGCCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTC
ACCCTCCTCCAAGCCTCAGAATATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCA
CGGGTTGCACGTAATCATCGGATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTT
TGAAGCCGCAGCCTGATACTGACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTAT
TAAGCAGTACAATTGACTTCCAATCAATCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACC
CTAGCCTCCCTACTCGTACTAATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCC
CATAGGATCAGCACGCCTCCCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCC
CTACCATGAGCATCCCAAACAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGA
ATGAACCCAAAAAGGCCTAGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTC
127 ATAATTATCAAGTGCCATTAGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATAT
CTTCACTACTATGCCTAGAAGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAA
TACCCATTATTTTACTAGTGTTTGCAGCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTAC
GTCCAAAACTTAAACCTCTTACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATC
TGAATCAATGCAACAGTACATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTT
AACATTCTTCTCCGACTCACTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATC
AAAAGAAACCACAACCCGAAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAA
TCTTATTCTATATCCTATTCGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGG
ACTTTATTTCCTATTCTACACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTT
AATTATCCATTACTGATCCCACCCATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACC
TCTATACGGACTCCATCTTTGACTGCCAAAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCG
GAGGCTATGGCATAATGCGAATCACTACTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATA
ATCATAACCAGCTCTATCTGCTTACGTCAAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCA
ATCATAATTCAAACCCCCTGAAGCTTCATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAA
CACTAACTATGAACGAGTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATA
GCAAGCCTCACAAACCTAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCAC
AATTATTCTCATAGGAATAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACA
TTAACAACATCAAACCCTCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATA
ATCCTAGGACCCCTTTACTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAA
AAGTTTGCAAGAACTGCTAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGA
ACCAAAAAATTGGTGCAACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTAT
AATATCCAACTCAAACATCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTT
ACTAATATTTATACACACAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAA
TAGACTATTTCTCAGTAATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCT
TCATCAACCGATTCTTTAAATACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGAT
GAGAAGGCGTAGGAATCATATCATTCCTCCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATA
CAACCGCATCGGAGACATTGGATTTGTCCTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAA
ACAATGAATGCCCAAACATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCA
GCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTT
AATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACACAAAAT
GATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGCATTTCT
TCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACATCCGAA
AAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTCACAGG
ATTCTACTCAAAAGACCTTATCATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATCCCTAA
CCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCCCCTAC
TAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAACACA
ACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCT
GAAATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACC
TGTCTATAAGCCAAAAATCCGCATCATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAA
ATATCAATTATAGTATCAAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAAT
TACCACGAGTAATCTCCATAATAACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATAAAGC
AGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTT
CTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACT
CAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAAC
CTAAAAAAGACCCACCAAAATTCAATACAATACCACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTT
AGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATGGAATCTAACCACG
ACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTAATAAAAATTATCA
ACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTAATCTTGCAAATCC
TAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGACGTAAATTACGGA
TGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATGTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTATACTACGGATCCTAT
ATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAGGACAAAT
ATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGGGCTTTT
CCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCTATTCC
TGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACATTCTA
GGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAAACCC
ACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCT
AGCTCTAATAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAAT
GCCTATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTA
GCCTCCATCTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTA
128 TATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAA
AGCTGAAATTCTAACTAAACTATTCCCTG
Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Ỉ:
>I PIG COMPLETE MITOCHONDRIAL GENOME
GCAACCAAAACAAGCATTCCATTCATATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCG
CACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATATTATAGCCCTATGTACGTCGTGCATTAACC
GCTAGTCCCCATGCATATAAGCATGTACATACTATTATTAATATTACATAGTACATATCATTATTGATCGTACATAGCACATATCATGTCAAA
TAACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCT
CTTCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTATTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCACCTAAAATC
GCCCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAGTGACTAATCAGCCCATGCTCACACATAACTGAGGTTTCATACATTTGGTATT
TTTTAACTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAATCAATTGTAGCTGGACTTCATGGAACTCATG
ATCCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCGTACACATGCGTACACATGCGTACACRTGCG
TACACATGCGTACACGTGCGTACACRTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGT
ACACRTGCGTACACGTGCGTACACATGCGTACACGTGCGTTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGT
ACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCCCTTACCC
CCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACA
CTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACGCTTACTTAAATACGTGCTACGAAAGCAGGCACCTACCCCCCTAGATTT
TTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCCCACAATCTGAA
TATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAACACACAGGTTTG
GTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAAAGATCAAAAGG
AGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAAAAATTAAGCCAT
GAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAAATTAATAGATCCA
CGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAATAAAATAACCCA
CGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTAAACCCAAATAGT
TACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTCACATCCACCTAGAGGAGCCTG
TTCTATAATCGATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAAAAAGGAACAAT
AGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTACATAAGAATAC
CCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAATAAGGCCATGAA
GCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGAAGAGACAAGTC
GTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGAAGATCCCATAA
TATATGGGTACTTTGAACCAAAGCTAGCTCAACATACTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCACCTAACATTAAA
GTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATAAAATAAAAGTAAAAAAAAGCAA
AGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAACCAGACGAGCT
ACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTAACGAGCCTGGT
GATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGAGATAGTCTAAA
AAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAGCCATCAATTGA
GAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATCTATTGAAACAT
AGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATAATTAACAATCA
ATAAACCAAAACAACACTAAAGCGTTTATTAACTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGAAGTAAAAGGA
ACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGTGACACCAGTTT
AACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACGAGGGTTTTACTG
TCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGAGCTTTAATTAAC
TATTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGACCTCGGAGTACAA
AAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAATCATAACATCACTTATTGATCCAAAATTTTGATCAACGGAACAAGTT
ACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGACACCCAAATGGTGC
AACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGTTTCTATCTATTAT
AAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAATCTTAACCTAATT
AACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTTATTACCAGAGGTT
CAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTCACCCTAGTAGAAC
GAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCGATGCCCTAAAACT
ATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTAGCCTTATCCCTAGCACTAACAATAT
GAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCAGTCTATTCTATCC
TATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTWCGAGCAGTAGCCCAAACAATTTCATATGAAGTAACACTGGC
AATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACAAGAGCACATTTGAATAATCTTTACAT
CCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAGTCAGAACTTGT
ATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAATGCATTCACAG
CAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCATTAACAATCACC
129 TTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTAACACTAGCTCT
ATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTACTTTGATAGAG
TAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTCAAAATTCTCCGTGCTACCAAAATAC
ACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACTAATAAATCCCA
TTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAATCGGATTCGAA
ATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCTAACACAAGCCA
CAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTAGCCAATGAACCATTACAAAAATATTTAACCCAGTAGCAATA
ACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAGGTAACCCAAGGCATTTCACTACAAGC
AGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCTAATATTAACTA
TGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCAATCGCACACAT
AGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAGCAATATTCATA
CTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATAATAGTAACCCT
ACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAAGCATCATCATG
CCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCCCATCCACCAAT
AACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCGACACTAATCCTACCTATAA
CACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGTACTTAACTCCTG
AAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGATTGGTGGGATTA
CATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAAAAGGCGGGAGA
AGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCTTAACCTCTGTCT
TTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGACATCGGCACCCTG
TACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGGAACCCTACTTGG
CGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGGGGGTTTTGGTAA
CTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCACCATCCTTCCTATT
ACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCACCTTTAGCTGGAAACTTAGCCCATGCAGGAGCT
TCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATTATTAACATAAAA
CCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTGCCAGTTCTAGCA
GCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCTTTATCAACACTT
GTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTATTCAGGTAAAAA
AGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACATATTCACCGTAG
GAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGTTGACTAGCTACC
CTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCTAACGGGCATTGT
ACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGGAGCAGTGTTTGC
CATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGTAATTATATTCGT
AGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGATTATCCGGAATACCTCGACGATACTCCGATTATCCTGACGCATACACAGCAT
GAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTGCATCAAAACGA
GAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGAACCAACATATA
TCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTCTTTCTCGATAAT
CGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCTTTCCAACTAGGC
TTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGCTCTTTAGTGTTA
TATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAACAATCCTACCCG
CTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGTAAAAACCATAG
GACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGATCTTAAACCTGGA
GAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAGACGTACTACACT
CATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGACCTGGCCTTTAT
TACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTCGAAAAATGGTC
AACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCTCAATGGTATGC
CACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTCAAACTACTCAT
ACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTATTTGCCTCTTTC
ATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGACTCATTAATAAC
CGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATAGCTATTCACAACCAAAAAGGCCAAACCTGATCACTAA
TACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAACTATCAATAAACC
TGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTTCTACCACAAGGA
ACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACGACTGACAGCCAA
CATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATAACAGCTTTTATCACATTTA
CTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATACCTACACGACA
ATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCCTTTTAATAACAT
CAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACCAATGGTGACGAG
ACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTTATTATTTCCGAG
GCTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCACCAACAGGAAT
TCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCATCACAGCCTAA
130 TAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCTCAGAATATTAC
GAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATCATCGGATCTAC
TTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTGATACTGACACTT
CGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTGACTTCCAATCAA
TCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTCGTACTAATCGCA
TTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCACGCCTCCCATTCTC
AATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATCCCAAACAAACAA
TCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAAGGCCTAGAATGG
ACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTGCCATTAGTATAC
ATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGCCTAGAAGGAATG
ATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTACTAGTGTTTGCA
GCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTARTAGTATCCAACACATACGGKACCGATTACGTCCAAAACTTAAACCTTTTACAATG
CTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAACAGTACATAGTCT
CCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGACTCACTATCAGC
ACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAACCCGAAAAAAAC
TATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCCTATTCGAAGCAA
CACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTCTACACCCTAGCA
GGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTTAATTATCCATTACTGATCCCACCCATTA
TCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTGTACGGACTCCATCTTTGACTGCCA
AAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAATGCGAATCACTA
CTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGGATAATCATAACCAGCTCTATCTGCTTACGTC
AAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTC
ATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCG
AACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCC
CCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAATAAACATAATA
ATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACATTAACAACATCAAACCCTCATTCACACG
AGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATA
GTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCT
TCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGAACCAAAAAATTGGTGCAACTCCAAATAA
AAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAATATCCAACTCAAACATCTACAAAACT
AACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATATTTATACACACAGGCCAAGA
AATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCAGTAATATTCATTCC
CGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTTAAATACCTACT
ACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTCCT
GCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTC
CTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCATTTTCAACAAATCTTTA
TACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTG
CCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTA
CCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACAC
AAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGC
ATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACAT
CCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTC
ACAGGATTCTACTCAAAAGACCTTATCATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATC
CCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCC
CCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAA
CACAACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTAC
TACCTGAAATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGGTATTATCCCTCCATCATACACCGCCTACCAACATACCA
CAACCTGTCTATAAGCCAAAAATCCGCATCATCATTACTAGACCTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAA
TAAAAATATCAATTATAGTATCAAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTAT
TTAATTACCACGAGTAATCTCCATAATAACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATAT
AAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAAT
AATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAG
AAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCAT
TAAACCTAAAAAAGACCCACCAAAATTCAATACAATACCACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAG
GGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATGGAATCTAA
CCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTAATAAAAAT
TATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTAATCTTGCA
AATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGACGTAAATT
ACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATRTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTATACTACGGA
TCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAGG
131 ACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGG
GCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCT
ATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACA
TTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCA
AACCCACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGG
AGTGCTAGCTCTAGTAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAA
GTCAATGCCTATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGC
CAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTT
GTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGC
ACCCAAAGCTGAAATTCTAACTAAACTATTCCCT
Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Móng Cái:
> MONG CAI PIG MITOCHONDRION, COMPLETE GENOME
CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATC
TTAAAACAAAAAAACCCATAAAAATTGCGCACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATAT
TATAGCCCTATGTACGTCGTGCATTAACTGCTAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATCATTAT
TGATCGTACATAGCACATATCATGTCAAATAACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGA
AACCAGCAACCCGCTTGGCAGGGATCCCTCTTCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTACTGATGAACTTTAACAGGCATCTGGT
TCTTACTTCAGGACCATCTCATCTAAAATCGCCCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAATGACTAATCAGCCCATGCTCAC
ACATAACTGAGGTTTCATACATTTGGTATTTTTTAATTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAAT
CAATTGTAGCTGGACTTCATGGAACTCATGATCCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCG
TACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGT
ACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTA
CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCCCTTACCCC
CCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACAC
TAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGGCACCTACC
CCCCTAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCC
CACAATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGVAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAAC
ACACAGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAA
AGATCAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAA
AAATTAAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAA
ATTAATAGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAA
TAAAATAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTA
AACCCAAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTCACATCCACCT
AGAGGAGCCTGTTCTATAATCGATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAA
AAAGGAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTA
CATAAGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAAT
AAGGCCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGA
AGAGACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGA
AGATCCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCAC
CTAACATTAAAGTATAGGAGATAGAAATTTTTATCYTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAAYAAAATAAAAGTA
AAAAAAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAA
CCAGACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTA
ACGAGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGA
GATAGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAG
CCATCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATC
TATTGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATA
ATTAACAATCAATAAACCAAAACAACACTAAAGCGTTTATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGA
AGTAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGT
GACACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACG
AGGGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGA
GCTTTAATTAACTACTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGAC
CTCGGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATAACATCACTTATTGATCCAAAATTTTGATCA
ACGGAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGAC
ACCCAAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGT
TTCTATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAA
TCTTAACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTT
ATTACCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTC
132 ACCCTAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCG
ATGCCCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTAGCCTTATCCCTAG
CACTAACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCA
GTCTATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAAACAATTTCATATGA
AGTAACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACAAGAGCACATTTGAA
TAATCTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAG
TCAGAACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAA
TGCATTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCAT
TAACAATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTA
ACACTAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTA
CTTTGATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTCAAAATTCTCCGTGC
TACCAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACT
AATAAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAA
TCGGATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCT
AACACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTACAAAAATATTTAACC
CAGTAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAGTAACCCAAGGCATT
TCACTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCT
AATATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCA
ATCGCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAG
CAATATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATA
ATAGTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAA
GCATCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCC
CATCCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCGACACTAAT
CCTACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGT
ACTTAACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGA
TTGGTGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAA
AAGGCGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCT
TAACCTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGAC
ATCGGCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGG
AACCCTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGG
GGGTTTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCAC
CATCCTTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCACCTTTAGCTGGAAACTTAGCC
CATGCAGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATT
ATTAACATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTG
CCAGTTCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCT
TTATCAACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTA
TTCAGGTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACA
TATTCACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGT
TGATTAGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCT
AACGGGCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGG
AGCAGTGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGT
AATTATATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCCGATTATCCTGACG
CATACACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTG
CATCAAAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGA
ACCAACATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTC
TTTCTCGATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCT
TTCCAACTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGC
TCTTTAGTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAAC
AATCCTACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGT
AAAAACCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGAT
CTTAAACCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAG
ACGTACTACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGA
CCTGGCCTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTC
GAAAAATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCT
CAATGGTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTC
AAACTACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTA
TTTGCCTCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGA
CTCATTAATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATGGCTATTCACAACCAAAAAGGCCAAA
CCTGATCACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAAC
TATCAATAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTT
133 CTACCACAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACG
ACTGACAGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATAACAGCTT
TTATCACATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATA
CCTACACGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCC
TTTTAATAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACC
AATGGTGACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTT
ATTATTTCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCA
CCAACAGGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCA
TCACAGCCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCT
CAGAATATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATC
ATCGGATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTG
ATACTGACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTG
ACTTCCAATCAATCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTC
GTACTAATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCAC
GCCTCCCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATC
CCAAACAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAA
GGCCTAGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTG
CCATTAGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGC
CTAGAAGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTA
CTAGTGTTTGCAGCCTGCGAAACTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTACGTCCAAAACTTAAA
CCTCTTACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAAC
AGTACATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGA
CTCACTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAA
CCCGAAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCC
TATTCGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTC
TACACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTTAATTATCCATTACTG
ATCCCACCCATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTATACGGACTCCA
TCTTTGACTGCCAAAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAA
TGCGAATCACTACTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATAATCATAACCAGCTCTA
TCTGCTTACGTCAAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCC
CCTGAAGCTTCATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGA
GTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACC
TAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAA
TAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACATTAACAACATCAAACCC
TCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATAATCCTAGGACCCCTTTA
CTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAAAAGTTTGCAAGAACTGC
TAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGAACCAAAAAATTGGTGCA
ACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAATATCCAACTCAAACA
TCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATATTTATACACA
CAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCAGTA
ATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTT
AAATACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAAT
CATATCATTCCTCCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGAC
ATTGGATTTGTCCTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCCCAAA
CATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCAGCAATAGAAGGCCCAA
CTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTTAATAGAAACTAACAAA
CTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACACAAAATGATATCAAAAAAATCGT
AGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGCATTTCTTCATATCTGCATGCACG
CTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACATCCGAAAAATAGGCGGACTGTAT
AAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTCACAGGATTCTACTCAAAAGACC
TTATCATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATCCCTAACCGCTGCCTACAGCACT
CGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCCCCTACTAATTAACTCTATTAAA
CGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAACACAACAATACCCCTTTACAT
AAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCTGAAATTTAAATACCCATCAC
AAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACCTGTCTATAAGCCAAAAATCCGCAT
CATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAAATATCAATTATAGTATCAAATCAAAAAG
GCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAATTACCACGAGTAATCTCCATAATAACAACAACT
CCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATAAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGA
ATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAAC
TCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACC
134 AAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATACCACAACCAACTCCA
CCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATG
CAATATATATTGTCATTATTCTCACATGGAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCA
ACATCCGAAAATCACACCCACTAATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTT
CCCTCTTAGGCATCTGCCTAATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTAC
ACACATCTGTCGAGACGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATGTTCTTTATTTGCCTATTCATCCACGTAGGC
CGAGGCCTATACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTAC
GTCCTGCCCTGAGGACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGA
ATCTGAGGGGGCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTAC
ATCTCCTATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAG
ACATTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAA
ACCCACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCT
AGCTCTAATAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAATGCCT
ATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTAGCCTCCAT
CTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTATATAAAATACCC
TGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAAAGCTGAAATTCT
AACTAAACTATTCCCTG
Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Mường Lay:
> BLACK MUONG LAY PIG MITOCHONDRION, COMPLETE GENOME
CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC
ACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATATTATAGCCCTATGTACGTCGTGCATTAACTGC
TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATCATTATTGATCGTACATAGCACATATCATGTCAAATA
ATTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT
TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTATTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC
CCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAATGACTAATCAGCCCATGCTCACACATAACTGAGGTTTCATACATTTGGTATTTT
TTAATTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAATCAATTGTAGCTGGACTTCATGGAACTCATGAT
CCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTACGTACACGTGCGTACACATGCGTACACGTGCGTA
CACGTGCGTACACGTGCGTACACATGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC
ACGTACGTACACGTACGTACACGTACGTACACGTACGTACACGTACGTACACGTACGTACACGTGCGTACACGTGCGTACACGTGCGTACA
CGTGCGTACACGTGCGTACACGTGCGTATACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCC
CTTACCCCCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTA
ACTTACACTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGGCACCTACCCCCC
TAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCCCACA
ATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAACACAC
AGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAAAGAT
CAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAAAAATT
AAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAAATTAAT
AGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAATAAAA
TAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTAAACCC
AAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTTACATCCACCTAGAG
GAGCCTGTTCTATAATCGATAAACCCCGATAGACCTCACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAAAAAG
GAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTACATA
AGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAATAAGG
CCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGAAGAG
ACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGAAGAT
CCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCACCTAA
CATTAAAGTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATAAAATAAAAGTAAAAA
AAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAACCAG
ACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTAACG
AGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGAGAT
AGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAGCCA
TCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATCTAT
TGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATAATT
AACAATCAATAAACCAAAACAACACTAAAGCGTTCATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGAAG
TAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGTGA
CACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACGAG
GGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGAGC
135 TTTAATTAACTATTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGACCTC
GGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATACATCACTTATTGATCCAAAATTTTGATCAACG
GAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGACACCC
AAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGTTTCT
ATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAATCTT
AACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTTATTA
CCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTCACCC
TAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCGATGC
CCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATCATTGCACCAATCCTAGCCTTATCCCTAGCACT
AACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCAGTCT
ATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAAACAATTTCATATGAAGTA
ACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACCCTATCCACCCTAATCACAACACAAGAGCACATTTGAATAAT
CTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAGTCAG
AACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAATGCA
TTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCATTAAC
AATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTAACAC
TAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTACTTT
GATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAGCCTGAGAATTCAAAATTCTCCGTGCTAC
CAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACTAAT
AAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAATCG
GATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCTAAC
ACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTACAAAAATATTTAACCCAG
TAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAGTAACCCAAGGCATTTCA
CTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCTAAT
ATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCAATC
GCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAGCAA
TATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATAATA
GTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAAGCA
TCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCCCAT
CCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCGACACTAATCCT
ACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGTACTT
AACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGATTGG
TGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAAAAGG
CGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCTTAAC
CTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGACATCG
GCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGGAACC
CTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGGGGGT
TTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCACCATCC
TTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCACCTTTAGCTGGAAACTTAGCCCATGC
AGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATTATTAA
CATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTGCCAGT
TCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCTTTATC
AACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTATTCAG
GTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACATATTC
ACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGTTGATT
AGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCTAACGG
GCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGGAGCAG
TGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGTAATYA
TATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCCGATTATCCTGACGCATAC
ACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTGCATCA
AAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGAACCAA
CATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTCTTTCTC
GATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCTTTCCAA
CTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGCTCTTTA
GTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAACAATCC
TACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGTAAAAA
CCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGATCTTAAA
CCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAGACGTAC
TACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGACCTGGC
CTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTCGAAAA
136 ATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCTCAATG
GTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTCAAACT
ACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTATTTGCC
TCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGACTCATT
AATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATAGCTATTCACAACCAAAAAGGCCAAACCTGAT
CACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAACTATCAA
TAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTTCTACCA
CAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACGACTGAC
AGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATGACAGCTTTTATCA
CATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATACCTACA
CGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCCTTTTAA
TAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACCAATGGT
GACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTTATTATT
TCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCACCAACA
GGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCATCACAG
CCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCTCAGAA
TATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATCATCGG
ATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTGATACTG
ACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTGACTTCC
AATCAATCAGTTTCGGTAAACTCCGAAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTCGTACT
AATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCACGCCTC
CCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATCCCAAA
CAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAAGGCCT
AGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTGCCATT
AGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGCCTAGA
AGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTACTAGT
GTTTGCAGCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTACGTCCAAAACTTAAACCTCT
TACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAACAGTA
CATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGACTCA
CTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAACCCG
AAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCCTATT
CGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTCTAC
ACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACTACAGGCTCACTAAACTTCTTAATTATCCATTACTGATCCCACC
CATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTATACGGACTCCATCTTTGACTGCCAA
AAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAATACGAATCACTACTATTCTA
AACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATAATCATAACCAGCTCTATCTGCTTACGTCAAACCGACCTAAAA
TCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTCATAGGAGCCACAGCTCTCATA
ATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCA
AACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCA
TTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAATAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACAC
AACGAGGAAAATACACCCACCACATTAACAACATCAAASCCTCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTG
ACCTTAAACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTT
ATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTT
AGGAACCAAAAAATTGGTGCAACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAA
TATCCAACTCAAACATCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATAT
TTATACACACAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCA
GTAATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTTAAA
TACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTC
CTGCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTCCTAT
CCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTACTC
CTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAG
TACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTA
TCACCACCTTATTTACAGCACTATGTGCAATCACACAAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTG
ACAATCGGCATCAACCAACCCCACCTAGCATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCAC
AGCCTCAATGACGAACAAGACATCCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAA
CAGGAATGCCTTATCTCACAGGATTCTACTCAAAAGACCTTATTATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTA
ATTGCCACATCCCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAAT
AACCCCCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAAC
ACAACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCTGAA
ATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACCTGTCTATAAG
137 CCAAAAATCCGCATCATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAAATATCAATTATAGTATC
AAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAATTACCACGAGTAATCTCCATAATA
ACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATAAAGCAGCAATCCCCATAGCTTCCTCACTAAAAA
ACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATAC
AAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATA
ACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATGCCACAACCAACTCCA
CCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCA
ATATATATTGTCATTATTCTCACATGGAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACAT
CCGAAAATCACACCCACTAATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTT
AGGCATCTGCCTAATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTG
TCGAGACGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCAYMYATGTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTAT
ACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAG
GACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGGGCTTT
TCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCTATTCCTGCACG
AAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACATTCTAGGGGCCTTATTT
ATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAAACCCACTAAACACCCCACCCCA
TATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCTAGCTCTAATAGCCTCCATCCTAAT
CCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAATGCCTATTCTGAATACTAGTAGCAGACCTCA
TTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATTGA
TACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCA
CCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAAAGCTGAAATTCTAACTAAACTATTCCCTG