XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ GEN TY THỂ CỦA...

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

-----------------------------

Bùi Anh Tuấn

XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ

GEN TY THỂ CỦA 6 GIỐNG LỢN BẢN ĐỊA TẠI MỘT SỐ

TỈNH MIỀN BẮC VIỆT NAM

LUẬN ÁN TIẾN SĨ SINH HỌC

Hà Nội - Năm 2020

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

-----------------------------

Bùi Anh Tuấn

XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ

GEN TY THỂ CỦA 6 GIỐNG LỢN BẢN ĐỊA TẠI MỘT SỐ

TỈNH MIỀN BẮC VIỆT NAM

Chuyên ngành: Công nghệ sinh học

Mã sỗ: 94 20 20 1

LUẬN ÁN TIẾN SĨ SINH HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:

1. GS.TS. Nghiêm Ngọc Minh

2. PGS.TS. Võ Thị Bích Thủy

Hà Nội - Năm 2020

i

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình do chính tôi thực hiện và một số kết quả

cùng cộng tác với các đồng nghiệp khác. Các số liệu, kết quả nêu trong luận án là

trung thực, một phần đã được công bố trên các tạp chí khoa học chuyên ngành với

sự đồng ý và cho phép của các đồng tác giả. Phần nội dung còn lại chưa được ai

công bố trong bất kỳ công trình nào khác.

Hà Nội, ngày tháng năm 2020

Tác giả

Bùi Anh Tuấn

ii

LỜI CẢM ƠN

Tôi xin được bày tỏ lòng biết ơn sâu sắc tới GS. TS. Nghiêm Ngọc Minh - Phó

Viện trưởng Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam

- Người thầy đã gieo mầm, định hướng nghiên cứu, tận tình hướng dẫn, giúp đỡ tôi

tháo gỡ những khó khăn trong suốt quá trình nghiên cứu và làm luận án.

Tôi cũng xin được bày tỏ lòng biết ơn sâu sắc đến PGS. TS. Võ Thị Bích

Thủy - Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam -

Người thầy đã sát sao dìu dắt, truyền lại cho tôi phương pháp mới về nghiên cứu phân

tích trình tự hệ gen ty thể cũng như niềm say mê nghiên cứu về Hệ gen học.

Trong suốt quá trình thực hiện Đề tài nghiên cứu, tôi đã nhận được sự giúp

đỡ tận tình về chuyên môn của các nhà khoa học, các cán bộ nghiên cứu công tác

tại Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Bằng

những tình cảm chân thành nhất, tôi xin trân trọng cảm ơn những sự giúp đỡ quý

báu đó.

Nhân dịp này, tôi xin chân thành cảm ơn Ban Giám đốc, tập thể cán bộ Học

viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Lãnh

đạo Khoa Công nghệ sinh học và các phòng ban nghiệp vụ trong Học viện đã giúp đỡ,

tạo điều kiện thuận lợi nhất cho tôi trong suốt quá trình học tập và tham gia nghiên cứu

đề tài luận án.

Nhân đây, tôi xin bày tỏ lòng biết ơn sâu sắc tới lãnh đạo Viện Khoa học

hình sự - Bộ Công an; lãnh đạo, đồng nghiệp tại Trung tâm Giám định Sinh học -

Viện Khoa học hình sự đã hết sức tạo điều kiện thuận lợi, giúp đỡ tôi trong công

việc học tập và tham gia nghiên cứu để hoàn thành luận án này.

Tôi xin gửi lời cám ơn thân ái tới gia đình, những người thân và bạn bè đã

luôn bên cạnh, yêu thương, khích lệ và ủng hộ tôi trong suốt thời gian qua.

Hà Nội, ngày tháng năm 2020

Tác giả

Bùi Anh Tuấn

iii

MỤC LỤC

LỜI CAM ĐOAN ....................................................................................................... i

LỜI CẢM ƠN ............................................................................................................ ii

MỤC LỤC ................................................................................................................ iii

DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIỆT TẮT ........................................... v

DANH MỤC CÁC BẢNG ....................................................................................... vi

DANH MỤC CÁC HÌNH ....................................................................................... vii

MỞ ĐẦU .................................................................................................................... 1

Chương 1. TỔNG QUAN TÀI LIỆU ...................................................................... 4

1.1. Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà ................................. 4

1.1.1. Nguồn gốc ............................................................................................................... 4

1.1.2. Phân loại .................................................................................................................. 5

1.1.3. Quá trình thuần hóa ................................................................................................. 5

1.2. Đặc điểm và một số ứng dụng của hệ gen ty thể ........................................... 7

1.2.1. Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú ................................................ 7

1.2.2. Một số ứng dụng của hệ gen ty thể ........................................................................ 9

1.3. Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh chủng

loại phân tử ............................................................................................................ 11

1.3.1. Cây phát sinh chủng loại ...................................................................................... 11

1.3.2. Phân tích phát sinh chủng loại .............................................................................. 13

1.4. Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn ........................ 17

1.4.1. Nghiên cứu các giống lợn trên thế giới ............................................................... 17

1.4.2. Nghiên cứu giống lợn Việt Nam .......................................................................... 19

Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ....................... 25

2.1. Đối tượng và địa điểm nghiên cứu ............................................................... 25

2.1.1. Đối tượng ................................................................................................................ 25

2.1.2. Địa điểm .................................................................................................................. 25

2.2. Hóa chất và thiết bị ........................................................................................ 28

2.2.1. Hóa chất .................................................................................................................. 28

2.2.2. Thiết bị .................................................................................................................... 30

2.3. Phương pháp nghiên cứu .............................................................................. 30

2.3.2. Phương pháp tách chiết DNA tổng số ................................................................. 32

2.3.3. Khuếch đại mtDNA .............................................................................................. 33

2.3.4. Xác định trình tự hệ gen ty thể ............................................................................. 33

2.3.5. Nhóm phương pháp lắp ráp, dóng hàng trình tự, dự đoán và chú giải hệ gen .. 35

iv

2.3.6. Phân tích trình tự và phương pháp xác định mức độ tương đồng trình tự ........ 38

2.3.7. Phương pháp xây dựng cây và phân tích chủng loại phát sinh .......................... 39

Chương 3. KẾT QUẢ VÀ THẢO LUẬN ............................................................. 41

3.1. Chọn lựa, thu thập mẫu ................................................................................ 41

3.2. Trình tự hệ gen ty thể của 6 giống lợn bản địa ........................................... 45

3.2.1. Tách chiết DNA tổng số của 6 giống lợn nghiên cứu ........................................ 45

3.2.2. Khuếch đại phân đoạn hệ gen ty thể (mtDNA) của 6 giống lợn bằng PCR ..... 48

3.2.3. Xác định trình tự các phân đoạn DNA của hệ gen ty thể ................................... 49

3.3. Phân tích hệ gen ty thể .................................................................................. 53

3.3.1. Phân tích thành phần hệ gen ty thể ...................................................................... 53

3.3.2. Chú giải cấu trúc hệ gen ty thể ................................................................ 66

3.3.3. Cấu trúc thành phần của các gen RNA vận chuyển ........................................... 69

3.3.4. Phân tích cấu trúc bậc hai của các tRNA ............................................................ 70

3.4. So sánh đa hình trình tự ............................................................................... 82

3.4.1. Trình tự vùng D-loop ............................................................................................ 74

3.4.2. Trình tự vùng mã hóa hệ gen ty thể ..................................................................... 80

3.5. Phân tích về quan hệ phát sinh chủng loại .................................................. 86

3.5.1. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự vùng D-loop ........... 87

3.5.2. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh .............. 91

4.1. Kết luận .......................................................................................................... 99

4.2. Kiến nghị ........................................................................................................ 99

DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ .......................................... 100

TÀI LIỆU THAM KHẢO .................................................................................... 101

PHỤ LỤC ............................................................................................................... 110

Phụ lục 1 - Nguồn gốc, phân bố, đặc điểm ngoại hình, khả năng sinh

trưởng 6 giống lợn bản địa Việt Nam .................................................................... 110

Phụ lục 2 - Điện di đồ sản phẩm PCR sau tinh sạch của 6 giống lợn bản địa

Việt Nam ................................................................................................................ 113

Phụ lục 3 - Trình tự hoàn chỉnh hệ gen ty thể của 6 giống lợn bản địa Việt Nam ... 118

v

DANH MỤC CÁC CHỮ VIẾT TẮT

BLAST Basic local alignment search tool

DNA Deoxyribonucleic acid

HV1, HV2 Hypervariable Segment 1, hypervariable Segment 2

Indel Insertion or deletion

ITS Internal transcribed spacer.

MCMC Monte Carlo Markov Chain

mtDNA Mitochondrial DNA

NCBI National Center for Biotechnology Information

Nu Nucleotide

OTU Operational taxonomic unit

PCR Polymerase chain reaction

rDNA Ribosomal DNA

RNA Ribonucleic acid

rRNA Ribosome RNA

SD Standard deviation

SNPs Single nucleotide polymorphism

tRNA Transfer RNA

UPGMA Unweighted-pair group method with arithmetic mean

vi

DANH MỤC CÁC BẢNG

Bảng 1.1. Phân loại lợn nhà ........................................................................................ 5

Bảng 1.2. Các loại thay thế đơn phân trong phân tử DNA ....................................... 12

Bảng 1.3. Phân bố các giống lợn bản địa Việt Nam ................................................. 22

Bảng 2.1. Mã số truy cập dữ liệu trình tự hệ gen ty thể của các giống lợn Âu Á và

phân bố địa lý được sử dụng trong nghiên cứu ......................................................... 27

Bảng 2.2. Các cặp mồi được sử dụng cho PCR và vị trí các phân đoạn .................. 29

được khuếch đại ........................................................................................................ 29

Bảng 2.3. Thành phần phản ứng PCR ....................................................................... 33

Bảng 2.4. Thành phần phản ứng giải trình tự ........................................................... 34

Bảng 3.1. Kết quả khảo sát lông da của 6 giống lợn bản địa ................................... 43

Bảng 3.2. Kết quả khảo sát đặc khối lượng và kích thước của 6 giống lợn bản địa413

Bảng 3.3. Khảo sát đặc điểm hình dáng cơ thể của 6 giốn bản địa ......................... 43

Bảng 3.4. Kết quả định lượng và kiểm tra độ tinh sạch của DNA tổng số ............... 45

Bảng 3.5. Kết quả sau chỉnh sửa chuẩn bị cho lắp ráp ............................................. 50

Bảng 3.6. Kết quả lắp ráp hệ gen hoàn chỉnh 6 giống lợn bản địa Việt Nam .......... 51

Bảng 3.7. Tỷ lệ thành phần các loại base trong trình tự hệ gen ty thể của 6 giống

lợn bản địa Việt Nam. ............................................................................................... 53

Bảng 3.8. Thành phần trình tự của các nhóm lợn phân bố theo khu vực địa lý ....... 55

Bảng 3.9. Cấu trúc của hệ gen ty thể lợn Móng Cái ................................................. 59

Bảng 3.10. Cấu trúc của hệ gen ty thể lợn Mường Lay ............................................ 60

Bảng 3.11. Cấu trúc của hệ gen ty thể lợn Mường Khương ..................................... 70

Bảng 3.12. Cấu trúc của hệ gen ty thể lợn Hạ Lang ................................................. 62

Bảng 3.13 Cấu trúc của lợn Hương ........................................................................... 62

Bảng 3.14. Cấu trúc của hệ gen ty thể lợn Ỉ .............................................................. 64

Bảng 3.15. Thành phần nucleotide của 22 gen tRNA của hệ gen 6 giống lợn bản địa

Việt Nam ................................................................................................................... 69

Bảng 3.16. So sánh độ tương đồng giữa các trình tự vùng D-loop của 6 giống lợn

bản địa Việt Nam với các giống lợn trên thế giới ..................................................... 75

Bảng 3.17. Các vị trí SNP trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam 77

Bảng 3.18. So sánh tương đồng các trình tự vùng mã hóa hệ gen ty thể của 6

giống lợn Việt Nam với các giống lợn trên thế giới ................................................ 81

vii

DANH MỤC CÁC HÌNH

Hình 1.1. Nguồn gốc thuần hóa lợn nhà ..................................................................... 4

Hình 1.2. Cấu trúc hệ gen ty thể ở động vật có vú .................................................... 8

Hình 1.3. Mô tả phương pháp neighbor-joining ....................................................... 15

Hình 2.1. Bản đồ địa điểm thu mẫu .......................................................................... 26

Hình 2.2. Sáu giống lợn bản địa Việt Nam được sử dụng trong nghiên cứu ................ 27

Hình 2.3. Sơ đồ tổng quát các bước nghiên cứu ....................................................... 30

Hình 2.4. Các bước lắp ráp hệ gen ty thể .................................................................. 35

Hình 3.1. A. Điện di đồ DNA tổng số của giống lợn Ỉ và Hạ Lang ............................. 47

Hình 3.1. B. Điện di đồ DNA tổng số của giống lợn Mường Lay và Hương ......... 47

Hình 3.1. C. Điện di đồ DNA tổng số tách chiết từ giống lợn Móng Cái và

Mường Khương ......................................................................................................... 48

Hình 3.2. Sản phẩm PCR sau tinh sạch đối với giống lợn Hương .............................. 49

Hình 3.3.A.B. Cấu trúc dạng vòng của hệ gen ty thể lợn Móng Cái,

lợn Mường Lay được xây dựng bởi phần mềm GenomeVx. .................................... 66

Hình 3.3.C.D. Cấu trúc dạng vòng của hệ gen ty thể lợn Mường Khương,

Hạ Lang được xây dựng bởi phần mềm GenomeVx. ............................................... 67

Hình 3.3.E.F. Cấu trúc dạng vòng của hệ gen ty thể lợn Hương và Ỉ được

xây dựng bởi phần mềm GenomeVx. ....................................................................... 68

Hình 3.4.A,B,C,D,E,F. Cấu trúc bậc hai của 22 loại tRNA được mã hóa trên

hệ gen ty thể lợn Móng Cái (A), Mường Lay (B), Mường Khương (C), Hạ Lang

(D), Hương (E) và Ỉ (F). ............................................................................................ 73

Hình 3.5. Vị trí khác biệt trên trình tự vùng D-loop của các giống lợn bản địa

Việt Nam và các giống lợn đã được công bố sau khi dóng hàng đa trình tự ............ 78

Hình 3.6. Một phần trình tự D-loop của lợn Ỉ và các giống lợn đã được công bố

sau khi tiến hành sắp xếp. ......................................................................................... 79

Hình 3.7. Biến thể trình tự tại vị trí nucleotide 2250 vùng mã hóa hệ gen ty thể

các giống lợn ............................................................................................................. 82

Hình 3.8. Biến thể trình tự tại vị trí nucleotide 11318 trình tự vùng mã hóa

hệ gen ty thể các giống lợn........................................................................................ 83

Hình 3.9. Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được

công bố sau khi tiến hành sắp xếp. ............................................................................ 85

Hình 3.10. Cây phát sinh chủng loại vùng D-loop.................................................. 90

Hình 3.11. Cây phát sinh chủng loại của trình tự hoàn chỉnh ................................... 92

1

MỞ ĐẦU

Lợn nhà là loài vật có mối liên hệ lâu đời với con người, là một chi động vật

móng guốc có nguồn gốc ở đại lục Á - Âu. Ngành chăn nuôi lợn phát triển với

những xu hướng cải tạo năng suất, chất lượng của vật nuôi, nhiều giống lợn được

nhập nội để cải tiến các giống lợn địa phương cùng với việc khai thác theo kiểu tận

diệt đã tạo ra không ít áp lực đối với vấn đề bảo tồn nguồn gen bản địa. Bên cạnh

đó, hiện nay cũng có xu hướng quay lại chăn nuôi các giống lợn bản địa vì các ưu

điểm nổi trội: thịt ngon, ít bệnh tật, khả năng thích nghi cao, giá trị kinh tế lớn.

Việt Nam có khoảng 26 giống lợn bản địa, trong số đó có những giống thuộc

Danh mục nguồn gen vật nuôi quý hiếm cần được bảo tồn. Lợn Ỉ nguồn gốc ở tỉnh

Nam Định, ngày nay ít được nuôi do hiệu quả kinh tế không cao và đang đối diện

nguy cơ lớn tuyệt chủng. Đặc biệt, lợn Ỉ được đưa vào Danh mục nguồn gen vật

nuôi quý hiếm cần được bảo tồn. Lợn Móng Cái là giống lợn nội được hình thành

và phát triển lâu đời, xuất xứ từ thành phố Móng Cái, tỉnh Quảng Ninh, với khả

năng sinh sản khá cao. Lợn Mường Khương với ưu điểm thích ứng tốt trong điều

kiện tự nhiên, có chất lượng thịt thơm ngon và là một giống lợn gắn liền với đời

sống người H’Mông, thuộc tỉnh Lào Cai. Giống lợn Hương có lớp mỡ mang mùi

thơm tự nhiên, được nuôi rộng rãi ở địa bàn biên giới phía Bắc thuộc tỉnh Cao

Bằng. Lợn Mường Lay được chăn nuôi chủ yếu ở địa bàn thị xã Mường Lay, tỉnh

Điện Biên, đây là giống lợn phàm ăn, có tính kháng bệnh tốt. Lợn Hạ Lang cũng

phân bố ở tỉnh Cao Bằng, như các giống lợn bản địa khác, quần thể lợn Hạ Lang đang

ngày càng bị thu hẹp.

Hiện tại, các giống lợn bản địa đang giảm dần về số lượng, đang mất đi một

nguồn gen quý của địa phương và quốc gia. Để cứu vãn các giống lợn bản địa quý

hiếm, hiện các nhà khoa học đang cố gắng nỗ lực bảo tồn nguồn gen của chúng.

Đến nay, chưa có công trình nghiên cứu khoa học đầy đủ nào về hệ gen của các

giống lợn bản địa Việt Nam, nhằm làm sáng tỏ nguồn gốc và quan hệ phát sinh

chủng loại, phục vụ cho công tác bảo tồn nguồn tài nguyên quý hiếm này. Việc xây

dựng cơ sở dữ liệu phân tử về nguồn gen của các giống lợn này vẫn chưa được tiến

hành và khai thác một cách đầy đủ. Để giải quyết các vấn đề nêu trên, chúng tôi tiến

hành nghiên cứu đề tài: “Xác định và phân tích hoàn chỉnh trình tự hệ gen ty thể

2

của 6 giống lợn bản địa tại một số tỉnh Miền Bắc Việt Nam” với các mục tiêu và

nội dung sau:

Mục tiêu nghiên cứu:

- Thu được dữ liệu hoàn chỉnh hệ gen ty thể của sáu giống lợn bản địa Việt

Nam (lợn Ỉ, lợn Móng Cái, lợn Mường Lay, lợn Hương, lợn Mường Khương và lợn

Hạ Lang), đăng ký trên Ngân hàng gen.

- Xác định được thành phần, cấu trúc hệ gen ty thể, so sánh sự sai khác trình

tự, xác định đặc điểm di truyền đặc trưng của sáu giống lợn bản địa trên, qua đó

đóng góp vào cơ sở dữ liệu phục vụ công tác nhận dạng và bảo tồn.

- Xác định được mối quan hệ về di truyền, nhận định nguồn gốc, phát sinh

chủng loại của sáu giống lợn bản địa Việt Nam.

Nội dung nghiên cứu:

- Điều tra, khảo sát về giống, nơi cư trú, thu thập mẫu máu của của 6 giống

lợn bản địa nghiên cứu.

- Giải trình tự toàn bộ hệ gen ty thể của 6 giống lợn bản địa.

- Lắp ráp, xác định trình tự hoàn chỉnh toàn bộ hệ gen ty thể và chú giải.

- Phân tích thành phần, cấu trúc hệ gen.

- Nghiên cứu đa hình trình tự, so sánh trình tự hệ gen ty thể của 6 giống lợn

này với một số giống lợn ở Châu Á, Châu Âu.

- Xây dựng cây phát sinh chủng loại dựa trên trình tự vùng D-loop và trình tự

hoàn chỉnh của hệ gen ty thể, phân tích mối quan hệ nguồn gốc phát sinh chủng loại

giữa 6 giống lợn bản địa và một số giống lợn khác trên thế giới.

Đóng góp mới của luận án:

- Đã giải trình tự hoàn chỉnh hệ gen ty thể của sáu cá thể lợn bản địa Việt

Nam (lợn Ỉ, lợn Móng Cái, lợn Mường Khương, lợn Mường Lay, lợn Hương và lợn

Hạ Lang) dữ liệu đã công bố trên ngân hàng Genbank.

- Đã phân tích, chú giải, dự đoán cấu trúc chức năng hệ gen ty thể của sáu cá

thể lợn nghiên cứu.

- Xây dựng giả thuyết về nguồn gốc của giống lợn Hương và Hạ Lang có thể

là cùng một nguồn gốc.

Ý nghĩa khoa học và thực tiễn:

- Luận án có ý nghĩa thực tiễn trong việc xác định nguồn gốc di truyền của

3

sáu giống lợn bản địa sử dụng trong nghiên cứu. Kết quả của luận án là nguồn dữ

liệu quan trọng trong các nghiên cứu về phát sinh chủng loại, tiến hóa phân tử, cũng

như các nghiên cứu khác nhằm nhận diện, đánh giá và sử dụng giống lợn bản địa

Việt Nam, góp phần hiệu quả cho việc bảo tồn và sử dụng bền vững nguồn gen này.

- Các bài báo đăng tải trên các tạp chí khoa học - công nghệ quốc tế và trong

nước cùng với các trình tự hệ gen công bố trên Ngân hàng Gen (GenBank - NCBI)

là những tư liệu có giá trị tham khảo trong nghiên cứu và giảng dạy.

- Những kết quả của nghiên cứu đã đóng góp vào thư viện nguồn gen của

một số giống bản địa trong ngân hàng gen quốc gia và quốc tế. Luận án sẽ tạo tiền

đề cho phát triển các nghiên cứu tiếp theo trên các giống lợn bản địa, cũng như các

giống vật nuôi khác của Việt Nam.

4

Chương 1. TỔNG QUAN TÀI LIỆU

1.1. Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà

1.1.1. Nguồn gốc

Có quan điểm cho rằng giống lợn nhà hiện nay (S. scrofa) bắt nguồn từ hai

nhóm lợn rừng hoang dã là lợn rừng Châu Âu (S. scrofaferus) và lợn rừng Châu Á

(Sus orientalis, Sus cristatus, Sus vittatus), được con người thuần hoá trong thời

gian dài mà thành. Căn cứ vào hình dáng của tai, người ta chia cả hai nhóm lợn

nguyên thuỷ Châu Âu và Châu Á thành hai loại: Lợn tai dài và lợn tai ngắn. Các

giống lợn nhà nuôi hiện nay hình thành từ các giống lợn cổ đại trước kia thông qua

các phương pháp tạp giao khác nhau [1]. Nguồn gốc các giống lợn được tóm tắt ở

hình 1.1.

Hình 1.1. Nguồn gốc thuần hóa lợn nhà [2]

Lịch sử nguồn gốc của lợn nhà được cho là đã trải qua 5 sự kiện lớn: (1) Sự

hình thành loài Sus ở khu vực Đông Nam Á, (2) Quá trình phân ly thành hai dòng

Châu Âu và Châu Á, (3) Quá trình thuần hóa độc lập dẫn đến sự phân tách thành hai

nhánh Châu Âu và Châu Á, (4) Sự tạp giao giữa lợn nhà Châu Âu và Châu Á và (5)

là quá trình hình thành các giống lợn ngày nay [2].

Đang

tiếp tục

~ 200 năm

~ 10.000 năm

Phân chia ~ 1,2 triệu năm

Hình thành loài Sus ~ 4-2 triệu năm

5

1.1.2. Phân loại

Lợn nhà thường được cho là một phân loài từ tổ tiên hoang dã của chúng -

lợn rừng, chúng được đặt tên sinh học là S. scrofa domesticus [3]. Một số nhà phân

loại học lại cho rằng lợn nhà là một loài riêng và gọi tên chúng là Sus domesticus,

lợn rừng là S. scrofa [4]. Bảng 1.1 minh họa về cách phân loại khoa học lợn nhà thuộc

các đơn vị phân loại sau:

Bảng 1.1. Phân loại lợn nhà

Giới Động vật (Animalia)

Ngành Động vật có xương sống (Chordata)

Lớp Động vật có vú (Mammalia)

Bộ Guốc chẵn (Artiodactyla)

Họ Lợn (Suidae)

Chi Sus

Loài S. scrofa

Phân loài S. s. domesticus

Họ lợn bao gồm 3 họ phụ (Phacochoerinae warthogs, Suinae, Babyrouinae).

Các giống lợn được phân thành các giống lợn chính và phụ, có 25 giống lợn phụ và

4 giống lợn chính. 4 giống phụ trong 25 giống phụ đã được thuần hóa và đưa vào sử

dụng hiện nay đã cho thấy mối quan hệ họ hàng và nguồn gốc chung của các loại

giống lợn trên thế giới [5].

Trong loài Sus (bao gồm các chủng và thứ chủng) có nhiều đại diện rải rác

khắp các lục địa, chính là nguồn gốc trực tiếp của các giống lợn nguyên thủy còn

tồn tại cho đến ngày nay.

1.1.3. Quá trình thuần hóa

Tổ tiên xa xưa của lợn là lợn rừng, đã được săn bắn để cung cấp thực phẩm

cho cuộc sống của người nguyên thủy. Dần dần họ nhận ra thay vì săn bắn, việc

thuần hóa nuôi dưỡng lợn được tiến hành dễ dàng và thuận lợi hơn để cung cấp thực

phẩm cho con người. Quá trình thuần hóa và chăn nuôi lợn là quá trình phát triển

liên tục, phụ thuộc lớn vào sự lai tạo giữa lợn đã được thuần hóa với lợn rừng địa

phương, đặc biệt là lợn nái hoang dã. Nhiều loài lợn rừng tồn tại trên thế giới hiện nay

như loài lợn rừng Châu Phi (warthog) Phacochoreus africanus, lợn lùn (pigmy hog)

Porcula salvania và lợn nhỏ (pig-deer) Babyrousa babyrussa; nhưng chỉ có S.

6

scrofa (lợn rừng) là đã được thuần hóa. Do đó, tất cả các giống lợn hiện nay được coi

là các dạng của S. scrofa domestica [2].

Các bằng chứng về phát sinh chủng loại địa lý cho thấy quá trình thuần hóa

lợn diễn ra nhiều lần ở nhiều nơi trên thế giới. Về thời điểm thuần hóa, các nhà

khảo cổ học dựa vào những di chỉ khảo cổ (chủ yếu là xương sọ) đã cho rằng lợn

được thuần hóa vào khoảng 9000 năm về trước [6], thậm chí từ rất sớm vào khoảng

13.000 đến 12.700 năm trước Công nguyên ở Cận Đông [7]. Lợn nhà đã được xác

định có mặt ở đảo Síp từ khoảng 11.400 năm trước Công Nguyên, chúng được du

nhập từ đất liền, đồng nghĩa với việc chúng đã được thuần hóa trong đất liền

[8]. Cũng có nghiên cứu khẳng định sự thuần hóa lợn diễn ra một cách riêng biệt ở

Trung Quốc cách đây khoảng 8000 năm [1].

Về địa điểm thuần hóa, quá trình thuần hóa lợn diễn ra đầu tiên ở khu vực

Cận Đông và diễn ra lặp lại từ các quần thể lợn hoang dã ở từng khu vực khác nhau

trên thế giới [9]. Sau khi được thuần hóa, lợn được phân tán đến Châu Âu và đến

các vùng nội địa khác. Cũng có giả thuyết về sự thuần hóa lợn diễn ra ở một số

trung tâm thuần hóa lợn trên thế giới, đầu tiên có thể kể đến là lục địa Đông Nam

Á. Theo một nghiên cứu của Larson (2005), các giống lợn được thuần hóa bắt

nguồn từ các quần thể lợn hoang, tổ tiên của lợn ngày nay được xác định là lợn

rừng nguyên thủy và quê hương của chúng chính là vùng Đông Nam Á [10]. Sau

khi được thuần hóa ở Đông Nam Á, lợn theo con người đến các vùng khác

của lục địa Á Âu (Eurasia) và ra các đảo Thái Bình Dương [11]. Trong một nghiên

cứu khác, DNA của các giống lợn thuộc các hải đảo Thái Bình Dương và lợn không

lông ở Vanuatu đã được phân tích để khẳng định rằng, lợn tại các hải đảo này cũng

xuất phát và được thuần hóa từ lục địa Đông Nam Á (đặc biệt là từ Việt Nam)

khoảng 3000 năm trước đây [11]. Sau đó, chúng theo con người "di cư" ra khỏi lục

địa và đến các hải đảo như Vanuatu và Lưu Cầu.

Ở Trung Quốc, có công bố cho rằng những con lợn thuần hóa đầu tiên

tại vùng Jiahu ở thời kỳ Đồ đá mới [12]. Từ quá trình thuần hóa đầu tiên, lợn

đã trở thành vật nuôi chính ở Trung Quốc. Tập tục nuôi nhốt từ sớm của người

nông dân Trung Quốc làm cho quá trình thuần hóa lợn ở Trung Quốc diễn ra

nhanh hơn so với ở khu vực Tây Á, Châu Âu.

7

Nghiên cứu của Larson và cs (2007) cho rằng sự hiện diện tại Châu Âu của

lợn nhà có tổ tiên ở vùng Cận Đông vào thời kỳ Đồ đá mới [13]. Bằng chứng khảo

cổ học cũng chứng minh lợn nhà lần đầu được khai thác ở Bắc Âu vào khoảng 4100

năm trước Công Nguyên [14]. Ngay sau khi lợn có nguồn gốc Cận Đông được đưa

vào Châu Âu, những người nông dân đã kết hợp lợn rừng địa phương vào đàn lợn

của họ. Bắt đầu từ khoảng 7.000 năm trước, người Trung Á chuyển đến Châu Âu,

mang theo vật nuôi bản địa và cả cây trồng. Nhưng có thể cùng thời điểm ấy, lợn

rừng tại Châu Âu cũng được thuần hóa, khi đó lợn rừng bản địa Châu Âu nhanh

chóng thay thế sự có mặt của lợn nhà có nguồn gốc Cận Động trên phạm vi khắp

Châu Âu. Do đó, không phải con lợn nào có nguồn gốc Cận Đông cũng trở thành tổ

tiên của giống lợn Châu Âu ngày nay.

Công trình nghiên cứu dựa trên trình tự mtDNA của 48 giống lợn bản địa tại

Trung Quốc và Đông Nam Á cho thấy khoảng cách tiến hóa tương đương và tương

đối gần giữa lợn rừng Châu Âu với các giống lợn kiểu Âu và giống lợn kiểu Á, đưa

đến một luận điểm là lợn rừng Châu Âu có thể là tổ tiên của cả giống lợn nhà Châu

Âu và Châu Á [15]. Theo Kim và cs (2002), đa dạng di truyền ở lợn thương phẩm

lớn hơn trong các quần thể lợn rừng hiện nay. Các ghi chép lịch sử cho thấy lợn

Châu Á đã được đưa vào Châu Âu trong thế kỷ 18 và đầu thế kỷ 19 [15]. Thời điểm

này ở nước Anh, nhu cầu về thịt lợn tăng cao, các nhà lai tạo giống đã nhập khẩu

một số cá thể lợn của Trung Quốc và lai chúng với những con lợn Châu Âu. Đa

dạng di truyền lớn trong các giống lợn thương mại hiện nay là kết quả của phép lai

giữa lợn Châu Âu và lợn Trung Quốc trong khoảng 200 năm về trước. Các bằng

chứng phân tử về sự du nhập gen đã chỉ ra nguồn gốc lai của một số giống lợn Châu

Âu chính. Lợn thương phẩm của Châu Âu hiện đại có chứa DNA nguồn gốc từ lợn

Châu Á [15].

1.2. Đặc điểm và một số ứng dụng của hệ gen ty thể

1.2.1. Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú

Ty thể là một bào quan dạng hình gậy hoặc hình hạt nằm trong nguyên sinh

chất của tế bào, có hệ di truyền độc lập và di truyền theo dòng mẹ. Hệ gen ty thể

của động vật có vú có cấu tạo DNA mạch vòng với kích thước tổng thể khoảng 16,6

kb mã hóa 13 chuỗi polypeptide. Hai sợi trên mạch kép của mtDNA được phân biệt

thành chuỗi nặng (H) và chuỗi nhẹ (L) dựa theo tỷ lệ thành phần bất đối xứng của

8

Guanine và Cytosine [16]. Bên cạnh các gen mã hóa protein, mtDNA cũng mã hóa

cho 22 tRNA và 2 rRNA (12S và 16S rRNAs). Các rRNA và 14 trong số 22 tRNA

được mã hóa bởi các gen nằm trên chuỗi H [17]. Các gen không chứa intron và

ngoại trừ một số vùng điều hòa bao gồm các promoter và điểm khởi đầu sao chép

trên chuỗi H [18]. Sơ đồ cấu trúc hệ gen ty thể ở động vật có vú được trình bày tại

hình 1.2.

Hình 1.2. Cấu trúc hệ gen ty thể ở động vật có vú [19]

Trong nhiều trường hợp, một phần của bộ ba kết thúc tuy không được mã

hóa nhưng được tạo ra bởi quá trình gắn đuôi polyA sau phiên mã [20]. Mã di

truyền của mtDNA ở động vật có xương sống khác mã di truyền trong nhân. Cụ

thể, thay vì là một bộ ba kết thúc, bộ ba TGA mã hóa Tryptophan trong ty thể của

động vật có xương sống. Bộ ba ATA mã hóa Methinonine ở ty thể nhưng lại mã

hóa cho Isoleucine, và AGA hoặc AGG trong mã bộ ba của ty thể là bộ ba kết thúc

thay vì mã hóa Arginine [21].

So với hệ gen nhân, hệ gen ty thể chứa rất ít trình tự không mã hóa xen kẽ

với vùng mã hóa. Vùng D-loop nằm giữa gen tRNAPhe (gen MT-TK) và tRNAPro

(gen MT-TP) là vùng không mã hóa lớn nhất và có vai trò quan trọng trong điều

hòa quá trình sao chép và phiên mã của hệ gen ty thể, chứa promoter cho sự phiên

mã chuỗi H và chuỗi L, chứa điểm khởi đầu của quá trình sao chép. Hệ gen ty thể

sao chép độc lập với hệ gen nhân bằng một hệ thống riêng trong ty thể nhưng các

enzyme cho quá trình sao chép lại do hệ gen nhân mã hóa [18]. Quá trình phiên mã

Chuỗi H

Chuỗi L

mtDNA

genome

9

và dịch mã của DNA ty thể lại được điều khiển bởi gen nhân. Hệ gen ty thể đƣợc

phiên mã từ một điểm khởi đầu nằm trên vùng D-loop, bản phiên mã sau đó được

endonuclease phân cắt để hình thành nên phân tử rRNA 12S và 16S, tRNA và

mRNA tiền thân. Phân tử mRNA hoàn thiện của ty thể không được gắn mũ nhưng

có đuôi polyA [22].

Vùng D-loop của hệ gen ty thể ở động vật có vú có mức độ bảo thủ nhất định

ở các vùng promoter và ba vùng CSB (Conserved Sequence Blocks). Các vùng

CSB được cho là có liên quan đến quá trình sao chép của mtDNA, đặc biệt vùng

CSB-I nằm ngay vị trí khởi đầu tổng hợp chuỗi H DNA. Vùng D-loop không mã

hóa cho bất kì một protein nào và có tốc độ tiến hóa cao hơn nhiều so với các khu

vực khác của hệ gen ty thể. Phần chính của vùng D-loop bao gồm các trình tự

không mã hóa và các vùng siêu biến (HV1 và HV2). Mặc dù tỉ lệ đột biến chung

trong các vùng siêu biến là cao hơn hẳn so với phần còn lại của mtDNA, tuy nhiên

một số vị trí nucleotide được xem là những điểm nóng (hot-spot) cho sự biến đổi.

Hai vùng HV1 và HV2 tương ứng ở khoảng vị trí 16024-16383 và 57-372 [18].

mtDNA có độ bảo tồn cao, dễ khuếch đại bởi tồn tại nhiều bản sao trong tế

bào, trình tự hệ gen ty thể có sự bảo thủ nhất định giữa các loài động vật, với ít sự

trùng lặp, không chứa intron, các vùng intergenic ngắn [23]. Đây là những đặc điểm

giúp mtDNA được ứng dụng trong nhận dạng cá thể, phân loại, phát sinh chủng loại

và xác định nguồn gốc.

1.2.2. Một số ứng dụng của hệ gen ty thể

1.2.2.1. Ứng dụng trong phân loại học và định danh loài

Hệ gen ty thể mặc dù có kích thước nhỏ so với kích thước toàn bộ hệ gen của

sinh vật nhưng nó lại được coi là một chỉ thị phân tử phổ biến ở động vật. Đã có rất

nhiều những nhà di truyền học quần thể và hệ thống học áp dụng các trình tự trên hệ

gen ty thể trong nghiên cứu. Một số nghiên cứu đã sử dụng các gen ty thể như là

những marker phân tử (DNA barcode). Bên cạnh gen 16S rRNA, 12S rRNA,

Cytochrome b,.. nhiều nghiên cứu đã xác định rằng gen ty thể cytochrome c oxidase

subunit I [24] có thể đóng vai trò cốt lõi như một hệ thống xác định sinh học phân

loại động vật [25]. Sự tiến hóa của gen COI cho phép phân biệt không chỉ giữa các

loài gần nhau, mà còn trong cùng một loài [26]. Trong phân loại phân tử hoặc định

danh sinh vật, trình tự DNA được sử dụng như “barcodes”, dùng để phân loại

10

nhóm. Một nghiên cứu tiêu biểu sử dụng gen COI trong định danh loài bò, lợn, gia

cầm là công trình của Spychaj và cs (2016). Nghiên cứu này đã phát triển một

phương pháp tự thiết kế mồi để khuếch đại trình tự gen COI để nhận dạng sản phẩm

thịt từ 3 loài động vật trên [27]. Cũng sử dụng đoạn gen COI, nhưng nhóm tác giả

Dawnay sử dụng cặp mồi phổ dụng để phân định loài gia súc và gia cầm [28]. Các

nghiên cứu đã cho thấy mtDNA trở thành một công cụ hữu hiệu trong việc định

danh sinh vật ở cấp độ loài hoặc dưới loài.

1.2.2.2. Ứng dụng trong nghiên cứu phát sinh chủng loại, xác định nguồn gốc

mtDNA có độ đa dạng cao trong quần thể tự nhiên do tỷ lệ đột biến lớn, trở

thành các bằng chứng cho lịch sử phát triển của quần thể.

Các kĩ thuật phân tích trình tự mtDNA để xác định mối quan hệ về phát sinh

chủng loại đã được sử dụng phổ biến dựa trên nguyên lý: thông tin về quá trình tiến

hóa có thể thu được qua phân tích dữ liệu về trình tự. Một số tác giả đã tiến hành so

sánh sự đa hình các trình tự để xác định mối quan hệ về tiến hóa giữa những cá thể

trong cùng loài hoặc các loài có quan hệ gần, thời gian phân ly ngắn [29, 15, 30].

Bên cạnh đó, mức độ đa dạng và tiểu cấu trúc địa lý trong một nhóm hay giữa các

nhóm cá thể sinh vật cũng sẽ được làm sáng tỏ [31]. Hệ gen ty thể của lợn (S.

scrofa) được giải trình tự hoàn chỉnh đầu tiên vào năm 1998 [32], là tiền đề cho các

công trình khoa học được tiến hành dựa trên những dữ liệu hoàn chỉnh hệ gen ty thể

của các giống lợn nhà và lợn rừng.

Ở mtDNA, sự tiến hóa đa dạng hơn so với DNA nhân [33, 34]. Sự tiến hóa

của mtDNA ở động vật có vú diễn ra trước hết từ sự thay thế các cặp base đơn, hơn

là việc tái sắp xếp các phân đoạn lớn của trình tự [18]. mtDNA di truyền theo dòng

mẹ, đơn bội và không tái tổ hợp [35]. Những đặc điểm trên đây khiến mtDNA là

một trong những chỉ thị phổ biến nhất được sử dụng nhằm xác định mối quan hệ

giữa các cá thể trong cùng loài và giữa các loài có mối quan hệ gần, thời gian phân

ly ngắn.

Đối với hệ gen ty thể, vùng D-loop được cho là vùng có nhiều sự biến đổi

hơn các vùng khác [36]. Trong suốt nhiều thập kỷ qua, vùng D-loop của hệ gen ty

thể đã được sử dụng trong các phân tích chủng loại phát sinh. Hai vùng siêu biến

(HV1 và HV2) được sử dụng nhiều cho nghiên cứu tiến hóa, xác định quan hệ huyết

thống dòng mẹ ở sinh vật nhân thực Eukaryotes và đặc biệt ở người [37, 38]. Thông

11

qua phân tích hệ gen ty thể ở các loài động vật có vú, sự phân ly về trình tự mtDNA

được xác định cứ mỗi 2 triệu năm diễn ra khoảng 2%, tương đương với tốc độ thay

thế nucleotide là 1x10-8 sự thay thế/vịtrí/năm ở mỗi giống [34]. Ở các loài gia súc

nói riêng, tốc độ thay thế các nucleotide ở vùng D-loop được cho là khoảng 1,5.10-7/vị

trí/năm [39]. Một số công trình nghiên cứu dựa trên độ đa hình trình tự vùng D-loop

nhằm xác định khoảng thời gian từ lúc phân ly thành các nhánh lợn Châu Âu và

Châu Á, qua đó đưa ra những đánh giá về phát sinh chủng loại [15, 40].

Tất cả những đặc điểm, cấu trúc, đặc tính sinh học đã giúp hệ gen ty thể trở

thành một chỉ thị phân tử phổ biến được sử dụng trong nghiên cứu đa dạng sinh học

và quan hệ phát sinh chủng loại cũng như xác định nguồn gốc tiến hóa.

1.3. Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh

chủng loại phân tử

Nghiên cứu về phát sinh chủng loại có thể sử dụng các bằng chứng về hình

thái từ những loài đang sống và dữ liệu hóa thạch hoặc dựa trên lượng dữ liệu

khổng lồ về phân tử [41]. Trong ngành phát sinh chủng loại phân tử, người ta

nghiên cứu mối quan hệ giữa các loài sinh vật thông qua các bằng chứng phân

tử, cụ thể là trình tự DNA và protein. Như vậy, sự khác biệt giữa các trình tự quy

định sự phân ly di truyền, được coi là kết quả của tiến hóa phân tử theo tiến trình

thời gian. Các mối quan hệ về tiến hóa được suy luận ra, chúng thường được biểu

diễn dưới dạng cây tiến hóa, qua đó có thể cung cấp các giả thuyết về những sự

kiện sinh học xảy ra trong quá khứ [42]. Tất cả các dạng sống đều có chung một

nguồn gốc tổ tiên và là một phần của cây sự sống. Hơn 99% các loài từng sống sót

đã bị tuyệt chủng [43], do đó, suy luận phát sinh chủng loại là suy luận các dữ kiện

trong quá khứ. Suy luận phát sinh chủng loại sử dụng các đặc điểm chung giữa hai

loài (có thể là đặc điểm hình thái hoặc đặc điểm ở cấp độ nhiễm sắc thể, các trình tự

phân tử). Phát sinh chủng loại cũng giúp ước lượng khoảng thời gian phân ly giữa

các sinh vật tính từ thời điểm chúng cùng chia sẻ một tổ tiên chung cuối cùng.

1.3.1. Cây phát sinh chủng loại

Cây phát sinh chủng loại nêu lên một giả thuyết về các sinh vật trên cây đã

có quan hệ họ hàng với nhau như thế nào [42]. Mỗi nhóm loài có thể có nhiều dạng

phát sinh, phải lựa chọn dạng phát sinh nào được coi là đúng nhất. Cách lựa chọn

phụ thuộc vào các phương pháp suy luận chứ không phải là quan sát hoặc tiến

12

hành thí nghiệm bởi những sự kiện phân chia trong tiến hóa đã xảy ra. Việc xây

dựng cây chỉ mang tính suy luận, ở đó biểu diễn các sự kiện trong quá khứ. Các

cây mô tả một chuỗi các sự kiện tiến hóa được suy luận từ các dữ liệu sẵn có, dựa

trên một số mô hình [42].

Có hai thông tin chính trong cây phát sinh chủng loại: thông tin về hình học

tô-pô và chiều dài nhánh. Hình học tô-pô của một cây xác định các mối quan hệ của

các thực thể được đại diện trên cây phát sinh. Chiều dài nhánh phản ánh mức độ

quan hệ của các đối tượng trên cây. Cây phát sinh là một biểu đồ bao gồm các

nhánh và các nút. Chỉ duy nhất một nhánh là nối giữa hai nút. Các nút đại diện cho

các đơn vị phân loại (các taxon mà cụ thể ở đây là các trình tự DNA hoặc protein),

nút là giao điểm hay điểm tận cùng của hai hoặc nhiều nhánh [44]. Một đơn vị phân

loại hoạt động [44] là một taxon hiện có có mặt ở một nút ngoài cùng hay còn gọi là

lá. Ở đây, các OTU sẽ là các chuỗi nucleic acid hoặc protein đang được phân tích

trên cây đó. Các nút phía trong đại diện cho các trình tự tổ tiên mà chúng ta có thể

suy ra nhưng hiếm khi có thể quan sát được (ví dụ như trường hợp trình tự DNA từ

các cơ thể đã tuyệt chủng). Một số OTU có thể được đổi chỗ cho nhau (chuyển đổi

hoặc xoay vị trí) mà không thay đổi trạng thái hình học tô-pô của cây. Nhìn chung,

các OTU hoặc các nhánh chia sẻ một nút tổ tiên gần nhất có thể xoay ngay trên nút đó [42].

Chiều dài nhánh cần phải được xác định khi dựng cây. Ở một số cây, chiều dài

nhánh đại diện cho số thay đổi nucleotide hoặc amino acid xảy ra trong nhánh đó (số

khác biệt trên mỗi vị trí). Định dạng cây này (phylogram) cho phép khảo sát rõ ràng

các mối quan hệ của các OTU khác nhau trong cây đó. Một số cây lại được vẽ không

theo tỷ lệ với số lượng thay đổi, dạng cây này (cladogram) biểu diễn các OTU thẳng

hàng theo chiều dọc, được áp dụng khi cây đó có rất nhiều OTU [40].

Xây dựng cây từ dữ liệu trình tự DNA thực chất là nghiên cứu sự thay thế trong

DNA qua phép dóng hàng, chẳng hạn như sự thay thế từng nucleotide đơn, sự thay thế

liên tiếp và sự thay thế ngẫu nhiên (được thể hiện tại bảng 1.2).

Bảng 1.2. Các loại thay thế đơn phân trong phân tử DNA[42]

Trình tự

tổ tiên

Trình tự phân rẽ

1


2 Các loại thay thế

A A A AA Thay thế song song

G G C G C CC

T T T TT Thay thế đơn nhất

13

Trình tự

tổ tiên


1


2 Các loại thay thế

C C C G CG

C C C T A CA Thay thế liên tiếp

T T T TT

Thay thế ngẫu nhiên G G G GG

T T A T C AC

T T G T GT

C C G C T G GG Thay thế trùng hợp

hội tụ A A A AA

G G T G G GG Thay thế hồi quy

1.3.2. Phân tích phát sinh chủng loại

Phân tích phát sinh chủng loại phân tử được chia làm năm bước: 1- thu nhận,

chọn lựa các trình tự để phân tích; 2 - dóng hàng đa trình tự của các trình tự nucleic

acid hay protein tương đồng; 3 - lựa chọn mô hình thống kê cho tiến hóa của

nucleotide hoặc amino acid; 4 - xây dựng cây; và 5 - phân tích cây.

1.3.2.1. Thu nhận trình tự, lựa chọn trình tự

Có thể thu nhận trình tự từ cơ sở dữ liệu HomoloGene của NCBI bao gồm hàng

ngàn họ protein của sinh vật nhân thực, hay các kết quả từ công cụ BLAST giúp lựa

chọn được các họ protein, được quan sát trong NCBI Protein hoặc NCBI Nucleotide.

Các trình tự có thể thu được từ cơ sở dữ liệu Viện Công nghệ tin sinh học Châu Âu

hoặc Ensembl. Cũng có thể thu nhận trình tự từ các cơ sở dữ liệu rộng lớn với định

dạng đầu ra FASTA (hoặc dóng hàng đa trình tự). Với RNA, các cơ sở dữ liệu này bao

gồm Rfam và Ribosomal Database. Với protein các cơ sở dữ liệu gồm Pfam và

InterPro.

1.3.2.2. Dóng hàng đa trình tự

Một họ gen (hoặc protein) được xác định bởi phép dóng hàng đa trình tự của

một nhóm các trình tự tương đồng (homologous). Dóng hàng đa trình tự là một tập

hợp của ba hay nhiều trình tự protein (hoặc nucleic acid) được dóng hàng từng phần

hoặc toàn bộ. Các đơn phân tương đồng được dóng hàng theo cột dọc suốt chiều dài

của trình tự. Các đơn phân được dóng hàng này là tương đồng theo ý nghĩa tiến hóa:

chúng được thu về từ một tổ tiên chung. Đây là bước then chốt trong phân tích phát

sinh chủng loại. Để chuẩn bị dóng hàng đa trình tự phục vụ phân tích phát sinh

chủng loại, các trình tự phải có chung nguồn gốc và tương đồng.

1.3.2.3. Lựa chọn mô hình thay thế trong chuỗi DNA và amino acid

14

Phân tích phát sinh chủng loại dựa trên các mô hình của sự thay thế trong

chuỗi DNA hoặc amino acid. Mô hình Jukes-Cantor mô tả quá trình tiến hóa bởi

những sự thay đổi các đơn phân trong một phép dóng hàng trình tự. Mô hình này

giả định rằng mỗi loại nucleotide có khả năng như nhau để chuyển thành 3 loại

còn lại và bốn loại có mặt với tỷ lệ bằng nhau, tỷ lệ của đồng hoán bằng với tỷ lệ

dị hoán. Trong mô hình hai thông số Kimura cũng mô tả sự thay đổi các đơn

phân nhưng thường thì dị hoán sẽ được chú trọng hơn về tính khả dĩ. Ở mô hình

Tamura giải thích cho sự đa dạng trong thành phần GC, đây là điển hình cho một

mô hình phức tạp hơn của sự thay thế nucleotide.

Trước khi chuỗi dữ liệu được tính toán và phân tích, chúng phải trải qua

quá trình kiểm tra dò tìm mô hình tiến hóa thích hợp.

1.3.2.4. Xây dựng cây

Có bốn phương pháp chính để dựng cây: dựa vào khoảng cách, maximum

parsimony, maximum likelihood và suy luận Bayes. Một trong những phần mềm

tiên tiến hiện nay là MrBayes được phát triển bởi John Huelsenbeck và Fredrik

Ronquist [45]. Công cụ này giúp suy luận dựa trên việc xác lập một phương

pháp phân tích Bayes và các phương pháp dựa trên mô hình để phân tích phát

sinh chủng loại. MrBayes lượng giá một phân bố xác suất tiên nghiệm, là khả

năng mà một cây tạo ra thỏa mãn dữ liệu quan sát.

- Nhóm phương pháp dựa trên khoảng cách

Phương pháp này sử dụng khoảng cách tiến hóa giữa các OTU để suy

luận lịch sử phát sinh loài. Nếu khoảng cách phân tử giữa các loài có sự gia

tăng không đổi theo thời gian, thì cặp loài nào có khoảng cách ngắn nhất sẽ có

chung tổ tiên gần nhất. Các cá thể cùng có một tổ tiên chung gần thì có sự

tương đồng với nhau hơn là những cá thể có chung tổ tiên ở xa hơn (lâu đời

hơn). Do đó, ta có thể suy luận các mối quan hệ tiến hóa từ các kiểu tương

đồng trong số các cá thể.

+ Phương pháp dựa trên khoảng cách UPGMA (Unweighted-Pair Group

Method with Arithmetic mean) được giới thiệu bởi Sokal và Michener [46].

Trong phương pháp này, dựa trên việc gom cụm các trình tự, mỗi trình tự được

xem nằm trong cụm của chính nó. Thông qua ma trận khoảng cách, có thể xác

định được chiều dài khoảng cách giữa mỗi đối tượng. Các taxon có khoảng cách

gần nhất sẽ nối lại với nhau và đặt tên cho một nút phía trong là. Cứ thế, xác

15

định các khoảng cách gần nhất tương ứng giữa các taxon, cuối cùng tất cả các

trình tự được kết nối lại trong một cây có gốc.

+ Tạo cây bằng nhóm phương pháp dựa trên khoảng cách - neighbor

joining:

Hình 1.3. Mô tả phương pháp neighbor-joining [47]

Phương pháp này sử dụng thuật toán khoảng cách được minh họa trên hình 1.3:

(a) các OTU trước hết được gom cụm trong một cây hình sao. Các lân cận được xác

định là các OTU được liên kết bởi một nút duy nhất ở bên trong của cây phân nhánh

không gốc. (b) hai OTU gần nhất được xác định, chẳng hạn là OTU số 1 và 2. Hai lân

cận này được nối với các OTU khác thông qua nhánh nội là XY. OTU được chọn là lân

cận sao cho tổng chiều dài nhánh là nhỏ nhất. Quá trình này được lặp lại cho đến khi

toàn bộ cây được tạo ra.

- Nhóm phương pháp Maximum Parsimony

Phương pháp sử dụng nguyên lý suy luận phát sinh chủng loại dựa trên ít

nhất những biến đổi trong quá trình tiến hóa, nghĩa là cây tốt nhất là cây có chiều

dài nhánh ngắn nhất có thể [48].

- Phương pháp Maximum Likelihood

Đây là một phương pháp được thiết kế để xác định kiểu hình học tô-pô cho

cây và chiều dài nhánh có tính khả dĩ cao nhất đối với tập hợp dữ liệu quan sát

được. Tính khả dĩ được tính toán cho mỗi đơn phân (residue) trong một phép dóng

hàng, bao gồm một vài mô hình của quá trình thay thế nucleotide hoặc amino acid.

Đây là phương pháp phải sử dụng dung lượng máy tính nhiều nhất và cũng là nhóm

phương pháp linh động nhất [49].

- Nhóm phương pháp dựa trên lý thuyết Bayes

Suy luận Bayes thực chất là việc tính toán khả năng của một số dữ liệu đang

quan sát với một vài mô hình xác suất đã cho. Suy luận Bayes tìm kiếm xác suất của

một cây với điều kiện dựa trên những dữ liệu sẵn có (dựa trên sự quan sát một phép

16

dóng hàng đa trình tự nào đó) [50]. Ước lượng Bayes của phát sinh chủng loại được

chú trọng vào một đại lượng được gọi là phân bố xác suất tiên nghiệm của cây. Với

một cây đã cho, xác suất tiên nghiệm là xác suất để cây đúng, mục đích là tìm ra cây

có xác suất cao nhất. Suy luận Bayes trong nghiên cứu phát sinh chủng loại tương

tự như maximum likelihood bởi mỗi phương pháp đều tìm kiếm một đại lượng gọi

là tỷ lệ khả dĩ với dữ liệu điều kiện đang quan sát của cây. Khác biệt là việc xác

định các thông tin ban đầu và sử dụng thuật toán MCMC (Markov chain Monte

Carlo) để xác định phân phối xác suất hậu nghiệm. Nhóm phương pháp dựa trên

nguyên lý Bayes được coi là công cụ tiên tiến, khắc phục được một số hạn chế của

các phương pháp khác. Các nghiên cứu gần đây có xu hướng sử dụng phương pháp

Bayes nhiều hơn thay vì các phương pháp khác.

1.3.2.5. Hoàn thiện cây phát sinh chủng loại

- Phân tích giá trị bootstrap

Sau khi dựng được một cây phát sinh chủng loại, cần đánh giá mức độ chính

xác, tin cậy và hiệu quả. Tính chính xác của cây được đánh giá bằng phương pháp

phổ biến nhất là phân tích bootstrap [51, 52]. Bootstrap mô tả độ mạnh về hình học

tô-pô của cây. Nghĩa là, với một trật tự phân nhánh cụ thể nào đó, xác định mức độ

tin cậy của thuật toán được sử dụng để dựng cây, để tìm ra trật tự phân nhánh sử

dụng các phép hoán vị ngẫu nhiên đối với các dữ liệu nguồn. Phân tích bootstrap

cho phép suy luận mức độ biến thiên trong một phân phối chưa biết mà dữ liệu

được rút ra từ đó [52]. Bootstrap là kĩ thuật xử lí thống kê các phép đo lường về độ

chính xác với các khoảng ước lượng về mẫu nghiên cứu. Cho phép sự ước lượng

các giá trị khác biệt trong một phân bố các mẫu nghiên cứu, qua đó kiểm định giả

thuyết trong thống kê bằng số lần thử lại (resampling) với sự thay thế từ nguồn dữ

liệu gốc.

Con số phần trăm thể hiện trên nhóm nào đó thể hiện trên cây gốc được cung

cấp dựa trên mức độ ủng hộ của bootstrap đối với hình học tô-pô của cây gốc. Giá

trị bootstrap lớn hơn 70% cung cấp giá trị ủng hộ cho việc tạo nhóm. Nếu nhìn vào

một nhóm (một nhóm trình tự có cùng tổ tiên) có giá trị ủng hộ bootstrap là 100%,

nghĩa là trong tất cả 500 phép bootstrap lặp lại, nhánh đó vẫ duy trì trạng thái (số

lượng, thành phần các trình tự vẫn không thay đổi trong nhánh). Nếu một nhánh chỉ

nhận được giá trị bootstrap là 52% ủng hộ, nghĩa là khoảng một nửa cơ hội một

trình tự thuộc nhánh lân cận với nhóm có giá trị bootstrap 52% là có khả năng thuộc

17

nhóm này [51]. Tóm lại, nhìn vào giá trị bootstrap, có thể đánh giá được độ tin cậy

của mỗi nhánh trong một cây.

- Phân tích gốc của cây:

Để suy luận tổ tiên cho các nút trên một cây, thì điều quan trọng phải biết

gốc của cây nằm ở đâu, điều này cho phép đánh giá tổng thể chiều hướng biến đổi.

Có hai phương pháp thường được sử dụng để xác định gốc của cây.

Phương pháp xác định gốc của cây dựa vào trung điểm: đơn giản nhưng độ

chính xác không cao. Phương pháp này xác định gốc như là trung tâm tập hợp của

các nhánh và cách đều một cách tương đối với các đỉnh.

Phương pháp thứ hai dựa vào nhóm đối chứng (nhóm ngoại - outgroup) chính

xác hơn, nhưng không phải lúc nào cũng sử dụng được bởi yêu cầu một nhóm

ngoài, một taxon được phân tách từ cây từ trước cho tới hiện tại của tổ tiên chung

sau cùng của tất cả các taxon khác đang được nghiên cứu.

1.4. Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn

1.4.1. Nghiên cứu các giống lợn trên thế giới

Phương pháp mô hình hóa dữ liệu di truyền từ lợn nhà và lợn rừng đã được

áp dụng để giải quyết các quan điểm mâu thuẫn và làm sáng tỏ quá trình thuần hóa

lợn [53]. Dữ liệu cho thấy lợn nhà ngày nay là một thể khảm của các quần thể lợn

rừng khác nhau. Kết quả của các nghiên cứu này đã không ủng hộ giả thuyết trước

đó cho rằng có nhiều trung tâm thuần hóa lợn bên ngoài khu vực Tây Á và Trung

Quốc [10].

Đã có nhiều nhà di truyền học quần thể và hệ thống học sử dụng dữ liệu trình

tự của hệ gen ty thể trong các nghiên cứu về nguồn gốc các giống lợn. Trình tự hoàn

chỉnh hệ gen ty thể của lợn (S. scrofa) được công bố vào năm 1998 [32], đây là tiền

đề cho một loạt các công trình khoa học tiến hành nghiên cứu trên dữ liệu hệ gen ty

thể của các giống lợn nhà và lợn rừng. Kim và cs (2002) đã xác định quan hệ phát

sinh chủng loại của các giống lợn Châu Âu và Châu Á bằng sự đa hình trình tự

vùng D-loop với chiều dài 1036 bp của mtDNA [15]. Watanobe và cs (2003) đã

công bố cấu trúc quần thể của lợn rừng Nhật Bản và địa lý phát sinh chủng loại

thông qua phân tích biến thể trình tự mtDNA [54]. Công trình của Wang và cs

(2014) đã công bố dữ liệu của hệ gen ty thể ở giống lợn Duroc [55], … Bên cạnh

đó, có nhiều công trình nghiên cứu đã công bố những bằng chứng rõ ràng từ trình tự

18

mtDNA của các mẫu lợn hiện đại và cổ đại để chứng minh một số vùng được xem

là trung tâm thuần hóa lợn nhà từ các giống lợn rừng trên thế giới trải dài từ Âu

sang Á [10, 56]. Một số công trình nghiên cứu thông qua độ đa hình trình tự vùng

D-loop, xác định khoảng thời gian từ lúc phân rẽ thành nhánh lợn Châu Âu và Châu

Á đã được nghiên cứu đánh giá trong các phân tích về phát sinh chủng loại [15,

40]. Giuffra và cs đã tiến hành giải trình tự mtDNA và một số gen nhân tế bào từ

các giống lợn rừng, lợn nhà Châu Âu, Châu Á. Nhóm tác giả đã phát hiện sự đa

hình trình tự và sử dụng công thức tính toán đồng hồ phân tử, kết luận rằng lợn

nhà có nguồn gốc từ lợn rừng Âu Á (S. scrofa), các bằng chứng về sự thuần hóa

diễn ra độc lập từ các loài phụ của lợn hoang ở Châu Âu và Châu Á cũng được đưa ra [1].

Fernández đã tiến hành nghiên cứu mối quan hệ giữa đa hình mtDNA và chất

lượng thịt ở giống lợn Iberia. Kết quả đã phát hiện một số đa hình đóng vai trò như

các chỉ thị phân tử đóng góp vào quá trình chọn giống lợn này [57]. Công trình

nghiên cứu mối liên hệ của 4 haplotype mtDNA với các đặc điểm năng suất ở giống

lợn Landrace và khẳng định các kiểu gen đơn bội của mtDNA có mối liên hệ lớn tới

các tính trạng hình thái ở giống lợn này [58]. Trình tự hệ gen ty thể hoàn chỉnh của

giống lợn Visayan, lợn Java được xác định với kích thước 16.475 bp, hệ gen có cấu

trúc đặc trưng của 13 gen mã hóa protein, 2 gen rRNA, 22 gen tRNA và một vùng

điều khiển không mã hóa D-loop, đây là nguồn dữ liệu di truyền giúp nghiên cứu sâu

hơn về sự tiến hóa của lợn [59]. Việc nghiên cứu hoàn chỉnh trình tự vùng D-loop ty

thể của giống lợn trắng Pudong ở vùng Taihu - Trung Quốc, đã cho thấy không có sự

trao đổi di truyền giữa các quần thể và giống lợn này chỉ xuất hiện duy nhất tại đây.

Do vậy cần có những chính sách để bảo tồn nguồn gen bản địa quý hiếm này [60]. Sự

đa dạng di truyền trong hệ gen ty thể cũng đã được xác định trong 17 giống lợn bản

địa Trung Quốc và 3 giống lợn bản địa Châu Âu. Qua phân tích đa dạng nucleotide

cho thấy mức độ khác biệt di truyền rất lớn giữa các giống có nguồn gốc Châu Âu so

với Châu Á, tuy nhiên ít có sự biến động trong 17 giống bản địa của Trung Quốc

[61]. Nghiên cứu của Wu và cs (2007) đã khẳng định hai vị trí phát sinh chủng loại

của các giống lợn nhà và lợn rừng Châu Á nằm trên hai nhánh tách biệt, trong đó

giống lợn hoang Malaysia có sự tách biệt lớn nhất khi nằm ra ngoài khỏi nhánh lợn

lưu vực sông Mekong và Nam Trung Quốc nhưng giống lợn này vẫn là lợn kiểu Châu

Á [56]. Nghiên cứu về các giống lợn bản địa Trung Quốc, nhóm của Yu đã cho rằng

19

lợn Lanyu phân ly từ các giống lợn Trung Quốc khác và nằm tại nhánh phát sinh riêng

[30].

Từ các kết quả nghiên cứu, có thể thấy thông tin về quá trình tiến hóa có thể

thu được thông qua dữ liệu về trình tự. Qua việc so sánh mức độ đa hình các trình

tự, các mối quan hệ về tiến hóa giữa những cá thể trong cùng loài hoặc các loài có

quan hệ gần, thời gian phân ly ngắn, cũng như độ đa dạng và tiểu cấu trúc địa lý

trong một nhóm hay giữa các nhóm cá thể động vật sẽ được làm sáng tỏ [62, 29, 63, 31].

1.4.2. Nghiên cứu giống lợn Việt Nam

1.4.2.1. Tình hình nghiên cứu chung

Việt Nam được coi là một trong những nơi bắt nguồn của lợn nhà Châu Á

[64]. Tuy nhiên, đến nay còn khá ít các công trình nghiên cứu xác định nguồn gốc

phát sinh chủng loại và đa dạng di truyền sử dụng hệ gen ty thể trên đối tượng là các

giống lợn bản địa Việt Nam. Nguyễn Thị Phương Mai (2017) đã sử dụng dữ liệu

trình tự hệ gen ty thể để xác định vị trí phân loại của heo rừng bản địa khu vực Tây

Nguyên trong mối quan hệ phát sinh loài của heo rừng trên thế giới. Cùng với đó, 3

vị trí SNP mới của vùng D-loop và 3 vị trí SNP mới của gen cytochrome b của heo

rừng Tây Nguyên cũng được xác định, giúp phân biệt giữa heo rừng Tây Nguyên và

các nhóm heo rừng khác [65].

Công trình nghiên cứu của Trần Thị Thúy Nhiên (2016) đã công bố giải trình

tự hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái [66]. Trong nghiên cứu này,

trình tự hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái được công bố có chiều

dài 16.632 bp bao gồm vùng không mã hóa (D-loop), 2 gen rRNA, 13 gen mã hóa

protein và 22 gen tRNA. Cây phát sinh chủng loại cũng được tái dựng lên, sử dụng

phương pháp khoảng cách UPGMA với 162 trình tự hoàn chỉnh của hệ gen ty thể

của lợn. Qua phân tích phát sinh chủng loại, nhóm tác giả đã xác định được mối

quan hệ gần gũi giữa lợn Móng Cái của Việt Nam với giống lợn Bama miniature ở

Miền Nam Trung Quốc. Bên cạnh đó các số liệu phân tích về thành phần hệ gen của

giống lợn Móng Cái cũng được tác giả công bố. Ishihara và cs đã nghiên cứu mối

quan hệ di truyền trong số các giống lợn địa phương sử dụng các chỉ thị SNP [67].

Đại diện của 15 giống lợn địa phương trải dài từ Bắc, Trung và Nam đã được thu

thập. Qua phân tích các chỉ thị SNP cho thấy có sự đa hình cao trong các giống lợn

Việt Nam. Hầu hết các giống được gom nhánh đều tương quan với nguồn gốc địa lý

20

của chúng. Một số giống lợn Việt Nam khác lại được gom nhánh khi cùng liên quan

về mặt di truyền với giống lợn Landrace của Châu Âu.

Trái với công bố khoa học cho rằng một số giống lợn địa phương ở Việt Nam

có nguồn gốc từ Trung Quốc, qua phân tích di truyền sử dụng vùng kiểm soát của

hệ gen ty thể đã chứng minh rằng các giống lợn Việt Nam ở khu vực Đông Bắc có

thể có mối quan hệ với giống lợn ở Campuchia hoặc Lào [68]. Nghiên cứu của

Hongo và cs (2002) xác định mối liên hệ về mặt di truyền giữa giống lợn bản địa

Việt Nam với một số giống lợn trên thế giới [69]. Cụ thể, Hongo đã dựa vào hình

thái giải phẫu bộ xương để phân ra nhóm lợn to và nhóm lợn nhỏ, nhóm lợn rừng

to có mối quan hệ gần với giống lợn hoang Ryukyu ở miền Nam Nhật Bản, nhóm

lợn nhỏ có mối liên hệ gần nhất với một số giống lợn nhà tại khu vực Đông Á có

nguồn gốc từ lợn bản địa Trung Quốc [69]. Các nhà khoa học Trung Quốc cũng đã

có các công bố về nguồn gốc và sự khác biệt di truyền của giống lợn bản địa phía

Tây Nam Trung Quốc thông qua nghiên cứu đa hình mtDNA. Kết quả cho thấy,

mối quan hệ giữa lợn rừng và lợn Tứ Xuyên ở Trung Quốc là tương đối xa so với

lợn rừng Việt Nam dựa trên các điểm đột biến tồn tại trong hệ gen ty thể của lợn

[70]. Trong nghiên cứu về đa hình mtDNA, Lan và Shi (1993) cho rằng tồn tại

khoảng cách tiến hóa tương đối xa giữa lợn Vân Nam ở Trung Quốc với lợn Việt

Nam, mặc dù khu vực Đông Nam Trung Quốc và Việt Nam có vị trí địa lý khá

gần [70]. Các giống lợn tại Việt Nam có mức độ đa dạng di truyền cao. Hầu hết

kiểu gen đơn bội của nhóm lợn nhỏ Việt Nam có mối liên hệ gần với các nhóm

lợn nhà Đông Á. Điều này chứng tỏ nhóm lợn nhỏ Việt Nam là lợn nhà và là cơ sở

đề hình thành hai giả thuyết giải thích cho quá trình thuần hóa lợn nhà Việt Nam:

một là chúng được thuần hóa ngay tại Việt Nam, hai là chúng được di cư từ khu

vực lân cận như miền Tây Nam Trung Quốc. Lợn Việt Nam bao gồm quần thể lợn

hoang và lợn nhà có thể có cùng tổ tiên với các nhóm lợn Đông Á. Hai công trình

nghiên cứu được tiến hành độc lập vào năm 2006 và 2014, đã sử dụng chỉ thị

microsatelite khẳng định nhánh các giống lợn Việt Nam khác biệt với các nhánh lợn

nhà Châu Âu, giống Meishan của Trung Quốc và lợn rừng Châu Á, cho rằng các

giống lợn Việt Nam đã trải qua quá trình thuần hóa trong thời gian lịch sử dài [71,

72]. Mối quan hệ di truyền của lợn Việt Nam ở vùng Tây Nguyên thông qua việc

phân tích trình tự Cytochrome b đã được thực hiện trong công trình nghiên cứu của

21

Lê Thành Long và cs (2014) [73]. Kết quả cho thấy, nhóm lợn rừng Việt Nam I tách

biệt di truyền với nhóm lợn rừng châu Á và có sự đa dạng di truyền cao trong các

giống lợn rừng và lợn nhà ở Tây Nguyên. Trong một số nghiên cứu trước đây, các

nhà khoa học trong nước chủ yếu tập trung nghiên cứu đánh giá, phân tích về quá

trình sinh trưởng và phát triển, tiêu tốn thức ăn, chỉ tiêu sinh lý và sinh hóa, khả

năng sinh sản ở lợn. Một số tác giả như Nguyễn Văn Thiện và cs (1995) có các

đánh giá trên lợn Ỉ và lợn Móng Cái [74]; Lê Viết Ly và cs (1999) đánh giá ở 2

giống lợn bản địa khác là Ba Xuyên và Thuộc Nhiêu [75]; Trần Văn Do và cs

(2005) nghiên cứu trên lợn Lang, lợn Móng Cái và lợn Vân Pa [76]; Trần Thanh

Vân và Đinh Thu Hà (2005) có các nghiên cứu trên lợn Mẹo [77].

Tính đến nay, những nghiên cứu về sinh học phân tử đối với các giống lợn

nội ở Việt Nam, phần lớn mới chỉ dừng ở mức kiểm tra sự biểu hiện của một số gen

liên quan đến tính trạng sinh trưởng, sinh sản và phòng chống bệnh. Lê Thị Thúy và

cs (2004) đã tiến hành nghiên cứu đa hình kiểu gen leptin liên quan trên một số

giống lợn nuôi tại Việt Nam [78]. Nghiên cứu phát hiện đa hình gen mã hóa

Mannan-Binding lectin serine protease 1 (MASP1) ở lợn do Đỗ Võ Anh Khoa và cs

tiến hành [79]. Trần Xuân Hoàn và cs (2013) đã xác định các chỉ thị phân tử trong

chọn lọc lợn giống thuần chủng đạt năng suất và chất lượng thịt cao, bao gồm 4 chỉ

thị phân tử DNA liên quan với tốc độ tăng trọng, 4 chỉ thị phân tử DNA liên quan

với chất lượng thịt, 4 chỉ thị phân tử DNA liên quan với số con sơ sinh sống của lợn

bố mẹ Yorkshire, Móng Cái và giải trình tự gen Mc4R của lợn Móng Cái nhưng

không phát hiện được sai khác đặc thù [80]. Kiểu gen halothan của lợn cũng được

xác định bằng phân tích DNA nhằm chọn lọc những cá thể có kiểu gen kháng stress

(CC và CT) do nhóm tác giả Đặng Vũ Bình và cs 2012 [81]. Nguyễn Thị Diệu Thúy

và cs (2004) đã xác định đa hình di truyền gen hormone sinh trưởng ở giống lợn

Móng Cái bằng phương pháp PCR-RFLP với mục đích ứng dụng các kết quả của di

truyền chất lượng vào công tác chọn tạo đàn giống lợn nội kinh tế phổ biến ở Miền

Bắc Việt Nam [82]. Nguyễn Thị Hoa (2013) sử dụng phương pháp PCR-RFLP để

phân tích đa hình một số gen liên quan đến chất lượng thịt lợn [83]. Cụ thể là xác

định các biến thể DNA của gen H-FABP và Lpin1 nhằm hỗ trợ công tác chọn giống.

Lê Thị Thu Phương (2003) cũng đã công bố kết quả trong nghiên cứu xác định tần

số kiểu gen và phân tích ảnh hưởng của kiểu gen halothan cũng như kiểu gen thụ

22

thể estrogen đến năng suất sinh sản của heo nái [84]. Nguyễn Văn Cường và cs

(2009) đã có các nghiên cứu phân tích đa hình DNA trong một số gen kháng bệnh ở

lợn nuôi Việt Nam và phát triển chỉ thị di truyền phân tử hỗ trợ chọn giống lợn kháng

bệnh [85].

Đối với các giống lợn bản địa Việt Nam, những nghiên cứu tổng thể về hệ

gen, đặc biệt là giải mã toàn bộ hệ gen ty thể của lợn nhằm xác định nguồn gốc,

đánh giá các đặc tính di truyền chưa được nhiều tác giả Việt Nam nghiên cứu. Đây

là một khía cạnh khoa học cần nghiên cứu sâu hơn, làm cơ sở nền tảng cho công tác

bảo tồn nguồn gen và chọn tạo giống lâu dài.

1.4.2.2. Đặc điểm ngoại hình một số giống lợn bản địa Việt Nam

Tại Việt Nam có các giống lợn bản địa đặc trưng đại diện cho mỗi vùng miền.

Theo định nghĩa về giống của FAO: “Một giống hoặc một nhóm giống trong loài có

đặc điểm bên ngoài có thể ghi nhận và phân biệt mà nó có thể cho phép tách biệt

bởi hình thức bên ngoài với các nhóm khác thì được gọi là một giống". Bên cạnh đó

cũng theo quy ước của FAO: "Các nhóm có ngoại hình giống nhau có thể được xem

là giống khác nhau nếu như xa nhau về địa lý" [5]. Trên cơ sở đó tính đến nay, các

giống lợn bản địa của Việt Nam được xác định có khoảng 26 giống, được nuôi chủ

yếu ở vùng nông thôn miền núi, vùng sâu, vùng xa. Danh sách các giống lợn bản

địa và đặc điểm phân bố được liệt kê ở bảng 1.3:

Bảng 1.3. Phân bố các giống lợn bản địa Việt Nam [5]

STT Tên giống Phân bố

Tỉnh Vùng

1. Lợn Táp Ná

Cao Bằng

Trung du miền núi phía Bắc

2. Lợn Hạ Lang

3. Lợn Hương

4. Lợn Lũng Pù Hà Giang

5. Lợn Hung

6. Lợn Mường Lay Điện Biên

7. Lợn Đen Mường Tè Lai Châu

8. Lợn Hung Sìn Hồ

9. Lợn Mường Khương Lào Cai

10. Lợn Lửng Phú Thọ

11. Lợn Lang Hồng* Bắc Giang

12. Lợn Bản Hòa Bình, Sơn La

23

13. Lợn Móng Cái Quảng Ninh

Đồng bằng Bắc bộ và Bắc Trung bộ

14. Lợn Ỉ Thanh Hóa

15. Lợn Mẹo Nghệ An

16. Lợn Khùa Quảng Bình

17. Lợn Vân Pa Quảng Trị

Trung và Nam Trung bộ

18. Lợn Cỏ A Lưới Thừa Thiên Huế

19. Lợn Cỏ Quảng Nam Quảng Nam

20. Lợn Kiềng Sắt Quảng Ngãi

21. Lợn Trắng Phú Khánh* Phú Yên, Khánh Hòa

22. Lợn Sóc Các tỉnh thuộc Tây Nguyên (Đắc Lắc) Tây Nguyên

23. Lợn Chư-Prông Gia Lai

24. Lợn Ba Xuyên Sóc Trăng Đồng bằng sông Cửu Long

25. Lợn Ô Lâm An Giang, Kiên Giang

26. Lợn Thuộc Nhiêu* Kiên Giang

Ghi chú: * Các giống hiện nay không còn tìm thấy con có đặc điểm ngoại hình đặc trưng.

Có thể thấy, các giống lợn bản địa Việt Nam được phân bố rải rác ở các tỉnh

vùng xa theo chiều dài đất nước, càng về các tỉnh miền xuôi thì sự đa dạng về đặc

điểm ngoại hình của các giống càng giảm [5].

Phân tích các đặc điểm ngoại hình thường dựa vào một số các chỉ tiêu, trong

đó có đặc điểm màu sắc lông da là một tính trạng chất lượng có ý nghĩa trong việc

chọn giống. Nhiều dấu hiệu màu sắc của lông da đặc trưng cho nòi giống. Mỗi một

giống vật nuôi có một màu sắc lông da đặc trưng, từ đó có thể dựa vào màu sắc bộ

lông mà phát hiện được sự lẫn gen hoặc nhầm lẫn khi xác định phả hệ, nguồn gốc

[5]. Qua nghiên cứu điều tra, các giống lợn bản địa có các đặc điểm ngoại hình đa

dạng. Hiện trạng của 6 giống lợn bản địa (lợn Ỉ, lợn Móng Cái, lợn Hương, lợn Hạ

Lang, lợn Mường Khương và lợn Mường Lay) như sau [5, 86]:

a. Giống lợn Ỉ

Giống lợn Ỉ hiện đang có nguy cơ cao tuyệt chủng do số lượng lợn sinh sản

còn quá ít, lợn bị suy thoái đồng huyết. Hiện nay chỉ còn sót lại ở một số xã của tỉnh

Thanh Hóa và Viện Chăn nuôi. Từ con số hai triệu con năm 1969, tới nay số lợn Ỉ

trên toàn quốc còn không được bao nhiêu, tại Viện Chăn Nuôi và tỉnh Thanh Hóa

cũng chỉ còn chưa đến 100 con giống.

24

b. Giống lợn Móng Cái

Giống lợn Móng Cái là giống lợn nội phổ biến nhất ở Việt Nam. Có nguồn

gốc ở vùng Móng Cái, Đầm Hà, Hà Cối, Đông Triều, tỉnh Quảng Ninh. Giống này

có tính ưu việt là mắn đẻ, tầm vóc lớn hơn lợn Ỉ, tăng trọng khá, số con đẻ ra/lứa

nhiều, do đó đã làm cho lợn Móng Cái phát triển nhanh chóng ra khắp các tỉnh đồng

bằng Sông Hồng, Trung Du và miền núi phía Bắc, miền Trung, Tây Nguyên và cả ở

miền Nam. Hiện nay do chăn nuôi lợn nhập nội theo hướng trang trại ngày càng

phát triển, nên số lượng lợn Móng Cái đang có xu hướng giảm.

c. Giống lợn Hạ Lang

Giống có nguồn gốc từ huyện Hạ Lang, tỉnh Cao Bằng, qua phỏng vấn người

chăn nuôi trực tiếp và tài liệu thu thập được, lợn Hạ Lang được du nhập từ Trung

Quốc từ hàng ngàn năm trước, thông qua giao lưu buôn bán giữa hai tỉnh giáp biên

giới Việt Nam - Trung Quốc. Hiện nay số lượng lợn nái Hạ Lang giảm đáng kể, tính

đến tháng 10/2012, tổng đàn nái Hạ Lang còn khoảng 500-1000 con.

d. Giống lợn Mường Lay (14 vú)

Là giống lợn được nuôi dưỡng lâu đời theo hình thức thả rông. Đến nay vẫn

chưa xác định chính xác giống lợn Mường Lay có nguồn gốc từ đâu. Giống lợn này

có đặc điểm chịu đựng tốt với điều kiện hoàn cảnh nông hộ nghèo, không đòi hỏi

thức ăn dinh dưỡng cao, ít bệnh tật, khả năng đẻ con tốt và thịt thơm ngon. Lợn

Mường Lay 14 vú đã được Viện Chăn Nuôi đề nghị nhà nước đưa vào danh sách

bảo tồn.

e. Giống lợn Mường Khương

Là giống lợn địa phương, có từ lâu đời được các dân tộc ít người nuôi trên

vùng núi cao hiểm trở của huyện Mường Khương, tỉnh Lào Cai. Đây là giống dễ

nuôi vì phàm ăn, chịu dịch bệnh tốt, thịt thơm ngon, nhiều nạc. Lợn Mường

Khương hiện có khoảng trên 1000 con sống chủ yếu tại vùng núi cao, hiểm trở.

f. Giống lợn Hương

Lợn Hương là giống lợn được nuôi phổ biến ở các huyện biên giới Việt

Nam - Trung Quốc thuộc tỉnh Cao Bằng gồm Bảo Lạc, Bảo Lâm, Hạ Lang… Đây

là một nguồn gen quý, được bảo tồn ở Việt Nam từ năm 2008 và ngày càng phát

triển về số lượng ở Cao Bằng. So với các giống lợn bản địa khác, thịt lợn Hương có

mùi thơm đặc trưng riêng nên được người dân địa phương gọi là “lợn Hương” từ xưa [5].

25

Chương 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1. Đối tượng và địa điểm nghiên cứu

2.1.1. Đối tượng:

Các cá thể lợn được lựa chọn ngẫu nhiên trong các đàn lợn, thuộc 6 giống

lợn bản địa Việt Nam (Ỉ, Móng Cái, Mường Khương, Mường Lay, Hương và Hạ

Lang). Riêng đối với quần thể lợn Ỉ thu tại tỉnh Thanh Hóa, do không còn tìm thấy

cá thể nào mang đặc điểm tương ứng của nhóm lợn Ỉ Mỡ nên toàn bộ cá thể khảo

sát và thu mẫu thuộc nhóm lợn Ỉ Pha. Đối tượng nghiên cứu được chọn lựa dựa trên

điều tra khảo sát các đặc điểm ngoại hình đặc trưng, thông tin về phả hệ, địa lý phân

bố của Viện Chăn nuôi Quốc gia và Trung tâm Giống vật nuôi - Sở Nông nghiệp và

phát triển nông thôn tại một số địa phương: Điện Biên, Lào Cai, Cao Bằng, Hải

Phòng và Thanh Hóa.

2.1.2. Địa điểm:

- Khảo sát, phân tích các chỉ tiêu về ngoại hình của 6 giống lợn nghiên cứu

được nuôi tại các hộ dân, triển khai nuôi nhân thuần tại một số địa phương sau :

+ Lợn Ỉ - tại tỉnh Thanh Hóa: thành phố Thanh Hóa (xã Hoằng Long);

huyện Hoằng Hóa (xã Hoằng Đức); huyện Thiệu Hóa; huyện Yên Định; thị xã Bỉm

Sơn; huyện Đông Sơn.

+ Lợn Móng Cái - tại thành phố Hải Phòng: Trung tâm Giống Tràng Duệ

thuộc Công ty Cổ phần Đầu tư và Phát triển Nông nghiệp, huyện An Dương.

+ Lợn Mường Lay - tại tỉnh Điện Biên: Thị xã Mường Lay (phường La

Nay, phường Sông Đà, Xã Lay Nưa).

+ Lợn Hương và lợn Hạ Lang - tại tỉnh Cao Bằng: Trung tâm giống cây

trồng, vật nuôi, thủy sản Cao Bằng, xã Bạch Đằng, huyện Hoà An.

+ Lợn Mường Khương - tại tỉnh Lào Cai: huyện Mường Khương, xã Tả

Gia Khâu (thôn Lao Chải, thôn Sảng Chải, thôn Sín Pao Chải).

Ngoại hình các cá thể từ 6 giống lợn bản địa và địa điểm thu mẫu được trình

bày ở hình 2.1 và 2.2.

26

Hình 2.1. Bản đồ địa điểm thu mẫu

Hình 2.1. Bản đồ địa điểm thu mẫu

LÀO

TRUNG QUỐC

Móng Cái

Ỉ

Mường Lay

Mường Khương

Hạ Lang

Hương

Lợn Mường Lay Lợn Ỉ

Lợn Móng Cái Lợn Hương

27

Hình 2.2. Sáu giống lợn bản địa Việt Nam được sử dụng trong nghiên cứu

Trình tự hệ gen ty thể của các giống lợn Châu Âu, Châu Á được tải từ GenBank

(NCBI) cùng với các mã số truy cập được xếp vào 6 khu vực địa lý chính: Đông Bắc

Á, Khu vực Mekong, Lưu vực sông Hoàng Hà, Nam Trung Quốc, Lưu vực sông

Dương Tử và các quốc gia Châu Âu được thể hiện ở bảng 2.1.

Bảng 2.1. Mã số truy cập dữ liệu trình tự hệ gen ty thể của các giống lợn Âu Á và

phân bố địa lý được sử dụng trong nghiên cứu

Khu vực địa lý Các giống lợn Mã số truy cập

GenBank (NCBI) Tên Tiếng Việt Tên Tiếng Anh

Đông Bắc Á

Lợn rừng Hàn Quốc WB-Korea AY574047.1

Lợn rừng Đông Bắc

Trung Quốc

WB-China

northeast EU333163.1

Khu vực Mê Kông

Lợn rừng Việt Nam WB -Vietnam EF545584.1

Ban-na mi-ni Banna mini GQ220328.1

Lợn Đa-hê Dahe GQ220329.1

Lợn rừng Malaysia WB-Malaysia EF545592.1

Lợn rừng Vân Nam WB-Yunnan EF545573.1

Nam Trung Quốc

Lợn rừng Phúc Kiến WB-Fujian EF545569.1

Lợn rừng Hải Nam WB-Hainan EF545572.1

Lang-tan Lantang KC250274

Lợn La-ny-u Lanyu DQ518915.2

Lưu vực sông

Dương Tử

A-ba Aba EF545578.1

Lợn rừng Jiangxi WB- Jiangxi EF545579.1

Lợn Kim Hoa Jinhua KC469586

Lợn Xi-ang Xiangg KC250273

Lợn Hạ Lang Lợn Mường Khương

28

Khu vực địa lý Các giống lợn Mã số truy cập

GenBank (NCBI) Tên Tiếng Việt Tên Tiếng Anh

Lợn Bi-hu Bihu EF545591.1

Wei Wei EF545577.1

Lưu vực sông

Hoàng Hà

Ba-mây Bamei EF545583.1

Hu-du Huzu EF545588.1

Các nước Châu Âu

Béc-sai Berkshire AY574045.1

Đu - rốc (Heo bò) Duroc AY337045.1

Lợn đen I-bê-ria Iberian FJ236994.1

Ham-p-shơ Hampshire AY574046.1

Đại Bạch Large-white KC250275

Lan-đờ-rát Landrace AF034253.1

Pi-ê-tờ-ranh Pietrain KC469587

Lợn rừng Châu Âu WB-European FJ237000.1

- Các thí nghiệm về sinh học phân tử được tiến hành tại Phòng thí nghiệm của

Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

2.2. Hóa chất và thiết bị

2.2.1. Hóa chất

Các hóa chất được sử dụng trong thí nghiệm đều ở dạng tinh khiết, các bộ kít

thương mại. Hóa chất để tách DNA tổng số và kiểm tra sản phẩm sau tách chiết:

phenol - chloroform - isoamyl alcohol (tỷ lệ: 25: 24: 1), EDTA, proteinase K,

Rnase, agarose, ethidium bromide, ... của các hãng Sigma, Invitrogen, Merk; thang

chuẩn DNA của hãng Thermo Fisher (Mỹ).

Các bộ kít được sử dụng trong nghiên cứu gồm: Phản ứng PCR được tiến

hành sử dụng bộ kít GoTaq® Green Master Mix (hãng Promega - Mỹ), bộ kít tinh

sạch sản phẩm PCR QIAquick® PCR Purification Kit (hãng Qiagen - Mỹ), bộ kít

giải trình tự nucleotide (Bigdye® 3.1 terminator) của hãng Thermo Fisher - Mỹ.

Ba mươi cặp mồi được sử dụng để khuếch đại trình tự các phân đoạn

mtDNA được thể hiện tại bảng 2.2. Mồi được kế thừa và hiệu chỉnh dựa trên trình

tự 30 cặp mồi công bố bởi Yu và cs (2013) [63].

29

Bảng 2.2. Các cặp mồi được sử dụng cho PCR và vị trí các phân đoạn được khuếch đại

TT Trình tự mồi (5’-3’) Ta

(oC) Vị trí

Mồi xuôi Mồi ngược

D-loop AGGAGACTAACTCCGCCAT GCGGATACTTGCATGTGT 54 16556-1306

1 ACTAAGTCAATGCCTATTCTG CAAATGTATGAAACCTCAG 54 16298-548

2 CTACACAATAACCTCCCATA TGGCACGAGATTTACCAACT 54 1107-1490

3 GCTCATAACGCCTTGCTC ATTCTTTCATCTTTCCCTT 54 1377-2415

4 CACAACCATGCAAGAAGAGACA ACAACCAGCTATCACCAGGC 54 2141-2634

5 CCGTAAGGGAAAGATGAAAG TATGGTTATTTTGACTGGT 54 2393-3493

6 CCGTGCAAAGGTAGCATA CCAACATCGAGGTCGTAA 55 3189-3606

7 TGGGGTGACCTCGGAGTAC AATATGGCGAAAGGTCCGG 54 3423-4589

8 CGAGCAGTAGCCCAAACA GGTCGTATCGGAATCGTG 55 4321-4771

9 GTATCAGGCTTTAACGTAGA TGGTAATACTGCTGTCATTC 55 4543-5671

10 CACAGAAGCAGCCACAAA ATGGGATAGGGATAAAGT 55 5242-5782

11 ACATAGGATGAATGACAGC TGGTGGAAGTAGTCAGAAAC 55 5643-6831

12 GCACTGCCTTGAGCCTAC GTGTTCAGGTTGCGGTCT 55 6599-7160

13 CCCATTATGATTGGGGGTTT TGCTGTGTATGCGTCAGGAT 55 6724-7857

14 CACTTTGTAATCATATTCGTAG TAGTTGGAAAGGGTAAGC 53 7747-8223

15 TTCATCTCACTAACAGCAG TTGAGTTCGGTTGATTCTG 55 7885-9086

16 GCTTCATGCCCATTGTAC TTATAGCGGAATCCTGTG 55 8816-9478

17 GCAAGCCCAGAATCAACCG CGAGGAGGATTGAGGTGTT 55 9061-10214

18 ATACCACATAGTAAACCCAA CCTGTAGCCACAAAGAAA 55 9820-10404

19 CTAAACACCTCAATCCTCC TTGGACGTAATCGGTACCG 55 10193-11341

20 CCTTGCAGGGTTACTTAT TTCGGGTTGTGGTTTCTT 53 11113-11632

21 CGGTACCGATTACGTCCAA CCGATTAGATTGATGGATG 55 11323-12488

22 ACCAGCTCTATCTGCTTA GAGGCTTTGATGTTGTTA 55 12172-12644

23 ATGATGACTAATAGCAAGCC GGGATGTAGTCCGAATTG 55 12429-13627

24 CATCGGAGACATTGGATT AGTTGGCTTGAAGTTGAG 55 13462-13863

25 CCTACTCCTAGCTGCAGCAG ATTATGGAGATTACTCGTGG 55 13579-14765

26 TCCGCATCATCATTACTA TTTATGGTGGACTTGGGT 55 14576-15187

27 TAATTACCACGAGTAATCTC TTCTACGAGGTCTGTTCCG 55 14740-15827

28 GGAGCATCCATATTCTTT GGTGTAGTTGTCTGGGTCT 53 15597-16112

29 TCGTAGAATGAATCTGAGG GGTGATACGCATGTTGACTG 55 15820-301

30

Trình tự nucleotide hoàn chỉnh hệ gen ty thể của lợn (S. scrofa) với mã số

truy cập GenBank: NC000845.1 được sử dụng làm trình tự tham khảo, để thiết kế,

hiệu chỉnh các cặp mồi và thực hiện các phép dóng hàng trình tự.

2.2.2. Thiết bị

Thiết bị lấy mẫu và bảo quản mẫu máu: Phích lạnh, đá khô, quần áo bảo hộ,

khẩu trang, găng tay, ủng, giấy tờ ghi chép. Dụng cụ lấy mẫu đều được tiệt trùng.

Ống đựng mẫu máu có bổ sung chất chống đông (EDTA).

Các thiết bị thí nghiệm được sử dụng trong nghiên cứu bao gồm: Máy giải

trình tự ABI 3500 Genetic Analyzer, Máy luân nhiệt GeneAmp® PCR System 9700

(Thermo Fisher, Mỹ). Tủ lạnh sâu (Sanyo, Nhật), máy soi DNA Mini -

transllumminator (hãng Biorad, Mỹ), máy voltex (Minishaker, IKA, Đức), máy ly

tâm Eppendorf, máy định lượng DNA Nanodrop Spectrophotomer (Thermo Fisher,

Mỹ), pipetman các loại (Gilson, Pháp),...

2.3. Phương pháp nghiên cứu

Các thí nghiệm, tiến trình nghiên cứu được tiến hành theo sơ đồ tổng quát

mô tả ở hình 2.3.

Hình 2.3. Sơ đồ tổng quát các bước nghiên cứu

Thu mẫu, tách chiết DNA

Khuếch đại, giải trình tự

Dóng hàng đa trình tự, xác

định mô hình tiến hóa

Phân tích tương đồng, đa

hình trình tự

Xây dựng cây phát sinh

chủng loại

Khảo sát điều tra các giống

lợn

Đánh giá cây và phân tích

phát sinh chủng loại

Lắp ráp, phân tích, chú giải

hệ gen

31

2.3.1. Phương pháp điều tra dựa trên đặc điểm ngoại hình lợn

Ngoại hình của các cá thể giới tính cái thuộc 6 giống lợn bản địa: Ỉ, Móng

Cái, Hương, Hạ Lang, Mường Khương và Mường Lay được đánh giá thông qua

quan sát bên ngoài con vật bởi các nhóm chỉ tiêu màu sắc lông, da và nhóm chỉ tiêu

đánh giá về hình dạng, đặc điểm của các bộ phận trên cơ thể lợn, đo đạc các chỉ tiêu

về tầm vóc, khối lượng.

Các giống lợn nghiên cứu được nuôi trong các trại giống và hộ nông dân có

điều kiện chăn nuôi cơ bản tương đồng nhau, toàn bộ các giống lợn được nuôi nhốt

hoàn toàn trong chuồng xây, nền xi măng, mái lợp phi-brô xi măng. Lợn được ăn

với tiêu chuẩn dinh dưỡng tương đương nhau ở các điểm thu mẫu.

Tiến hành phỏng vấn các hộ chăn nuôi theo các câu hỏi đã đặt sẵn trên cơ sở

tìm hiểu trước về thông tin từ trại giống, các hộ chăn nuôi, thông tin về phả hệ của

Viện Chăn nuôi Quốc gia và Trung tâm giống vật nuôi - Sở Nông nghiệp và phát

triển nông thôn tại một số địa phương.

Lập phiếu điều tra, ghi chép số liệu và dùng máy chụp ảnh ghi lại hình ảnh

các giống lợn bản địa đang nuôi của từng hộ, ̣trại giống cu ̣thể. Đánh giá sơ bô ̣về

nguồn gốc, chất lượng từng giống lợn đang nuôi.

Đối với việc khảo sát nhóm chỉ tiêu về kích thước, lợn được cố định bằng

dây thừng và đo các chỉ số: dài thân, vòng ngực và cao vai bằng thước dây theo đơn

vị cm.

- Cao vai: Đo khoảng cách từ mặt đất đến u vai (đo bằng thước gậy, thước

dây).

- Dài thân: Đo khoảng cách từ điểm nối hai tai đến khâu đuôi theo chiều cong

của lưng (thước dây).

- Vòng ngực: đo chu vi lồng ngực sau bả vai (thước dây).

- Khối lượng: sử dụng cân bàn.

Tiêu chí đánh giá là dựa vào đặc điểm ngoại hình đã được nghiên cứu và

công bố (theo Át lát Các giống vật nuôi ở Việt Nam và Chuyên khảo Bảo tồn và

khai thác nguồn gen vật Nuôi Việt Nam - Phụ lục 1) [5, 86].

32

Phương pháp thu mẫu máu

Phương pháp lấy mẫu máu lợn vô trùng, có chất chống đông theo Quy chuẩn

kỹ thuật quốc gia về bệnh động vật - Yêu cầu chung lấy mẫu bệnh phẩm, bảo quản

và vận chuyển (QCVN 01 - 83: 2011/BNNPTNT) [87]. Cụ thể như sau:

- Lấy 5 ml máu ở vị trí tĩnh mạch cổ, động mạch đuôi, tĩnh mạch tai.

- Trước khi lấy máu vị trí lấy sẽ được sát trùng bằng bông cồn ethanol 70%

rồi dùng bơm kim tiêm vô trùng lấy từ 3 ml đến 5 ml máu. Máu lấy ra được chứa

trong bơm tiêm, rồi chuyển nhẹ nhàng mẫu vào ống đựng máu có chứa chất chống

đông. Đảo nhẹ ống đựng mẫu để chất chống đông được trộn đều với máu, tránh lắc

mạnh các thành phần trong máu sẽ bị vỡ làm máu có màu đỏ đậm.

- Ghi ký hiệu mẫu trên ống nghiệm, dùng giấy parafin quấn chặt nắp ống

tránh mẫu bị đổ ra ngoài trong quá trình vận chuyển.

- Bảo quản mẫu ở điều kiện 10oC trong quá trình chuyển mẫu về phòng thí

nghiệm. Tại phòng thí nghiệm các mẫu máu sẽ được chuyển vào bảo quản ở tủ -

200C, cho đến khi tiến hành các thí nghiệm sinh học phân tử tiếp theo.

2.3.2. Phương pháp tách chiết DNA tổng số

DNA được chiết tách theo phương pháp mô tả bởi Sambrook và cs [88]:

- Ủ tan máu ở 370C/15 phút

- Bổ sung 1000 µl PBS; votex đều; đặt trong đá 30 phút; ly tâm ở 10000

rpm/10 phút/40C, loại bỏ pha trên.

- Bổ sung 1000 µl PBS hòa tan lớp dưới trong ống eppendorf; ly tâm ở 6000

rpm/10 phút/40C - Lặp lại bước 3 đến khi hồng cầu bị dung giải hết.

- Bổ sung 900 µl dung dịch Lysis Buffer; trộn đều bằng pipet; ủ ở 370C trong 1 giờ.

- Bổ sung 20 µl Proteinase K (2,5mg/ml) vào dung dịch; trộn đều; ủ ở 650C/2 giờ.

- Thêm 450 µl P:C:I (25:24:1) vào các ống eppendorf; trộn đều; ly tâm ở

12000 rpm/15 phút/40C. Thu pha trên.

- Thêm 450 µl P:C:I (25:24:1) vào các ống eppendorf; trộn đều; ly tâm ở

12000 rpm/15 phút/40C. Thu pha trên.

- Bổ sung 1000 µl EtOH 100% + 50 µl CH3COONa 3M, pH 5,2 vào ống

eppendorf; trộn đều.

- Ly tâm 12000 rpm/15 phút/40C

- Hòa tan cặn trong 1000 µl EtOH 10%; ly tâm ở 12000rpm/10 phút/4oC.

33

- Để khô DNA tự nhiên (hoặc sử dụng máy làm khô Speedvac). Hòa tan

DNA trong 100µl dH2O.

DNA tổng số tách chiết được sau đó được pha loãng về nồng độ 20 ng/ml.

Chất lượng và nồng độ DNA tổng số được kiểm tra bằng máy đo quang phổ

Nanodrop (Thermo Fisher, Mỹ) và điện di trên gel agarose 1 %, nhuộm ethidium

bromide.

2.3.3. Khuếch đại mtDNA

Kĩ thuật PCR sử dụng DNA polymerase chịu nhiệt để tổng hợp (in vitro) các

đoạn DNA từ mạch khuôn trong môi trường có các dNTPs và cặp mồi đặc hiệu.

Toàn bộ phân đoạn mtDNA được khuếch đại bằng phản ứng PCR sử dụng 30 cặp

mồi (bảng 2.2). Các đoạn DNA mới được tạo thành lại được sử dụng làm khuôn.

Sau nhiều chu kỳ, số đoạn DNA khuôn được nhân lên gấp bội, nhờ vậy đủ nguyên

liệu để phục vụ cho các nghiên cứu tiếp theo.

Tổng thể tích PCR sử dụng bộ kít GoTaq® Green Master Mix (hãng Promega,

Madison, WI, USA), với tổng thể tích 25 µl cho mỗi phản ứng khuếch đại theo tỷ lệ

khuyến cáo của nhà sản xuất, thành phần phản ứng được liệt kê tại bảng 2.3:

Bảng 2.3. Thành phần phản ứng PCR

Thành phần Thể tích Nồng độ cuối

GoTaq® Green Master Mix 2X 12,5 µl 1X

Mồi xuôi 0,25-2,5 µl 0,1-1,0 µM

Mồi ngược 0,25-2,5 µl 0,1-1,0 µM

DNA khuôn 1-5 µl <250 ng

ddH2O (thêm tới đủ thể tích) 25 µl

- Phản ứng PCR được tiến hành với chu trình nhiệt: 95oC trong 7 phút, 25

chu kì (95oC, 30 giây; 50-65oC tùy theo mồi, 30 giây; 72oC, 15 giây); 72oC, 7 phút

và cuối cùng giữ ở 4oC.

- Kiểm tra sản phẩm PCR bằng cách điện di trên agarose 1%.

- Tinh sạch sản phẩm PCR bằng kit QIAquick PCR Purification Kit

(Qiagen).

2.3.4. Xác định trình tự hệ gen ty thể

Các cá thể thuộc 6 giống lợn bản địa Việt Nam sau khi được sàng lọc có

34

các đặc điểm ngoại hình đặc trưng của giống sẽ được lựa chọn mỗi giống một cá

thể đem đi giải trình tự hệ gen ty thể. Giải trình tự hệ gen ty thể bằng phương

pháp giải trình tự phân đoạn (shotgun) theo nguyên lý của Sanger [89]. DNA

polymerase xúc tác gắn các deoxynucleotide vào mạch đơn DNA đang tổng hợp

vào đầu 3'-OH, khi gặp dideoxynucleotide đánh dấu huỳnh quang không có

nhóm 3'-OH, phản ứng tổng hợp sẽ dừng lại. Nồng độ của mỗi

dideoxynucleotide được xác định thận trọng để đảm bảo sự gắn hỗn hợp các

chuỗi đang tổng hợp tại mỗi vị trí có thể và không gắn ở vị trí đầu tiên của

nucleotide bổ trợ của khuôn. Kết quả là hỗn hợp sản phẩm sau phản ứng bao gồm

các polynucleotide có kích thước hơn kém nhau một nucleotide.

Quy trình được tiến hành trên máy ABI - 3500 (Thermo Fisher) theo khuyến

cáo của nhà sản xuất:

- Chuẩn bị thành phần phản ứng được trình bày tại bảng 2.4:

Bảng 2.4. Thành phần phản ứng giải trình tự

Thành phần Lượng

BigDye® Terminator v3.1 4 l

BigDye® Sequencing Buffer 2 l

Mồi 3,2 pmol

Khuôn 5-20 ng

Nước Thêm tới 20 l

- Chạy phản ứng với chu trình nhiệt: 96oC trong 1 phút, 25 chu kì (96oC,

10 giây; 50oC, 5 giây; 60oC, 4 phút); sau đó giữ ở 4oC.

- Tinh sạch sản phẩm

+ Bổ sung 5 l EDTA 125 mM.

+ Bổ sung 60 l ethanol 100%.

+ Trộn đều, ủ 15 phút ở nhiệt độ phòng.

+ Ly tâm 12000 vòng/phút trong 15 phút tại 4oC.

+ Loại bỏ phần dịch.

+ Bổ sung 60 l ethanol 70%.

+ Ly tâm 12000 vòng/phút trong 5 phút tại 4oC.

35

+ Loại bỏ phần dịch.

+ Làm khô và bảo quản ở 4oC

- Biến tính

+ Bổ sung 20 l Hi-DiTM.

- Trộn đều.

+ Biến tính ở 95oC trong 5 phút.

- Điện di mao quản

+ Chuyển mẫu sang plate.

+ Đặt chương trình cho máy đọc trình tự.

- Xử lí thô kết quả

2.3.5. Nhóm phương pháp lắp ráp, dóng hàng trình tự, dự đoán và chú giải

hệ gen

2.3.5.1. Lắp ráp hệ gen

Các bước lắp ráp hệ gen ty thể được tóm tắt ở hình 2.4.

Hình 2.4. Các bước lắp ráp hệ gen ty thể

- Lắp ráp (phần mềm EditSeq và DNADragon)

- Lưu dưới dạng đuôi .fasta

Dữ liệu thô (tệp tin định dạng .ab1)

- Đánh giá, chỉnh sửa trình tự (phần mềm Bioedit)

- Lưu dưới dạng đuôi .fasta

Dữ liệu đã được tinh sạch

Các contigs

- Ghép nối các contigs (phần mềm DNA Dragon) - Lưu dưới dạng đuôi .fasta

Trình tự hoàn chỉnh hệ gen (dạng fasta)

36

Dữ liệu trình tự đọc được từ hệ thống giải trình tự ABI3500 được kết xuất

tệp tin với định dạng ".ab1" bao gồm hai loại thông tin: trình tự nucleic acid và

cường độ của tín hiệu mà hệ thống ghi nhận được. Dữ liệu sau đó sẽ được đánh giá

và chỉnh sửa trên phần mềm BioEdit v7.2.5. Thông qua độ mạnh yếu của tín hiệu

thu được, chúng tôi có thể xác định một cách tương đối chất lượng của đoạn trình tự

đã đọc được. Từ đó, tiến hành cắt bỏ đoạn trình tự có chất lượng thấp, nhằm làm

tăng độ tin cậy cho đoạn trình tự thu được để tạo ra các contig.

Các đoạn contig thu được từ quá trình cắt gọt sẽ được ghép nối lại dựa trên

phần trình tự gối lên nhau ở hai đầu mỗi đoạn. Công cụ được sử dụng để nhận diện

và ghép nối các phần trùng nhau của trình tự vùng D-loop và vùng mã hóa là

phần mềm DNA Dragon v1.6.0 (SequentiX, Đức, http://www.dna-dragon.com/) và

phần mềm EditSeq (DNASTAR Inc., Madison, WI, Mỹ) [90].

Như vậy, trình tự các phân đoạn tương ứng với 30 cặp mồi sau khi dóng hàng

sẽ được ghép nối để tạo ra trình tự hoàn chỉnh liền mạch khép vòng của hệ gen ty thể.

Trình tự cuối cùng thu được chính là trình tự hoàn chỉnh của hệ gen ty thể. Trình tự

này được lưu dưới định dạng .fasta phù hợp với các phần mềm phân tích sau đó.

2.3.5.2. Dóng hàng đa trình tự

Trước khi tiến hành dóng hàng đa trình tự, các trình tự vùng D-loop và trình tự

vùng mã hóa của hệ gen ty thể vừa lắp ráp sẽ được tách riêng bằng cách sử dụng trình

tự D-loop tham chiếu được tải về từ Genbank - NCBI. Các đoạn trình tự lặp ngắn trước

sau: 5' -CGTGCGTACA-3' được xác định số lượng đơn vị lặp và loại bỏ khỏi dữ liệu

phân tích. Số lượng đoạn lặp này ở nghiên cứu đã công bố trước đây [91] khi so sánh

giữa các cá thể là khá đa dạng, chứng tỏ có một tỷ lệ heteroplasmy cao, do đó các đoạn

trình tự này không có ý nghĩa trong nghiên cứu phát sinh chủng loại.

Trình tự D-loop và trình tự hoàn chỉnh của toàn bộ hệ gen ty thể của 6 giống

lợn bản địa Việt Nam, cùng với các giống lợn Châu Âu và giống lợn Châu Á được

dóng hàng đa trình tự, sử dụng thuật toán MUSCLE trong phần mềm MEGA7

(http://www.megasoftware.net/) nhằm xác định các vị trí tương đồng [92, 93]. Khi

có tệp tin dữ liệu đầu ra của phép dóng hàng đa trình tự, sẽ là nguồn dữ liệu

đầu vào để xác định mô hình tiến hóa thích hợp nhất bằng phần mềm MEGA7

[93]. Dựa trên trình tự đã bắt cặp, các mô hình tiền nghiệm ban đầu phù hợp nhất

cho trình tự bắt cặp vùng D-loop và toàn bộ hệ gen cũng được xác định.

37

2.3.5.3. Phân tích, chú giải hệ gen

Công cụ Mitos là một webserver dùng để chú giải tự động hệ gen ty thể của các

sinh vật đa bào. Mitos còn cho phép chú giải các protein và các RNA không mã hóa.

Phân tích và chú giải hệ gen của các giống lợn bản địa Việt Nam bằng công cụ trực

tuyến Dogma và Mitos Web Server [94, 95]. Tất cả các chú giải được kiểm tra bằng

công cụ BLAST trên GenBank [96, 97]. Toàn bộ 22 gen tRNA được dự đoán cấu trúc

bậc hai sử dụng công cụ trực tuyến MITOS Web Server.

Hai công cụ phân tích trực tuyến song song là Mitos (http://Mitos.bioinf.uni-

leipzig.de) và Dogma (https://dogma.ccbb.utexas.edu/) [98] dựa trên ngân hàng dữ

liệu có sẵn giúp tìm ra các vùng gen có sự tương đồng, từ đó dự đoán vị trí của các

gen này trên trình tự.

- Mitos:

Quá trình phân tích diễn ra theo các bước sau: tìm kiếm các vùng mã hóa cho

protein thông qua công cụ Blastx hệ gen ty thể lên NCBI RefSeq, bước phân tích sau

đó sẽ xác định bộ ba khởi đầu và kết thúc, các đoạn lặp, các vùng tương đồng và các

đoạn trình tự tham chiếu tìm được.

Các bước phân tích được tiến hành như sau:

+ Đầu tiên, tìm kiếm các vùng mã hóa cho protein thông qua công cụ Blastx

hệ gen ty thể lên NCBI RefSeq.

+ Tiếp theo, các gen ứng viên mã hóa protein được tìm thấy qua việc phát

hiện sự tương đồng trong kết quả của tìm kiếm Blastx đối với các trình tự amino

acid của các protein được chú giải của hệ gen ty thể của các sinh vật đa bào được

tìm thấy trong NCBI RefSeq.

+ Sau đó là bước phát hiện các codon khởi đầu và kết thúc, các bản sao và

các tương đồng thuộc cùng một bản sao, ví dụ: thay đổi khung hoặc ghép nối.

+ Các tRNA được chú giải sử dụng MITFI, tức là các mô hình hiệp phương sai

dựa trên cấu trúc mới được mô tả bởi Jühling [99]. Phương pháp này được chứng minh

là có độ nhạy chưa từng có (độ chính xác vượt trội hơn các công cụ ARWEN và

tRNAscan-SE).

+ Chú thích rRNA được thực hiện bằng cách sử dụng các mô hình hiệp

phương sai dựa trên cấu trúc đã được phát triển tương tự như các mô hình

tRNA. Dự đoán cấu trúc được cải thiện thông qua dự đoán đầu 5 'và 3' của rRNA.

38

+ Bước cuối cùng, phân tích kết quả, so sánh sự không đồng nhất và kết xuất

dữ liệu.

- Dogma

Dogma (Dual Organellar Genome Annotator) là công cụ dựa trên nền tảng

web sử dụng để chú giải hệ gen ty thể ở động vật và lạp thể ở thực vật được phát

triển bởi Stacia Wyman từ năm 2004 [98]. Công cụ cho phép sử dụng công cụ tìm

kiếm BLAST đối với một cơ sở dữ liệu tùy ý và sự bắt cặp các base trong cấu trúc

bậc hai của các gen tRNA của hệ gen ty thể động vật nhằm mục đích nhận dạng và

chú giải gen [98]. Dogma cũng cho phép người dùng trích xuất các trình tự phụ của

hệ gen (bao gồm các vùng không mã hóa giữa các gen (intergenic regions), intron,

trình tự amino acid của gen mã hóa protein, ...) cho các phân tích tiếp theo.

Tệp tin đầu vào bao gồm trình tự hoàn chỉnh của các nucleotide được chuẩn bị ở

dạng FASTA. Dữ liệu hệ gen đưa vào dưới dạng một contig, trình tự bao gồm 4 loại

nucleotide A, T, G, C ở dạng kí tự viết in hoa. Với các gen mã hóa protein, hệ gen được

dịch mã trong tất cả 6 khung đọc và được truy vấn với dữ liệu trình tự amino acid sử

dụng BLAST [100]. RNA ribosome (rRNAs) và RNA vận chuyển (tRNAs) được truy

vấn với một cơ sở dữ liệu trình tự nucleotide. Bởi việc xác định vị trí các gen bằng sự

tương đồng trình tự với các gen ở các hệ gen khác và bởi kết quả BLAST không cho

biết vị trí chính xác của bộ ba khởi đầu, bộ ba kết thúc của các gen mã hóa protein, nên

tác giả phải tự xác định, lựa chọn vị trí của bộ ba khởi đầu và bộ ba kết thúc, vị trí khởi

đầu và kết thúc của mỗi tRNA và rRNA cũng cần được xác định.

2.3.6. Phân tích trình tự và phương pháp xác định mức độ tương đồng trình tự

Với trình tự thu được, chúng tôi tiến hành phân tích các chỉ số cơ bản về tỷ lệ

bất đối xứng của các loại nucleotide như phần trăm của các loại nucleotide sử dụng

phần mềm DAMBE v6.3.17 (http://dambe.bio.uottawa.ca/), cùng với đó là hai chỉ

số độ lệch: GC skew và AT skew được tính toán dựa theo công thức sau [101]:

Các đoạn lặp ngắn trước sau 5'-CGTGCGTACA-3' được xác định số đợn vị

lặp và loại bỏ khỏi dữ liệu phân tích. Các vị trí đa hình, vị trí SNP trên trình tự vùng

39

D-loop và trình tự vùng mã hóa của hệ ge ty thể của các giống lợn cũng được xác

định nhờ sử dụng phần mềm DnaSP v.6 và SeqMan v.7.1.0 (DNASTAR Inc.,

Madison, WI, Mỹ) [102].

2.3.7. Phương pháp xây dựng cây và phân tích chủng loại phát sinh

2.3.7.1. Ước lượng khoảng cách tiến hóa

Khoảng cách tiến hóa có thể ước lượng thông qua tính toán khoảng cánh cặp

trình tự - khoảng cách p (pairwise distance, p-distance), khoảng cách p là thước đo

sự khác biệt di truyền giữa các loài hoặc giữa các quần thể trong một loài. Khoảng

cách p giữa các cặp trình tự được tính toán sử dụng thuật toán hai thông số của

Kimura trong phần mềm MEGA [93]. Khoảng cách này là tỷ lệ (p) của các vị trí

nucleotide mà tại đó hai trình tự được so sánh là khác nhau. Nó được xác định bằng

cách chia số nucleotide khác nhau cho tổng số nucleotide được so sánh [103].

2.3.7.2. Phân tích phát sinh chủng loại

Trình tự của vùng Dloop và trình tự hoàn chỉnh của hệ gen ty thể được sử

dụng riêng biệt làm dữ liệu đầu vào để dựng cây phát sinh chủng loại. Cây được vẽ

theo tỷ lệ với chiều dài nhánh được đo bằng số lượng thay đổi trên mỗi vị trí,

dựa trên phương pháp suy luận Bayes. Phương pháp suy luận Bayes được phát

triển bởi John Huelsenbeck và Fredrik Ronquist [45], suy luận dựa trên việc xác

lập một phương pháp phân tích Bayes và các phương pháp mô hình hóa để phân

tích phát sinh chủng loại. Phương pháp này lượng giá một phân bố xác suất tiên

nghiệm, là khả năng mà một cây tạo ra thỏa mãn dữ liệu quan sát.

Suy luận Bayes thực chất là việc tính toán khả năng của một số dữ liệu đang

quan sát với một vài mô hình xác suất đã cho, nghĩa là: xác suất của dữ liệu với điều

kiện dựa trên mô hình đó. Suy luận Bayes thay vì tìm kiếm xác suất của một cây với

điều kiện dựa trên những dữ liệu sẵn có (dựa trên sự quan sát một phép dóng hàng

đa trình tự nào đó).

Ước lượng Bayes của phát sinh chủng loại được chú trọng vào một đại lượng

được gọi là phân bố xác suất tiên nghiệm của cây. Với một cây đã cho, xác suất tiên

nghiệm là xác suất để cây đúng, mục đích là tìm ra cây có xác suất cao nhất. Suy

luận Bayes trong nghiên cứu phát sinh chủng loại tương tự như khả dĩ tối đa

(maximum likelihood) bởi mỗi phương pháp đều tìm kiếm một đại lượng gọi là tỷ

lệ khả dĩ với dữ liệu điều kiện đang quan sát của cây. Khác biệt là việc xác định các

40

thông tin ban đầu và sử dụng thuật toán MCMC (Markov chain Monte Carlo) để

xác định phân phối xác suất hậu nghiệm.

Phân tích phát sinh chủng loại phân tử được tiến hành dựa trên dữ liệu rời

rạc sử dụng phương pháp suy luận Bayes. Thuật toán phân tích Bayesian được sử

dụng trong nghiên cứu này được phát triển trên phần mềm BEAST v1.8.3

(http://beast.bio.ed.ac.uk) [104] với thiết lập ban đầu Yule process và MCMC

10000000 được sử dụng để tính toán xác suất hậu nghiệm [45]. Sau đó, cây tốt nhất

sẽ được tìm ra bằng phần mềm Tree Annotater v.1.8.4.

Gốc của cây phát sinh chủng loại được xác định bằng phương pháp sử dụng

nhóm đối chứng (out - group). Trong luận án này, chúng tôi sử dụng trình tự tương

đồng đối chứng của lợn hoang Malaysia (Sus barbatus) để xác định gốc cho cây.

Trình tự của giống lợn hoang Malaysia (WB-Malaysia) được chọn lựa là nhóm đối

chứng bởi được biết đến là giống có trình tự mtDNA khác biệt với nhóm lợn hoang

Châu Âu và Châu Á và nhóm đối chứng này thường được sử dụng trong các nghiên

cứu trước đây về phát sinh chủng loại ở lợn [63, 56].

Sau đó, cây sẽ được kiểm tra thứ tự phân nhánh và tính chính xác bằng phân

tích giá trị bootstrap sau 1000 lần lặp lại sử dụng công cụ MEGA.

Cuối cùng, phần mềm Figure Tree v1.4.2 [105] được sử dụng để đọc tệp tin

kết xuất ra và xây dựng cây phát sinh chủng loại.

41

Chương 3. KẾT QUẢ VÀ THẢO LUẬN

3.1. Chọn lựa, thu thập mẫu

Tính đến nay tại Việt Nam, để nhận diện các giống lợn bản địa các nhà chọn

giống chưa có cơ sở dữ liệu phân tử nào mà chủ yếu căn cứ vào bộ chỉ tiêu các đặc

điểm hình thái đã được công bố và phê chuẩn bởi Bộ Nông nghiệp và Phát triển

nông thôn (Át lát các giống vật nuôi ở Việt Nam và Chuyên khảo Bảo tồn và khai

thác nguồn gen vật nuôi Việt Nam) [5, 86]. Để đảm bảo độ tin cậy trong việc thu

mẫu phục vụ nghiên cứu, chúng tôi đã tiến hành khảo sát các đặc điểm ngoại hình

của 6 giống lợn bản địa Việt Nam. Bộ chỉ tiêu nhận dạng giống trong Át lát giống

vật nuôi ở Việt Nam, cùng với những thông tin phả hệ, thông tin địa lý phân bố của

Viện Chăn nuôi Quốc gia và Trung tâm Giống vật nuôi - Sở Nông nghiệp và Phát

triển nông thôn tại một số địa phương cũng đã được sử dụng để tiến hành khảo sát.

Việc khảo sát ngoại hình 6 giống lợn bản địa dựa trên 3 nhóm chỉ tiêu là: (1) Đặc

điểm lông, da; (2) tầm vóc, khối lượng và (3) hình dáng cơ thể, số lượng núm vú.

Trong 3 nhóm chỉ tiêu, nhóm hình thái lông da luôn được ưu tiên và có ý nghĩa

quyết định hơn trong việc khẳng định tính đặc trưng của giống, được quan sát, ghi

nhận để sàng lọc trước. Tiếp đến là nhóm chỉ tiêu về khối lượng và tầm vóc được

sàng lọc sau, cuối cùng là nhóm chỉ tiêu về đặc điểm hình dáng bộ phận cơ thể.

Như vậy, việc khảo sát được tiến hành liên tiếp qua 3 cấp độ hình thái dựa trên

3 nhóm chỉ tiêu kể trên. Ở mỗi nhóm chỉ tiêu, số lượng các cá thể được quan sát,

đưa vào thống kê sẽ được sử dụng để sàng lọc ở các nhóm chỉ tiêu tiếp theo. Chúng

tôi đã thu được một số kết quả khảo sát về đặc điểm ngoại hình của các cá thể đại

diện cho 6 giống lợn bản địa bao gồm Ỉ, Móng Cái, Hương, Hạ Lang, Mường

Khương và Mường Lay như sau:

a. Nhóm chỉ tiêu đặc điểm lông da

Quan sát các đặc điểm lông da của các cá thể ở 6 giống lợn, kết quả khảo sát

được trình bày ở bảng 3.1. Ở giống Mường Lay, qua quan sát thấy sự phân bố màu

sắc lông da thường kèm theo với một số chỉ tiêu ngoại hình để tạo thành phân nhóm

nhỏ hơn (gọi tên: nhóm A+). Số lượng các cá thể lợn được quan sát màu sắc lông da

được phân vào các nhóm A+, A và B theo thứ tự giảm dần các chỉ tiêu đặc trưng

của giống. Chỉ những cá thể nào có đầy đủ chỉ tiêu của giống (nhóm A hoặc A+)

mới được chọn lựa để sàng lọc ở các nhóm chỉ tiêu tiếp theo.

42

Bảng 3.1. Kết quả khảo sát đặc điểm lông, da của 6 giống lợn bản địa

Đặc điểm về màu sắc lông da Tổng số N Nhóm %

Lợn Ỉ

Lông thưa, thô. Lông, da đen nhưng không bóng 9 9 A 100

Lợn Móng Cái

- Thân lang đen trắng, đầu đen, tiếp giáp giữa

lông đen và trắng có khoảng mờ

100

82 B 82,0

- Thân lang đen trắng, đầu đen giữa trán có

đốm trắng, tiếp giáp giữa lông đen và trắng có

khoảng mờ

18 A 18,0

Lợn Mường Khương

- Màu sắc lông da đen tuyền. Lông thưa và mềm.

100

77 B 77,0

- Màu sắc lông da đen tuyền hoặc đen có đốm

trắng ở đầu đuôi và chân, lông thưa mềm. 23 A 23,0

Lợn Hương

- Thân và 4 chân trắng, có mảng lông da màu

đen ở mông và da đầu. Phần tiếp giáp giữa đen

và trắng rộng khoảng 2-3 cm, trên đó da đen,

lông trắng 38

22 B 57,8

- Có thêm đặc điểm: giữa trán có một điểm

trắng, bốn chân có mầu trắng. 16 A 42,1

Lợn Hạ Lang

- Bụng trắng và có dải trắng vắt vai có dải đen

gần giống yên ngựa. 41

13 B 31,7

- Có thêm đặc điểm: Giữa trán có điểm trắng

gần giống hình nêm 28 A 68,3

Lợn Mường Lay

- Đen tuyền, lưng thẳng, đầu núm vú cách mặt

đất 10-15cm

70

35 B 50,0

- Có thêm đốm trắng ở chân, trán, đuôi, lưng

thẳng, đầu núm vú cách mặt 10-15 cm 8 A

11,4

2

- Có thêm lưng hơi võng, bụng hơi sệ, đầu

núm vú đều không sa sệ. 27 A+ 38,5

(N: Số cá thể được lựa chọn có đặc điểm màu sắc lông da phù hợp với Át lát;

%: phần trăm cá thể có đặc điểm phù hợp trên tổng số cá thể quan sát)

43

Các kết quả khảo sát về đặc điểm lông da cho thấy, các cá thể đều mang

những đặc điểm đặc trưng cho từng giống. Mặc dù trong một số giống có sự

phân ly về đặc điểm lông da tạo thành các nhóm cá thể nhưng vẫn mang những

đặc điểm chung của giống. Tuy nhiên để đảm bảo mức độ tin cậy cao nhất cho

nghiên cứu, chỉ những cá thể ở nhóm A và A+ sẽ được chọn lựa để tiến hành khảo

sát ở nhóm tiêu chí về tầm vóc, khối lượng.

b. Đặc điểm về kích thước các chiều đo và khối lượng

Ở hầu hết các giống lợn, khi lợn đạt 8 tháng tuổi, các đặc điểm ngoại hình đặc

trưng của giống được thể hiện hầu hết, đây cũng là thời điểm để xây dựng tiêu chí

tầm vóc của mỗi giống lợn thể hiện trong Át lát các giống vật nuôi. Kết quả khảo

sát về một số chiều đo ngoại hình và khối lượng cũng được lựa chọn lúc lợn đạt 8

tháng tuổi của 6 giống lợn nghiên cứu được trình bày ở bảng 3.2.

Bảng 3.2. Kết quả khảo sát khối lượng và kích thước của 6 giống lợn bản địa

Giống lợn N Khối lượng Dài thân Vòng ngực Cao vai

± SD ± SD ± SD ± SD

Ỉ 9 40,34 ± 0,92 85,76 ± 1,32 83,93 ± 1,44 39,58 ± 0,91

Móng Cái 18 51,47 ± 0,32 92,41 ± 1,35 90,77 ± 1,46 45,25 ± 0,93

Hương 16 40,55 ± 0,22 86,73 ± 1,33 81,31 ± 1,42 42,56 ±0,36

Hạ Lang 28 42,68 ± 042 87,12 ± 1,33 84,34 ± 1,43 43,68 ±0,98

Mường Khương 23 52,64 ± 0,92 93,94 ± 1,32 90,52 ± 1,46 46,14 ±0,96

Mường Lay 27 40,43 ± 0,95 85,71 ± 1,38 83,97 ± 1,46 43,25±0,94

(ĐVT: Khối lượng: Kg; kích thước: cm) N: số cá thể quan sát; : Trị số trung bình

± SD: độ lêch chuẩn

So sánh chỉ tiêu khối lượng và một số chiều đo khảo sát được của từng giống

với các chỉ tiêu trong Át lát các giống vật nuôi ở Việt Nam cho thấy đều có sự

tương đồng hoặc biến động tương đối nhỏ. 100% các cá thể được khảo sát về nhóm

chỉ tiêu tầm vóc và kích thước cơ thể đều mang những đặc điểm đặc trưng của từng

giống.

c. Khảo sát trên nhóm chỉ tiêu hình dáng cơ thể

Với số lượng cá thể chọn lựa được qua hai nhóm chỉ tiêu đặc điểm lông da và

tầm vóc, khối lượng sẽ được sàng lọc tiếp theo ở nhóm chỉ tiêu thứ ba là đặc điểm

44

hình dáng cơ thể, kết quả được trình bày tại bảng 3.3.

Bảng 3.3. Khảo sát đặc điểm hình dáng cơ thể của 6 giống lợn bản địa

Đặc điểm hình dáng cơ thể (số lượng núm vú) Tổng

số N %

Lợn Ỉ

- Đầu to vừa phải, trán gần phẳng, mặt nhăn, nọng cổ và

má chảy sệ khi béo, mõm ngắn,

- Bụng ít sệ, thân, chân dài và cao hơn so với lợn Ỉ Mỡ

9 9 100

Lợn Móng Cái

- Đầu to, mõm nhỏ và dài, tai nhỏ và nhọn, có nếp nhăn to

và ngắn ở miệng.

- Cổ to ngắn, ngực nở và sâu, lưng dài, hơi võng, bụng hơi

sệ, mông rộng và xuôi.

18 15 83,3

Lợn Mường Khương

- Mõm dài thẳng hoặc hơi cong. Trán nhẵn, tai tô cúp rủ về

phía trước.

- Bốn chân to cao, vũng chắc. Lưng hơi cong, bụng to

nhưng không sệ tới sát đất, mông hơi dốc.

23 20 86,9

Lợn Hương

- Đầu đen và thô, giữa trán có một điểm trắng.

- Chân to, bụng to vừa phải và không chạm đất, lưng võng

nhưng không gãy, bốn chân có mầu trắng, mông dốc, vai

nở, ngực sâu.

16 10 62,5

Lợn Hạ Lang

- Mõm ngắn, mặt nhăn to.

- Chân to ngắn. Lưng võng, bụng không chạm đất 28 25 89,2

Lợn Mường Lay

- Mõm thẳng, dài vừa phải, trán có nếp nhăn, tai to và dày cụp.

- Mình thuôn dài, lưng hơi võng, chân to và cao vừa phải,

đi bằng bàn.

- Núm vú đều, khi mang thai và nuôi con, núm vú không

sa sệ, không chạm đất.

27 13 48,1

(N: Số cá thể được lựa chọn có đặc điểm hình dáng cơ thể phù hợp với Át lát;

%: phần trăm cá thể có đặc điểm phù hợp trên tổng số cá thể quan sát)

45

Riêng với giống lợn Ỉ, do số lượng cá thể trong đàn còn quá ít, chỉ có 9 cá thể,

việc chọn lựa các cá thể chủ yếu chỉ dựa trên quan sát bằng mắt thường các đặc

điểm ngoại hình, giới tính, thông tin hồ sơ phả hệ, bỏ qua yếu tố tuổi lợn.

Số cá thể thuộc 6 giống lợn sau khi được chọn lựa qua 3 nhóm chỉ tiêu về

ngoại hình đã đạt đầy đủ các tiêu chí đặc trưng của từng giống. Mẫu máu của những

cá thể này được lựa chọn ngẫu nhiên mỗi giống 6 mẫu đem tách chiết DNA tổng số

phục vụ nghiên cứu.

Đặc điểm ngoại hình của giống vật nuôi vừa thể hiện tính đặc trưng cho mỗi

giống, vừa thể hiện hướng sản xuất của vật nuôi và là yếu tố rất quan trọng trong

công tác chọn giống và chăn nuôi. Kết quả điều tra, khảo sát đặc điểm ngoại hình

của các giống lợn bản địa, cùng các thông tin về phả hệ, cũng như hướng dẫn của

Viện Chăn nuôi Quốc gia và trung tâm Giống vật nuôi - sở Nông nghiệp và Phát

triển nông thôn tại một số địa phương, đã giúp chúng tôi thu thập được các mẫu

máu từ các cá thể đặc trưng cho từng giống, đảm bảo tính chính xác và đại diện,

phục vụ cho các thí nghiệm tiếp theo.

3.1.1. Thu thập mẫu máu

Mẫu máu sau khi thu thập từ các cá thể đặc trưng cho mỗi giống, được bảo

quản lạnh và chuyển về Phòng thí nghiệm của Viện Nghiên cứu hệ gen, lưu giữ ở

nhiệt độ - 20oC. Tất cả các mẫu máu thu được đều đạt tiêu chuẩn vô trùng, không

đông. Các mẫu máu đều đạt chất lượng cho việc tách chiết DNA phục vụ nghiên

cứu sinh học phân tử. Với lượng mẫu thu về, 6 mẫu ngẫu nhiên được lựa chọn từ

mỗi giống để tách chiết DNA tổng số và khuếch đại bằng PCR.

3.2. Trình tự hệ gen ty thể của 6 giống lợn bản địa

3.2.1. Tách chiết DNA tổng số của 6 giống lợn nghiên cứu

DNA tổng số sau tách chiết được kiểm tra độ tinh sạch và nồng độ bằng máy

đo quang phổ. Kết quả được trình bày tại bảng 3.4.

Bảng 3.4. Kết quả định lượng và kiểm tra độ tinh sạch của DNA tổng số

Giống lợn Tên mẫu Nồng độ (ng/µl) Độ tinh sạch OD

260/280 nm

Ỉ

I1 72,28 1,92 I2 51,25 1,98

I3 62,57 1,80

I4 73,13 1,88

I5 92,15 1,84

I6 52,03 2,03

46

Giống lợn Tên mẫu Nồng độ (ng/µl) Độ tinh sạch OD

260/280 nm

Hương

H1 51,24 1,95

H2 84,28 1,81

H3 82,18 1,92

H4 72,97 1,97

H5 63,18 2,14

H6 82,04 1,84

Móng Cái

MC1 93,21 1,72

MC2 172,23 1,72

MC3 151,88 2,02

MC4 164,08 2,02

MC5 162,56 1,99

MC6 82,22 1,94

Mường Khương

MK1 52,65 1,84

MK2 73,86 1,83

MK3 81,28 1,94

MK4 95,04 2,53

MK5 72,27 1,88

MK6 82,68 1,71

Mường Lay

ML1 192,37 1,94

ML2 172,23 1,97

ML3 82,45 1,92

ML4 91,58 1,96

ML5 73,16 1,84

ML6 72,46 1,83

Hạ Lang

HL1 73,45 1,97

HL2 72,93 1,82

HL3 91,87 1,94

HL4 72,11 1,99

HL5 62,44 1,84

HL6 82,78 1,83

I1-I6: Các mẫu thuộc giống lợn Ỉ; H1-H6: Các mẫu thuộc giống lợn Hương; MC1-MC6: Các mẫu thuộc giống lợn Móng Cái; MK1-MK6: Các mẫu thuộc giống lợn Mường Khương; ML1-ML6: Các mẫu thuộc giống lợn Mường Lay; HL1-HL6: Các mẫu thuộc giống lợn Hạ Lang.

Các mẫu DNA tổng số được tách chiết từ máu của 6 giống lợn bản địa sau

khi kiểm tra bằng máy đo quang phổ đều có chỉ số OD 260/280 đạt từ 1,7 - 2,1,

nồng độ đạt từ 51,24 - 192,37 ng/µl, như vậy mẫu DNA tách chiết được khá tinh

khiết, không bị tạp nhiễm protein.

Các mẫu DNA tổng số tiếp tục được kiểm tra bằng phương pháp điện di trên

gel agarose 1% để xác định chất lượng, mức độ đứt gãy và độ tinh sạch. Kết quả

được trình bày tại hình 3.1. A, B, C.

47

Hình 3.1. A. Điện di đồ DNA tổng số của giống lợn Ỉ và Hạ Lang

Số thứ tự của giếng từ 1 - 6 tương ứng với số thứ tự của mẫu, M: Marker 1kb

Hình 3.1. B. Điện di đồ DNA tổng số của giống lợn Mường Lay và Hương


M(bp) 1 2 3 4 5 6

Ỉ Hạ Lang

1 2 3 4 5 6

M(bp) 1 2 3 4 5 6

Mường Lay Hương

1 2 3 4 5 6

48

Hình 3.1. C. Điện di đồ DNA tổng số tách chiết từ giống lợn Móng Cái và

Mường Khương


Như vậy, qua kết quả điện di đồ trình bày tại hình 3.1 A, B, C cho thấy ở

tất cả các giếng, băng DNA tổng số đều hiển thị rõ, không bị đứt gãy, các mẫu

này là đạt yêu cầu cho các thí nghiệm tiếp theo.

Toàn bộ sản phẩm DNA tổng số sau tách chiết được bảo quản ở nhiệt độ -

20oC để sử dụng cho các thí nghiệm tiếp theo.

3.2.2. Khuếch đại phân đoạn hệ gen ty thể (mtDNA) của 6 giống lợn bằng PCR

Ba mươi cặp mồi liệt kê ở bảng 2.2 đã được sử dụng để tiến hành khuếch

đại trình tự toàn bộ hệ gen ty thể bằng các phản ứng PCR.

Sản phẩm PCR sau khi đạt đủ lượng, được kiểm tra kích thước đặc hiệu và

tinh sạch nhằm thu lượng DNA tinh khiết nhất. Toàn bộ sản phẩm PCR sau tinh

sạch của 6 giống lợn bản địa một lần nữa được kiểm tra chất lượng và kích thước trên

gel điện di agarose. Kết quả kiểm tra sản phẩm PCR sau tinh sạch đối với giống lợn

Hương được minh chứng tại hình 3.2, Kết quả đối với các giống còn lại được trình bày

ở phần Phụ lục 2.

M 1 2 3 4 5 6 (bp)

1 2 3 4 5 6

Móng Cái Mường Khương

49

Hình 3.2. Sản phẩm PCR sau tinh sạch trên gel agarose 1% đối với giống

lợn Hương

Số thứ tự của giếng tương ứng với số thứ tự của mồi được trình bày tại bảng 2.2, M: Marker1 kb, Neg: đối chứng âm.

Điện di đồ sản phẩm PCR sau tinh sạch cho thấy các băng rõ nét, chuẩn

kích thước, không xuất hiện băng phụ, chứng tỏ độ tinh sạch đã được đảm bảo,

sản phẩm cho ra đúng yêu cầu, không bị thất thoát hay nhiễm tạp trong quá trình

tinh sạch.

3.2.3. Xác định trình tự các phân đoạn DNA của hệ gen ty thể

Các sản phẩm PCR sau khi tinh sạch được giải trình tự. Quá trình giải trình

tự được thực hiện theo phương pháp Sanger trên hệ thống giải trình tự gen ABI-

3500. Với những phân đoạn DNA dài, phản ứng xác định trình tự được tiến hành

theo cả hai chiều xuôi và ngược.

Kết quả giải trình tự được thể hiện dưới dạng biểu đồ các peak và chuỗi ký

tự. Những đoạn trình tự được lựa chọn là những đoạn biểu đồ với hình thái các peak

có cường độ phù hợp, điển hình, rõ ràng và không hề xuất hiện các tín hiệu phụ hay

các tín hiệu chồng chéo. Từ đó có thể đảm bảo rằng chất lượng giải trình tự các

10000 bp

250 bp

M Neg 1 2 3 4 5 6 7 8 9 10

Neg 21 22 23 24 25 26 27 28 29 30 M

11 12 13 14 15 16 17 18 19 20 Neg M

10000 bp

250 bp

10000 bp

250 bp

50

phân đoạn là tốt, dữ liệu trình tự hệ gen ty thể thu được của các giống lợn nghiên

cứu đáng tin cậy.

Ba mươi phân đoạn trình tự DNA của hệ gen ty thể của 6 giống lợn được giải

trình tự một cách độc lập, trình tự của mỗi phân đoạn sẽ được kết xuất ra dưới dạng

tệp tin dữ liệu thô. Một số phần mềm tin sinh đã được sử dụng để phân tích kết

quả. Đầu tiên, dữ liệu trình tự được đọc và tiến hành chỉnh sửa trên phần mềm

BioEdit v7.2.5. Thông qua độ mạnh yếu của tín hiệu thu được, chất lượng của

đoạn trình tự đã đọc được có thể xác định một cách tương đối. Tiếp đến, các

đoạn trình tự có chất lượng thấp sẽ được tiến hành cắt bỏ, nhằm làm tăng độ tin

cậy cho đoạn trình tự thu được. Đồng thời trình tự này được lưu dưới dạng file

FASTA phù hợp với các phần mềm phân tích sau đó.

3.2.4. Lắp ráp các phân đoạn DNA của hệ gen ty thể

Công cụ được sử dụng để nhận diện và ghép nối tạo các contig từ các

phân đoạn trình tự là phần mềm DNA Dragon v1.6.0. Kết quả của quá trình cắt

gọt trình tự, chuẩn bị cho dữ liệu đầu vào của quá trình lắp ráp được trình bày tại

bảng 3.5.

Các đoạn contig thu được từ quá trình cắt gọt sẽ được ghép nối lại dựa

trên phần trình tự gối lên nhau ở hai đầu mỗi đoạn để dựng nên trình tự hoàn

chỉnh của hệ gen.

Bảng 3.5. Kết quả quá trình chỉnh sửa trình tự chuẩn bị cho lắp ráp

hệ gen hoàn chỉnh

Giống lợn Ỉ Móng

Cái

Mường

Khương

Mường

Lay Hương

Hạ

Lang

Số lượng trình tự

cần lắp ráp 46 46 46 46 46 46

Chiều dài trung

bình các trình tự

trước lắp ráp (bp)

870,8 869,7 869,9 871,0 871,1 870,2

Chiều dài đoạn

gối lên nhau tối

thiểu (bp)

30 31 30 30 32 30

Số đoạn gối lên

nhau 47 47 47 47 47 47

51

Trình tự cuối cùng thu được của quá trình lắp ráp chính là trình tự hoàn

chỉnh của hệ gen ty thể và được lưu dưới dạng file FASTA. Trình tự hoàn chỉnh

hệ gen ty thể của 6 giống lợn bản địa gồm Ỉ, Móng Cái, Mường Khương, Mường

Lay, Hương và Hạ Lang đã được xác định và công bố trên GenBank với các mã số

truy cập tương ứng (liệt kê tại phần Phụ lục 3).

Kích thước hoàn chỉnh hệ gen ty thể cùng với thông số về các vùng trình tự

gối lên nhau giữa các gen thuộc hệ gen ty thể của 6 giống lợn bản địa Việt Nam

được trình bày ở bảng 3.6. :

Bảng 3.6. Kết quả lắp ráp hệ gen hoàn chỉnh 6 giống lợn bản địa Việt Nam

Giống lợn (Genbank

ID)

Kích thước genome

(bp)

Số lượng vùng gối giữa các

gen

Các vùng gối gen và kích thước (bp)

Tổng chiều dài các đoạn gối

(bp)

Ỉ

(KX094894) 16731 7

nd1- tRNAIle (2)

tRNAIle-tRNAGln (3)

nd2-tRNATrp (2)

atp8-atp6 (43)

nd4L-nd4 (7)

nd5-nd6 (17)

tRNAThr-tRNAPro (1)

75

Móng Cái (KX147100)

16711 10

nd1- tRNAIle (2)

tRNAIle-tRNAGln (3)

nd2-tRNATrp (2)

atp8-atp6 (43)

atp6-cox3 (1)

cox3- tRNAGly (1)

nd4L-nd4 (7) nd5-nd6 (14)

nd6-tRNAGlu (3)

tRNAThr-tRNAPro (1)

77

Mường Khương

(KY432578) 16679 8

nd1- tRNAIle (2)

tRNAIle-tRNAGln (3)

nd2-tRNATrp (2)

atp8-atp6 (43)

atp6-cox3 (1)

nd4L-nd4 (7)

nd5-nd6 (17)

tRNAThr-tRNAPro (1)

76

Mường Lay (KX147101)

16740 7

12srRNA-tRNAVal (1)

tRNAVal-16SrRNA (2)

tRNAIle-tRNAGln (3)

atp8-atp6 (34)

50

52

nd4L-nd4 (4)

nd5-nd6 (5)

tRNAThr-tRNAPro (1)

Hương (KY964306)

16753 10

12srRNA-tRNAVal (1)

tRNAVal-16SrRNA (2)

nd1- tRNAIle (2)

tRNAIle-tRNAGln (3)

nd2-tRNATrp (2)

atp8-atp6 (43)

atp6-cox3 (1)

nd4L-nd4 (7)

nd5-nd6 (17)

tRNAThr-tRNAPro (1)

79

Hạ Lang (KY800118)

16722 11

12srRNA-tRNAVal (1)

tRNAVal-16SrRNA (2)

nd1- tRNAIle (2)

tRNAIle-tRNAGln (3)

nd2-tRNATrp (2)

atp8-atp6 (43)

atp6-cox3 (1)

nd4L-nd4 (7)

nd5-nd6 (14)

nd6-tRNAGlu (3)

tRNAThr-tRNAPro (1)

78

Cùng thời điểm chúng tôi công bố dữ liệu trình tự hoàn chỉnh hệ gen ty thể

giống lợn bản địa Móng Cái của Việt Nam, công trình của nhóm tác giả Tran Thi

Thuy Nhien và cộng sự (2016) tiến hành nghiên cứu độc lập cũng công bố trình tự

hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái (mã số truy cập GenBank:

KU556691) [66]. Trình tự hệ gen ty thể trong nghiên cứu này được xác định từ mẫu

mô tai đông lạnh của một cá thể lợn Móng Cái thu tại tỉnh Sơn La. Kích thước hệ

gen của lợn Móng Cái do nhóm tác giả này công bố là 16.632 bp, ngắn hơn so với

trình tự trong kết quả nghiên cứu của chúng tôi là 79 bp. Tiến hành dóng hàng theo

cặp, so sánh trình tự mtDNA genome của giống lợn Móng Cái giữa công bố của

nhóm tác giả nêu trên với kết quả của chúng tôi, nhận thấy sự khác biệt chủ yếu chỉ

nằm trong vùng D-loop. Trong đó, số motif lặp ‘CGTGCGTACA' là 26 đoạn so

với công bố của luận án này là 23 đoạn, đây là nhân tố gây nên hiện tượng

herteroplasmy thường gặp giữa các cá thể trong cùng một giống. Ngoài ra, khi tiến

hành dóng hàng đa trình tự giữa trình tự được công bố bởi Tran Thi Thuy Nhien,

53

trình tự các giống lợn bản địa của luận án và các trình tự của một số giống lợn khác

trên thế giới, cho thấy trình tự của nhóm tác giả Tran Thi Thuy Nhien khác với hầu

hết các công bố khác là thiếu đi đoạn trình tự từ nucleotide thứ 951 đến 1038. Có

thể thấy sự khác biệt này chủ yếu là khác biệt về kích thước của trình tự ở vùng D-

loop. Tuy nhiên các công bố đều là kết quả từ những nghiên cứu độc lập, nên vẫn

cần có thêm những kiểm chứng đề làm sáng tỏ sự khác biệt.

3.3. Phân tích hệ gen ty thể

3.3.1. Phân tích thành phần hệ gen ty thể

Sau khi thu được trình tự hệ gen hoàn chỉnh, để có những đánh giá về thành

phần, cấu trúc của hệ gen ty thể của các giống lợn bản địa Việt Nam so sánh với các

giống lợn khác trên thế giới, chúng tôi tiến hành phân tích các chỉ số cơ bản nhất,

góp phần là cơ sở giúp đưa ra các nhận định về nguồn gốc và tiến hóa.

Các chỉ số cơ bản về thành phần hệ gen như phần trăm của các nucleotide A,

C, G, và T, chỉ số độ lệch các loại base: GC skew và AT skew, trong thành phần hệ

gen của 6 giống lợn được tiến hành phân tích bằng phần mềm DAMBE v.6.3.17

(http://dambe.bio.uottawa.ca/). Tỷ lệ thành phần các loại nucleotide A, C, G và T

được liệt kê tại bảng 3.7.

Bảng 3.7. Tỷ lệ thành phần các loại base trong trình tự hệ gen ty thể của 6

giống lợn bản địa Việt Nam.

Giống lợn A(%) C(%) G(%) T(%) G+C(%)

Ỉ 34,64 26,24 13,33 25,75 39,57

Móng Cái 34,70 26,20 13,30 25,79 39,50

Mường Khương 34,68 26,19 13,31 25,81 39,50

Hạ Lang 34,67 26,20 13,32 25,78 39,55

Hương 34,65 26,22 13,352 25,78 39,57

Mường Lay 34,70 26,19 13,32 25,79 39,51

Kết quả từ bảng 3.7 cho thấy, độ lệch thành phần các nucleotide hệ gen ty thể

của các giống lợn bản địa Việt Nam theo hướng giàu A+T (60,43 - 60,50%). Độ

lệch theo hướng giàu A+T có tác động tới sự khởi đầu của quá trình sao chép và

54

phiên mã, độ lệch tương tự cũng được quan sát thấy trong thành phần nucleotide hệ

gen ty thể của nhiều giống lợn Châu Á [55].

Bên cạnh đó, để phân tích sâu hơn tìm ra các đặc điểm đặc trưng trong thành

phần hệ gen ty thể, chúng tôi sử dụng hai chỉ số về độ lệch số lượng nucleotide (GC

skew và AT skew). Trong nghiên cứu này, hai chỉ số GC skew và AT skew được

tính toán dựa theo công thức đã trình bày ở phần phương pháp nghiên cứu [101].

Chỉ số GC skew và AT skew phản ánh sự bất tương xứng trong tỉ lệ thành phần

nucleotide của trình tự hệ gen ty thể. Tức là khi xét trên một vùng trình tự nào

đó, số lượng nucleotide có một sự biến thiên nhất định.

Sueoka (1995) đã sử dụng hai chỉ số này để đưa ra giả thuyết về sự thay thế

không cân bằng giữa hai sợi DNA [106]. Trong điều kiện cân bằng, không có sự tác

động của quá trình đột biến, áp lực của chọn lọc và có sự phân bố một cách ngẫu

nhiên trong toàn hệ gen, thì thành phần các Pirimidine và Purine (trong 4 loại base:

A, T, G, C) trên cả hai sợi của phân tử DNA sẽ bằng nhau. Nghĩa là, nếu cho rằng

khi không xảy ra đột biến và thay thế trong mỗi sợi DNA, tần số xuất hiện của base

loại T sẽ bằng với tần số xuất hiện của base loại A và tần số xuất hiện của base loại

G sẽ bằng với tần số xuất hiện của base loại C. Bất cứ sai lệch nào làm mất đi tỉ lệ

cân xứng thành phần các loại base ở hai chuỗi (chuỗi nhanh và chuỗi chậm) trong

phân tử DNA được gọi là AT skew và GC skew [107].

Độ lệch thành phần nucleotide nằm trong khoảng giá trị từ (-1) khi G = 0

hoặc A = 0 đến (+1) khi T = 0 hoặc C = 0. Do đó, trị số GC skew đạt giá trị dương

phản ánh số lượng G giàu hơn so với C, ngược lại GC skew đạt giá trị âm phản ánh

số lượng C giàu hơn so với G.

Một số chỉ số đặc trưng cho trình tự hệ gen ty thể có thể kể đến là tỷ lệ

phần trăm base loại G và loại C (% GC), độ lệch GC và AT (GC skew và AT

skew) được liệt kê nhằm phân tích và so sánh giữa các giống lợn bản địa Việt

Nam với các giống lợn khác trên thế giới, kết quả được trình bày tại bảng 3.8.

55

Bảng 3.8. Thành phần trình tự của các nhóm lợn phân bố theo khu vực địa lý

Khu vực Giống lợn Genbank ID

Trình tự hoàn chỉnh Trình tự D-loop

%GC GC

skew

AT

skew %GC

GC

skew

AT

skew

Lợn bản địa

Việt Nam

Ỉ KX094894 39,35 -0,33 0,15 39,91 -0,32 0,16

Móng Cái KX147100 39,23 -0,33 0,15 38,77 -0,33 0,16

Hạ Lang KY800118 39,24 -0,33 0,15 38,47 -0,34 0,16

Hương KY964306 39,25 -0,33 0,15 39,25 -0,30 0,14

Mường Khương KY432578 39,25 -0,33 0,15 38,79 -0,33 0,16

Mường Lay KX147101 39,29 -0,33 0,15 39,59 -0,31 0,16

Đông Bắc Á

Jeju AY879785.1 - - - 38,55 -0,35 0,17

Korean native

pig AY879794.1 - - - 38,76 -0,35 0,15

WB-China

northeast EU333163.1 39,25 -0,33 0,15 38,2 -0,34 0,15

WB-Japan AB015085.1 - - - 39,09 -0,33 0,16

WB-Korea AY574047.1 39,19 -0,33 0,15 38,59 -0,33 0,16

Lưu vực

sông Hoàng

Hà

Bamei EF545583.1 39,21 -0,33 0,15 38,69 -0,34 0,16

Huzu EF545588.1 39,2 -0,33 0,15 38,69 -0,34 0,16

Khu vực các

nước Châu

Âu

Berkshire AY574045.1 39,28 -0,33 0,15 38,47 -0,34 0,16

Duroc AY337045.1 39,32 -0,33 0,15 38,66 -0,35 0,16

Hampshire AY574046.1 39,33 -0,33 0,15 38,27 -0,36 0,16

Iberian FJ236994.1 39,29 -0,34 0,15 38,37 -0,35 0,16

Landrace AF034253.1 39,28 -0,33 0,15 38,47 -0,35 0,15

Large White KC250275 39,27 -0,33 0,15 38,47 -0,35 0,16

Pietrain KC469587 39,28 -0,34 0,15 38,52 -0,35 0,16

WB-European FJ237000.1 39,28 -0,34 0,15 38,56 -0,35 0,17

Lưu vực

sông Mê

Kông

Banna mini GQ220328.1 39,28 -0,33 0,15 39,16 -0,34 0,16

Dahe GQ220329.1 39,24 -0,33 0,15 38,92 -0,33 0,16

Thailand

indigenous pig FM244493.1 - - - 38,7 -0,33 0,16

WB-Malaysia EF545592.1 39,18 -0,33 0,15 38,59 -0,38 0,19

WB-Vietnam EF545584.1 39,26 -0,33 0,15 38,69 -0,34 0,16

56

Khu vực Giống lợn Genbank ID

Trình tự hoàn chỉnh Trình tự D-loop

%GC GC

skew

AT

skew %GC

GC

skew

AT

skew

WB-Yunnan EF545573.1 39,28 -0,33 0,15 39,27 -0,31 0,15

Khu vực

Nam Trung

Quốc

Lantang KC250274 39,22 -0,33 0,15 38,57 -0,34 0,16

Lanyu DQ518915.2 39,25 -0,30 0,12 38,55 -0,34 0,16

WB-Fujian EF545569.1 39,19 -0,33 0,15 38,71 -0,33 0,16

WB-Hainan EF545572.1 39,19 -0,33 0,15 38,68 -0,33 0,15

Lưu vực

sông Trường

Giang

Aba EF545578.1 39,21 -0,33 0,15 38,69 -0,34 0,16

Bihu EF545591.1 39,81 -0,31 0,14 38,69 -0,34 0,16

Jinhua KC469586 39,22 -0,33 0,15 38,46 -0,34 0,16

Kele EF536857.1 - - - 38,68 -0,34 0,16

Taoyuan AM040653.1 - - - 38,66 -0,34 0,16

WB-Jiangxi EF545579.1 39,22 -0,33 0,15 38,59 -0,34 0,16

Wei EF545577.1 39,2 -0,33 0,15 38,69 -0,34 0,16

Xiang pig KC250273 39,18 -0,33 0,15 38,59 -0,33 0,16

"-" : Trình tự hoàn chỉnh chưa được công bố.

Kết quả ở bảng 3.8. cho thấy, các chỉ số GC skew đối với các giống lợn đều

mang giá trị âm, AT skew đều mang giá trị dương ở cả hai vùng trình tự. Như vậy,

xét về mặt tiến hóa, xu hướng thay đổi thành phần nucleotide giữa các giống lợn là

không có khác biệt lớn. Nếu so sánh giữa vùng trình tự D-loop và trình tự hoàn

chỉnh, có thể thấy vùng D-loop ở đa phần các giống lợn đều có chỉ số AT skew cao

hơn, tức là có mức độ biến đổi thành phần nucleotide loại A và T cao hơn so với

trình tự toàn bộ hệ gen ty thể. Giá trị trung bình cộng của trị số GC skew đối với các

giống lợn bản địa Việt Nam (-0,32) cao hơn so với giá trị trung bình cộng của các

giống lợn khác trên thế giới (-0,34). Nhưng ngược lại đối với trị số AT skew các

giống lợn bản địa Việt Nam lại có giá trị trung bình (0,156) thấp hơn so với các

giống lợn khác (0,160).

Tiến hành so sánh mức độ biến đổi GC hay AT được thể hiện qua giá trị tuyệt

đối của các giá trị GC skew và AT skew tương ứng giữa các giống lợn, kết quả so sánh

các chỉ số đối với tất cả các giống đã thể hiện một số khác biệt đáng chú ý sau:

Đối với trình tự hoàn chỉnh, toàn bộ sáu giống lợn bản địa Việt Nam giống

nhau về trị số GC skew và AT skew. Giống lợn Lanyu và Bihu là hai giống lợn ít có

57

sự biến đổi về thành phần GC nhất (tương ứng là 0,30 và 0,31) đây cũng là hai

giống có sự biến đổi thành phần AT thấp nhất (0,12 và 0,14).

Đối với trình tự vùng D-loop, hai giống lợn bản địa của Việt Nam là Hương

và Mường Lay cùng với giống WB-Yunnan của Trung Quốc có trình tự hoàn chỉnh

ít có sự chênh lệch nhất giữa C và G tương ứng là 0,30 và 0,31. Bên cạnh đó, giống

lợn Hương cũng là giống có độ lệch giữa hai loại nucleotide A và T thấp nhất

(0,14). Ngược lại giống lợn có mức độ khác biệt giữa C và G trên trình tự vùng D-

loop cao nhất là giống WB-Malaysia (0,38) sau đó là giống Hampshire (0,36), đồng

thời cũng có chỉ số AT skew của trình tự hoàn chỉnh là cao nhất (0,19 và 0,16) khi so

sánh giữa các trình tự ở vùng D-loop với nhau.

Dấu của giá trị AT skew và GC skew đại diện cho xu hướng lệch của thành

phần nucleotide tương ứng. Các trị số AT skew của các giống lợn trên thế giới được

chọn lựa cho khảo sát trong nghiên cứu này đều đồng thời nhận giá trị dương và trị

số GC skew đều nhận giá trị âm, do đó hệ gen ty thể của các giống lợn này đều có

hàm lượng C và A cao hơn G và T. Kết quả này cho thấy, các giá trị của các chỉ số

AT skew và GC skew ở cùng một loài có thể có sự liên hệ mật thiết với nhau, giống

nào có độ biến đổi GC cao thì mức độ AT cũng sẽ cao.

Những biến đổi thành phần base thể hiện qua hai chỉ số độ lệch GC hoặc độ

lệch AT, các chỉ số này đã được sử dụng trong các nghiên cứu về thành phần

nucleotide của hệ gen ty thể và kết quả cho thấy chúng có mối liên hệ với quá trình

phát sinh chủng loại [108-110]. Đối với 6 giống lợn bản địa Việt Nam là đối tượng

nghiên cứu trong luận án này có sự đồng nhất trong thành phần trình tự hoàn chỉnh

hệ gen ty thể về hai trị số AT skew (0,15) và GC skew (-0,33), bên cạnh đó các

giống cũng có sự tương đồng về phân bố địa lý khi cùng thuộc khu vực phía Bắc

Việt Nam. Về lý thuyết, các chỉ số độ lệch này cũng cho phép đánh giá một phần độ

đa dạng di truyền và gián tiếp xác định các mối quan hệ về phát sinh chủng loại.

Tuy nhiên sự khác biệt là chưa đủ lớn giữa các đối tượng nghiên cứu, nên chưa thể

đưa ra suy luận khoa học cụ thể nào theo hai hướng trên từ các chỉ số GC skew và

AT skew.

So sánh các trình tự lặp trước sau theo motif 5'-tacacgtgcg-3' ở vùng D-

loop của hệ gen ty thể nhóm lợn bản địa Việt Nam so sánh với các giống lợn

khác trên thế giới cho thấy có những khác biệt nhất định. Cụ thể ở giống lợn Ỉ

58

(18 đoạn lặp), Hương (27 đoạn lặp), Hạ Lang (23 đoạn lặp), Mường Khương (20

đoạn lặp), lợn Móng Cái (22 đoạn lặp), Mường Lay (17 đoạn lặp) khác biệt lớn

so với các giống lợn nhóm Châu Âu: Duroc (10 đoạn), Landrace (13 đoạn),

Large-white (6 đoạn) hay các giống lợn Châu Á: Lợn rừng Nhật Bản (1 đoạn

lặp), và giống lợn rừng Ryukyu (1 đoạn lặp). Sự đa dạng trong cấu trúc lặp này

có thể được lý giải bởi đặc tính lặp lại và tự bổ sung của trình tự, điều này có

khuynh hướng làm bắt cặp sai dẫn tới sự trượt đi trong quá trình sao chép. Số

lượng motif lặp càng lớn thì càng có nhiều cơ hội cho việc hình thành cấu trúc

kẹp tóc là nguyên nhân gây ra lỗi trong quá trình sao chép. Đặc điểm đoạn lặp

này xuất hiện trong hệ gen của các giống lợn là sự xen kẽ chuỗi Purine-

Pirimidine tự nhiên dài nhất [91]. Mặc dù vậy, cấu trúc lặp này được coi là có

thể gây nên hiện tượng heteroplasmy nên được xem là không có ý nghĩa trong

nghiên cứu quan hệ phát sinh chủng loại [91].

3.3.2. Chú giải cấu trúc hệ gen ty thể

Giống như các loài động vật có xương sống khác, thứ tự sắp xếp và thành

phần cấu trúc của mtDNA của các giống lợn bản địa có sự tương đồng khá cao. Các

gen mã hóa chủ yếu nằm trên chuỗi H ngoại trừ gen ND6 và 8 gen tRNA được mã

hóa trên chuỗi L. Kết quả chú giải cấu trúc cho thấy: Hệ gen ty thể của các giống

lợn nghiên cứu đều bao 37 gen, trong đó có 2 gen mã hóa RNA ribosome, 13 gen

mã hóa protein, 22 gen mã hóa RNA vận chuyển và một vùng kiểm soát D-loop,

phân bố trên cả hai chuỗi H và L của ty thể. Vùng D-loop nằm giữa hai gen mã

hóa tRNA Phe và tRNA Pro. Ngoài ra còn có 12 vùng không mã hóa nằm rải rác

trên khắp hệ gen ty thể. Mã bộ ba kết thúc của các gen này đều là TAG hoặc

TAA hoặc AGA. Bên cạnh đó có một số gen mang bộ ba kết thúc không hoàn

chỉnh T--, theo giả định sẽ hình thành một bộ ba kết thúc TAA sau khi trải qua

quá trình gắn đuôi poly A trong quá trình biến đổi sau phiên mã. Cấu trúc hệ gen

ty thể của các giống lợn nghiên cứu được chú thích rõ tại các bảng 3.9 - 3.14.

59

Bảng 3.9. Cấu trúc của hệ gen ty thể lợn Móng Cái

Tên gen

Chuỗi

Vị trí Kích

thước

Bộ ba

AT/GC skew Khởi đầu

Kết thúc

Khởi đầu

Kết thúc

Đối mã

D-loop H 1 1275 1275

tRNA Phe H 1276 1345 70 GAA

12s rRNA H 1346 2305 960

tRNA Val H 2307 2374 68 TAC

16S rRNA H 2375 3944 1570

tRNA Leu2 H 3945 4019 75 TAA

ND1 H 4022 4978 957 ATG TAG -0,40/0,13

tRNA Ile H 4977 5045 69 GAT

tRNA Gln L 5043 5115 73 TTG

tRNA Met H 5117 5186 70 CAT

ND2 H 5187 6230 1044 ATA TAG -0,49/0,24

tRNA Trp H 6229 6296 68 TCA

tRNA Ala L 6303 6370 68 TGC

tRNA Asn L 6372 6446 75 GTT

tRNA Cys L 6479 6544 66 GCA

tRNA Tyr L 6545 6609 65 GTA

COX1 H 6611 8155 1545 ATG TAA -0,20/0,00

tRNA Ser2 L 8159 8227 69 TGA

tRNA Asp H 8235 8302 68 GTC

COX2 H 8303 8990 688 ATG T-- -0,31/0,12

tRNA Lys H 8991 9057 67 TTT

ATPase8 H 9059 9262 204 ATG TAA -0,55/0,20

ATPase6 H 9220 9900 681 ATG TAA -0,46/0,11

COX3 H 9900 10684 785 ATG TA- -0,32/0,05

tRNA Gly H 10684 10752 69 TCC

ND3 H 10753 11099 347 ATA TA- -0,49/0,17

tRNA Arg H 11100 11168 69 TCG

ND4l H 11169 11465 297 GTG TAA -0,35/0,02

ND4 H 11459 12836 1378 ATG T-- -0,50/0,14

tRNA His H 12837 12905 69 GTG

tRNA Ser1 H 12906 12964 59 GCT

tRNA Leu1 H 12965 13034 70 TAG

ND5 H 13035 14855 1821 ATA TAA -0,46/0,15

ND6 L 14842 15369 528 ATG TAA -0,56/0,35

tRNA Glu L 15367 15435 69 TTC

Cytb H 15440 16579 1140 ATG AGA -0,38/0,09

tRNA Thr H 16580 16647 68 TGT

tRNA Pro L 16647 16711 65 TGG

60

Bảng 3.10. Cấu trúc của hệ gen ty thể lợn Mường Lay

Tên gen Chuỗi

Vị trí Kích thước

(bp)

Bộ ba AT skew/ GC skew Khởi đầu Kết thúc

khởi đầu

kết thúc

đối mã

Dloop 1 1304 1304


12s rRNA H 1375 2336 962


16S rRNA H 2402 3972 1571

tRNA Leu2 H 3973 4047 75 TAA

ND1 H 4056 5000 945 ATG TAG 0,14/-0,41




ND2 H 5215 6253 1044 ATT TAG 0,17/-0,43






COX1 H 6640 8178 1539 ATG TAA 0,08/-0,27

tRNA Ser2 L 8188 8256 69 TGA


COX2 H 8332 9012 681 ATG T- - 0,15/-0,34


ATPase8 H 9088 9282 195 ATG TAA 0,23/-0,57

ATPase6 H 9249 9923 675 ATG TAA 0,08/-0,43

COX3 H 9929 10711 783 ATG TA- 0,008/-0,28

tRNA Gly H 10713 10782 70 TCC

ND3 H 10783 11127 345 ATA TA 0,09/-0,41

tRNA Arg H 11130 11198 69 TCG

ND4l H 11214 11492 279 GTG TAA 0,11/-0,42

ND4 H 11489 12856 1368 ATG T-- 0,07/-0,45

tRNA His H 12867 12935 69 GTG

tRNA Ser1 H 12936 12994 59 GCT

tRNA Leu1 H 12995 13064 70 TAG

ND5 H 13065 14880 1800 ATA TAA 0,10/-0,42

ND6 L 14876 15391 516 ATG TAA 0,48/-0,25

tRNA Glu L 15398 15466 69 TTC

Cytb H 15471 16604 1134 ATG AGA 0,04/-0,34

tRNA Thr H 16611 16678 68 TGT

tRNA Pro L 16678 16742 65 TGG

61

Bảng 3.11. Cấu trúc của hệ gen ty thể lợn Mường Khương

Tên gen

Chuỗi

Vị trí Kích

thước

Bộ ba AT/GC

skew Khởi đầu

Kết thúc

Khởi đầu

Kết thúc

Đối mã

D-loop H 1 1244 1244


12s rRNA H 1315 2274 960


16S rRNA H 2344 3912 1569

tRNA Leu2 H 3913 3987 75 TAA

ND1 H 3990 4946 957 ATG TAG 0,13/-0,40




ND2 H 5155 6198 1044 ATA TAG 0,24/-0,48






COX1 H 6579 8123 1545 ATG TAA -0,003/-0,19

tRNA Ser2 L 8127 8195 69 TGA


COX2 H 8271 8958 688 ATG T-- 0,11/-0,31


ATPase8 H 9027 9230 204 ATG TAA 0,19/-0,55

ATPase6 H 9188 9868 681 ATG TAA 0,10/-0,45

COX3 H 9868 10651 784 ATG T-- 0,05/-0,31

tRNA Gly H 10652 10720 69 TCC

ND3 H 10721 11066 346 ATA T-- 0,16/-0,48

tRNA Arg H 11068 11136 69 TCG

ND4l H 11137 11433 297 GTG TAA 0,01/-0,35

ND4 H 11427 12804 1378 ATG T-- 0,14/-0,49

tRNA His H 12805 12873 69 GTG

tRNA Ser1 H 12874 12932 59 GCT

tRNA Leu1 H 12933 13002 70 TAG

ND5 H 13003 14823 1821 ATA TAA 0,14/-0,46

ND6 L 14807 15334 528 ATG TAA -0,36/0,55

tRNA Glu L 15335 15403 69 TTC

Cytb H 15408 16547 1140 ATG AGA 0,08/-0,38

tRNA Thr H 16548 16615 68 TGT

tRNA Pro L 16615 16679 65 TGG

62

Bảng 3.12. Cấu trúc của hệ gen ty thể lợn Hạ Lang

Gen Chuỗi Vị trí Kích thước

(bp)

Bộ ba

AT/GC skew

Khởi đầu

Kết thúc

Khởi đầu

Kết thúc

Đối mã

D-loop H 1 1285 1285


12S rRNA H 1356 2318 963


16S rRNA H 2384 3955 1572

tRNA Leu2 H 3956 4030 75 TAA

ND1 H 4033 4989 957 ATG TAG 0,13/-0,40




ND2 H 5198 6241 1044 ATA TAG 0,24/-0,48






COX1 H 6622 8166 1545 ATG TAA 0,00/-0,19

tRNA Ser2 L 8170 8238 69 TGA


COX2 H 8314 9001 688 ATG T-- 0,11/-0,31


ATPase8 H 9070 9273 204 ATG TAA 0,19/-0,55

ATPase6 H 9231 9911 681 ATG TAA 0,10/-0,45

COX3 H 9911 10694 784 ATG T-- 0,05/-0,31

tRNA Gly H 10695 10763 69 TCC

ND3 H 10764 11109 346 ATA T-- 0,16/-0,48

tRNA Arg H 11111 11179 69 TCG

ND4l H 11180 11476 297 GTG TAA 0,01/-0,35

ND4 H 11470 12847 1378 ATG T-- 0,14/-0,49

tRNA His H 12848 12916 69 GTG

tRNA Ser1 H 12917 12975 59 GCT

tRNA Leu1 H 12976 13045 70 TAG

ND5 H 13046 14866 1821 ATA TAA 0,15/-0,46

ND6 L 14853 15380 528 ATG TAA 0,36/-0,56

tRNA Glu L 15378 15446 69 TTC

Cytb H 15451 16590 1140 ATG AGA 0,08/-0,39

tRNA Thr H 16591 16658 68 TGT

tRNA Pro L 16658 16722 65 TGG

63

Bảng 3.13. Cấu trúc của hệ gen ty thể lợn Hương

Tên gen Chuỗi

Vị Trí Kích thước

(bp)

Bộ ba AT/GC

skew Khởi đầu

Kết thúc

Khởi đầu

Kết thúc

Đối mã

D-loop H 1 1315 1315


12S rRNA H 1386 2349 964


16S rRNA H 2415 3986 1572

tRNA Leu2 H 3987 4061 75 TAA

ND1 H 4064 5020 957 ATG TAG 0,13/-0,40




ND2 H 5229 6272 1044 ATA TAG 0,24/-0,48






COX1 H 6653 8197 1545 ATG TAA -0,004/-0,19

tRNA Ser2 L 8201 8269 69 TGA


COX2 H 8345 9032 68 ATG T-- 0,11/-0,31


ATPase8 H 9101 9304 204 ATG TAA 0,19/-0,55

ATPase6 H 9262 9942 681 ATG TAA

COX3 H 9942 10725 784 ATG T-- 0,05/-0,31

tRNA Gly H 10726 10794 69 TCC

ND3 H 10795 11140 346 ATA T-- 0,16/-0,48

tRNA Arg H 11142 11210 69 TCG

ND4L H 11211 11507 297 GTG TAA

ND4 H 11501 12878 1378 ATG T-- 0,14/-0,49

tRNA His H 12879 12947 69 GTG

tRNA Ser1 H 12948 13006 59 GCT

tRNA Leu1 H 13007 13076 70 TAG

ND5 H 13077 14897 1821 ATA TAA 0,14/-0,46

ND6 L 14881 15408 528 ATG TAA -0,37/0,56

tRNA Glu L 15409 15477 69 TTC

Cytb H 15482 16621 1140 ATG AGA

tRNA Thr H 16622 16689 68 TGT

tRNA Pro L 16689 16753 65 TGG

64

Bảng 3.14. Cấu trúc của hệ gen ty thể lợn Ỉ

Gen Chuỗi

Vị trí Kích thước

(bp)

Bộ ba AT

skew

GC

skew Khởi đầu

Kết thúc

Khởi đầu

Kết thúc

Đối mã

D-loop H 1 1295 1295


12S rRNA H 1366 2325 960 -0,15 /0,25


16S rRNA H 2395 3964 1570 -0,11 /0,24

tRNA Leu2 H 3965 4039 75 TAA

ND1 H 4042 4998 957 ATG TAG -0,40 /0,13




ND2 H 5207 6250 1044 ATA TAG -0,49 /0,24






COX1 H 6631 8175 1545 ATG TAA -0,20 /0,00

tRNA Ser2 L 8179 8247 69 TGA


COX2 H 8323 9010 688 ATG T-- -0,31 /0,12


ATPase8 H 9079 9282 204 ATG TAA -0,55 /0,20

ATPase6 H 9240 9920 681 ATG TAA -0,46 /0,11

COX3 H 9920 10703 784 ATG T-- -0,32 /0,05

tRNA Gly H 10704 10772 69 TCC

ND3 H 10773 11118 346 ATA T-- -0,47 /0,16

tRNA Arg H 11120 11188 69 TCG

ND4L H 11189 11485 297 GTG TAA -0,32 /0,01

ND4 H 11479 12856 1378 ATG T-- -0,49 /0,14

tRNA His H 12857 12925 69 GTG

tRNA Ser1 H 12926 12984 59 GCT

tRNA Leu1 H 12985 13054 70 TAG

ND5 H 13055 14875 1821 ATA TAA -0,46 /0,15

ND6 L 14859 15386 528 ATG TAA 0,56 /-0,35

tRNA Glu L 15387 15455 69 TTC

Cytb H 15460 16599 1140 ATG AGA -0,38 /0,09

tRNA Thr H 16600 16667 68 TGT

tRNA Pro L 16667 16731 65 TGG

65

Chú thích Quy ước tên gen:

- rRNA: ribosomal RNA; 16S rRNA: rRNA tiểu phần lớn; 12S rRNA: rRNA tiểu phần nhỏ; tRNA:

RNA vận chuyển và các từ in nghiêng là mã của các amino acid; ND1-6 và ND4l: gen mã hóa nicotinamide

dinucleotide dehydrogenase các tiểu phần 1 đến 6 và 4l; ATPase6 và 8: các gen mã hóa adenosine

triphosphatase tiểu phần 6 và 8; COX1 đến 3: các gen mã hóa các tiểu phẩn cytochrome c oxidase I đến III;

Cytb: gen mã hóa cytochrome b. T-- thể hiện ở bộ ba tận cùng không hoàn thiện; H(+), L(-): tương ứng là

chuỗi nặng và chuỗi nhẹ.

- D-loop: non-coding control region; tRNA Phe: transfer RNA Phenylalanime; tRNA Lys: transfer

RNA Lysine; tRNA Val: transfer RNA Valine; tRNA Leu2: transfer RNA Leucine 2; tRNA Gly: transfer

RNA Glycine; tRNA Ile: transfer RNA Isoleucine; tRNA Arg: transfer RNA Arginine; tRNA Gln: transfer

RNA Glutamine; tRNA Met: transfer RNA Methionine; tRNA His: transfer RNA Histidine; tRNA Trp:

transfer RNA Tryptophan; tRNA Ser1: transfer RNA Serine 1; tRNA Ala: transfer RNA Alanine; tRNA

Leu1: transfer RNA Leucine 1; tRNA Asn: transfer RNA Asparagine; tRNA Cys: transfer RNA Cysteine;

tRNA Tyr: transfer RNA Tyrosine; tRNA Glu: transfer RNA Glutamic acid; tRNA Ser2: transfer RNA

Serine2; tRNA Thr: transfer RNA Threonine; tRNA Asp: transfer RNA Aspartic acid; tRNA Pro: transfer

RNA Prolin.

Các kết quả bảng 3.9 - 3.14 cho thấy ở hệ gen ty thể của 6 giống lợn bản địa,

hầu hết các gen mã hóa protein và rRNA đều nằm trên chuỗi H. Hệ gen ty thể của

5/6 giống mang các gen này có GC skew mang giá trị âm và AT skew mang giá trị

dương, giống lợn Ỉ là giống duy nhất có các gen mã hóa protein và rRNA mang giá

trị GC skew dương, AT skew âm. Các gen mã hóa protein và rRNA là những nhân

tố có vai trò quyết định trong quá trình tiến hóa, do đó có thể giả định mức độ biến

thiên lớn trong thành phần nucleotide ở các gen này xuất phát từ quá trình tích lũy

các đột biến, chọn lọc trong lịch sử tiến hóa và phát sinh chủng loại.

Hệ gen ty thể của 6 giống lợn bản địa Việt Nam cũng được dự đoán cấu

trúc mạch vòng sử dụng công cụ trực tuyến GenomeVx [111]. Các giống lợn bản

địa Việt Nam có hệ gen ty thể cấu trúc mạch kép, khép vòng, với kích thước lần

lượt là: lợn Móng Cái: 16.711 bp (hình 3.3.A), lợn Mường Lay: 16.740 bp (hình

3.3.B), lợn Mường Khương: 16.679 bp (hình 3.3.C), lợn Hạ Lang:16.722 bp

(hình 3.3.D), lợn Hương:16.753 bp (hình 3.3.E) và lợn Ỉ có kích thước hệ gen ty

thể là: 16.731 bp (hình 3.3.F). Chiều dài trình tự vùng D-loop của lợn Hạ Lang,

Hương, Mường Lay, Móng Cái, Ỉ, Mường Khương lần lượt là: 1284, 1314, 1303,

1294, 1274, 1243 bp và đều nằm xen giữa hai trình tự của gen tRNAPhe và

tRNAPro. Tuy nhiên có thể coi các kích thước này không đặc trưng cho giống

bởi sự có mặt của trình tự lặp 5'-CGTGCGTACA tạo nên hiện tượng

heteroplasmy trong vùng D-loop trong các cá thể thuộc cùng một giống [112].

66

Biểu đồ hình tròn hệ gen ty thể cho biết vị trí các gen, biểu thị tỷ lệ về

kích thước tương đối của các phân đoạn DNA trong hệ gen, tương ứng với các

phân đoạn có màu sắc khác nhau thể hiện trên biểu đồ trong hình 3.3 (A, B, C,

D, E và F):

A

B

Hình 3.3.A.B. Cấu trúc dạng vòng của hệ gen ty thể lợn Móng Cái, lợn

Mường Lay được xây dựng bởi phần mềm GenomeVx.

67

C

D

Hình 3.3.C.D. Cấu trúc dạng vòng của hệ gen ty thể lợn Mường Khương, Hạ

Lang được xây dựng bởi phần mềm GenomeVx.

68

E

F

Hình 3.3.E.F. Cấu trúc dạng vòng của hệ gen ty thể lợn Hương và Ỉ được xây

dựng bởi phần mềm GenomeVx.

Kết quả phân tích cấu trúc, tổ chức hệ gen ty thể của các giống lợn cho thấy

có sự tương đồng với cấu trúc hệ gen ty thể của các loài động vật có vú khác. Thành

phần các loại base có trong hệ gen ty thể của cả 6 giống lợn đều theo hướng giàu

69

A+T (trên 60%), tương đồng với các nhóm lợn Châu Á khác [55]. Sự phân bố của

hầu hết các gen đều nằm trên chuỗi H, ngoại trừ gen ND6 và tám gen tRNA nằm

trên chuỗi L.

3.3.3. Cấu trúc thành phần của các gen RNA vận chuyển

22 gen tRNA trải khắp chiều dài của hệ gen ty thể, trong đó có hai gen tRNA

Leucine (tRNALeu(TTA) và tRNALeu(CTA)) và hai gen serine-tRNA

(tRNASer(AGC) và tRNASer(TCA)).

Kích thước tổng thể của 22 tRNA là 1509 bp và chiều dài trung bình là 68,6

bp, nằm trong khoảng từ 59 bp (tRNAPro) đến 75 bp tRNALeu(CTA). Thành phần

nucleotide của toàn bộ 22 gen tRNA đều theo hướng độ lệch thiên về hàm lượng

AT với tỉ lệ các loại nucleotide là: 32,2% A, 30,6% T, 19,6% G và 17,5% C, theo

thứ tự A > T > G >C. Thông tin về cấu trúc thành phần của các gen tRNA được liệt

kê ở bảng 3.15.

Bảng 3.15. Thành phần nucleotide của 22 gen tRNA của hệ gen 6 giống lợn

bản địa Việt Nam

STT Tên gen Sợi

(+/-)

Chiều dài

(bp)

Thành phần Nucleotide GC skew AT skew

A G C T

1. tRNA Phe + 70 26 13 16 15 -0,10 0,27

2. tRNA Val + 68 26 10 14 18 -0,17 0,18

3. tRNA

Leu2 + 75 23 14 17 21 -0,10 0,05

4. tRNA Ile + 69 28 11 8 22 0,16 0,12

5. tRNA Gln - 73 16 20 8 29 0,43 -0,29

6. tRNA Met + 70 20 13 20 17 -0,21 0,08

7. tRNA Trp + 68 26 12 14 16 -0,08 0,24

8. tRNA Ala - 68 19 15 8 26 0,30 -0,16

9. tRNA Asn - 75 21 18 11 25 0,24 -0,09

10. tRNA Cys - 66 18 16 12 20 0,14 -0,05

11. tRNA Tyr - 65 21 15 11 18 0,15 0,08

12. tRNA Ser2 - 69 17 20 11 21 0,29 -0,11

13. tRNA Asp + 68 23 12 9 24 0,14 -0,02

14. tRNA Lys + 67 20 14 16 17 -0,07 0,08

15. tRNA Gly + 69 25 10 13 21 -0,13 0,09

16. tRNA Arg + 69 29 6 9 25 -0,20 0,07

17. tRNA His + 69 29 8 8 24 0,00 0,09

70

STT Tên gen Sợi

(+/-)

Chiều dài

(bp)

Thành phần Nucleotide GC skew AT skew

A G C T

18. tRNA Ser1 + 59 20 9 12 18 -0,14 0,05

19. tRNA

Leu1 + 70 27 13 11 19 0,08 0,17

20. tRNA Glu - 69 17 17 8 27 0,36 -0,23

21. tRNA Thr + 68 22 12 18 16 -0,20 0,16

22. tRNA Pro - 65 13 19 10 23 0,31 -0,28

Tổng chiều dài

khi kết nối

1509 486 297 264 462

Giá trị Trung

bình

68,59 22,09 13,50 12,00 21,00 0,06 0,02

Kết quả phân tích thành phần các loại nucleotide của các gen tRNA, giá trị chỉ số

GC skew trong 22 gen có 10 gen mang giá trị âm (chiếm 0,45%), 8 gen tRNA có chỉ số

AT skew âm (chiếm 36%) và giá trị trung bình chỉ số AT skew, GC skew đều mang giá

trị dương (0,06 và 0,02 %). Điều này chứng tỏ rằng sự hiện diện của nucleotide loại A

trên các sợi DNA nhiều hơn T ở đa số các gen tRNA và tỉ lệ chênh lệch G, C gần như

tương đương nhau trong số 22 gen tRNA của hệ gen ty thể các giống lợn bản địa Việt

Nam. Duy nhất chỉ có gen tRNA His có tần số G bằng C với chỉ số GS skew bằng 0.

3.3.4. Phân tích cấu trúc bậc hai của các tRNA

Dựa trên trình tự vùng gen đã dự đoán, cấu trúc bậc hai của các tRNA được xây

dựng và mô tả bằng đồ họa bởi công cụ MITOS. Toàn bộ 22 gen tRNA của cả 6 giống

bản địa chung cấu trúc bậc hai với các gen tRNA có chiều dài từ 59 đến 75 bp. Kết

quả dự đoán cấu trúc bậc hai cho thấy, cấu trúc của 21 tRNA ngoại trừ tRNASer-1

đều có dạng cỏ ba lá điển hình được tạo thành từ ba thùy dihydrouridine DHU,

pseudouridin (TψC) và anti-codon. Riêng tRNA Ser-1 do có kích thước gen ngắn,

do đó có phần thùy dihydrouridine (DHU) không hình thành được cấu trúc bền

vững. Cấu trúc bậc hai của các tRNA ở 6 giống lợn bản địa Việt Nam được trình

bày tại hình 3.4.A, B, C, D, E và F.

71

A

B

72

C

D

73

E

F

Hình 3.4.A,B,C,D,E,F. Cấu trúc bậc hai của 22 loại tRNA được mã hóa trên hệ

gen ty thể lợn Móng Cái (A), Mường Lay (B), Mường Khương (C), Hạ Lang (D),

Hương (E) và Ỉ (F).

74

tRNA Ser-1 do có kích thước gen ngắn, chỉ có 59 bp, với việc không có thùy

DHU trong cấu trúc bậc hai ở tRNA Ser-1 được xem là một điều kiện phổ biến ở

hệ gen của động vật đa bào [113] [114]. Phân tích so sánh tổng thể cấu trúc bậc hai

của 22 tRNA cho thấy, có tới 21 tRNA có chiều dài của các gốc nhánh gắn amino

acid (amino acid acceptor) và gốc nhánh bộ ba đối mã tương ứng đều là 7 bp và 5

bp, ngoại trừ tRNA Ser-1 có chiều dài gốc nhánh bộ ba đối mã là 6 bp. Cấu trúc bất

thường của tRNA Ser-1 này gặp ở hầu hết các động vật có vú.

Kết quả dự đoán cấu trúc bậc hai của tRNA của 6 giống lợn bản địa mặc dù

chưa thấy có sự khác biệt nào so với các giống lợn khác trên thế giới, tuy nhiên đây

vẫn là nguồn dữ liệu cho những nghiên cứu tiếp theo trên các tRNA của hệ gen ty

thể ở các giống lợn bản địa Việt Nam.

3.4. So sánh đa hình trình tự

Để phân tích đa hình trình tự, phép dóng hàng theo cặp và dóng hàng đa trình

tự được tiến hành giữa các trình tự mtDNA của các giống lợn bản địa Việt Nam với

trình tự của các giống lợn Á, Âu trên thế giới sử dụng thuật toán MUSCLE. Hệ gen

ty thể bao gồm vùng trình tự không mã hóa (vùng D-loop) có cấu trúc DNA riêng

đặc trưng cho các cá thể trong một nhóm cá thể có nguồn gốc theo dòng mẹ, cũng là

vùng trình tự có biến đổi nhiều hơn và nhanh hơn so với vùng mã hóa còn lại. Do có

sự khác biệt về đặc điểm cấu trúc và vai trò trong tiến hóa giữa hai vùng này, nên

kết quả phân tích đa hình trình tự được thể hiện ở hai nhóm kết quả: đa hình vùng

D-loop và đa hình vùng mã hóa.

3.4.1. Trình tự vùng D-loop

3.4.1.1. Mức độ tương đồng

Sử dụng dữ liệu trình tự vùng D-loop để so sánh mức độ tương đồng giữa các

giống lợn, kết quả hệ số tương đồng được trình bày tại bảng 3.16. Hệ số tương đồng

nằm trong khoảng giá trị từ 0 - 1, hệ số tương đồng càng tiệm cận giá trị 1 cho thấy

hai trình tự có độ tương đồng càng cao, ngược lại càng gần về 0, nghĩa là hai trình

tự có độ khác biệt càng lớn.

..

75

Bảng 3.16. So sánh độ tương đồng giữa các trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam với các giống lợn trên thế giới

..33 TT

Trình tự giống

lợn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 Aba ID

2 Bamei 0.998 ID

3 Banna_mini 0.991 0.993 ID

4 Berkshire 0.992 0.994 0.989 ID

5 Bihu 0.996 0.998 0.993 0.996 ID

6 Dahe 0.959 0.959 0.954 0.955 0.959 ID

7 Duroc 0.971 0.969 0.966 0.967 0.971 0.952 ID

8 Halang 0.984 0.984 0.979 0.98 0.984 0.95 0.96 ID

9 Hampshire 0.969 0.967 0.964 0.967 0.969 0.949 0.993 0.958 ID

10 Huong 0.985 0.985 0.98 0.981 0.985 0.951 0.961 0.999 0.959 ID

11 Huzu 0.998 0.998 0.993 0.992 0.996 0.96 0.971 0.986 0.969 0.987 ID

12 Iberian 0.973 0.971 0.968 0.971 0.973 0.954 0.996 0.962 0.995 0.963 0.973 ID

13 I 0.919 0.921 0.927 0.917 0.921 0.951 0.912 0.909 0.909 0.91 0.921 0.913 ID

14 Jinhua 0.995 0.995 0.99 0.995 0.997 0.958 0.97 0.983 0.97 0.984 0.995 0.974 0.918 ID

15 Landrace 0.969 0.967 0.964 0.965 0.969 0.95 0.994 0.958 0.991 0.959 0.969 0.994 0.91 0.968 ID

16 Lantang 0.984 0.986 0.981 0.982 0.986 0.95 0.96 0.998 0.958 0.999 0.986 0.962 0.911 0.983 0.958 ID

17 Lanyu 0.937 0.937 0.932 0.937 0.939 0.933 0.938 0.927 0.941 0.928 0.937 0.94 0.894 0.94 0.936 0.927 ID

18 Large_white 0.972 0.97 0.965 0.968 0.972 0.951 0.995 0.959 0.994 0.96 0.97 0.995 0.911 0.971 0.993 0.959 0.941 ID

19 Mong cai 0.975 0.977 0.972 0.973 0.977 0.958 0.967 0.988 0.964 0.989 0.977 0.969 0.92 0.974 0.965 0.99 0.935 0.966 ID

20 Muong Khuong 0.986 0.988 0.981 0.984 0.988 0.967 0.977 0.975 0.974 0.976 0.986 0.978 0.928 0.985 0.975 0.977 0.945 0.977 0.986 ID

21 Muong Lay 0.917 0.919 0.912 0.915 0.919 0.949 0.909 0.907 0.906 0.908 0.917 0.911 0.974 0.916 0.907 0.909 0.891 0.91 0.917 0.927

22 Pietrain 0.972 0.97 0.967 0.968 0.972 0.953 0.997 0.961 0.994 0.962 0.972 0.997 0.913 0.973 0.995 0.961 0.939 0.996 0.968 0.978

23 WB-China 0.983 0.983 0.978 0.981 0.983 0.948 0.979 0.974 0.977 0.975 0.985 0.981 0.907 0.984 0.976 0.974 0.929 0.977 0.964 0.974 0.905..33

76

Qua bảng so sánh độ tương đồng cho thấy hệ số tương đồng trình tự ở vùng D-

loop đạt mức thấp nhất ở giống lợn Ỉ (< 0,951), tiếp đến là giống lợn Mường Lay

(<0,971), điều này phản ánh nét đặc trưng khác biệt về mặt di truyền của hai giống

lợn bản địa của Việt Nam so với các giống lợn khác.

Bên cạnh đó, có thể thấy mức độ tương đồng cao về trình tự giữa hai giống lợn

Hương và Hạ Lang (chỉ số tương đồng cao nhất đạt: 0,999). So sánh độ tương đồng

ở nhóm lợn Lang của Việt Nam (Hương, Hạ Lang và Móng Cái) với nhau cho thấy

có mức độ tương đồng cao hơn trong nội bộ nhóm so với các giống lợn bản địa Việt

Nam khác và các giống lợn trên thế giới. Các kết quả so sánh mức độ tương đồng

cũng phản ánh những nét gần gũi về kiểu hình giữa các giống lợn với nhau.

Giống lợn rừng Malaysia có độ tương đồng thấp với các giống lợn khác, qua

đó được tái khẳng định mức độ khác biệt lớn về di truyền nên thường được sử dụng

là nhóm ngoại (out group) trong các nghiên cứu phát sinh chủng loại.

3.4.1.2. Mức độ khác biệt

Trình tự DNA vùng D-loop của hệ gen ty thể các giống lợn Việt Nam được so

sánh với nhau và so sánh với các giống lợn khác cho thấy có một số điểm khác biệt

về trình tự đáng lưu ý, cụ thể là các biến thể đa hình nucleotide đơn. Mức độ khác

biệt về di truyền đối với trình tự vùng D-loop của các giống lợn được sử dụng trong

nghiên cứu này có 25 vị trí đa hình trên tổng số 1184 vị trí (chiều dài contig), trong

đó có 5 vị trí có mặt ít nhất 2 biến thể (Ỉ với 3 vị trí, Hạ Lang và Hương mỗi giống

có 1 vị trí) (bảng 3.17). Kết quả so sánh trình tự tương đồng cho thấy độ tương đồng

cao về trình tự D-loop giữa giống Hạ Lang và giống Hương (hai giống bản địa có

cùng nơi cư trú tại địa bàn tỉnh Cao Bằng). Đây là cơ sở để xây dựng giả thuyết

nguồn gốc giống giữa hai giống lợn Hạ Lang và Hương có phải có chung nguồn gốc

hoặc thực chất chỉ là một giống. Để khẳng định điều này cần có các nghiên cứu dựa

trên các chỉ thị di truyền khác cũng như các nghiên cứu về đặc điểm hình thái học.

77

Bảng 3.17. Các vị trí SNP trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam

STT Giống

Vị trí Ỉ

Mường

Khương

Mường

Lay

Móng

Cái Hạ

Lang Hương

1 24 G/A - - - - -

2 183 T/C - - - - -

3 215 T/C - - - - -

4 242 T/C T/C T/C T/C - -

5 280 - C/T C/T - - -

6 407 - - - T/C T/C T/C

7 454 - C/T C/T C/T C/T C/T

8 503 A/G - - - - -

9 562 T/C - - - - -

10 706 G G - G - -

11 714 A - A - - -

12 736 - - A - - -

13 734 G/G/A - - - - -

14 744 A - - - - -

15 746 - - A - - -

16 754 G/G/A - - - - -

17 756 - - A - - -

18 764 G/G/A - - - - -

19 766 - - A - - -

20 774 A - - - - -

21 776 - - A - - -

22 791 C - - - - -

23 813 - T/T/C - - - -

24 1032 A/G - - - - -

25 1165 - - - - A/C/A A/C/A

"T/C": Vị trí có 1 biến thể thay thế nucleotide; "G/G/A": Vị trí có mặt ít nhất 2 biến

thể; "-": Vị trí không có đa hình.

Khi so sánh khác biệt trình tự vùng D-loop của nhóm lợn bản địa Việt Nam

với các nhóm lợn khác trên thế giới có thể thấy tại vị trí nucleotide thứ 454 (hình

3.5.) tất cả các nhóm lợn Việt Nam trừ lợn Ỉ khác biệt với hầu hết các giống lợn còn

lại ở biến thể này (C/T). Dóng hàng đa trình tự vùng D-loop cho thấy, vùng trình tự

này của giống lợn Ỉ mang khá nhiều các điểm khác biệt với 5 giống lợn bản địa Việt

78

Nam còn lại, trong đó có một số điểm có sự khác biệt với hầu hết các giống lợn

khác trên thế giới. Kết quả này cũng phù hợp với kết quả phân tích chỉ số tương

đồng khi giống lợn Ỉ là giống có chỉ số tương đồng thấp nhất, so với 5 giống lợn bản

địa Việt Nam còn lại.

Hình 3.5. Vị trí khác biệt trên trình tự vùng D-loop của các giống lợn bản địa

Việt Nam và các giống lợn đã được công bố sau khi dóng hàng đa trình tự

Đa phần các khác biệt trình tự vùng D-loop của lợn Ỉ với các giống lợn khác

này là đơn nucleotide. Với đoạn trình tự so sánh từ nucleotide thứ 151 tới vị trí

nucleotide thứ 200 được thể hiện ở hình 3.6.

79

Hình 3.6. Một phần trình tự D-loop của lợn Ỉ và các giống lợn đã được công

bố sau khi tiến hành sắp xếp.

Kết quả tại hình 3.6 cho thấy tại các vị trí 154 (T/C), 159 (G/A), 182 (C/T) hay

tại các vị trí khác như 295 (G/A), 307 (T/C),… (phần này không được thể hiện trên

hình) trình tự lợn Ỉ có sự khác biệt với các giống lợn Duroc, Hampshire, Iberian,

Landrace, Large White, Pietrain, WB-European thuộc Châu Âu; giống lợn Jeju,

giống lợn bản địa Hàn Quốc, giống lợn hoang WB-China northeast thuộc Châu Á.

Bên cạnh đó ở các giống WB-Korea, WB-Malaysia cũng có các khác biệt với lợn Ỉ

tại vị trí nucleotide thứ 182 (C/T). Vị trí nucleotide thứ 183, ngoại trừ các giống lợn

Banna mini và Wei có trình tự tương đồng là C, các giống lợn còn lại đều có trình

tự chung là T. Ngoài ra còn có các vị trí khác không được thể hiện trên hình như

nucleotide thứ 215, 242, 503, … cũng là các điểm mà trình tự lợn Ỉ khác biệt với

hầu hết các giống lợn khác, đa phần là các giống lợn Châu Âu.

80

3.4.2. Trình tự vùng mã hóa hệ gen ty thể

3.4.2.1. Mức độ tương đồng

Trình tự hệ gen ty thể của các giống lợn nghiên cứu sau khi đã được loại bỏ

vùng D-loop, so sánh mức độ tương đồng, kết quả thu được hệ số tương đồng được

thể hiện tại bảng 3.18.

Các giống lợn trong nhóm lợn Lang của Việt Nam (Hạ Lang, Hương và Móng

Cái) có mức độ tương đồng với nhau khá cao. Hai giống bản địa tại tỉnh Cao Bằng

(Hương và Hạ Lang) thể hiện mức độ gần gũi về di truyền khi so sánh trình tự vùng

mã hóa với chỉ số tương đồng cao (0,999). So với vùng D-loop, trình tự vùng mã

hóa của giống Ỉ không thể hiện mức độ đặc trưng cao. Có thể thấy sự khác biệt của

giống lợn Ỉ so với các giống lợn khác chủ yếu tập trung ở vùng kiểm soát của hệ

gen ty thể.

Kết quả so sánh tương đồng cũng cho thấy ngoài giống lợn rừng Malaysia,

giống lợn Lanyu của Trung Quốc cũng có độ tương đồng thấp nhất so với các giống

còn lại.

81

Bảng 3.18. So sánh tương đồng các trình tự vùng mã hóa hệ gen ty thể của 6 giống lợn Việt Nam với các giống lợn trên thế giới

TT Các giống lợn1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1 Aba ID

2 Xiang 0.996 ID

3 Bamei 0.996 0.998 ID

4 Huzu 0.996 0.999 0.999 ID

5 Bihu199 0.963 0.965 0.966 0.966 ID

6 Wei 0.996 0.998 0.999 0.999 0.966 ID

7 WBJiangxi 0.996 0.998 0.998 0.999 0.966 0.998 ID

8 WBFuijan 0.995 0.997 0.997 0.998 0.964 0.997 0.997 ID

9 WBYunnan 0.991 0.994 0.994 0.994 0.961 0.994 0.994 0.993 ID

10 WBVietnam 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.994 ID

11 Dahe 0.993 0.996 0.996 0.996 0.963 0.996 0.996 0.997 0.991 0.996 ID

12 Halang 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.992 0.996 0.994 ID

13 Huong 0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.996 0.993 0.997 0.995 0.999 ID

14 Lantang 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.997 0.995 0.998 0.998 ID

15 Mongcai 0.994 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.992 0.996 0.995 0.998 0.998 0.998 ID

16 WBHainan 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.996 0.994 0.998 0.995 0.996 0.996 0.997 0.996 ID

17 Banna_Mini 0.995 0.997 0.997 0.998 0.965 0.997 0.997 0.996 0.993 0.998 0.995 0.996 0.996 0.997 0.995 0.997 ID

18 I 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.988 0.993 0.994 0.992 0.992 0.991 0.992 0.992 0.994 ID

19 Muongkhuong0.995 0.997 0.997 0.997 0.964 0.997 0.997 0.997 0.993 0.996 0.996 0.997 0.997 0.996 0.997 0.996 0.996 0.993 ID

20 Muonglay 0.989 0.992 0.992 0.992 0.959 0.992 0.992 0.993 0.987 0.991 0.994 0.992 0.992 0.991 0.992 0.991 0.991 0.995 0.994 ID

21 Jinhua 0.995 0.998 0.998 0.998 0.965 0.998 0.998 0.997 0.993 0.998 0.995 0.996 0.996 0.997 0.996 0.997 0.997 0.991 0.996 0.991

..33

.. 33

82

3.4.2.2. Mức độ khác biệt

So sánh sự khác biệt trình tự mã hóa cho phép tìm kiếm sự sai khác trình tự

của hệ gen ty thể ngoại trừ vùng trình tự D-loop với sự đa dạng cao đã được so sánh

riêng. Kết quả, các vùng có mức độ khác biệt thường rơi vào các vùng gen mã hóa

cho protein và tRNA, trong khi các vùng còn lại khá bảo thủ. Bên cạnh đó, trong số

các biến thể SNP đáng chú ý có biến thể tại vị trí 2250 nằm trên gen mã hóa 12S

rRNA. Tất cả các giống bản địa Việt Nam ngoại trừ giống Ỉ không có biến thể (C/T)

nằm ở vùng này, trong khi hầu hết các giống lợn khác đều có, kết quả này được

minh chứng ở hình 3.7.

So sánh một số vùng trình tự khác trong nội bộ các giống lợn Châu Âu và

Châu Á cho thấy sự tương đồng cao, nhưng khi so sánh giữa hai vùng địa lý Á, Âu

này lại thấy tồn tại sự khác biệt tại một số vị trí nucleotide thứ 4365 và 4386 (G/A)

hay 6857 (A/T) và 6884 (G/A). Các giống lợn Châu Âu ngoại trừ Duroc và

Landraces có thêm vị trí khác biệt tại 4398 (T/C). Tại các vị trí biến đổi khác như:

1560 (C/T), 1913 (A/G), 1988 (C/T), … thuộc vùng gen 12S rRNA; 2539 (T/C),

2990 (T/C), … thuộc vùng gen 16S rRNA, cũng như: 15652 (C/T), 15688 (T/C), …

thuộc vùng gen Cytb và những điểm nằm phân bố trên một số gen mã hóa cho

protein khác, cho thấy trình tự của các giống lợn Châu Âu khác biệt so với các

giống lợn bản địa Việt Nam.

Hình 3.7. Biến thể trình tự tại vị trí nucleotide 2250 vùng mã hóa hệ gen ty thể

các giống lợn

Tại hình 3.8 cũng minh họa một sự khác biệt về trình tự, biến thể xuất hiện

tại vị trí nucleotide 11318 thuộc vùng gen ND5, trong đó sự thay thế nucleotide C/T

83

xảy ra hầu hết ở các giống lợn nhà và lợn rừng khác trên thế giới. Sáu giống lợn bản

địa Việt Nam không có biến thể này, ngoại trừ giống lợn Ỉ.

Kết quả so sánh biến thể trình tự này thể hiện có sự tương đồng giữa giống

lợn Ỉ với giống Banamini (ở lưu vực sông Mekong); giữa nhóm 5 giống lợn Việt

Nam (Hương, Móng Cái, Mường Lay, Mường Khương và Hạ Lang) với giống lợn

Lantang (ở khu vực miền nam Trung Quốc) cho phép đưa ra những dự đoán về

những mối liên hệ gần gũi trong quá trình phát sinh chủng loài giữa các giống lợn

này. Điều này sẽ được kiểm chứng trong kết quả phân tích về phát sinh chủng loại

được trình bày ở phần sau.

Hình 3.8. Biến thể trình tự tại vị trí nucleotide 11318 trình tự vùng mã hóa hệ

gen ty thể các giống lợn

Tương tự như khi so sánh trình tự vùng D-loop, trong số nhóm các giống lợn

bản địa Việt Nam, trình tự mã hóa của giống lợn Ỉ có sự khác biệt lớn nhất so với

các giống còn lại. Cụ thể, so sánh trình tự hệ gen ty thể của lợn Ỉ với các giống lợn

khác, thấy nhiều điểm khác biệt. Hình 3.9 thể hiện các khác biệt cho các vùng gen

đó, vùng được lựa chọn làm đại diện là hai đoạn trình tự nhỏ lần lượt thuộc các gen

ND1 (hình 3.9.A) và COX1 (hình 3.9.B). Trong các đoạn này, giữa các giống lợn

Châu Âu cho thấy sự tương đồng cao, và giữa các giống Châu Á và cả lợn Ỉ cũng có

độ tương đồng trình tự cao nhưng giữa hai vùng địa lý này lại tồn tại sự khác biệt về

84

trình tự như tại vị trí nucleotide thứ 4365 và 4386 (G/A) hay 6857 (A/T) và 6884

(G/A), các giống lợn Châu Âu ngoại trừ Duroc và Landraces có thêm vị trí khác

biệt tại 4398 (T/C). Ngoài ra, một số giống Châu Á như Lanyu hay WB-China

northeast cũng cho thấy một số sự đồng khác biệt với giống Châu Âu tại một số

điểm như tại vị trí 4386 (G/A) và vị trí 6884 của Lanyu chuyển G thành A. Lanyu

cũng có sự biến đổi tại vị trí 6857 nhưng nucleotide biến đổi là G. WB-China

northeast cũng có thêm một vị trí biến đổi tại 6876 (G/A). Giống lợn WB-Malaysia

có ba vị trí biến đổi tại 4371, 4374 và 6889. Bihu có một vị trí khác biệt tại 4356

(A/G) và Dahe có một vị trí khác biệt tại 6890 (T/C).

85

Hình 3.9. Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được

công bố sau khi tiến hành sắp xếp.

A. Một phần trình tự gen ND1, B. Một phần trình tự gen COX1

Kết quả so sánh đa hình trình tự mtDNA giữa các giống lợn nhằm tìm ra các

điểm tương đồng và khác biệt, qua đó đã phần nào giải thích được mức độ đa dạng

di truyền trong nội bộ các giống lợn Việt Nam và một số giống lợn khác trên thế

giới. Kết quả so sánh ở hai vùng trình tự của hệ gen ty thể cũng cho thấy mức độ

tương đồng cao trong nội bộ các giống lợn Châu Âu và Châu Á. Mặt khác, những

thay thế đơn phân trong chuỗi trình tự của các giống lợn bản địa Việt Nam có xu

hướng tương đồng hơn với các giống lợn Châu Á so với các giống Châu Âu. Các

biến thể trình tự của nhóm lợn Việt Nam tại các vị trí chưa được liệt kê ở trên chủ

yếu là khác biệt đối với các giống lợn Châu Âu.

Có thể thấy, các giống lợn bản địa Việt Nam có điểm chung là trong hệ gen

ty thể phần lớn các vị trí biến thể có sự khác biệt lớn với nhóm lợn Châu Âu. Điều

này giúp đưa ra hai nhận định, thứ nhất là có mức độ tương đồng tương đối cao về

trình tự mtDNA giữa các giống lợn Châu Âu với nhau và giữa các giống Châu Á

với nhau. Nhận định này phù hợp với quan điểm của Yu và cs (2013) khi cho rằng

86

các giống lợn nhà Châu Âu có mối liên hệ gần theo dòng mẹ, tồn tại một khoảng

cách p gần như bằng nhau giữa giống lợn rừng Châu Âu với các giống lợn kiểu Âu

(0,0168) và với các giống lợn kiểu Á (0,0181) [30]. Thứ hai, các giống lợn bản địa

Việt Nam có xu hướng tương đồng hơn với nhau về trình tự mtDNA so với các

giống lợn Châu Á khác. Những đặc điểm khác biệt trong trình tự hệ gen ty thể các

giống lợn bản địa tạo nên những nét đặc trưng về mặt di truyền, góp phần vào việc

bảo tồn các giống lợn bản địa Việt Nam.

3.5. Phân tích về quan hệ phát sinh chủng loại

Quan hệ phát sinh chủng loại của 6 giống lợn bản địa Việt Nam và 17

giống lợn nhà và lợn rừng Á - Âu được xác định thông qua việc phân tích tính đa

hình vùng D-loop và trình tự hoàn chỉnh hệ gen ty thể các giống lợn. Để tăng

cường độ tin cậy về nguồn gốc và quan hệ phát sinh chủng loại, dữ liệu vùng D-

loop và dữ liệu trình tự hoàn chỉnh được phân tích một cách độc lập để xây dựng

các cây phát sinh chủng loại riêng biệt. Đối với giống lợn Móng Cái ngoài kết

quả trình tự của luận án, chúng tôi còn sử dụng trình tự của nhóm tác giả Tran

Thi Thuy Nhien (2016) [66] (kí hiệu trên cây phát sinh chủng loại là

MongCai_TN) để xây dựng cây phát sinh chủng loại, cũng như phân tích về

quan hệ tiến hóa.

Các trình tự hệ gen ty thể của các giống lợn cũng được dóng hàng thông

qua thuật toán MUSCLE của phần mềm MEGA nhằm xác định các vị trí tương

đồng. Từ kết quả đó, các mô hình thay thế nucleotide phù hợp nhất cho trình tự

D-loop và trình tự hoàn chỉnh cũng được xác định lần lượt là HKY+G và

TN93+I. Phân tích phát sinh chủng loại phân tử được tiến hành dựa trên dữ liệu

rời rạc bằng phương pháp suy luận Bayes, thuật toán phân tích Bayes trên phần

mềm BEAST v1.8.3 với thiết lập ban đầu Yule process. Chuỗi Markov Chain

Monte Carlo (MCMC) [45] 10.000.000 được sử dụng để tính toán xác suất hậu

nghiệm của cây. Sau đó, cây phát sinh chủng loại sẽ được dựng bằng phần mềm

Tree Annotater v.1.8.4. thông qua việc sử dụng kết quả tính toán.

Cây được xác định gốc nhờ sử dụng trình tự tương đồng đối chứng của giống

lợn hoang Malaysia (WB Malasia - Sus barbatus). Trình tự của giống lợn hoang

Malaysia được chọn lựa là nhóm ngoại (outgroup) bởi nó được biết đến là có sự

khác biệt với nhóm lợn hoang Châu Âu và Châu Á, thường được sử dụng trong các

87

nghiên cứu trước đây về phát sinh chủng loại ở lợn [63, 56].

3.5.1. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự vùng D-loop

Cây phát sinh chủng loại được xây dựng dựa trên trình tự vùng D-loop của 6

giống lợn bản địa Việt Nam, cùng với các giống lợn nhà, các giống lợn hoang dã

thuộc nhóm lợn Châu Âu (như giống lợn Duroc, Landraces, Hampshire, Pietrain,

Iberian, Đại Bạch, lợn hoang Châu Âu) và lợn Châu Á (thuộc khu vực sông Mekong,

khu vực Đông Bắc Á, khu vực sông Trường Giang, khu vực sông Hoàng Hà, Nam

Trung Quốc). Kết quả xây dựng cây phát sinh chủng loại vùng D-loop của các giống

lợn được trình bày ở hình 3.10.

Cây phát sinh chủng loại cho thấy có sự phân nhánh giữa các giống lợn Châu

Á và Châu Âu (giá trị bootstrap là 77%). Ước lượng khoảng cách tiến hóa thông

qua tính toán khoảng cách p theo cặp được thực hiện theo phương pháp tính khả

dĩ thành phần tối đa (maximum composite likelihood) bằng phần mềm MEGA7.

Khoảng cách p giữa hai nhóm này là 0,0136 - 0,019. Hai giống Lanyu và WB-

Malaysia là nhóm ngoại với khoảng cách tiến hóa với nhóm còn lại lần lượt nằm

trong khoảng 0,0243 - 0,0296 và 0,0329 - 0,0482. Giống lợn rừng Bắc Trung Quốc

(WB-China northeast) cho thấy có mối quan hệ gần gũi với các giống lợn Châu Âu.

Nhóm lợn Châu Á có sự phân tách để tạo thành năm nhánh tách biệt nhau, là nhóm

Đông Bắc Châu Á (North East Asia), thung lũng sông Hoàng Hà (Yellow River

Valley), nhóm sông Mê Kông (Mekong River), nhóm Nam Trung Quốc (South

China) và nhóm sông Trường Giang (Yangtze River Region).

Giống lợn Ỉ của Việt Nam ở cùng nhánh với giống lợn Banna Mini (thuộc

vùng sông Mê Kông, với khoảng cách p là 0,0006, giá trị bootstrap đạt 99%).

Điều thú vị là 3 giống lợn bản địa tại vùng Đông Bắc Bộ (lợn Móng Cái, Hạ

Lang, và Hương) đều có cùng cặp taxon chị em với giống lợn Lantang (thuộc

vùng Nam Trung Quốc, khoảng cách p từ 0,0006 - 0,0016. Đặc biệt, giống lợn

Móng Cái có quan hệ gần nhất với lợn Lantang khi là các taxon chị em trong

cùng nhánh phụ), mặc dù giá trị bootstrap ủng hộ chỉ đạt 52% trên cây D-loop

(hình 3.10) nhưng đạt 88% bootstrap trên cây sử dụng trình tự hệ gen hoàn chỉnh

(hình 3.11). Đối với giống lợn Móng Cái, taxon MongCai_TN có trình tự

mtDNA được công bố bởi Tran Thi Thuy Nhien và cs khác biệt khá lớn về kích

thước và đoạn lặp so với các giống lợn khác nên nằm ở nhánh tách biệt với hầu

88

hết các giống lợn Châu Á khác và nằm rất xa với taxon từ kết quả nghiên cứu

của chúng tôi. Hai giống lợn bản địa thuộc khu vực Tây Bắc Bộ (gồm lợn

Mường Khương và lợn Mường Lay) có quan hệ di truyền gần gũi với giống lợn

Bamei (thuộc khu vực lưu vực sông Hoàng Hà với khoảng cách p là 0,0012).

Kết quả về phát sinh chủng loại thể hiện trên cây phù hợp với dự đoán về sự gần

gũi giữa hai giống lợn bản địa của Việt Nam là Hương và Hạ Lang khi chúng có

những sự tương đồng về hình thái và phân bố địa lý. Giá trị xác suất bootstrap

tương đối thấp đối với các nút trong của nhánh các giống lợn ở khu vực miền núi

phía bắc Việt Nam (Hương, Hạ Lang và Móng Cái). Điều này có thể được giải

thích bởi có ít các vị trí cung cấp thông tin có mặt trong các trình tự được phân

tích, khi mà chỉ có một hoặc hai vị trí nucleotide hỗ trợ cho việc tạo nút [15].

Có thể thấy trên cây chủng loại phát sinh, một giống lợn bản địa nổi tiếng

của Việt Nam là lợn Ỉ, cùng với Banna mini và WB Korea nằm ở nhánh khá tách

biệt với các giống lợn còn lại thuộc Châu Á. Trong đó, giống lợn Ỉ có vị trí tách

biệt với 5 giống lợn bản địa Việt Nam khác. Ở phía ngoài cùng trên nhánh còn lại

là hai giống lợn thuộc khu vực Mekong là Dahe và WB-Yunnan.

Các giống lợn Châu Âu cho thấy mối quan hệ khá gần gũi, nằm trong

cùng nhóm này là cặp taxon chị em WB-European và Iberian, khoảng cách p

giữa hai giống này là 0,0004, có khoảng cách p xa hơn tới cặp này lần lượt là

Pietrain (0,0004), Large White (0,0006), Hampshire (0,0019), Landraces

(0,0021), Duroc (0,0035). Nhánh ngoài cùng của nhóm này lại là một giống lợn

Châu Á WB-China northeast (0,0085).

Nhánh phát sinh của nhóm lợn Châu Á cho thấy một sự phân nhánh khá đa

dạng. Giống lợn Châu Âu Berkshire nằm ở các nhánh lân cận với các giống Châu

Á. Kết quả này tương đồng với công bố trước đây về hai giống Large White và

Berkshire có liên quan đến nguồn gốc Châu Á. Các nghiên cứu trước đã thông báo

có 2 haplotype riêng biệt của mtDNA (Châu Á và Châu Âu) của lợn LargeWhite,

cho thấy đã có sự lai chéo giữa giống lợn Châu Âu và lợn Châu Á xảy ra trong suốt

quá trình hình thành giống này [115, 116]. Tương tự với giống Berkshire, các

nghiên cứu cũng chỉ ra rằng một số giống lợn Trung Quốc đóng góp đáng kể vào sự

phát triển của giống Berkshire [115].

Các giống lợn thuộc vùng sông Trường Giang là Wei, Bihu (0,0008) và

Jinhua (0,0012) nằm khá gần nhau. Một giống lợn khác cũng thuộc khu vực sông

89

Trường Giang là WB-Jiangxi lại có quan hệ gần gũi với hai giống lợn Nam Trung

Quốc là Lantang (0,001) và WB-Fuijan (0,0012). Hai đại diện duy nhất của khu vực

sông Hoàng Hà là Bamei và Huzu lần lượt tạo thành nhóm với giống lợn Aba

(0,0006) và Xiang (0,0008) đều thuộc khu vực sông Trường Giang.

Kết quả tính toán khoảng cách p cũng cho thấy, khoảng cách trung bình

tương đối gần trong nhóm các con lợn Việt Nam là 0,0039±0,00112 (trị số trung

bình ± độ lệch chuẩn) so với khoảng cách p trung bình chung của nhóm lợn Việt

Nam với các giống lợn Châu Âu, Châu Á là 0,01279±0,00196. Phân tích khoảng

cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có khoảng cách gần nhất

với lợn Bamei (0,00104) của Trung Quốc. Lợn Hương có khoảng cách p lớn nhất

với nhóm lợn Châu Âu khi phân tích khoảng cách p ở vùng D-loop và vùng mã

hóa tương ứng là 0,0120 và 0,0144. Lợn Hương và Hạ Lang có khoảng cách p

bằng 0,0000 (có sự đồng nhất 100% về trình tự). Lợn Hạ Lang và Hương có

khoảng cách tiến hóa ngắn nhất với lợn Lantang (khoảng cách p = 0,00104).

Khoảng cách tiến hóa của giống lợn Ỉ là xa nhất so với 5 giống lợn bản địa Việt

Nam còn lại, cụ thể là giống lợn Ỉ có khoảng cách p với Hương và Hạ Lang là

0,0081; khoảng cách với 3 giống Móng Cái, Mường Khương và Mường Lay là

0,00782. Quan hệ giữa các giống lợn này được thể hiện rõ trên cây phát sinh

chủng loại ở phần kết quả dưới đây, khi giống lợn Ỉ nằm ở phân nhánh xa hơn so

với nhánh các giống còn lại của Việt Nam.

90

Hình 3.10. Cây phát sinh chủng loại vùng D-loop: Quan hệ phát sinh chủng loại được phân tích sử dụng phương pháp suy luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree Annotator,

thông qua việc so sánh các trình tự ở vùng D-loop của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn Châu Âu, Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết quả của

Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]).

WB-China

99

52

47

54

44

54

100

88

98

77

72

64

25

46

11 34

65 36

66

100

86

99

44

64

54

51

26

52

74

91

3.5.2. Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh

Sau khi trình tự hoàn chỉnh của các giống lợn Châu Âu, Châu Á được tải về

từ ngân hàng gen (GenBank-NCBI), từ dữ liệu dóng hàng đa trình tự của 27 giống

lợn nhà và lợn rừng Châu Âu và Châu Á, chúng tôi tiến hành xây dựng cây phát

sinh chủng loại. Ở cây này, các giống lợn vẫn được phân chia một cách rõ ràng

thành 2 nhánh chính: nhánh Châu Á (bao gồm cả giống Berkshire, điều này đã được

lý giải bằng việc đưa ra nhận định có sự lai chéo giữa nhóm lợn Châu Âu và Châu

Á diễn ra trong quá trình hình thành giống Bershire [116, 1]; nhánh Châu Âu (bao

gồm cả giống lợn hoang phía Bắc Trung Quốc - WB China northest, với khoảng

cách p chỉ là 0,007). Quan hệ phát sinh chủng loại của nhóm lợn Lang Việt Nam

(Hương, Hạ Lang và Móng Cái) một lần nữa được khẳng định ở cây dựa trên trình

tự hoàn chỉnh so với cây dựa trên trình tự vùng D-loop. Tuy nhiên đối với taxon

MongCai_TN đã trở thành taxon chị em với taxon MongCai thu được từ kết quả

nghiên cứu của chúng tôi. Điều này phù hợp với sự tương đồng về trình tự ở toàn bộ

vùng mã hóa của hệ gen ty thể giữa hai công bố khoa học về dữ liệu trình tự hệ gen

ty thể của các cá thể lợn Móng Cái. Bên cạnh đó, cả hai cây có sự tương đồng cao ở

nhánh phát sinh này, cùng với những tương đồng về đặc điểm hình thái giữa giống

lợn Hương và giống Lantang ở tỉnh Quảng Đông, miền nam Trung Quốc, điều này

đã được nhắc tới trong nghiên cứu của Rothschild và Ruvinsky [87, 118]. Từ quan

hệ phát sinh này có thể đưa ra giả thiết về nguồn gốc chung của nhóm lợn bản địa

Việt Nam với lợn Lantang xuất phát từ hoạt động giao thương trong quá khứ từ

hàng ngàn năm trước giữa tỉnh Quảng Đông Trung Quốc với các tỉnh biên giới

miền núi phía bắc Việt Nam.

Cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh hệ gen ty thể

cũng cho thấy một số các hướng phân chia lớn. Đầu tiên, hai giống lợn là Lanyu và

lợn hoang WB - Malaysia có sự tách biệt hẳn với những giống lợn còn lại. Chúng

nằm tại các nhánh riêng biệt và xa nhất của cây với khoảng cách p lần lượt tới nhóm

bên trong lần lượt là 0,0185 và 0,0303.

92

Hình 3.11. Cây phát sinh chủng loại của trình tự hoàn chỉnh: Quan hệ phát sinh chủng loại được phân tích sử dụng phương pháp suy luận Bayes bằng phần mềm BEAST v1.8.3 [117]. Cây phát sinh chủng loại được dựng lên sử dụng phần mềm Tree

Annotator, thông qua việc so sánh các trình tự hoàn chỉnh của hệ gen ty thể của 6 giống lợn bản địa Việt Nam và các giống lợn Châu Âu, Châu Á. Giá trị bootstrap được thể hiện trên các nút với 1000 lần lặp lại. Giống Móng Cái có 2 taxon (MongCai: là kết

quả của Luận án, MongCai_TN là công bố của Tran Thi Thuy Nhien và cs [66]).

94

44

46

35

41

56

92

84 97

36

74

54

97

99

66

100

42

54

100

95

100

64

55

55

86

39

56

93

Khoảng cách tiến hóa trung bình xác định được là tương đối gần trong nhóm

các con lợn bản địa Việt Nam (0,00209) thuộc nghiên cứu này, lớn hơn khi so sánh

với nhóm lợn Châu Á (0,00694) và đặc biệt có khoảng cách rất xa với nhóm lợn

Châu Âu (0,01734). Khoảng cách tiến hóa gần trong nhóm lợn Lang của Việt Nam

được ước lượng thông qua khoảng cách cặp giữa các trình tự đối với nhóm lợn

(Hương, Hạ Lang, Móng Cái) đạt giá trị khoảng cách p trung bình ± độ lệch chuẩn

là: 0,00445 ± 0,00198 trong nội bộ nhóm, cho thấy chúng có mối quan hệ gần theo

dòng mẹ. Nhưng khi so sánh với các nhóm Châu Á, Châu Âu thì cho thấy sự khác

biệt, khoảng cách p trung bình là (0,01743 ± 0,00179, giữa các nhóm).

Phân tích khoảng cách cặp giữa các giống lợn cho thấy, lợn Mường Lay có

khoảng cách gần nhất với lợn Mường Khương (0,00104), lợn Hương và Hạ Lang có

khoảng cách p bằng 0,0000 (có sự đồng nhất 100% về trình tự), trật tự phân nhánh

với giá trị bootstrap ủng hộ là 100%. Lợn Hạ lang và Hương có khoảng cách tiến

hóa ngắn nhất với lợn Lantang (0,00104). Hai giống lợn đều có khoảng cách tiến

hóa xa nhất với lợn hoang Malaysia (0,03673 và 0,03562) rồi sau đó là giống Lanyu

(0,02471 và 0,02361).

Phân tích về phát sinh chủng loại của trình tự vùng D-loop (hình 3.10) và

trình tự mtDNA hoàn chỉnh (hình 3.11) đều cho thấy tồn tại 3 nhánh chính riêng

biệt: một nhánh Châu Âu và hai nhánh Châu Á. Nhánh Châu Âu bao gồm các

giống lợn kiểu Âu như: Berkshire, Duroc, Hampshire, Landrace, Pietrain, Large

White, Iberian, WB-European. Nhánh Châu Á thứ nhất gồm chủ yếu các con lợn

nhà Trung Quốc, nhánh Châu Á thứ hai là tập hợp chủ yếu các giống lợn hoang

Châu Á. Kết quả xây dựng cả hai cây phát sinh chủng loại đều cho thấy 4 giống

lợn bản địa Việt Nam bao gồm: Ỉ, Móng Cái, Hạ Lang và Hương có sự tương đồng

về trật tự phân nhánh. Bên cạnh đó, cũng có sự khác biệt khác về trật tự phân

nhánh giữa 2 cây phát sinh chủng loại. Cụ thể là ở cây D-loop, giống lợn Mường

Khương cùng nhánh phụ với giống Bamei ở lưu vực sông Hoàng Hà, Trung Quốc.

Trật tự phân nhánh đối với nhánh phụ này không đảm bảo độ tin cậy cao (khi giá

trị bootstrap thấp chỉ đạt 25%), khác biệt với cây sử dụng hệ gen hoàn chỉnh khi

Mường Khương và Mường Lay lại nằm cùng nhánh phụ (với giá trị bootstrap cao

tuyệt đối là 100%).

94

Hongo cho rằng một số loài phụ của lợn rừng cư trú ở vùng Đông Á được

thuần hóa diễn ra lặp lại trong khoảng thời gian từ 6000 - 9000 năm trước [119]. Cả

hai cây phát sinh chủng loại của luận án đều cho thấy sự tách biệt rõ ràng giữa hai

nhánh lợn Châu Âu và Châu Á, hai nhánh đã có sự phân ly từ thời gian khá lâu

(khoảng 746.000 năm trước) [1], so với thời điểm các giống lợn nhà được thuần hóa

là khoảng 9.000 năm trước đây. Đặc điểm phát sinh trên hai cây phân loài cũng có

sự tương đồng với các luận điểm khoa học của các nghiên cứu trước đây về các

giống lợn nhà và lợn rừng trên thế giới. Guanghui Yu (2013) đã tìm ra rằng các

giống lợn bản địa ở Trung Quốc, Hàn Quốc và Nhật Bản, bao gồm cả những giống

lợn rừng ở các khu vực này có mối quan hệ gần với nhau và khác xa các giống lợn

Châu Âu nếu xét theo quan hệ huyết thống dòng mẹ [63]. Gui-Sheng Wu (2007) đã

nghiên cứu các trình tự vùng kiểm soát hệ gen ty thể (670 bp) của 567 cá thể lợn

nhà và 155 các thể lợn rừng trải khắp khu vực Châu Á, Đông Nam Á và Ấn Độ, đã

khẳng định một lần nữa sự phát sinh chủng loại từ một tổ tiên chung (monophyletic)

của các giống lợn nhà và lợn rừng Đông Á [56]. Tác giả Kim (2002) cũng đã làm

sáng tỏ luận điểm mặc dù có sự cách biệt về mặt địa lý, các quần thể lợn ở Trung

Quốc, Hàn Quốc và Nhật bản đều có sự tương đồng về mặt di truyền với nhau [15].

Kết quả phân tích phát sinh chủng loại vùng D-loop và trình tự hệ gen hoàn chỉnh

cho thấy sự có mặt của giống lợn rừng Trung Quốc WB- China Northeast trong

nhánh Châu Âu, tương tự với công bố khoa học khác, đã một lần nữa chứng tỏ luận

điểm cho rằng sự du nhập của vật liệu di truyền Châu Á vào các giống vật nuôi ở

Châu Âu diễn ra từ thế kỉ thứ 18 cho đến thế kỉ thứ 19 [120]. Như vậy, khi đối chiếu

với các kết quả nghiên cứu của một số tác giả trên thế giới, các cây phát sinh chủng

loại của luận án có những sự tương đồng, qua đó khẳng định độ tin cậy trong trật tự

phát sinh nhánh trên cây.

Kết quả xác định khoảng cách tiến hóa và phân tích quan hệ phát sinh chủng

loại cho thấy sự tương đồng với các nghiên cứu khác về nguồn gốc của lợn bản địa

Việt Nam có liên quan đến lợn Châu Á, đặc biệt là lợn Trung Quốc trong suốt quá

trình phát triển giống vật nuôi từ các dạng tổ tiên có quan hệ gần theo dòng mẹ [1].

Quan điểm này tương đồng với kết luận trong nghiên cứu của Kim (2002) khi cho

rằng rất nhiều các giống lợn ở Đại lục (Trung Quốc) có nguồn gốc ở khu vực Đông

Nam Á, trong đó có Việt Nam [15]. Ở Việt Nam và Trung Quốc, các giống bản địa

95

nổi tiếng như Ỉ, Móng Cái, Meishan và Jinhua đều đã được đưa vào sử dụng như

những nguồn gen trực tiếp để phát triển các giống lợn [116, 70]. Như vậy, các giống

lợn bản địa Việt Nam đều có mối quan hệ theo dòng mẹ gần với nhau, vị trí xuất

hiện trên cây phân loại của các giống lợn bản địa Việt Nam đều nằm tương đối gần

nhau và nằm trong nhánh Châu Á. Cây phát sinh cũng chỉ ra các giống lợn bản địa

của Việt Nam ở cùng các nhánh phụ với các giống lợn Nam Trung Quốc và lưu vực

sông Hoàng Hà với khoảng cách tiến hóa tương đối gần. Cả hai cây phát sinh chủng

loại đều cho phản ánh chung về mối quan hệ phát sinh chủng loại và trật tự phân

nhánh như sau: thứ nhất là, sự gần gũi về mặt di truyền giữa lợn Ỉ và Banna mini

(một giống lợn vùng Mekong); thứ hai là tồn tại một phân nhánh gồm: lợn Móng

Cái, lợn Hạ Lang, lợn Hương với lợn Bihu, Wei và lợn Bamei; thứ ba, các giống

lợn Mường Khương, lợn Mường Lay với lợn Lantang (một giống lợn Nam Trung

Quốc) là các taxon chị em trong cùng một phân nhánh; thứ tư là, nhánh lợn hoang

bao gồm lợn hoang Việt Nam và một số giống lợn hoang Châu Á khác. Tuy nhiên,

các nhóm lợn kể trên lại nằm ở nhánh lớn riêng biệt với các giống lợn Châu Á khác

có vị trí địa lý thuộc khu vực Đông Bắc Á (như giống lợn của Hàn Quốc, Nhật

Bản). Các kết quả nêu trên khẳng định thêm quan điểm khoa học cho rằng Việt

Nam thuộc một trong những trung tâm thuần hóa lợn nhà vào loại sớm của thế giới

[121]. Nhận định này được củng cố bằng kết quả nghiên cứu trong công trình của

Watanabe (2003) cho rằng nguồn gốc của lợn rừng nhật bản được di cư từ khu vực

Đông Nam Á sanng khu vực Đông Bắc Á ở kỷ Pleistocene.

Các giống lợn bản địa (Hương, Hạ Lang, Mường Khương) có nguồn gốc ở

các tỉnh Miền núi phía Bắc Việt Nam, nơi có vị trí địa lý thuận lợi cho các hoạt

động giao thương lâu đời với các tỉnh phía Nam Trung Quốc. Nhóm lợn Lang Việt

Nam bao gồm lợn Móng Cái, Hương và Hạ Lang nằm cùng một nhánh phụ (giá trị

bootstrap 95%) với khoảng cách tiến hóa gần, điều này phù hợp với sự tương đồng

về đặc điểm địa lý phân bố và đặc điểm về hình thái học. Ba giống lợn Móng Cái,

Hương, và Hạ Lang đều có mối quan hệ gần gũi về mặt di truyền và cùng một lớp

với giống lợn Lantang (thuộc khu vực Nam Trung Quốc) với khoảng cách p giữa

các giống lần lượt là 0,0004 (lợn Móng Cái), 0,0004 (lợn Hương), 0,0006 (lợn Hạ

Lang). Tương đồng về các đặc điểm hình thái của bốn giống này là đều có đầu đen,

giữa trán có một điểm trắng hình tam giác kéo dài, có cổ khoang chia thân lợn ra

96

làm hai phần, nửa trước màu đen kéo dài đến mắt, nửa sau màu trắng kéo dài đến

vai làm thành một vành trắng kéo dài đến bụng và bốn chân. Lưng và mông màu

đen, mảng đen ở hông kéo dài xuống nửa bụng bịt kín mông và hông có hình yên

ngựa. Đường ranh giới giữa khoang đen và trắng rộng 3 - 4 cm, trên có da đen, còn

lông thì trắng. Ngoài ra, cả 3 giống lợn bản địa của Việt Nam đều tập trung nuôi

dưỡng và bảo tồn ở vùng Đông Bắc Bộ, và cũng gần với tỉnh Quảng Châu, Trung

Quốc (là nơi khởi nguồn và tồn tại của giống lợn Lantang). Như vậy, có thể trong

quá trình giao thương buôn bán hàng trăm năm trước giữa các vùng miền núi giáp

biên giới giữa hai nước, các giống lợn đã được trao đổi dưới dạng hàng hóa, lâu dần

được thuần hóa thành các giống bản địa. Do vậy, có thể giống lợn Lantang (Trung

Quốc) và 3 giống lợn bản địa tại vùng Đông Bắc bộ (Việt Nam) có chung một

nguồn gốc. Tuy nhiên để xác nhận điều này, cần có các nghiên cứu sâu hơn về di

truyền học phân tử.

Lợn Mường Lay và Mường Khương ở các nhánh chị em có khoảng cách

tiến hóa rất gần (khoảng cách p = 0,0005). Từ cây phát sinh chủng loại có thể

thấy, hai giống lợn bản địa Hương và Hạ Lang cùng nhóm với lợn Lantang ở miền

nam Trung Quốc. Giống Mường Lay cùng nhánh phụ với giống Bamei ở lưu vực

sông Hoàng Hà, Trung Quốc. Như dự đoán, có khoảng cách lớn giữa lợn Vịêt

nam, Trung quốc với nhóm lợn Châu Âu tương đồng với sự phân bố khá xa của

các nhóm lợn theo vùng địa lý. Giống lợn Ỉ có khoảng cách xa nhất với các giống

lợn bản địa Việt Nam còn lại và có khoảng cách tiến hóa gần nhất với lợn

Banamini (giá trị bootstrap cho nhánh này là 99%).

Hai giống bản địa của tỉnh Cao Bằng là Hạ Lang và Hương có độ tương đồng

cao về trình tự D-loop, phù hợp với một số đặc điểm tương đồng giữa hai giống lợn

về hình thái, bên cạnh đó đã có một số tài liệu đề cập đến nguồn gốc gần gũi hoặc

có chung nguồn gốc của hai giống lợn này [122, 123]. Trên cây phát sinh chủng loại

hai giống Hương và Hạ Lang nằm trên hai nhánh chị em với giá trị bootstrap ủng hộ

là 97%. Thông qua phân tích phát sinh chủng loại có thể nhận định rằng hai giống

Hạ Lang và Hương có chung nguồn gốc tổ tiên, phân ly ở cùng một thời điểm tiến

hóa. Tuy nhiên, cần có những nghiên cứu sâu hơn về tiến hóa, có thể sử dụng thêm

các chỉ thị di truyền khác để làm sáng tỏ và khẳng định vững chắc luận điểm trên.

97

Sự thuần hóa động vật nói chung, lợn nhà nói riêng có liên quan mật thiết

đến tập tính lao động sản xuất nông nghiệp. Nhiều bằng chứng về phát sinh chủng

loại địa lý cho thấy quá trình thuần hóa lợn diễn ra nhiều lần và độc lập ở nhiều nơi

trên thế giới, từ Châu Á, Đông Nam Á, Ấn Độ, Châu Âu, và Châu Phi. Có quan

điểm về thuần hóa lợn nhà cho rằng các giống lợn được thuần hóa bắt nguồn từ các

quần thể lợn hoang ở nhiều khu vực địa lý trên thế giới. Bán đảo Ðông Dương,

trong đó có Việt Nam, một nơi thuần hóa, nơi xuất phát của nhiều nhóm gia súc là

kết quả của quá trình lao động sáng tạo của tổ tiên chúng ta. Trong một nghiên cứu,

DNA của các giống lợn thuộc các hải đảo Thái Bình Dương đã được phân tích giúp

các tác giả đưa ra đã khẳng định rằng lợn tại các hải đảo này cũng xuất phát và được

thuần hóa từ lục địa Đông Nam Á (đặc biệt là từ Việt Nam) khoảng 3000 năm trước

đây [11]. Lan và Shi (1993) cho rằng Lợn Việt Nam bao gồm quần thể lợn hoang và

lợn nhà có thể có cùng tổ tiên với các nhóm lợn Đông Á [70]. Ước tính về thời điểm

thuần hóa và di cư của lợn nêu trên khá phù hợp với các di chỉ khảo cổ tìm thấy ở

Việt Nam. Theo các di chỉ này thì nghề chăn nuôi lợn ở Việt Nam khá phát triển

vào thời Hùng Vương. Các di chỉ khảo cổ học thuộc thời kì hậu Đồ Đá Mới (tức

khoảng 8000 đến 3000 năm trước đây) ở khu vực Phùng Nguyên, Đồng Đậu và Hoa

Lộc có nhiều xương cốt các con vật nuôi trong nhà như lợn, chó, trâu bò nuôi, gà,

vịt... Tại di chỉ Đồng Đậu, tỉ lệ xương lợn trong tầng văn hóa ở đây cao hơn xương

lợn rừng và các gia cầm [122]. Từ những dữ kiện nêu trên và kết quả phân tích phát

sinh chủng loại của luận án có thể nhận định hai giả thuyết giải thích cho quá trình

thuần hóa lợn nhà Việt Nam: thứ nhất là chúng có thể được thuần hóa ngay tại Việt

Nam, hai là tổ tiên chúng có mặt ở khu vực lân cận như Miền tây nam Trung Quốc

rồi được đưa vào lãnh thổ Việt Nam [70]. Tuy nhiên vẫn có những quan điểm trái

chiều về nguồn gốc của lợn bản địa Việt Nam, chẳng hạn như trong nghiên cứu của

Hongo và cs (2002) khi tiến hành so sánh trình tự mtDNA của lợn Việt Nam với các

cá thể lợn nhà và lợn rừng Châu Á, đã cho rằng một số giống lợn nhà Việt Nam có

quan hệ gần gũi với giống lợn rừng và có quan hệ tách biệt về mặt di truyền với với

các nhóm lợn Đông Á. Do đó, cần có thêm những nghiên để khẳng định vững chắc

hơn về nguồn gốc các giống lợn bản địa Việt Nam.

Hiện nay không chỉ Việt Nam mà trên toàn thế giới, ngày càng nhiều giống

lợn bản địa đang ở mức bị đe dọa xóa khỏi bản đồ vật nuôi. Nguyên nhân chủ yếu là

98

do sức ép của quá trình sản xuất lợn với quy mô toàn cầu, buộc người nông dân

phải chọn lựa nuôi những giống lợn lai, nhập nội [6]. Đã có những bằng chứng cho

thấy sự đa dạng di truyền ở tất cả các giống lợn hiện đại ngày nay đang giảm dần

khi tiến hành lai tạo các dòng thương mại. Một số quốc gia đã nhận ra được vấn đề

này và đang bắt đầu hỗ trợ việc duy trì liên tục các giống phi thương mại như một

nguồn gen cho tương lai. Kết quả của luận án bao gồm các dữ liệu về thông tin di

truyền thu được giúp nhận định nguồn gốc giống, đánh giá đặc trưng di truyền của

những giống lợn bản địa nghiên cứu, được coi là những nguồn gen vật nuôi bản địa

đang bị thất thoát tại Việt Nam. Những kết quả nghiên cứu cũng đóng góp vào thư

viện nguồn gen của một số giống bản địa trong Ngân hàng gen Quốc gia, phục vụ

cho mục tiêu bảo tồn, phát triển và khai thác có hiệu quả nguồn gen quý của sáu

giống lợn bản địa. Đề tài luận án tạo tiền đề cho phát triển các nghiên cứu tiếp theo

trên các giống vật nuôi bản địa khác của Việt Nam.

99

Chương 4. KẾT LUẬN VÀ KIẾN NGHỊ

4.1. Kết luận

1. Đã giải trình tự hoàn chỉnh hệ gen ty thể của 6 cá thể lợn bản địa Việt

Nam (lợn Ỉ, lợn Móng Cái, lợn Mường Khương, lợn Mường Lay, lợn Hương và lợn

Hạ Lang) dữ liệu đã công bố trên ngân hàng Genbank tương ứng với các mã số

KX094894, KU556691, KY432578, KX147101, KY964306 và KY800118.

2. Đã phân tích, chú giải, dự đoán cấu trúc chức năng hệ gen ty thể của 6 cá

thể lợn nghiên cứu. Xác định được độ đa hình trình tự hệ gen ty thể của 6 cá thể lợn

nghiên cứu. Chỉ số tương đồng trình tự hệ gen ty thể của vùng D-loop ở giống lợn Ỉ

là thấp nhất so với 5 giống còn lại. Xác định được 25 vị trí đa hình trong vùng D-

loop của 6 cá thể lợn nghiên cứu.

3. Xác định được khoảng cách tiến hóa, mối quan hệ phát sinh chủng loại

giữa 6 cá thể lợn nghiên cứu với một số giống lợn nhà và lợn rừng khác trên thế

giới. Nguồn gốc của 6 giống lợn bản địa Việt Nam gần gũi với nhóm lợn Châu Á,

đặc biệt là các giống lợn bản địa Nam Trung Quốc và khác xa với nhóm lợn Châu

Âu. Xây dựng được giả thuyết về nguồn gốc chung của giống lợn Hương và Hạ

Lang có thể là cùng một nguồn gốc.

4.2. Kiến nghị

1. Cần tiến hành nghiên cứu các loại chỉ thị phân tử khác, kết hợp với dữ liệu

về hệ gen ty thể của các giống lợn bản địa nghiên cứu để sử dụng như một công cụ

nhận dạng giống.

2. Cần tiến hành các nghiên cứu tiếp theo trên khoảng 20 giống lợn bản địa

khác của Việt Nam, từ đó tạo nguồn dữ liệu di truyền đóng góp cho ngân hàng dữ

liệu gen quốc gia và sử dụng những nguồn gen này cho nhiệm vụ bảo tồn các giống

vật nuôi quý hiếm.

100

DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ

1. Nguyen HD, Bui TA, Nguyen PT, Kim OT, Vo TT. The complete

mitochondrial genome sequence of the indigenous I pig (S. scrofa) in

Vietnam. Asian - Australia Journal of Animal Sciences. 2017; 30(7): 930–

937.

2. Thuy Thi Bich Vo, Hieu Duc Nguyen, Tuan Anh Bui, Minh Ngoc Nghiem,

Eui Bae Jeung. Phylogenomic analysis of mitochondrial DNA in the Huong

pig: an indigenous pig of Vietnam. Global Journal of Animal Breeding and

Genetics. 2017. 5 (4), pp. 389-397.

3. Hieu Duc Nguyen, Linh Thuy Pham, Tuan Anh Bui, Minh Ngoc Nghiem,

Thuy Thi Bich Vo. The Complete Sequence of Mitochondrial Genome of

Muong Khuong Pig (S. scrofa). International Journal of Research Studies in

Biosciences. 5, (7), 2017, pp. 1-3.

4. Thuy Thi Bich Vo, Tuan Anh Bui, Hieu Duc Nguyen, Hanh Hong Ha and

Eui Bae Jeung. The Mitochondrial Genome and Phylogenetic Relationships

of Muong Lay Black Pig (S. scrofa) in Vietnam. Approaches in Poultry,

Dairy & Veterinary Sciences (2018) 5:1-7.

5. Tuan Anh Bui, Hieu Duc Nguyen and Thuy Thị Bich Vo. Complete

mitochondrial genome sequence and phylogenetic status of Halang pig (S.

scrofa). Asian Journal of Biology, 6(3): 1-8, 2018; Article no.AJOB.41995.

6. Thuy Thi Bich Vo, Hieu Duc Nguyen, Tuan Anh Bui, Binh Thi Nguyen Le,

Minh Ngoc Nghiem and Hai Van Nong. Phylogenomic analysis and gene

organisation of mitogenome from Mong Cai pig in Vietnam. Current

Science. Vol. 116, No. 9, 10. 2019, p 1566-1571.

Doi:10.18520/cs/v116/i9/1566-1571.

7. Bùi Anh Tuấn, Nguyễn Đức Hiếu, Nghiêm Ngọc Minh, Võ Thị Bích Thủy.

Phân tích đa dạng di truyền hệ gen ty thể và nguồn gốc tiến hóa của sáu

giống lợn bản địa Việt Nam. Tạp chí Khoa học và Công nghệ Việt Nam.

2018. 60(7), tr. 53-60.

101

TÀI LIỆU THAM KHẢO

1. E. Giuffra, J.M. Kijas, V. Amarger, et al., The origin of the domestic pig: independent domestication and subsequent introgression. Genetics, 2000, 154 (4), 1785-91.

2. M. Bosse, A Genomics Perspective on Pig Domestication, Animal Domestication. Fabrice Teletchea, IntechOpen, 2018.

3. A. Gentry, J. Clutton-Brock, C. P Groves, The naming of wild animal species and their domestic derivates, 2004, Vol, 31.Elsevier, Journal of Archaeological Science, 645-651.

4. S. Solari,R.J. Baker, Mammal Species of the World: A Taxonomic and Geographic Reference by D. E. Wilson; D. M. Reeder. Journal of Mammalogy, 2007, 88 (3), 824-830.

5. Tạ Thị Bích Duyên, Đặng Hoàng Biên, Nguyễn Văn Trung, et al., Một số giống lợn bản địa Việt Nam. Chuyên khảo Bảo tồn và khai thác nguồn gen vật nuôi Việt Nam, 2013, Nhà xuất bản Khoa học tự nhiên và công nghệ, 52-93.

6. B.M. Epstein J, Pig. In: Mason, I.L, Evolution of Domesticated Animals, 1986, John Wiley & Sons, Incorporated, 145-162.

7. S.M. Nelson, Ancestors for the Pigs: Pigs in Prehistory, 1998, University of Pennsylvania Press, Incorporated, 532.

8. J.D. Vigne, A. Zazzo, J.F. Saliege, et al., Pre-Neolithic wild boar management and introduction to Cyprus more than 11,400 years ago. Proceedings of the National Academy of Sciences U S A, 2009, 106 (38), 16135-8.

9. S. Bökönyi, History of domestic mammals in central and eastern Europe, 1974, Akadémiai Kiadó, Budapest, 89.

10. G. Larson, K. Dobney, U. Albarella, et al., Worldwide phylogeography of wild boar reveals multiple centers of pig domestication. Science, 2005, 307 (5715), 1618-21.

11. J.K. Lum, J.K. McIntyre, D.L. Greger, et al., Recent Southeast Asian domestication and Lapita dispersal of sacred male pseudohermaphroditic “tuskers” and hairless pigs of Vanuatu. Proceedings of the National Academy of Sciences of the United States of America, 2006, 103 (46), 17190-17195.

12. K.K. Hirst, The Domestication of Pigs: Sus Scrofa's Two Distinct Histories. ThoughtCo, Jun. Thoughtco.com/the-domestication-of-pigs-170665., 2018.

13. G. Larson, U. Albarella, K. Dobney, et al., Ancient DNA, pig domestication, and the spread of the Neolithic into Europe. Proceedings of the National Academy of Sciences, 2007, 104 (39), 15276-15281.

102

14. P. Rowley-Conwy, Westward Ho! The Spread of Agriculturalism from Central Europe to the Atlantic. Current Anthropology, 2011, 52 (S4), 431-451.

15. K.I. Kim, J.H. Lee, K. Li, et al., Phylogenetic relationships of Asian and European pig breeds determined by mitochondrial DNA D-loop sequence polymorphism. Animal Genetic, 2002, 33 (1), 19-25.

16. H Kasamatsu,J. Vinograd, Replication of Circular DNA in Eukaryotic Cells. Annual Review of Biochemistry, 1974, 43 (1), 695-719.

17. A. Chomyn, W.J.C. Michael, C.I. Ragan, et al., URF6, Last Unidentified Reading Frame of Human mtDNA, Codes for an NADH Dehydrogenase Subunit. Science, 1986, 234 (4776), 614-618.

18. D.R. Wolstenholme, Animal mitochondrial DNA: structure and evolution. International Review of Cytology, 1992, 141, 173-216.

19. H. Chial,J. Craig, mtDNA and mitochondrial diseases. Nature Education, 2008, 1 (1), 217.

20. D. Ojala, J. Montoya, G. Attardi, tRNA punctuation model of RNA processing in human mitochondria. Nature, 1981, 290 (5806), 470-4.

21. R. Richter, S. Pajak A Fau - Dennerlein, A. Dennerlein S Fau - Rozanska, et al., Translation termination in human mitochondrial ribosomes. (1470-8752 (Electronic)).

22. J. Blasiak, S. Glowacki, A. Kauppinen, et al., Mitochondrial and nuclear DNA damage and repair in age-related macular degeneration. International journal of molecular sciences, 2013, 14 (2), 2996-3010.

23. C. Gissi, F. Iannelli, G. Pesole, Evolution of the mitochondrial genome of Metazoa as exemplified by comparison of congeneric species. Heredity, 2008, 101, 301.

24. V. Dominguez Del Angel, E. Hjerde, L. Sterck, et al., Ten steps to get started in Genome Assembly and Annotation. F1000Research, 2018, 7, ELIXIR-148.

25. P.D. Hebert, A. Cywinska, S.L. Ball, et al., Biological identifications through DNA barcodes. Proceedings of the Royal Society B: Biological Sciences, 2003, 270 (1512), 313-21.

26. A.J. Cox,P.D. Hebert, Colonization, extinction, and phylogeographic patterning in a freshwater crustacean. Molecular Ecology, 2001, 10 (2), 371-86.

27. A. Spychaj, M. Szalata, R. Słomski, et al., Identification of Bovine, Pig and Duck Meat Species in Mixtures and in Meat Products on the Basis of the mtDNA Cytochrome Oxidase Subunit I (COI) Gene Sequence. Polish Journal of Food and Nutrition Sciences, 2016, 66 (1), 31-36.

28. N. Dawnay, R. Ogden R Fau - McEwing, G.R. McEwing R Fau - Carvalho, et al., Validation of the barcoding gene COI for use in forensic genetic species identification. (1872-6283 (Electronic)).

103

29. C. Wu, Y. Jiang, H. Chu, et al., The type I Lanyu pig has a maternal genetic lineage distinct from Asian and European pigs. Animal genetics, 2007, 38 (5), 499-505.

30. G. Yu, H. Xiang, J. Wang, et al., The phylogenetic status of typical Chinese native pigs: analyzed by Asian and European pig mitochondrial genome sequences. Journal of Animal Science and Biotechnology, 2013, 4 (1), 9.

31. R.G. Harrison, Animal mitochondrial DNA as a genetic marker in population and evolutionary biology. Trends in Ecology & Evolution, 1989, 4 (1), 6-11.

32. B. M. Ursing,U. Arnason, The Complete Mitochondrial DNA Sequence of the Pig (Sus scrofa), 1998, Vol, 47. 302-6.

33. G. Luikart, L. Gielly, L. Excoffier, et al., Multiple maternal origins and weak phylogeographic structure in domestic goats. Proceedings of the National Academy of Sciences, 2001, 98 (10), 5927-5932.

34. W.M. Brown, M. George, Jr., A.C. Wilson, Rapid evolution of animal mitochondrial DNA. Proceedings of the National Academy of Sciences U S A, 1979, 76 (4), 1967-71.

35. R.E. Giles, H. Blanc, H.M. Cann, et al., Maternal inheritance of human mitochondrial DNA. Proceedings of the National Academy of Sciences, 1980, 77 (11), 6715-6719.

36. R.L. Cann, W.M. Brown, A.C. Wilson, Polymorphic sites and the mechanism of evolution in human mitochondrial DNA. Genetics, 1984, 106 (3), 479-99.

37. L.B. Jorde, W.S. Watkins, M.J. Bamshad, et al., The distribution of human genetic diversity: a comparison of mitochondrial, autosomal, and Y-chromosome data. American Journal of Human Genetics, 2000, 66 (3), 979-88.

38. B.F. Lang, M.W. Gray, G. Burger, Mitochondrial genome evolution and the origin of eukaryotes. Annual Review of Genetics, 1999, 33, 351-97.

39. D.G. Bradley, D.E. MacHugh, P. Cunningham, et al., Mitochondrial diversity and the origins of African and European cattle. Proceedings of the National Academy of Sciences U S A, 1996, 93 (10), 5131-5.

40. H. Mannen, S. Tsuji, R.T. Loftus, et al., Mitochondrial DNA variation and evolution of Japanese black cattle (Bos taurus). Genetics, 1998, 150 (3), 1169-75.

41. E. Mayr, The Growth of Biological Thought: Diversity, Evolution and Inheritance. 1982, (Belknap Press, Cambridge, MA).

42. J. Pevsner, Bioinformatics and functional genomics, 2015, John Wiley & Sons Inc., New York, United States.

43. A.L. Clarke, The Diversity of Life Politics and the Life Sciences, 2016, 13 (1), 129-130.

104

44. J. Hein,J. Støvlbæk, Combined DNA and protein alignment. Methods in enzymology, 1996, 266, 402-418.

45. J.P. Huelsenbeck,F. Ronquist, MRBAYES: Bayesian inference of phylogenetic trees. Bioinformatics, 2001, 17 (8), 754-755.

46. R.R. Sokal,C.D. Michener, A statistical method for evaluating systematic relationships. University of Kansas Scientific Bulletin, 1958, 28, 1409-1438.

47. N. Saitou,M. Nei, The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution, 1987, 4 (4), 406-25.

48. J. Czelusniak, M. Goodman, N.D. Moncrief, et al., Maximum parsimony approach to construction of evolutionary trees from aligned homologous sequences. Methods Enzymol, 1990, 183, 601-15.

49. J. Felsenstein, Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution, 1981, 17 (6), 368-76.

50. J.P. Huelsenbeck, B. Larget, R.E. Miller, et al., Potential applications and pitfalls of Bayesian inference of phylogeny. Systematic Biology, 2002, 51 (5), 673-88.

51. D. Hillis,J. J. Bull, An Empirical Test of Bootstrapping as a Method for Assessing Confidence in Phylogenetic Analysis, 1993, Vol, 42. 182-192.

52. J. Felsenstein, Confidence limits on phylogenies: An approach using the bootstrap. Evolution, 1985, 39 (4), 783-791.

53. L.A.F. Frantz, J.G. Schraiber, O. Madsen, et al., Evidence of long-term gene flow and selection during domestication from analyses of Eurasian wild and domestic pig genomes. Nature Genetics, 2015, 47, 1141.

54. T. Watanobe, N. Ishiguro, M. Nakano, Phylogeography and population structure of the Japanese wild boar Sus scrofa leucomystax: mitochondrial DNA variation. Zoological Science, 2003, 20 (12), 1477-89.

55. L.Y. Wang, Y.L. Chai, H.M. Ma, The complete sequence of the mitochondrial genome of Duroc pig (Sus Scrofa). Mitochondrial DNA A DNA Mapp Seq Anal, 2016, 27 (1), 3-4.

56. G.S. Wu, Y.G. Yao, K.X. Qu, et al., Population phylogenomic analysis of mitochondrial DNA in wild boars and domestic pigs revealed multiple domestication events in East Asia. Genome Biology, 2007, 8 (11), R245.

57. A.I. Fernandez, E. Alves, A. Fernandez, et al., Mitochondrial genome polymorphisms associated with longissimus muscle composition in Iberian pigs. Journal of Animal Science, 2008, 86 (6), 1283-90.

58. M.A. Kolosova, L.V. Getmantseva, S.Y. Bakoev, et al., Associations of mtDNA haplotypes with productive traits in pigs. Rendiconti Lincei. Scienze Fisiche e Naturali, 2019, 30 (4), 807-813.

59. F. Liu, H.X. Tang, Y.G. Liu, et al., The complete mitochondrial genome of Sus cebifrons (Sus, Suidae). Mitochondrial DNA, 2015, 26 (3), 483-4.

105

60. M. Wang, Z. Sheng, X. Wu, et al., Mitochondrial DNA-based genetic structure analysis of Pudong White pigs. Biochemical genetics, 2010, 48 (11-12), 924-37.

61. J. Yang, J. Wang, J. Kijas, et al., Genetic diversity present within the near-complete mtDNA genome of 17 breeds of indigenous Chinese pigs. J Hered, 2003, 94 (5), 381-5.

62. K.I. Kim, J.H. Lee, K. Li, et al., Phylogenetic relationships of Asian and European pig breeds determined by mitochondrial DNA D loop sequence polymorphism. International Society for Animal Genetics, 2002, 33 (Animal Genetics), 19-25.

63. G. Yu, H. Xiang, J. Wang, et al., The phylogenetic status of typical Chinese native pigs: analyzed by Asian and European pig mitochondrial genome sequences. Animal Science and Biotechnology, 2013, 4-9.

64. Y. Kurosawa, Electrophoretic variations of serum amylase-1 (Am-1) in native domestic pigs of Vietnam. Rep. Soc. Res. Native Livestock, 1998, 16, 85-90.

65. Nguyễn Thị Phương Mai, Nghiên cứu một số đặc điểm sinh học và di truyền của heo rừng Tây Nguyên, Luận án Tiến sĩ. 2017, Học viện Khoa học và Công nghệ - Viện Hàn Lâm Khoa học và Công nghệ Việt Nam

66. Tran Thi Thuy Nhien, P. Ni, J. Chen, et al., The complete mitochondrial genome of Mong Cai pig (Sus scrofa) in Vietnam. Mitochondrial DNA Part B, 2016, 1 (1), 226-227.

67. S. Ishihara, A. Arakawa, M. Taniguchi, et al., Genetic relationships among Vietnamese local pigs investigated using genome-wide SNP markers. Animal Genetic, 2018, 49 (1), 86-89.

68. K. Tanaka, Y. Iwaki, T. Takizawa, et al., Mitochondrial diversity of native pigs in the mainland South and South‐east Asian countries and its relationships between local wild boars, 2008, Vol, 79. 417-434.

69. H. Hongo, N. Ishiguro, T. Watanobe, et al., Variation in mitochondrial DNA of Vietnamese pigs: relationships with Asian domestic pigs and Ryukyu wild boars. Zoological Science, 2002, 19 (11), 1329-35.

70. H. Lan, L. Shi, The origin and genetic differentiation of native breeds of pigs in southwest China: an approach from mitochondrial DNA polymorphism. Biochemical Genetics, 1993, 31 (1-2), 51-60.

71. Pham Doan Lan, Do Ngoc Duy, Le Quang Nam, et al., Molecular genetic diversity and genetic structure of Vietnamese indigenous pig populations. Journal of Animal Breeding and Genetics, 2014, 131 (5), 379-386.

72. N.T. Thuy, E. Melchinger-Wild, A.W. Kuss, et al., Comparison of Vietnamese and European pig breeds using microsatellites. Journal of Animal Science, 2006, 84 (10), 2601-8.

106

73. Le Thanh Long, Thi Phuong Mai, N.D. Chung, et al., The Genetic Relationship of Vietnamese Pigs in Central Highlands Assessed by Cytochrome b, 2014, Vol, 4. 362-369.

74. Nguyễn Văn Thiện,Đinh Hồng Luận, Một số đặc điểm di truyền về năng suất của hai giống lợn nội Ỉ và Móng Cái (Sus vittatus). Kết quả bước đầu bảo tồn nguồn gene vật nuôi ở Việt Nam. 1994.

75. Lê Viết Ly, Hoàng Kim Giao, Mai Văn Sánh, et al., Bảo tồn nguồn gen vật nuôi ở Việt Nam. Sách chuyên khảo, 1999, Tập 1, 23-78.

76. Trần Văn Do, Trương Thị Quỳnh, T.H. Hải, Sinh trưởng phát triển của lợn Vân Pa tại Đakrông, Hướng Hóa, tỉnh Quảng Trị. Báo cáo tóm tắt đề tài nghiên cứu khoa học, 2005.

77. Trần Thanh Vân,Đinh Thu Hà, Khảo sát một số chỉ tiêu sản xuất của lợn Mẹo nuôi tại huyện Phú Sa tỉnh Sơn La. Tạp chí Chăn nuôi, 2005, 1.

78. Lê Thị Thúy, Lưu Quang Minh, Trần Thu Thủy, et al., Đa hình kiểu gen Leptin liên quan đến tính trạng kinh tế của một số giống lợn nuôi tại Việt Nam. Tạp chí Di truyền học và Ứng dụng, 2004, Số 4, 34-40.

79. Đỗ Võ Anh Khoa, Klaus Wimmers, Đặc điểm gen mã hóa Mannan-Binding lectin serine protease 1 ở lợn. Tạp chí Công nghệ Sinh học, 2012, Tập 10 (Số 3/2012), 65.

80. Trần Xuân Hoàn, Nghiên cứu xác định các chỉ thị phân tử trong chọn lọc lợn giống thuần chủng đạt năng suất và chất lượng thịt cao. Chương trình trọng điểm ứng dụng công nghệ sinh học trong nông nghiệp từ 2006- 2010, 2009-2013.

81. Đặng Vũ Bình, Nhân giống thuần chủng và đánh giá khả năng phát triển của đàn lợn Piétrain kháng stress Bỉ nuôi tại Việt Nam. Đề tài cấp Bộ (Bộ Giáo dục và Đào tạo) trong khuôn khổ của Chương trình hợp tác giữa Trường Đại học Nông nghiệp Hà Nội và Cộng đồng các trường Đại học pháp ngữ (Vương quốc Bỉ), 2012.

82. Nguyễn Thị Diệu Thúy, Nguyễn Thu Thúy, Nguyễn Văn Cường, Đa hình di truyền gen hormone sinh trưởng ở lợn Móng Cái. Tạp chí Công nghệ Sinh học, 2004, 2 (1), 4-6.

83. Nguyễn Thị Hoa, Phân tích đa hình một số gen liên quan đến chất lượng thịt lợn bằng phương pháp PCR – RFLP. Luận văn Thạc sỹ, 2013.

84. Lê Thị Thu Phương, Phát hiện gen halothan, gen thụ thể estrogen và mối liên quan giữa hai gen này đến năng suất sinh sản của heo nái. Luận văn thạc sỹ, 2003.

85. Nguyễn Văn Cường, Phân tích đa hình ADN trong một số ứng gen kháng bệnh ở lợn nội Việt Nam và phát triển chỉ thị di truyền phân tử hỗ trợ chọn giống lợn kháng bệnh. 2009, Đề tài NCCB trong khoa học tự nhiên được Quỹ phát triển khoa học và công nghệ quốc gia tài trợ.

86. Võ Văn Sự, Phạm Công Thiếu, Át lát các giống vật nuôi ở Việt Nam, 2016, NXB Nông Nghiệp, 37-55.

107

87. Quy chuẩn kĩ thuật quốc gia về bệnh động vật - Yêu cầu chung lấy mẫu bệnh phẩm, bảo quản và vận chuyển - QCVN 01- 83:2011/BNNPTNT

88. J. Sambrook,D. Russell, Molecular Cloning: A Laboratory Manual. 2001, Cold Spring Harbor: Cold Spring Harbor Laboratory Press, 317-332.

89. F. Sanger, S. Nicklen, A.R. Coulson, DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences U S A, 1977, 74 (12), 5463-7.

90. J. Hein,J. Stovlbaek, Combined DNA and protein alignment. Methods Enzymol, 1996, 266, 402-18.

91. S.C. Ghivizzani, S.L. Mackay, C.S. Madsen, et al., Transcribed heteroplasmic repeated sequences in the porcine mitochondrial DNA D-loop region. Journal of molecular evolution, 1993, 37 (1), 36-47.

92. W.L.S. Li,A.J. Drummond, Model averaging and Bayes factor calculation of relaxed molecular clocks in Bayesian phylogenetics. Molecular biology and evolution, 2012, 29 (2), 751-761.

93. S. Kumar, G. Stecher, K. Tamura, MEGA7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets. Molecular Biology and Evolution, 2016, 33 (7), 1870-4.

94. M. Bernt, A. Donath, F. Jühling, et al., MITOS: Improved de novo metazoan mitochondrial genome annotation. Molecular phylogenetics and evolution, 2013, 69 (2), 313-319.

95. T. Seemann, Prokka: rapid prokaryotic genome annotation. Bioinformatics, 2014, btu153.

96. S.F. Altschul, T.L. Madden, A.A. Schäffer, et al., Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic acids research, 1997, 25 (17), 3389-3402.

97. D.A. Benson, M. Cavanaugh, K. Clark, et al., GenBank. Nucleic acids research, 2013, 41 (D1), D36-D42.

98. S.K. Wyman, R.K. Jansen, J.L. Boore, Automatic annotation of organellar genomes with DOGMA. Bioinformatics, 2004, 20 (17), 3252-5.

99. F. Jühling, J. Pütz, M. Bernt, et al., Improved systematic tRNA gene annotation allows new insights into the evolution of mitochondrial tRNA structures and into the mechanisms of mitochondrial genome rearrangements. Nucleic Acids Research, 2012, 40 (7), 2833-2845.

100. S.F. Altschul, W. Gish, W. Miller, et al., Basic local alignment search tool. Journal of Molecular Biology, 1990, 215 (3), 403-410.

101. J.R. Lobry, Asymmetric substitution patterns in the two DNA strands of bacteria. Molecular Biology and Evolution, 1996, 13 (5), 660-5.

102. J. Rozas, A. Ferrer-Mata, J.C. Sanchez-DelBarrio, et al., DnaSP 6: DNA Sequence Polymorphism Analysis of Large Data Sets. Molecular Biology and Evolution, 2017, 34 (12), 3299-3302.

108

103. M. Nei,S. Kumar, Molecular Evolution and Phylogenetics, 2000, Oxford University Press.

104. A.J. Drummond, M.A. Suchard, D. Xie, et al., Bayesian phylogenetics with BEAUti and the BEAST 1.7. Molecular Biology and Evolution, 2012, 29 (8), 1969-73.

105. FigureTree, Tree Figure Drawing Tool, A. Rambaut, Editor. 2014, Institute of Evolutionary Biology, University of Edinburgh., Institute of Evolutionary Biology, University of Edinburgh.

106. N. Sueoka, Intrastrand parity rules of DNA base composition and usage biases of synonymous codons. Journal of Molecular Evolution, 1995, 40 (3), 318-25.

107. J.R. Lobry, Properties of a general model of DNA evolution under no-strand-bias conditions. Journal of Molecular Evolution, 1995, 40 (3), 326-30.

108. A. Hassanin, N. Leger, J. Deutsch, Evidence for multiple reversals of asymmetric mutational constraints during the evolution of the mitochondrial genome of metazoa, and consequences for phylogenetic inferences. Systematic Biology, 2005, 54 (2), 277-98.

109. S.J. Wei, M. Shi, X.X. Chen, et al., New views on strand asymmetry in insect mitochondrial genomes. PLoS One, 2010, 5 (9), e12708.

110. K.B. Yoon,Y.C. Park, Secondary structure and feature of mitochondrial tRNA genes of the Ussurian tube-nosed bat Murina ussuriensis (Chiroptera: Vespertilionidae). Genomics Data, 2015, 5, 213-217.

111. G.C. Conant,K.H. Wolfe, GenomeVx: simple web-based creation of editable circular chromosome maps. Bioinformatics, 2008, 24 (6), 861-2.

112. C.S. Lin, Y.L. Sun, C.Y. Liu, et al., Complete nucleotide sequence of pig (Sus scrofa) mitochondrial genome and dating evolutionary divergence within Artiodactyla. Gene, 1999, 236 (1), 107-14.

113. D.V. Lavrov, W.M. Brown, J.L. Boore, A novel type of RNA editing occurs in the mitochondrial tRNAs of the centipede Lithobius forficatus. Proceedings of the National Academy of Sciences U S A, 2000, 97 (25), 13738-42.

114. F. Kilpert,L. Podsiadlowski, The complete mitochondrial genome of the common sea slater, Ligia oceanica (Crustacea, Isopoda) bears a novel gene order and unusual control region features. BMC Genomics, 2006, 7, 241.

115. N. Okumura, Y. Kurosawa, E. Kobayashi, et al., Genetic relationship amongst the major non‐coding regions of mitochondrial DNAs in wild boars and several breeds of domesticated pigs. Animal genetics, 2001, 32 (3), 139-147.

116. T. Watanabe, Y. Hayashi, J. Kimura, et al., Pig mitochondrial DNA: polymorphism, restriction map orientation, and sequence data. Biochemical genetics, 1986, 24 (5), 385-396.

109

117. A.J. Drummond, M.A. Suchard, D. Xie, et al., Bayesian phylogenetics with BEAUti and the BEAST 1.7. Molecular Biology and Evolution, 2012, 29 (8), 1969-73.

118. M.F. Rothchild,A. Ruvinsky, The Genetics of the Pig. CAB International, Wallingford, Oxon, UK, . Journal of Animal Breeding and Genetics, 2001, 118 (5), 354-355.

119. H. Hongo, Ishiguro, N. Watanobe, T. Nobuo Shigehara, Tomoko Anezaki, Vu The Long, Dang Vu Binh, Nguyen Trong Tien, and Nguyen Huu Nam, Variation in mitochondrial DNA of Vietnamese pigs: relationships with Asian domestic pigs and Ryukyu wild boars. Zoological Science, 2002, 19 (11), 1329-1335.

120. J.M. Kijas,L. Andersson, A phylogenetic study of the origin of the domestic pig estimated from the near-complete mtDNA genome. Journal of Molecular Evolution, 2001, 52 (3), 302-8.

121. P.J. Piper, H. Matsumura, D. Bulbeck, New perspectives in Southeast Asian and Pacific prehistory. Acton, The Australian National University Press, 2017, online resource.

122. Đoàn Thị Năm, Nuôi thử nghiệm giống lợn hương quý hiếm của Trung Quốc tại Cao Bằng. http://khcncaobang.gov.vn, 2005, (Trung tâm ứng dụng tiến bộ KHCN Cao Bằng, Sở Khoa học và Công nghệ tỉnh Cao Bằng).

123. Lê Xuân Diệm, Hoàng Xuân Chinh, Di chỉ khảo cổ học Đồng Đậu, 1983, Khoa học xã hội, Hà Nội, 166.

110

PHỤ LỤC

1. Phụ lục 1 - Nguồn gốc, phân bố, đặc điểm ngoại hình, khả năng sinh

trưởng 6 giống lợn bản địa Việt Nam (theo Át lát Các giống vật nuôi ở Việt Nam

và Chuyên khảo Bảo tồn và khai thác nguồn gen vật Nuôi Việt Nam - Phụ lục 1) [5, 86]

a. Giống lợn Ỉ pha:

- Nguồn gốc: Thanh Hóa, Nam Định

- Phân bố: Từng có ở các tỉnh Nam Định, Thanh Hóa, Hà Nội và một số tỉnh

miền Bắc.

Màu sắc lông

da, hình dáng

bên ngoài

- Lông thưa, thô. Lông, da đen nhưng không bóng như lợn Ỉ

Mỡ.

- Đầu to vừa phải, trán gần phẳng, mặt nhăn, nọng cổ và má

chảy sệ khi béo, mõm ngắn, bụng ít sệ, thân, chân dài và cao

hơn so với lợn Ỉ Mỡ

Tầm vóc Trung bình

Khả năng sinh

trưởng

- Khối lượng sơ sinh 420 g/con

- Khối lượng 2 tháng tuổi: 4-4,5 kg/con

- Khối lượng 9 tháng tuổi: 40-55 kg/con

- Khối lượng 2-3 năm tuổi: 60-70 kg/con

b. Giống lợn Móng Cái:

- Nguồn gốc: huyện Đông Triều, tỉnh Quảng Ninh

- Phân bố: Các tỉnh phía Bắc và miền Trung

Màu sắc lông

da, hình dáng

bên ngoài

- Toàn thân màu lang đen trắng hình yên ngựa, đầu đen giữa

trán có một đốm trắng hình tam giác hoặc hình thoi. Mõm

trắng, có vành trắng vắt qua vai kéo xuống bụng và 4 chân

trắng. Ở chỗ tiếp giáp giữa lông đen và trắng có khoảng mờ

rộng 2-3 cm trên đó da đen lông trắng. Da mỏng mịn, lông

thưa và thô.

- Đầu to, mõm nhỏ và dài, tai nhỏ và nhọn, có nếp nhăn to và

ngắn ở miệng. Cổ to ngắn, ngực nở và sâu, lưng dài, hơi

võng, bụng hơi sệ, mông rộng và xuôi.

111

Tầm vóc Tương đối lớn, hướng mỡ

Khả năng sinh

trưởng

- Khối lượng sơ sinh 450-500 g/con



c. Giống lợn Mường Khương:

- Nguồn gốc: Huyện Mường Khương, tỉnh Lào Cai

- Phân bố: Chủ yếu ở 3 xã Cao Sơn, Tả Thàng, La Pau Tẩn, huyện Mường

Khương, tỉnh Lào Cai.

Màu sắc lông

da, hình dáng

bên ngoài.

- Màu sắc lông da đen tuyền hoặc đen có đốm trắng ở đầu,

đuôi và chân. Lông thưa và mềm.

- Bốn chân to cao, vũng chắc. Lưng hơi cong, bụng to nhưng

không sệ tới sát đất, mông hơi dốc.

- Mõm dài thẳng hoặc hơi cong. Trán nhẵn, tai tô cúp rủ về

phía trước.

Tầm vóc To nhưng lép người.

Khả năng sinh

trưởng

- Khối lượng so sinh: 600 g/con

- Khối lượng 2 tháng tuổi: 4-4,5 kg/con


- Khối lượng lúc trưởng thành: 90 -120 kg/con

d. Giống lợn Hương:

- Nguồn gốc: Cao Bằng

- Phân bố: Cao Bằng, Quảng Ninh, Hà Nội

Màu sắc lông

da, hình dáng

bên ngoài.

- Phần thân và 4 chân trắng, có mảng lông da màu đen ở mông và

da đầu. Phần tiếp giáp giữa đen và trắng rộng khoảng 2-3 cm,

trên đó da đen, lông trắng.

- Đầu đen và thô, giữa trán có một điểm trắng, chân to, bụng to

vừa phải và không chạm đất, lưng võng nhưng không gãy, bốn

chân có mầu trắng, mông dốc, vai nở, ngực sâu.


Khả năng

sinh trưởng

- Sinh trưởng chậm


112

e. Giống lợn Hạ Lang:

- Nguồn gốc: huyện Hạ Lang, Cao Bằng

- Phân bố: huyện Hạ Lang, Bảo Lâm, tỉnh Cao Bằng

Màu sắc lông

da, hình dáng

bên ngoài.

- Bụng trắng và có dải trắng vắt vai, một số con có dải đen này

gần giống yên ngựa.

- Mõm ngắn, mặt nhăn to, chân to ngắn. Lưng võng, bụng không

chạm đất và giữa trán có điểm trắng, một số con điểm trắng này

gần giống hình nêm.

Tầm vóc Lớn, hướng mỡ

Khả năng

sinh trưởng

- Khối lượng 2 tháng tuổi: 4,5-5,5 kg/con


f. Giống lợn Mường Lay:

- Nguồn gốc: tỉnh Điện Biên

- Phân bố: Chủ yếu ở huyện Mường Lay, tỉnh Điện Biên.

Màu sắc lông

da, hình dáng

bên ngoài.

- Lông da, đen toàn thân, đốm trắng bốn chân, chóp đuôi và trán,

lông thưa và hơi cứng.

- Mõm thẳng, dài vừa phải, trán có nếp nhăn, mình dài, lưng

phẳng hoặc hơi võng.

- Mình thuôn dài, tai to và dày cụp, lưng hơi võng, chân to và cao

vừa phải, đi bằng bàn.

- Núm vú đều, khi mang thai và nuôi con, núm vú không sa sệ,

không chạm đất.


Khả năng

sinh trưởng

- Khối lượng sơ sinh: 450-550 g/con



- Khối lượng lúc trưởng thành: 80-120 kg/con

113

2. Phụ lục 2 - Điện di đồ sản phẩm PCR sau tinh sạch của 6 giống lợn bản địa

Việt Nam

2.1. Điện di đồ sản phẩm PCR của Gống lợn Ỉ:

(A) Số thứ tự của giếng từ 1 - 10 tương ứng với thứ tự các cặp mồi 1 -10

(B) Số thứ tự của giếng từ 11 - 20 tương ứng với thứ tự các cặp mồi 11 -20

(C) Số thứ tự của giếng từ 21 - 30 tương ứng với thứ tự các cặp mồi 21 -30

Neg: đối chứng âm. , M: Marker 1kb

11 12 13 14 15 16 17 18 19 20 Neg M

Neg 21 22 23 24 25 26 27 28 29 30 M

A

B

C

1 2 3 4 5 6 M 7 8 9 10 Neg

10000 bp 1500 bp

1000 bp 750 bp 500 bp

250 bp

114

Điện di đồ sản phẩm PCR lại của giống lợn Ỉ

(sau khi đã thay đổi nhiệt độ gắn mồi).

Số thứ tự của giếng tương ứng với số thứ tự của mồi được trình bày tại bảng 2.2

Phản ứng diễn ra với nhiệt độ gắn mồi 53oC (hình A, B, C), 51oC (hình D).

Neg: đối chứng âm. , M: Marker 1kb

3 4 Neg M 21 23 28 29 30 M Neg

15 16 M Neg

A B

Neg 21 29 M

D C

10000 bp 1500 bp 1000 bp

750 bp 500 bp

250

115

2.2. Điện di đồ sản phẩm PCR của giống lợn Mường Khương

Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở

bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.

2.3. Điện di đồ sản phẩm PCR của Giống lợn Móng Cái

Điện di đồ sản phẩm PCR của lợn Móng Cái với 30 cặp mồi

Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.

250 bp

750

bp

1000 bp

10000 bp

1500 bp

500 bp

M 1 2 3 4 5 6 7 8 9 10

1000 bp

10000 bp

750 bp 500 bp 250

1500 bp

116

2.4. Điện di đồ sản phẩm PCR của Giống lợn Mường Lay

Sản phẩm PCR của lợn Mường Lay với 30 cặp mồi


1000 bp 1500 bp

250 bp

10000 bp

750 bp 500 bp

117

2.5. Điện di đồ sản phẩm PCR của Giống lợn Hạ Lang

Điện di đồ sản phẩm khuếch đại trình tự hệ gen ty thể của lợn Hạ Lang với 30 cặp mồi


7 8 9 Neg M

10000 bp

1500 bp

250 bp 500 bp 750 bp 1000 bp

118

2.6. Điện di đồ sản phẩm PCR của Giống lợn Hương

Số thứ tự của giếng từ 1 - 30 tương ứng với thứ tự các cặp mồi được liệt kê ở

bảng 2.2., M: Marker 1kb, Neg: đối chứng âm.

3. Phụ lục 3 - Trình tự hoàn chỉnh hệ gen ty thể của 6 giống lợn bản địa Việt

Nam

Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Mường Khương: >VNpig4 [organism=S. scrofa] [breed=Muong Khuong black pig] [country=Vietnam] S. scrofa breed Muong Khuong Black pig mitochondrion, complete genome CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC

ACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATATTATAGCCCTATGTACGTCGTGCATTAACTGC

TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATCATTATTGATCGTACATAGCACATATCATGTCAAATA

ATTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT

TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTATTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC

CCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAATGACTAATCAGCCCATGCTCACACATAACTGAGGTTTCATACATTTGGTATTTT

TTAATTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAATCAATTGTAGCTGGACTTCATGGAACTCATGAT

CCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTA

CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC

ACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATA

AGCAGGTAAAYTATTAGCTCATTCAAACCCCCCTTACCCCCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAA

CAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACACTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTACTTAA

ATACGTGCTACGAAAGCAGGCACCTACCCCCCTAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAA

AATATAAGCACCTATTTAAGCATACGCCCACAATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGC

CTAGATGGGCCTCACAGCCCCATAAACACACAGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCC

CCGGTGAGAATGCCCTCCAGATCCTAAAGATCAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCAC

ACCCCCACGGGAAACAGCAGTGATAAAAATTAAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAG

M Neg 1 2 3 4 5 6 7 8 9 10

M 15 Neg 11 12 13 14 15 16 17 18 19 20 M

21 22 23 24 2 5 26 27 28 29 30 Neg M

10000 bp

1500 bp

1000 bp 750 bp 500 bp

250 bp

119 CCACCGCGGTCATACGATTAACCCAAATTAATAGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAAC

TAAGCTGTAAAAAGCCCTAGTTAAAATAAAATAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGAT

TAGATACCCCACTATGCCTAGCCCTAAACCCAAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAA

GGACTTGGCGGTGCTTTACATCCACCTAGAGGAGCCTGTTCTATAATCGATAAACCCCGATAGACCTCACCAACCCTTGCCAATTCAGCCTA

TATACCGCCATCTTCAGCAAACCCTAAAAAGGAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGG

TTGGAAAGAAATGGGCTACATTTTCTACATAAGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTA

AATCAAGAATAGAGTGCTTGATTGAATAAGGCCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACC

TATATTCAATTACACAACCATGCAAGAAGAGACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTA

AACTAAAGCACCTAGTTTACACCTAGAAGATCCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAA

TACACCAAAATAAAATAAAACATTCACCTAACATTAAAGTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGG

AAAGATGAAAGAATAAAATAAAAGTAAAAAAAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAA

AGAGAACTTTAGCTAGATACCCCGAAACCAGACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAA

GACTTGTAGGTAGAGGTGAAAAGCCTAACGAGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAA

AACCCTAAATTCCAATGTATTTTTAAGAGATAGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTA

ATACTACCATAGTAGGCCTAAAAGCAGCCATCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACA

AACTCCTAGCCCAATACCGGACTAATCTATTGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTT

ACATCAGTAACTAATAATATACTGATAATTAACAATCAATAAACCAAAACAACACTAAAGCGTTCATTAATTATATTGTTAACCCAACACA

GGAGTGCACCAAGGAAAGATTAAAAGAAGTAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTA

CTAGTATTAGAGGCAATGCCTGCCCAGTGACACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAA

ATAAGGACTTGTATGAATGGCCACACGAGGGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAA

AAAATAAGACGAGAAGACCCTATGGAGCTTTAATTAACTATTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACAT

GGACTAGCAATTTCGGTTGGGGTGACCTCGGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATACAT

CACTTATTGATCCAAAATTTTGATCAACGGAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTT

TACGACCTCGATGTTGGATCAGGACACCCAAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGT

TCAGACCGGAGCAATCCAGGTCGGTTTCTATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGC

GTCTCAGAGATAATTAATGATATAATCTTAACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCG

GTAATTGCGTAAAACTTAAACCTTTATTACCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCC

TATCCTACTGGCCGTAGCATTCCTCACCCTAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCT

ACGGCCTACTCCAACCCATCGCCGATGCCCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATT

GCACCAATCCTAGCCTTATCCCTAGCACTAACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATT

CATGCTAGCCATGTCAAGCCTAGCAGTCTATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAG

CAGTAGCCCAAACAATTTCATATGAAGTAACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACCCTATCCACCCTA

ATCACAACACAAGAGCACATTTGAATAATCTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGC

CCCGTTCGACCTTACAGAAGGAGAGTCAGAACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAG

AATATGCCAACATCATCATAATAAATGCATTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATC

AACTTCGTACTAAAAACACTCGCATTAACAATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTT

ACTATGAAAAAGCTTCCTGCCCCTAACACTAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCAT

AGAAATATGTCTGATAAAAGAGTTACTTTGATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAA

GCCTGAGAATTCAAAATTCTCCGTGCTACCAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAA

AATGTTGGTTCATACCCTTCCCATACTAATAAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAAT

CAGCTCACACTGACTACTCATCTGAATCGGATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCA

CAGAAGCAGCCACAAAATATTTCCTAACACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAA

TGGACCATTACAAAAATATTTAACCCAGTAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTG

AGTCCCAGAAGTAACCCAAGGCATTTCACTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAA

ATCTCACAATCAATCAACCCAAACCTAATATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAAC

TTCGAAAAATCATAGCATATTCATCAATCGCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCT

ACTAATTTACATCACAACAACACTAGCAATATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACA

AGATACCCATCATCACAAGCCTAATAATAGTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATC

ATTCAAGAAATAACAAAAAATGAAAGCATCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAG

CCTACTCCTCCTCACTGACTATGTTCCCATCCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCC

ACAATAATTGTATTATCGACACTAATCCTACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCT

TCAAAGCTCTAAGTAAGTACAAAGTACTTAACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACAC

TTTAATTAAGCTAAATCCTCACTAGATTGGTGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAA

TCTACTTCTCCCGCCGCAGGAAAAAAAAGGCGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTC

ACCACGGAACTGGCAAAAAGAGGGCTTAACCTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTT

GACTATACTCAACAAACCACAAAGACATCGGCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACT

AATTCGCGCTGAACTAGGTCAGCCCGGAACCCTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCT

TCTTTATAGTAATACCCATTATGATTGGGGGTTTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAA

ACAACATAAGTTTCTGACTACTTCCACCATCCTTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTA

TACCCACCTTTAGCTGGAAACTTAGCCCATGCAGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTA

120 GGGGCTATTAATTTCATTACCACAATTATTAACATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATC

ACAGCCGTACTACTTCTACTATCCCTGCCAGTTCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGAT

CCAGCAGGTGGTGGAGACCCTATCCTTTATCAACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGA

ATAATCTCCCACATTGTAACCTACTATTCAGGTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTT

AGGTTTTATCGTATGGGCTCACCACATATTCACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTA

TTCCCACTGGAGTAAAAGTATTTAGTTGATTAGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTC

ATCTTCCTATTCACCGTAGGAGGTCTAACGGGCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCA

CACTTCCACTATGTCTTATCTATAGGAGCAGTGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAAC

CAAGCATGAGCAAAAATTCACTTTGTAATTATATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACC

TCGACGATACTCCGATTATCCTGACGCATACACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAA

TAATCTTCATTATCTGAGAAGCATTTGCATCAAAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATG

TCCTCCTCCCTATCACACATTTGAAGAACCAACATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTT

CAAGCCAACGTCATAACCACTATGTCTTTCTCGATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAA

GCCCTATATGCCTCTATGGCTTACCCTTTCCAACTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCAC

ACCTTAATAATTGTATTCTTAATCAGCTCTTTAGTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGAT

GCCCAAGAAGTAGAAACAATTTGAACAATCCTACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGAC

GAAATTAATAACCCAGCCTTAACCGTAAAAACCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTG

ACTCATATATAATCCCCACATCAGATCTTAAACCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAAC

AATCCGAATATTAGTGTCCTCTGAAGACGTACTACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAA

ACCAAACAACTCTAATATCCACACGACCTGGCCTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTA

CTTGAACTTGTCCCATTAAAGTACTTCGAAAAATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGT

TAGAGATCGGGAGCCTAAATCTCCCCTCAATGGTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACAT

TATTTATTTTATTCCAACTAAAAATCTCAAACTACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCT

TGAGAAATAAAATGAACGAAAATCTATTTGCCTCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAA

GCTTACTATTCCCAACACCCAAACGACTCATTAATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATA

GCTATTCACAACCAAAAAGGCCAAACCTGATCACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACC

ACACTCATTCACACCCACCACACAACTATCAATAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATA

AAACCAAAACATCACTAGCCCACTTTCTACCACAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTT

ATTCAACCAGTAGCCCTAGCCGTACGACTGACAGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCAC

TACTCAACATCAGCACTATGACAGCTTTTATCACATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTT

ATGTGTTTACACTGCTAGTAAGCTTATACCTACACGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCAT

GACCACTTACCGGAGCCCTATCAGCCCTTTTAATAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGAC

TATTAACCAATACTTTGACAATATACCAATGGTGACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAA

AGGCTTACGATACGGTATAATTTTATTTATTATTTCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCA

ACACCCGAATTAGGAGGTTGCTGACCACCAACAGGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGC

CTCAGGAGTATCCATTACCTGAGCCCATCACAGCCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTA

GGCGTATACTTCACCCTCCTCCAAGCCTCAGAATATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCT

ACAGGATTTCACGGGTTGCACGTAATCATCGGATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCA

CCACTTCGGCTTTGAAGCCGCAGCCTGATACTGACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTA

CTCTTTTAGTATTAAGCAGTACAATTGACTTCCAATCAATCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTC

ACAAACGTAACCCTAGCCTCCCTACTCGTACTAATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATG

TGGATTTGACCCCATAGGATCAGCACGCCTCCCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGC

CCTCCTCCTTCCCCTACCATGAGCATCCCAAACAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAA

GCCTAGCATACGAATGAACCCAAAAAGGCCTAGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGAC

TATGATTTACTTCATAATTATCAAGTGCCATTAGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGA

TCTCACTTAATATCTTCACTACTATGCCTAGAAGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACC

CTAGCTAACATAATACCCATTATTTTACTAGTGTTTGCAGCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATA

CGGTACCGATTACGTCCAAAACTTAAACCTCTTACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAA

ACACAACATAATCTGAATCAATGCAACAGTACATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCC

TTAATTTTTCCTTAACATTCTTCTCCGACTCACTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCA

ATCCCACCTATCAAAAGAAACCACAACCCGAAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCG

CCACCGAACTAATCTTATTCTATATCCTATTCGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACG

ACTCAATGCAGGACTTTATTTCCTATTCTACACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACTACAGGCTC

ACTAAACTTCTTAATTATCCATTACTGATCCCACCCATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCAT

AGTAAAAATACCTCTATACGGACTCCATCTTTGACTGCCAAAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTAC

TGCTAAAACTCGGAGGCTATGGCATAATACGAATCACTACTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCC

ATATGAGGTATAATCATAACCAGCTCTATCTGCTTACGTCAAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTT

GTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTCATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATT

CTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACA

TGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATG

121 ATCCAACATCACAATTATTCTCATAGGAATAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAAT

ACACCCACCACATTAACAACATCAAACCCTCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTA

AACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCT

TATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCG

TTGGTCTTAGGAACCAAAAAATTGGTGCAACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAAC

CATCCCAATTATAATATCCAACTCAAACATCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCA

GCCTAGTCCCCTTACTAATATTTATACACACAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCT

CTTAGCTTTAAAATAGACTATTTCTCAGTAATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATA

CACTCAGACCCCTTCATCAACCGATTCTTTAAATACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAA

CTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTCCTGCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTAC

AAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTCCTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAA

ATCTTTATACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCC

CTGATTGCCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCC

GCTTCTACCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCA

ATCACACAAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCC

ACCTAGCATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAAC

AAGACATCCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCC

TTATCTCACAGGATTCTACTCAAAAGACCTTATTATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTG

CCACATCCCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAA

ATAACCCCCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAG

TACCAAACACAACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACAC

AACCTACTACCTGAAATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAA

CATACCACAACCTGTCTATAAGCCAAAAATCCGCATCATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTC

ATCCAAATAAAAATATCAATTATAGTATCAAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCAT

AATACTATTTAATTACCACGAGTAATCTCCATAATAACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCAT

AACTATATAAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAAC

TTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGT

CTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAA

AACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATGCCACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAA

TAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATG

GAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTA

ATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTA

ATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGA

CGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATGTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTAT

ACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTG

CCCTGAGGACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAAT

CTGAGGGGGCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGT

ACATCTCCTATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTA

TTAAAGACATTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTAC

ACCCCAGCAAACCCACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAA

ACTAGGTGGAGTGCTAGCTCTAATAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTC

GACCACTAAGTCAATGCCTATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATC

ATCATCGGCCAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGA

AGAGTCTTTGTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCC

GCCATCAGCACCCAAAGCTGAAATTCTAACTAAACTATTCCCTG

Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Hạ Lang:

>VNpig5 [organism=S. scrofa] [breed=Ha Lang pig] [country=Vietnam] S. scrofa breed Ha Lang pig

mitochondrion, complete genome

CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC


TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATTATTATTGATCGTACATAGCACATATCATGTCAAATA

ACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT

TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTACTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC




122 CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC

ACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACA

CGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCCCTTACCCCCCATTAAACTTATGCTCTACAC

ACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACACTAAACAACATTTAACAACACAA

ACCACCATATCTTATAAAACACTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGGCACCTACCCCCCTAGATTTTTACGCCAATCT

ACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCCCACMATCTGAATATAGCTTATA

GTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAACACACAGGTTTGGTCCTGGCCTTT

CTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAAAGATCAAAAGGAGCAGGTATCA

AGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAAAAATTAAGCCATGAACGAAAGTT

TGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAAATTAATAGATCCACGGCGTAAAGA

GTGTTTAAGAAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAATAAAATAACCCACGAAAGTGAC

TCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTAAACCCAAATAGTTACATAACAA

AACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTCACATCCACCTAGAGGAGCCTGTTCTATAATCG

ATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAAAAAGGAACAATAGTAAGCACA

ATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTACATAAGAATACCCACCATACG

AAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAATAAGGCCATGAAGCACGCACA

CACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGAAGAGACAAGTCGTAACAAGG

TAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGAAGATCCCATAATATATGGGT

ACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCACCTAACATTAAAGTATAGGAG

ATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATAAAATAAAAGTAAAAAAAAGCAAAGATTACCC

CTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAACCAGACGAGCTACCTATGAG

CAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTAACGAGCCTGGTGATAGCTGG

TTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGAGATAGTCTAAAAAGGTACAG

CTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAGCCATCAATTGAGAAAGCGTT

AAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATCTATTGAAACATAGAAGCAAT

AATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATAATTAACAATCAATAAACCAA

AACAACACTAAAGCGTTTATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGAAGTAAAAGGAACTCGGCAA

ACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGTGACACCAGTTTAACGGCCGC

GGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACGAGGGTTTTACTGTCTCTTACT

TCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGAGCTTTAATTAACTACTCCAAA

AGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGACCTCGGAGTACAAAAAACCCTC

CGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATAACATCACTTATTGATCCAAAATTTTGATCAACGGAACAAGTTACCCTAGGG

ATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGACACCCAAATGGTGCAACCGCTAT

TAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGTTTCTATCTATTATAAATTTCTCC

CAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAATCTTAACCTAATTAACTCATAAT

AAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTTATTACCAGAGGTTCAACTCCTCT

CCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTCACCCTAGTAGAACGAAAAGTACT

AGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCGATGCCCTAAAACTATTCACCAAA

GAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTAGCCTTATCCCTAGCACTAACAATATGAGTTCCACTA

CCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCAGTCTATTCTATCCTATGATCAGG

ATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAAACAATTTCATATGAAGTAACACTGGCAATCATCCTA

CTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACAAGAGCACATTTGAATAATCTTTACATCCTGACCCCT

AGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAGTCAGAACTTGTATCAGGCTTT

AACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAATGCATTCACAGCAATTCTCTT

CCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCATTAACAATCACCTTCCTATGAA

TCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTAACACTAGCTCTATGTATATGA

CACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTACTTTGATAGAGTAAAAAATAG

AGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTCAAAATTCTCCGTGCTACCAAAATACACCACATTCT

ACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACTAATAAATCCCATTATCTACAC

TACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAATCGGATTCGAAATAAACCTAT

TAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCTAACACAAGCCACAGCCTCCAT

GATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTACAAAAATATTTAACCCAGTAGCAATAACAATAATAA

CCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAGTAACCCAAGGCATTTCACTACAAGCAGGCCTACTA

TTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCTAATATTAACTATGGCCATATT

ATCAATTTTAATCGGAGGGTGAGGGGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCAATCGCACACATAGGATGAATG

ACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAGCAATATTCATACTATTAATCCA

CAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATAATAGTAACCCTACTCTCAATAG

GAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAAGCATCATCATGCCAACACTCAT

AGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCCCATCCACCAATAACATAAAAA

TAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCAACACTAATCCTACCTATAACACCAGCCCTC

123 TCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGTACTTAACTCCTGAAAACCTAAG

GACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGATTGGTGGGATTACATACCCACG

AAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAAAAGGCGGGAGAAGTCCCGGCA

GAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCTTAACCTCTGTCTTTAGATTTAC

AGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGACATCGGCACCCTGTACCTACTAT

TTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGGAACCCTACTTGGCGATGATCA

AATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGGGGGTTTTGGTAACTGACTCGT

ACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCACCATCCTTCCTATTACTACTGGC

ATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCGCCTTTAGCTGGAAACTTAGCCCATGCAGGAGCTTCAGTTGAT

CTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATTATTAACATAAAACCTCCCGCA

ATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTGCCAGTTCTAGCAGCTGGCATT

ACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCTTTATCAACACTTGTTCTGATTT

TTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTATTCAGGTAAAAAAGAACCATT

TGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACATATTCACCGTAGGAATAGACG

TGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGTTGATTAGCTACCCTGCACGGC

GGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCTAACGGGCATTGTACTAGCTAA

CTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGGAGCAGTGTTTGCCATTATAGG

GGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGTAATCATATTCGTAGGAGTAA

ATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCCGATTATCCTGACGCATACACAGCATGAAATACT

ATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTGCATCAAAACGAGAAGTATC

TGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGAACCAACATATATCAACCTA

AAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTCTTTCTCGATAATCGAGGTA

TTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCTTTCCAACTAGGCTTCCAAG

ACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGCTCTTTAGTGTTATATATCA

TTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAACAATCCTACCCGCTATTATT

TTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGTAAAAACCATAGGACATCA

ATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGATCTTAAACCTGGAGAAATAC

GACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAGACGTACTACACTCATGAGCT

GTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGACCTGGCCTTTATTACGGACA

GTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTCGAAAAATGGTCAACATCAA

TATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCTCAATGGTATGCCACAACTA

GATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTCAAACTACTCATACCCAGCA

AGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTATTTGCCTCTTTCATTGCCCC

TACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGACTCATTAATAACCGCACAAT

CTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATGGCTATTCACAACCAAAAAGGCCAAACCTGATCACTAATACTTATA

TCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAACTATCAATAAACCTGGGTAT

AGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTTCTACCACAAGGAACACCC

GCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACGACTGACAGCCAACATTACA

GCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATAACAGCTTTTATCACATTTACTATCCT

CATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATACCTACACGACAATACATA

ATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCCTTTTAATAACATCAGGCCT

AATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACCAATGGTGACGAGACATTAT

TCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTTATTATTTCCGAGGTTCTGT

TCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCACCAACAGGAATTCACCCA

CTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCATCACAGCCTAATAGAAGG

GGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCTCAGAATATTACGAAGCAC

CATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATCATCGGATCTACTTTCCTAG

CAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTGATACTGACACTTCGTAGAT

GTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTGACTTCCAATCAATCAGTTT

CGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTCGTACTAATCGCATTCTGAC

TACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCACGCCTCCCATTCTCAATAAA

ATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATCCCAAACAAACAATCTAAA

AACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAAGGCCTAGAATGAACAGAA

TATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTGCCATTAGTATACATAAAC

ATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGCCTAGAAGGAATGATATTA

TCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTACTAGTGTTTGCAGCCTGC

GAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTACGTCCAAAACTTAAACCTCTTACAATGCTAAAA

ATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAACAGTACATAGTCTCCTCAT

TAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGACTCACTATCAGCACCCCT

ACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAACCCGAAAAAAACTATATA

124 TTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCCTATTCGAAGCAACACTAG

TACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTCTACACCCTAGCAGGATCC

CTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTTAATTATCCATTACTGATCCCACCCATTATCCAAC

TCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTATACGGACTCCATCTTTGACTGCCAAAAGCC

CATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAATGCGAATCACTACTATTCT

AAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATAATCATAACCAGCTCTATCTGCTTACGTCAAACCG

ACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTCATAGGA

GCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCGAACCAT

AATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCCCCATCC

ATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAATAAACATAATAATTAC

AGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACATTAACAACATCAAASCCTCATTCACACGAGAAA

ACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATAGTTTAA

TAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCTTCCACA

CTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGAACCAAAAAATTGGTGCAACTCCAAATAAAAGTAA

TAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAATATCCAACTCAAACATCTACAAAACTAACCTTT

ACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATATTKATACACACAGGCCAAGAAATAATC

ATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCAGTAATATTCATTCCCGTAGCA

CTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTTAAATACCTACTACTATTC

TTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTCCTCCTAATC

GGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTCCTATCCA

TAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTA

CTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACT

ACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACAC

TATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACACAAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGC

CAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGCATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACT

ATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACATCCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACA

ACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTCACAGGATTCTACTCAAAAGACCTTATCATTGAAGCAGCAA

ACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATCCCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCAT

TCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCCCCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGC

ATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAACACAACAATACCCCTTTACATAAAAATAACAGCCCTAAT

CGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCTGAAATTTAAATACCCATCACAAACATACAAATTTT

CCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACCTGTCTATAAGCCAAAAATCCGCATCATCATTACTA

GACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAAATATCAATTATAGTATCAAATCAAAAAGGCCTAAT

CAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAATTACCACGAGTAATCTCCATAATAACAACAACTCCA

ATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATRAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTG

AATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATAC

AAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGT

AGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATACC

ACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAAT

AGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATGGAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAA

CTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTAATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAA

CATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTAATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATC

AGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGACGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCAT

CCATRTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTATACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCC

TACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAGGACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTA

CTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGGGCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGC

CTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCTATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAAT

CTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACATTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCT

TGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAAACCCACTAAACACCCCACCCCATATTAAACCAGAATGA

TATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCTAGCTCTAATAGCCTCCATCCTAATCCTAATTTTA

ATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAATGCCTATTCTGAATACTAGTAGCAGACCTCATTAC

ACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATT

GATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAG

GAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAAAGCTGAAATTCTAACTAAACTATTCCCTG

Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Hương: >VNpig6 [organism=S. scrofa] [breed=Huong pig] [country=Vietnam] S. scrofa breed Huong pig mitochondrion, complete genome CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC


125 TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATTATTATTGATCGTACATAGCACATATCATGTCAAATA

ACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT

TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTACTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC




CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC

ACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACA

CGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCC

CTTACCCCCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTA

ACTTACACTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGG

CACCTACCCCCCTAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAG

CATACGCCCACAATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCC

CCATAAACACACAGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCA

GATCCTAAAGATCAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCA

GTGATAAAAATTAAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTA

ACCCAAATTAATAGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCT

AGTTAAAATAAAATAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCCACTATGC

CTAGCCCTAAACCCAAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTC

ACATCCACCTAGAGGAGCCTGTTCTATAATCGATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAG

CAAACCCTAAAAAGGAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGC

TACATTTTCTACATAAGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTG

CTTGATTGAATAAGGCCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACA

ACCATGCAAGAAGAGACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAG

TTTACACCTAGAAGATCCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAA

TAAAACATTCACCTAACATTAAAGTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATA

AAATAAAAGTAAAAAAAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAG

ATACCCCGAAACCAGACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGG

TGAAAAGCCTAACGAGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAAT

GTATTTTTAAGAGATAGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAG

GCCTAAAAGCAGCCATCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAAT

ACCGGACTAATCTATTGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAAT

AATATACTGATAATTAACAATCAATAAACCAAAACAACACTAAAGCGTTTATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGA

AAGATTAAAAGAAGTAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAA

TGCCTGCCCAGTGACACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGA

ATGGCCACACGAGGGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAA

GACCCTATGGAGCTTTAATTAACTACTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCG

GTTGGGGTGACCTCGGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATAACATCACTTATTGATCCA

AAATTTTGATCAACGGAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGT

TGGATCAGGACACCCAAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCA

ATCCAGGTCGGTTTCTATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAA

TTAATGATATAATCTTAACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAA

ACTTAAACCTTTATTACCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCC

GTAGCATTCCTCACCCTAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCC

AACCCATCGCCGATGCCCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTA

GCCTTATCCCTAGCACTAACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCAT

GTCAAGCCTAGCAGTCTATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAA

ACAATTTCATATGAAGTAACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACA

AGAGCACATTTGAATAATCTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACC

TTACAGAAGGAGAGTCAGAACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAAC

ATCATCATAATAAATGCATTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACT

AAAAACACTCGCATTAACAATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAA

GCTTCCTGCCCCTAACACTAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCT

GATAAAAGAGTTACTTTGATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTC

AAAATTCTCCGTGCTACCAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCAT

ACCCTTCCCATACTAATAAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTG

ACTACTCATCTGAATCGGATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCC

ACAAAATATTTCCTAACACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTAC

AAAAATATTTAACCCAGTAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAG

TAACCCAAGGCATTTCACTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCA

126 ATCAACCCAAACCTAATATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGGGGACTAAACCAAACCCAACTTCGAAAAATCA

TAGCATATTCATCAATCGCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATC

ACAACAACACTAGCAATATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCAT

CACAAGCCTAATAATAGTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATA

ACAAAAAATGAAAGCATCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTC

ACTGACTATGTTCCCATCCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTA

TTATCAACACTAATCCTACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAA

GTAAGTACAAAGTACTTAACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTA

AATCCTCACTAGATTGGTGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCG

CCGCAGGAAAAAAAAGGCGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGG

CAAAAAGAGGGCTTAACCTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAAC

AAACCACAAAGACATCGGCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAA

CTAGGTCAGCCCGGAACCCTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATA

CCCATTATGATTGGGGGTTTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTT

CTGACTACTTCCACCATCCTTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCGCCTTTAG

CTGGAAACTTAGCCCATGCAGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATT

TCATTACCACAATTATTAACATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTA

CTTCTACTATCCCTGCCAGTTCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGT

GGAGACCCTATCCTTTATCAACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCAC

ATTGTAACCTACTATTCAGGTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGT

ATGGGCTCACCACATATTCACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAG

TAAAAGTATTTAGTTGATTAGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCA

CCGTAGGAGGTCTAACGGGCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTAT

GTCTTATCTATAGGAGCAGTGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCA

AAAATTCACTTTGTAATTATATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCC

GATTATCCTGACGCATACACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATC

TGAGAAGCATTTGCATCAAAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATC

ACACATTTGAAGAACCAACATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCA

TAACCACTATGTCTTTCTCGATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTC

TATGGCTTACCCTTTCCAACTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGT

ATTCTTAATCAGCTCTTTAGTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAG

AAACAATTTGAACAATCCTACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACC

CAGCCTTAACCGTAAAAACCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATC

CCCACATCAGATCTTAAACCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAG

TGTCCTCTGAAGACGTACTACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTA

ATATCCACACGACCTGGCCTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCC

ATTAAAGTACTTCGAAAAATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAG

CCTAAATCTCCCCTCAATGGTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTC

CAACTAAAAATCTCAAACTACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAAT

GAACGAAAATCTATTTGCCTCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCC

AACACCCAAACGACTCATTAATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATGGCTATTCACAAC

CAAAAAGGCCAAACCTGATCACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCAC

ACCCACCACACAACTATCAATAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACA

TCACTAGCCCACTTTCTACCACAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTA

GCCCTAGCCGTACGACTGACAGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCA

GCACTATAACAGCTTTTATCACATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACT

GCTAGTAAGCTTATACCTACACGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCG

GAGCCCTATCAGCCCTTTTAATAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATA

CTTTGACAATATACCAATGGTGACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATA

CGGTATAATTTTATTTATTATTTCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTA

GGAGGTTGCTGACCACCAACAGGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATC

CATTACCTGAGCCCATCACAGCCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTC

ACCCTCCTCCAAGCCTCAGAATATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCA

CGGGTTGCACGTAATCATCGGATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTT

TGAAGCCGCAGCCTGATACTGACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTAT

TAAGCAGTACAATTGACTTCCAATCAATCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACC

CTAGCCTCCCTACTCGTACTAATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCC

CATAGGATCAGCACGCCTCCCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCC

CTACCATGAGCATCCCAAACAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGA

ATGAACCCAAAAAGGCCTAGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTC

127 ATAATTATCAAGTGCCATTAGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATAT

CTTCACTACTATGCCTAGAAGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAA

TACCCATTATTTTACTAGTGTTTGCAGCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTAC

GTCCAAAACTTAAACCTCTTACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATC

TGAATCAATGCAACAGTACATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTT

AACATTCTTCTCCGACTCACTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATC

AAAAGAAACCACAACCCGAAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAA

TCTTATTCTATATCCTATTCGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGG

ACTTTATTTCCTATTCTACACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTT

AATTATCCATTACTGATCCCACCCATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACC

TCTATACGGACTCCATCTTTGACTGCCAAAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCG

GAGGCTATGGCATAATGCGAATCACTACTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATA

ATCATAACCAGCTCTATCTGCTTACGTCAAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCA

ATCATAATTCAAACCCCCTGAAGCTTCATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAA

CACTAACTATGAACGAGTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATA

GCAAGCCTCACAAACCTAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCAC

AATTATTCTCATAGGAATAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACA

TTAACAACATCAAACCCTCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATA

ATCCTAGGACCCCTTTACTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAA

AAGTTTGCAAGAACTGCTAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGA

ACCAAAAAATTGGTGCAACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTAT

AATATCCAACTCAAACATCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTT

ACTAATATTTATACACACAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAA

TAGACTATTTCTCAGTAATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCT

TCATCAACCGATTCTTTAAATACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGAT

GAGAAGGCGTAGGAATCATATCATTCCTCCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATA

CAACCGCATCGGAGACATTGGATTTGTCCTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAA

ACAATGAATGCCCAAACATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCA

GCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTT

AATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACACAAAAT

GATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGCATTTCT

TCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACATCCGAA

AAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTCACAGG

ATTCTACTCAAAAGACCTTATCATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATCCCTAA

CCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCCCCTAC

TAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAACACA

ACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCT

GAAATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACC

TGTCTATAAGCCAAAAATCCGCATCATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAA

ATATCAATTATAGTATCAAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAAT

TACCACGAGTAATCTCCATAATAACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATAAAGC

AGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTT

CTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACT

CAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAAC

CTAAAAAAGACCCACCAAAATTCAATACAATACCACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTT

AGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATGGAATCTAACCACG

ACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTAATAAAAATTATCA

ACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTAATCTTGCAAATCC

TAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGACGTAAATTACGGA

TGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATGTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTATACTACGGATCCTAT

ATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAGGACAAAT

ATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGGGCTTTT

CCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCTATTCC

TGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACATTCTA

GGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAAACCC

ACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCT

AGCTCTAATAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAAT

GCCTATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTA

GCCTCCATCTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTA

128 TATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAA

AGCTGAAATTCTAACTAAACTATTCCCTG

Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Ỉ:

>I PIG COMPLETE MITOCHONDRIAL GENOME

GCAACCAAAACAAGCATTCCATTCATATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCG

CACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATATTATAGCCCTATGTACGTCGTGCATTAACC

GCTAGTCCCCATGCATATAAGCATGTACATACTATTATTAATATTACATAGTACATATCATTATTGATCGTACATAGCACATATCATGTCAAA

TAACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCT

CTTCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTATTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCACCTAAAATC

GCCCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAGTGACTAATCAGCCCATGCTCACACATAACTGAGGTTTCATACATTTGGTATT

TTTTAACTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAATCAATTGTAGCTGGACTTCATGGAACTCATG

ATCCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCGTACACATGCGTACACATGCGTACACRTGCG

TACACATGCGTACACGTGCGTACACRTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGT

ACACRTGCGTACACGTGCGTACACATGCGTACACGTGCGTTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGT

ACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCCCTTACCC

CCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACA

CTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACGCTTACTTAAATACGTGCTACGAAAGCAGGCACCTACCCCCCTAGATTT

TTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCCCACAATCTGAA

TATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAACACACAGGTTTG

GTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAAAGATCAAAAGG

AGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAAAAATTAAGCCAT

GAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAAATTAATAGATCCA

CGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAATAAAATAACCCA

CGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTAAACCCAAATAGT

TACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTCACATCCACCTAGAGGAGCCTG

TTCTATAATCGATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAAAAAGGAACAAT

AGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTACATAAGAATAC

CCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAATAAGGCCATGAA

GCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGAAGAGACAAGTC

GTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGAAGATCCCATAA

TATATGGGTACTTTGAACCAAAGCTAGCTCAACATACTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCACCTAACATTAAA

GTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATAAAATAAAAGTAAAAAAAAGCAA

AGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAACCAGACGAGCT

ACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTAACGAGCCTGGT

GATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGAGATAGTCTAAA

AAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAGCCATCAATTGA

GAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATCTATTGAAACAT

AGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATAATTAACAATCA

ATAAACCAAAACAACACTAAAGCGTTTATTAACTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGAAGTAAAAGGA

ACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGTGACACCAGTTT

AACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACGAGGGTTTTACTG

TCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGAGCTTTAATTAAC

TATTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGACCTCGGAGTACAA

AAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAATCATAACATCACTTATTGATCCAAAATTTTGATCAACGGAACAAGTT

ACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGACACCCAAATGGTGC

AACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGTTTCTATCTATTAT

AAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAATCTTAACCTAATT

AACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTTATTACCAGAGGTT

CAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTCACCCTAGTAGAAC

GAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCGATGCCCTAAAACT

ATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTAGCCTTATCCCTAGCACTAACAATAT

GAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCAGTCTATTCTATCC

TATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTWCGAGCAGTAGCCCAAACAATTTCATATGAAGTAACACTGGC

AATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACAAGAGCACATTTGAATAATCTTTACAT

CCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAGTCAGAACTTGT

ATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAATGCATTCACAG

CAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCATTAACAATCACC

129 TTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTAACACTAGCTCT

ATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTACTTTGATAGAG

TAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTCAAAATTCTCCGTGCTACCAAAATAC

ACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACTAATAAATCCCA

TTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAATCGGATTCGAA

ATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCTAACACAAGCCA

CAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTAGCCAATGAACCATTACAAAAATATTTAACCCAGTAGCAATA

ACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAGGTAACCCAAGGCATTTCACTACAAGC

AGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCTAATATTAACTA

TGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCAATCGCACACAT

AGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAGCAATATTCATA

CTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATAATAGTAACCCT

ACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAAGCATCATCATG

CCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCCCATCCACCAAT

AACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCGACACTAATCCTACCTATAA

CACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGTACTTAACTCCTG

AAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGATTGGTGGGATTA

CATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAAAAGGCGGGAGA

AGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCTTAACCTCTGTCT

TTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGACATCGGCACCCTG

TACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGGAACCCTACTTGG

CGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGGGGGTTTTGGTAA

CTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCACCATCCTTCCTATT

ACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCACCTTTAGCTGGAAACTTAGCCCATGCAGGAGCT

TCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATTATTAACATAAAA

CCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTGCCAGTTCTAGCA

GCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCTTTATCAACACTT

GTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTATTCAGGTAAAAA

AGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACATATTCACCGTAG

GAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGTTGACTAGCTACC

CTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCTAACGGGCATTGT

ACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGGAGCAGTGTTTGC

CATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGTAATTATATTCGT

AGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGATTATCCGGAATACCTCGACGATACTCCGATTATCCTGACGCATACACAGCAT

GAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTGCATCAAAACGA

GAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGAACCAACATATA

TCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTCTTTCTCGATAAT

CGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCTTTCCAACTAGGC

TTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGCTCTTTAGTGTTA

TATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAACAATCCTACCCG

CTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGTAAAAACCATAG

GACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGATCTTAAACCTGGA

GAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAGACGTACTACACT

CATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGACCTGGCCTTTAT

TACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTCGAAAAATGGTC

AACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCTCAATGGTATGC

CACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTCAAACTACTCAT

ACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTATTTGCCTCTTTC

ATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGACTCATTAATAAC

CGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATAGCTATTCACAACCAAAAAGGCCAAACCTGATCACTAA

TACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAACTATCAATAAACC

TGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTTCTACCACAAGGA

ACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACGACTGACAGCCAA

CATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATAACAGCTTTTATCACATTTA

CTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATACCTACACGACA

ATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCCTTTTAATAACAT

CAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACCAATGGTGACGAG

ACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTTATTATTTCCGAG

GCTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCACCAACAGGAAT

TCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCATCACAGCCTAA

130 TAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCTCAGAATATTAC

GAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATCATCGGATCTAC

TTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTGATACTGACACTT

CGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTGACTTCCAATCAA

TCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTCGTACTAATCGCA

TTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCACGCCTCCCATTCTC

AATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATCCCAAACAAACAA

TCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAAGGCCTAGAATGG

ACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTGCCATTAGTATAC

ATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGCCTAGAAGGAATG

ATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTACTAGTGTTTGCA

GCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTARTAGTATCCAACACATACGGKACCGATTACGTCCAAAACTTAAACCTTTTACAATG

CTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAACAGTACATAGTCT

CCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGACTCACTATCAGC

ACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAACCCGAAAAAAAC

TATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCCTATTCGAAGCAA

CACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTCTACACCCTAGCA

GGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTTAATTATCCATTACTGATCCCACCCATTA

TCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTGTACGGACTCCATCTTTGACTGCCA

AAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAATGCGAATCACTA

CTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGGATAATCATAACCAGCTCTATCTGCTTACGTC

AAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTC

ATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCG

AACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCC

CCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAATAAACATAATA

ATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACATTAACAACATCAAACCCTCATTCACACG

AGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATA

GTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCT

TCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGAACCAAAAAATTGGTGCAACTCCAAATAA

AAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAATATCCAACTCAAACATCTACAAAACT

AACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATATTTATACACACAGGCCAAGA

AATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCAGTAATATTCATTCC

CGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTTAAATACCTACT

ACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTCCT

GCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTC

CTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCATTTTCAACAAATCTTTA

TACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTG

CCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTA

CCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACAC

AAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGC

ATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACAT

CCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTC

ACAGGATTCTACTCAAAAGACCTTATCATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATC

CCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCC

CCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAA

CACAACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTAC

TACCTGAAATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGGTATTATCCCTCCATCATACACCGCCTACCAACATACCA

CAACCTGTCTATAAGCCAAAAATCCGCATCATCATTACTAGACCTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAA

TAAAAATATCAATTATAGTATCAAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTAT

TTAATTACCACGAGTAATCTCCATAATAACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATAT

AAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAAT

AATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAG

AAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCAT

TAAACCTAAAAAAGACCCACCAAAATTCAATACAATACCACAACCAACTCCACCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAG

GGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCAATATATATTGTCATTATTCTCACATGGAATCTAA

CCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACATCCGAAAATCACACCCACTAATAAAAAT

TATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTTAGGCATCTGCCTAATCTTGCA

AATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTGTCGAGACGTAAATT

ACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATRTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTATACTACGGA

TCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAGG

131 ACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGG

GCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCT

ATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACA

TTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCA

AACCCACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGG

AGTGCTAGCTCTAGTAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAA

GTCAATGCCTATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGC

CAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTT

GTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGC

ACCCAAAGCTGAAATTCTAACTAAACTATTCCCT

Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Móng Cái:

> MONG CAI PIG MITOCHONDRION, COMPLETE GENOME

CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATC

TTAAAACAAAAAAACCCATAAAAATTGCGCACAAACATACAAATATGCGACCCCAAAAATTTAACCATTAAAAACAAAAAATTTAATATAT

TATAGCCCTATGTACGTCGTGCATTAACTGCTAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATCATTAT

TGATCGTACATAGCACATATCATGTCAAATAACTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGA

AACCAGCAACCCGCTTGGCAGGGATCCCTCTTCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTACTGATGAACTTTAACAGGCATCTGGT

TCTTACTTCAGGACCATCTCATCTAAAATCGCCCACTCTTTCCCCTTAAATAAGACATCTCGATGGACTAATGACTAATCAGCCCATGCTCAC

ACATAACTGAGGTTTCATACATTTGGTATTTTTTAATTTTTGGGGATGCTTGGACTCAGCCATGGCCGTCAAAGGCCCTAACACAGTCAAAT

CAATTGTAGCTGGACTTCATGGAACTCATGATCCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTGCG

TACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGT

ACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTA

CACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCCCTTACCCC

CCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTAACTTACAC

TAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGGCACCTACC

CCCCTAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCC

CACAATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGVAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAAC

ACACAGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAA

AGATCAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAA

AAATTAAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAA

ATTAATAGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAA

TAAAATAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTA

AACCCAAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTCACATCCACCT

AGAGGAGCCTGTTCTATAATCGATAAACCCCGATAGACCTTACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAA

AAAGGAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTA

CATAAGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAAT

AAGGCCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGA

AGAGACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGA

AGATCCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCAC

CTAACATTAAAGTATAGGAGATAGAAATTTTTATCYTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAAYAAAATAAAAGTA

AAAAAAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAA

CCAGACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTA

ACGAGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGA

GATAGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAG

CCATCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATC

TATTGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATA

ATTAACAATCAATAAACCAAAACAACACTAAAGCGTTTATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGA

AGTAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGT

GACACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACG

AGGGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGA

GCTTTAATTAACTACTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGAC

CTCGGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATAACATCACTTATTGATCCAAAATTTTGATCA

ACGGAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGAC

ACCCAAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGT

TTCTATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAA

TCTTAACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTT

ATTACCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTC

132 ACCCTAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCG

ATGCCCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATTATTGCACCAATCCTAGCCTTATCCCTAG

CACTAACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCA

GTCTATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAAACAATTTCATATGA

AGTAACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACTCTATCCACCCTAATCACAACACAAGAGCACATTTGAA

TAATCTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAG

TCAGAACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAA

TGCATTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCAT

TAACAATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTA

ACACTAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTA

CTTTGATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAACCTGAGAATTCAAAATTCTCCGTGC

TACCAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACT

AATAAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAA

TCGGATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCT

AACACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTACAAAAATATTTAACC

CAGTAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAGTAACCCAAGGCATT

TCACTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCT

AATATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCA

ATCGCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAG

CAATATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATA

ATAGTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAA

GCATCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCC

CATCCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCGACACTAAT

CCTACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGT

ACTTAACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGA

TTGGTGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAA

AAGGCGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCT

TAACCTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGAC

ATCGGCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGG

AACCCTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGG

GGGTTTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCAC

CATCCTTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCACCTTTAGCTGGAAACTTAGCC

CATGCAGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATT

ATTAACATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTG

CCAGTTCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCT

TTATCAACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTA

TTCAGGTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACA

TATTCACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGT

TGATTAGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCT

AACGGGCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGG

AGCAGTGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGT

AATTATATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCCGATTATCCTGACG

CATACACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTG

CATCAAAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGA

ACCAACATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTC

TTTCTCGATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCT

TTCCAACTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGC

TCTTTAGTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAAC

AATCCTACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGT

AAAAACCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGAT

CTTAAACCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAG

ACGTACTACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGA

CCTGGCCTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTC

GAAAAATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCT

CAATGGTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTC

AAACTACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTA

TTTGCCTCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGA

CTCATTAATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATGGCTATTCACAACCAAAAAGGCCAAA

CCTGATCACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAAC

TATCAATAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTT

133 CTACCACAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACG

ACTGACAGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATAACAGCTT

TTATCACATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATA

CCTACACGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCC

TTTTAATAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACC

AATGGTGACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTT

ATTATTTCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCA

CCAACAGGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCA

TCACAGCCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCT

CAGAATATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATC

ATCGGATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTG

ATACTGACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTG

ACTTCCAATCAATCAGTTTCGGTAAACTCCGAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTC

GTACTAATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCAC

GCCTCCCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATC

CCAAACAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAA

GGCCTAGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTG

CCATTAGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGC

CTAGAAGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTA

CTAGTGTTTGCAGCCTGCGAAACTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTACGTCCAAAACTTAAA

CCTCTTACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAAC

AGTACATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGA

CTCACTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAA

CCCGAAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCC

TATTCGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTC

TACACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACCACAGGCTCACTAAACTTCTTAATTATCCATTACTG

ATCCCACCCATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTATACGGACTCCA

TCTTTGACTGCCAAAAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAA

TGCGAATCACTACTATTCTAAACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATAATCATAACCAGCTCTA

TCTGCTTACGTCAAACCGACCTAAAATCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCC

CCTGAAGCTTCATAGGAGCCACAGCTCTCATAATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGA

GTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCAAACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACC

TAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCATTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAA

TAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACACAACGAGGAAAATACACCCACCACATTAACAACATCAAACCC

TCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTGACCTTAAACCCTAAAATAATCCTAGGACCCCTTTA

CTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTTATCTACCGAAAAAGTTTGCAAGAACTGC

TAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTTAGGAACCAAAAAATTGGTGCA

ACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAATATCCAACTCAAACA

TCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATATTTATACACA

CAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCAGTA

ATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTT

AAATACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAAT

CATATCATTCCTCCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGAC

ATTGGATTTGTCCTATCCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCCCAAA

CATACCATTAATCGGCCTACTCCTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCAGCAATAGAAGGCCCAA

CTCCCGTATCAGCATTACTACACTCCAGTACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTTAATAGAAACTAACAAA

CTAGTTCAAACCATAACACTATGCCTAGGAGCTATCACCACCTTATTTACAGCACTATGTGCAATCACACAAAATGATATCAAAAAAATCGT

AGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTGACAATCGGCATCAACCAACCCCACCTAGCATTTCTTCATATCTGCATGCACG

CTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCACAGCCTCAATGACGAACAAGACATCCGAAAAATAGGCGGACTGTAT

AAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAACAGGAATGCCTTATCTCACAGGATTCTACTCAAAAGACC

TTATCATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTAATTGCCACATCCCTAACCGCTGCCTACAGCACT

CGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAATAACCCCCTACTAATTAACTCTATTAAA

CGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAACACAACAATACCCCTTTACAT

AAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCTGAAATTTAAATACCCATCAC

AAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACCTGTCTATAAGCCAAAAATCCGCAT

CATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAAATATCAATTATAGTATCAAATCAAAAAG

GCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAATTACCACGAGTAATCTCCATAATAACAACAACT

CCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATAAAGCAGCAATCCCCATAGCTTCCTCACTAAAAAACCCTGA

ATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATACAAAAC

TCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATAACC

134 AAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATACCACAACCAACTCCA

CCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATG

CAATATATATTGTCATTATTCTCACATGGAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCA

ACATCCGAAAATCACACCCACTAATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTT

CCCTCTTAGGCATCTGCCTAATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTAC

ACACATCTGTCGAGACGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCATCCATGTTCTTTATTTGCCTATTCATCCACGTAGGC

CGAGGCCTATACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTAC

GTCCTGCCCTGAGGACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGA

ATCTGAGGGGGCTTTTCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTAC

ATCTCCTATTCCTGCACGAAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAG

ACATTCTAGGGGCCTTATTTATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAA

ACCCACTAAACACCCCACCCCATATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCT

AGCTCTAATAGCCTCCATCCTAATCCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAATGCCT

ATTCTGAATACTAGTAGCAGACCTCATTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTAGCCTCCAT

CTTATATTTCCTAATCATTCTAGTATTGATACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTATATAAAATACCC

TGGTCTTGTAAACCAGAAAAGGAGGACCACCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAAAGCTGAAATTCT

AACTAAACTATTCCCTG

Kết quả trình tự hoàn chỉnh hệ gen ty thể lợn Mường Lay:

> BLACK MUONG LAY PIG MITOCHONDRION, COMPLETE GENOME

CAACCAAAACAAGCATTCCATTCGTATGCAAACCAAAACGCCAAGTACTTAATTACTATCTTTAAAACAAAAAAACCCATAAAAATTGCGC


TAGTCCCCATGCATATAAGCATGTACATATTATTATTAATATTACATAGTACATATCATTATTGATCGTACATAGCACATATCATGTCAAATA

ATTCCAGTCAACATGCGTATCACCACCATTAGATCACGAGCTTAATTACCATGCCGCGTGAAACCAGCAACCCGCTTGGCAGGGATCCCTCT

TCTCGCTCCGGGCCCATAAATCGTGGGGGTTTCTATTGATGAACTTTAACAGGCATCTGGTTCTTACTTCAGGACCATCTCATCTAAAATCGC



CCGGCACGACAATCCAAACAAGGTGCTATTCAGTCAATGGTTACGGGACATAACGTACGTACACGTGCGTACACATGCGTACACGTGCGTA

CACGTGCGTACACGTGCGTACACATGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTACACGTGCGTAC

ACGTACGTACACGTACGTACACGTACGTACACGTACGTACACGTACGTACACGTACGTACACGTGCGTACACGTGCGTACACGTGCGTACA

CGTGCGTACACGTGCGTACACGTGCGTATACGTGCGTACACGTGCGTACACGCGCATATAAGCAGGTAAATTATTAGCTCATTCAAACCCCC

CTTACCCCCCATTAAACTTATGCTCTACACACCCTATAACGCCTTGCCAAACCCCAAAAACAAAGCAGAGTGTACAAATACAATAAGCCTA

ACTTACACTAAACAACATTTAACAACACAAACCACCATATCTTATAAAACACTTACTTAAATACGTGCTACGAAAGCAGGCACCTACCCCCC

TAGATTTTTACGCCAATCTACCACAAATAAGTTTAAAATTACAACACAATAACCTCCCAAAATATAAGCACCTATTTAAGCATACGCCCACA

ATCTGAATATAGCTTATAGTTAATGTAGCTTAAATTATCAAAGCAAGGCACTGAAAATGCCTAGATGGGCCTCACAGCCCCATAAACACAC

AGGTTTGGTCCTGGCCTTTCTATTAATTCTTAATAAAATTACACATGCAAGTATCCGCGCCCCGGTGAGAATGCCCTCCAGATCCTAAAGAT

CAAAAGGAGCAGGTATCAAGCACACCTATAACGGTAGCTCATAACGCCTTGCTCAACCACACCCCCACGGGAAACAGCAGTGATAAAAATT

AAGCCATGAACGAAAGTTTGACTAAGTTATATTAATTAGAGTTGGTAAATCTCGTGCCAGCCACCGCGGTCATACGATTAACCCAAATTAAT

AGATCCACGGCGTAAAGAGTGTTTAAGAAAAAAAAACCACAATAGAGTTAAATTATAACTAAGCTGTAAAAAGCCCTAGTTAAAATAAAA

TAACCCACGAAAGTGACTCTAATAATCCTGACACACGATAGCTAGGACCCAAACTGGGATTAGATACCCCACTATGCCTAGCCCTAAACCC

AAATAGTTACATAACAAAACTATTCGCCAGAGTACTACTCGCAACTGCCTAAAACTCAAAGGACTTGGCGGTGCTTTACATCCACCTAGAG

GAGCCTGTTCTATAATCGATAAACCCCGATAGACCTCACCAACCCTTGCCAATTCAGCCTATATACCGCCATCTTCAGCAAACCCTAAAAAG

GAACAATAGTAAGCACAATCATAACACATAAAAACGTTAGGTCAAGGTGTAGCTTATGGGTTGGAAAGAAATGGGCTACATTTTCTACATA

AGAATACCCACCATACGAAAGTTTTTATGAAACTAAAAACCAAAGGAGGATTTAGCAGTAAATCAAGAATAGAGTGCTTGATTGAATAAGG

CCATGAAGCACGCACACACCGCCCGTCACCCTCCTCAAGCATGTAGTAATAAAAATAACCTATATTCAATTACACAACCATGCAAGAAGAG

ACAAGTCGTAACAAGGTAAGCATACTGGAAAGTGTGCTTGGATTACCAAAGCATAGCTTAAACTAAAGCACCTAGTTTACACCTAGAAGAT

CCCATAATATATGGGTACTTTGAACCAAAGCTAGCTCAACATATTAAACAAATACAAAAATACACCAAAATAAAATAAAACATTCACCTAA

CATTAAAGTATAGGAGATAGAAATTTTTATCCTGACGCTATAGAGATAGTACCGTAAGGGAAAGATGAAAGAATAAAATAAAAGTAAAAA

AAAGCAAAGATTACCCCTTCTACCTTTTGCATAATGGTTTAACCAGAAAAAATCTAACAAAGAGAACTTTAGCTAGATACCCCGAAACCAG

ACGAGCTACCTATGAGCAGTTTAAAAGAACCAACTCATCTATGTGGCAAAATAGTGAGAAGACTTGTAGGTAGAGGTGAAAAGCCTAACG

AGCCTGGTGATAGCTGGTTGTCCGAGAAAGAATTTTAGTTCAACCTTAAAAATACCCCAAAAACCCTAAATTCCAATGTATTTTTAAGAGAT

AGTCTAAAAAGGTACAGCTTTTTAGAAACGGATACAACCTTGACTAGAGAGTAAAATCTTAATACTACCATAGTAGGCCTAAAAGCAGCCA

TCAATTGAGAAAGCGTTAAAGCTCAACAAATTCACCAACATAATCCCAAAAACTAATAACAAACTCCTAGCCCAATACCGGACTAATCTAT

TGAAACATAGAAGCAATAATGTTAATATGAGTAACAAGAAGCCTTTCTCCTCGCACACGCTTACATCAGTAACTAATAATATACTGATAATT

AACAATCAATAAACCAAAACAACACTAAAGCGTTCATTAATTATATTGTTAACCCAACACAGGAGTGCACCAAGGAAAGATTAAAAGAAG

TAAAAGGAACTCGGCAAACACAAACCCCGCCTGTTTACCAAAAACATCACCTCTAGCATTACTAGTATTAGAGGCAATGCCTGCCCAGTGA

CACCAGTTTAACGGCCGCGGTATTCTGACCGTGCAAAGGTAGCATAATCACTTGTTCTCCAAATAAGGACTTGTATGAATGGCCACACGAG

GGTTTTACTGTCTCTTACTTCCAATCAGTGAAATTGACCTTCCCGTGAAGAGGCGGGAATAAAAAAATAAGACGAGAAGACCCTATGGAGC

135 TTTAATTAACTATTCCAAAAGTTAAACAATTCAACCACAAAGGGATAAAACATAACTTAACATGGACTAGCAATTTCGGTTGGGGTGACCTC

GGAGTACAAAAAACCCTCCGAGTGATTTTAATCTAGACAAACCAGTCAAAATAACCATACATCACTTATTGATCCAAAATTTTGATCAACG

GAACAAGTTACCCTAGGGATAACAGCGCAATCCTATTCTAGAGTTCCTATCGACAATAGGGTTTACGACCTCGATGTTGGATCAGGACACCC

AAATGGTGCAACCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGCAATCCAGGTCGGTTTCT

ATCTATTATAAATTTCTCCCAGTACGAAAGGACAAGAGAAATGGGACCAACCTCACAAACGCGTCTCAGAGATAATTAATGATATAATCTT

AACCTAATTAACTCATAATAAATCCAGCCCTAGAACAGGGCACATTAGGGTGGCAGAGACCGGTAATTGCGTAAAACTTAAACCTTTATTA

CCAGAGGTTCAACTCCTCTCCCTAATAGCATGTTCATAATTAACATTCTAAGCCTAATCATTCCTATCCTACTGGCCGTAGCATTCCTCACCC

TAGTAGAACGAAAAGTACTAGGTTATATGCAACTACGAAAAGGACCCAACGTTGTAGGCCCCTACGGCCTACTCCAACCCATCGCCGATGC

CCTAAAACTATTCACCAAAGAACCCCTACGACCAGCCACATCCTCAATCTCCATGTTCATCATTGCACCAATCCTAGCCTTATCCCTAGCACT

AACAATATGAGTTCCACTACCAATACCCTACCCTCTAATCAACATAAATCTAGGAGTACTATTCATGCTAGCCATGTCAAGCCTAGCAGTCT

ATTCTATCCTATGATCAGGATGAGCATCTAACTCAAAATACGCACTCATCGGGGCCCTACGAGCAGTAGCCCAAACAATTTCATATGAAGTA

ACACTGGCAATCATCCTACTATCAGTGCTCCTAATAAATGGATCATATACCCTATCCACCCTAATCACAACACAAGAGCACATTTGAATAAT

CTTTACATCCTGACCCCTAGCCATAATATGATTTATCTCAACCCTAGCAGAAACCAACCGAGCCCCGTTCGACCTTACAGAAGGAGAGTCAG

AACTTGTATCAGGCTTTAACGTAGAATATGCAGCCGGACCTTTCGCCATATTCTTCATAGCAGAATATGCCAACATCATCATAATAAATGCA

TTCACAGCAATTCTCTTCCTAGGAGCATTCCACGACCCACACACATCAGAACTATATACAATCAACTTCGTACTAAAAACACTCGCATTAAC

AATCACCTTCCTATGAATCCGAGCATCATACCCACGATTCCGATATGACCAACTAATACATTTACTATGAAAAAGCTTCCTGCCCCTAACAC

TAGCTCTATGTATATGACACATCTCACTCCCTATTATAACAGCAAGTATTCCCCCACAATCATAGAAATATGTCTGATAAAAGAGTTACTTT

GATAGAGTAAAAAATAGAGGTTCAAACCCTCTTATTTCTAGAACAATAGGACTCGAACCTAAGCCTGAGAATTCAAAATTCTCCGTGCTAC

CAAAATACACCACATTCTACAGTAAGGTCAGCTAAGCTAAGCTATCGGGCCCATACCCCGAAAATGTTGGTTCATACCCTTCCCATACTAAT

AAATCCCATTATCTACACTACCCTTATCATAACAGTAATATCCGGAACCATACTAGTAATAATCAGCTCACACTGACTACTCATCTGAATCG

GATTCGAAATAAACCTATTAGCAATAATCCCAGTATTAATAAAAAATTTTAACCCACGAGCCACAGAAGCAGCCACAAAATATTTCCTAAC

ACAAGCCACAGCCTCCATGATACTAATAATAGCCATCATCATCAACCTCCTATATTCTGGCCAATGGACCATTACAAAAATATTTAACCCAG

TAGCAATAACAATAATAACCCTGGCCCTAGCCATAAAACTAGGACTCTCACCTTTCCACTTCTGAGTCCCAGAAGTAACCCAAGGCATTTCA

CTACAAGCAGGCCTACTATTACTAACATGACAAAAACTAGCCCCATTATCAGTACTATGCCAAATCTCACAATCAATCAACCCAAACCTAAT

ATTAACTATGGCCATATTATCAATTTTAATCGGAGGGTGAGGAGGACTAAACCAAACCCAACTTCGAAAAATCATAGCATATTCATCAATC

GCACACATAGGATGAATGACAGCAGTATTACCATATAACACAACCATAACAATCTTAAACCTACTAATTTACATCACAACAACACTAGCAA

TATTCATACTATTAATCCACAGCTCAGCAACCACAACTTTATCCCTATCCCATACATGAAACAAGATACCCATCATCACAAGCCTAATAATA

GTAACCCTACTCTCAATAGGAGGCCTGCCTCCACTATCAGGATTTATACCAAAATGAATAATCATTCAAGAAATAACAAAAAATGAAAGCA

TCATCATGCCAACACTCATAGCAATAACAGCACTGCTAAACCTCTATTTCTACATACGACTAGCCTACTCCTCCTCACTGACTATGTTCCCAT

CCACCAATAACATAAAAATAAAATGACAATTCGAACACACAAAACAAATAAAACTACTTCCCACAATAATTGTATTATCGACACTAATCCT

ACCTATAACACCAGCCCTCTCGTCCCTAAACTAGGAATTTAGGTTAACACAGACCAAGAGCCTTCAAAGCTCTAAGTAAGTACAAAGTACTT

AACTCCTGAAAACCTAAGGACTGCAGGATTCATCCTACATCAATTGAATGCAAATCAAACACTTTAATTAAGCTAAATCCTCACTAGATTGG

TGGGATTACATACCCACGAAACTTTTAGTTAACAGCTAAACACCCTAATCAACTGGCTTCAATCTACTTCTCCCGCCGCAGGAAAAAAAAGG

CGGGAGAAGTCCCGGCAGAATTGAAGCTGCTTCTTTGAATTTGCAATTCAACATGACATTCACCACGGAACTGGCAAAAAGAGGGCTTAAC

CTCTGTCTTTAGATTTACAGTCTAATGCTTACTCAGCCATTTTACCTATGTTCGTAAATCGTTGACTATACTCAACAAACCACAAAGACATCG

GCACCCTGTACCTACTATTTGGTGCCTGAGCAGGAATAGTGGGCACTGCCTTGAGCCTACTAATTCGCGCTGAACTAGGTCAGCCCGGAACC

CTACTTGGCGATGATCAAATCTATAATGTAATTGTTACAGCTCATGCCTTTGTAATAATCTTCTTTATAGTAATACCCATTATGATTGGGGGT

TTTGGTAACTGACTCGTACCGCTAATAATCGGAGCTCCCGATATGGCCTTTCCACGTATAAACAACATAAGTTTCTGACTACTTCCACCATCC

TTCCTATTACTACTGGCATCCTCAATAGTAGAAGCCGGGGCGGGTACTGGATGAACCGTATACCCACCTTTAGCTGGAAACTTAGCCCATGC

AGGAGCTTCAGTTGATCTAACAATTTTCTCCCTACACCTTGCAGGTGTATCATCAATCCTAGGGGCTATTAATTTCATTACCACAATTATTAA

CATAAAACCTCCCGCAATGTCTCAATACCAAACACCCCTGTTTGTCTGATCAGTACTAATCACAGCCGTACTACTTCTACTATCCCTGCCAGT

TCTAGCAGCTGGCATTACTATACTACTGACAGACCGCAACCTGAACACAACCTTTTTTGATCCAGCAGGTGGTGGAGACCCTATCCTTTATC

AACACTTGTTCTGATTTTTCGGACACCCAGAAGTATATATTCTCATCTTACCAGGGTTCGGAATAATCTCCCACATTGTAACCTACTATTCAG

GTAAAAAAGAACCATTTGGATATATAGGCATAGTATGAGCCATAATGTCCATTGGATTCTTAGGTTTTATCGTATGGGCTCACCACATATTC

ACCGTAGGAATAGACGTGGATACCCGAGCATACTTTACATCTGCCACAATAATCATTGCTATTCCCACTGGAGTAAAAGTATTTAGTTGATT

AGCTACCCTGCACGGCGGCAATATTAAATGATCACCCGCAATACTATGAGCTCTGGGCTTCATCTTCCTATTCACCGTAGGAGGTCTAACGG

GCATTGTACTAGCTAACTCCTCCCTAGACATTGTATTACATGATACATATTATGTAGTCGCACACTTCCACTATGTCTTATCTATAGGAGCAG

TGTTTGCCATTATAGGGGGCTTTGTTCACTGATTCCCCCTATTCTCCGGGTACACACTCAACCAAGCATGAGCAAAAATTCACTTTGTAATYA

TATTCGTAGGAGTAAATATAACATTCTTTCCACAACACTTTCTAGGACTATCCGGAATACCTCGACGATACTCCGATTATCCTGACGCATAC

ACAGCATGAAATACTATTTCCTCAATAGGCTCATTCATCTCACTAACAGCAGTGATATTAATAATCTTCATTATCTGAGAAGCATTTGCATCA

AAACGAGAAGTATCTGCAGTAGAACTGACAAGCACAAACCTAGAATGACTACACGGATGTCCTCCTCCCTATCACACATTTGAAGAACCAA

CATATATCAACCTAAAATAAGCATAAGAAAGGAAGGAATCGAACCCTCTCCCACTGGTTTCAAGCCAACGTCATAACCACTATGTCTTTCTC

GATAATCGAGGTATTAGTAAAATATTACATAACTTTGTCGAAGTTATATTATAGGTGAAAGCCCTATATGCCTCTATGGCTTACCCTTTCCAA

CTAGGCTTCCAAGACGCCACTTCACCCATCATAGAAGAACTCCTACACTTTCACGATCACACCTTAATAATTGTATTCTTAATCAGCTCTTTA

GTGTTATATATCATTTCACTTATACTAACAACAAAACTGACACACACTAGCACAATGGATGCCCAAGAAGTAGAAACAATTTGAACAATCC

TACCCGCTATTATTTTAATTCTTATTGCCCTTCCATCATTACGAATCCTTTATATAATAGACGAAATTAATAACCCAGCCTTAACCGTAAAAA

CCATAGGACATCAATGATACTGAAGCTATGAGTATACAGACTATGAAGACCTCACCTTTGACTCATATATAATCCCCACATCAGATCTTAAA

CCTGGAGAAATACGACTACTAGAAGTAGACAATCGAGTTGTTCTGCCAATAGAAATAACAATCCGAATATTAGTGTCCTCTGAAGACGTAC

TACACTCATGAGCTGTCCCATCCCTCGGTTTAAAAACAGATGCTATCCCAGGACGACTAAACCAAACAACTCTAATATCCACACGACCTGGC

CTTTATTACGGACAGTGCTCAGAAATCTGTGGATCAAACCACAGCTTCATGCCCATTGTACTTGAACTTGTCCCATTAAAGTACTTCGAAAA

136 ATGGTCAACATCAATATTAACAGGTTCATTGAGAAGCTAGTCAGCACTAACCTTTTAAGTTAGAGATCGGGAGCCTAAATCTCCCCTCAATG

GTATGCCACAACTAGATACATCTACATGATTCATTACAATTACATCAATAATTATAACATTATTTATTTTATTCCAACTAAAAATCTCAAACT

ACTCATACCCAGCAAGCCCAGAATCAACCGAACTCAAAACTCAAAAACATAGCACCCCTTGAGAAATAAAATGAACGAAAATCTATTTGCC

TCTTTCATTGCCCCTACGATAATAGGACTACCTATTGTCACCTTAATTATTATATTCCCAAGCTTACTATTCCCAACACCCAAACGACTCATT

AATAACCGCACAATCTCGATCCAACAATGATTAATCCAACTAACATCCAAACAAATAATAGCTATTCACAACCAAAAAGGCCAAACCTGAT

CACTAATACTTATATCTCTAATTATATTCATTGGCTCAACAAACATCCTAGGCCTACTACCACACTCATTCACACCCACCACACAACTATCAA

TAAACCTGGGTATAGCAATCCCCCTATGATCAGCAACCGTATTCACAGGATTCCGCCATAAAACCAAAACATCACTAGCCCACTTTCTACCA

CAAGGAACACCCGCCCCATTAATTCCTATGCTCGTAATTATTGAAACTATTAGCCTATTTATTCAACCAGTAGCCCTAGCCGTACGACTGAC

AGCCAACATTACAGCAGGGCACCTATTAATTCATCTAATTGGAGGGGCCACATTAGCACTACTCAACATCAGCACTATGACAGCTTTTATCA

CATTTACTATCCTCATCCTATTAACTATTCTTGAATTTGCAGTAGCTCTGATCCAAGCTTATGTGTTTACACTGCTAGTAAGCTTATACCTACA

CGACAATACATAATGACCCACCAAACACATGCATACCACATAGTAAACCCAAGCCCATGACCACTTACCGGAGCCCTATCAGCCCTTTTAA

TAACATCAGGCCTAATTATATGATTCCACTTTAACTCTATACTCTTACTATCTCTAGGACTATTAACCAATACTTTGACAATATACCAATGGT

GACGAGACATTATTCGAGAAAGCACTTTCCAAGGCCACCACACATCAGTCGTCCAAAAAGGCTTACGATACGGTATAATTTTATTTATTATT

TCCGAGGTTCTGTTCTTCACTGGATTCTTTTGAGCTTTCTACCACTCAAGCCTAGCACCAACACCCGAATTAGGAGGTTGCTGACCACCAACA

GGAATTCACCCACTAAACCCCCTAGAAGTACCCCTACTAAACACCTCAATCCTCCTCGCCTCAGGAGTATCCATTACCTGAGCCCATCACAG

CCTAATAGAAGGGGACCGAAAACACATAATCCAAGCACTATCCATCACCATTGCACTAGGCGTATACTTCACCCTCCTCCAAGCCTCAGAA

TATTACGAAGCACCATTCACAATCTCCGACGGAGTGTATGGATCCACTTTCTTTGTGGCTACAGGATTTCACGGGTTGCACGTAATCATCGG

ATCTACTTTCCTAGCAGTGTGCTTACTACGACAACTAAAATTCCACTTCACATCCAACCACCACTTCGGCTTTGAAGCCGCAGCCTGATACTG

ACACTTCGTAGATGTAGTTTGACTATTCCTTTACGTATCAATCTATTGATGAGGATCCTACTCTTTTAGTATTAAGCAGTACAATTGACTTCC

AATCAATCAGTTTCGGTAAACTCCGAAAAAAGAGTAATAAATATTATACTAACACTATTCACAAACGTAACCCTAGCCTCCCTACTCGTACT

AATCGCATTCTGACTACCCCAACTAAACACATATTCAGAAAAAACAAGCCCATATGAATGTGGATTTGACCCCATAGGATCAGCACGCCTC

CCATTCTCAATAAAATTTTTCCTAGTAGCCATTACATTTCTCCTTTTTGATCTAGAAATCGCCCTCCTCCTTCCCCTACCATGAGCATCCCAAA

CAAACAATCTAAAAACAATACTTACAATAGCACTATTCCTTCTTACCCTACTAGCAGCAAGCCTAGCATACGAATGAACCCAAAAAGGCCT

AGAATGAACAGAATATGATAATTAGTTTAAAACAAAACAAATGATTTCGACTCATTAGACTATGATTTACTTCATAATTATCAAGTGCCATT

AGTATACATAAACATCATTATAGCATTCACGATTGCCCTTGCAGGGTTACTTATATATCGATCTCACTTAATATCTTCACTACTATGCCTAGA

AGGAATGATATTATCACTATTCATCATATCGACTCTAATTGTCCTAAACACACACTTCACCCTAGCTAACATAATACCCATTATTTTACTAGT

GTTTGCAGCCTGCGAAGCTGCACTGGGCCTATCACTACTAGTAATAGTATCCAACACATACGGTACCGATTACGTCCAAAACTTAAACCTCT

TACAATGCTAAAAATTATTATCCCAACAACAATACTACTACCCATAACATGAATATCTAAACACAACATAATCTGAATCAATGCAACAGTA

CATAGTCTCCTCATTAGCCTGATCAGTCTATCCCTACTAAACCAACTAGGCGAAAACAGCCTTAATTTTTCCTTAACATTCTTCTCCGACTCA

CTATCAGCACCCCTACTAGTTCTAACCACATGACTCCTCCCCCTTATACTAATAGCTAGCCAATCCCACCTATCAAAAGAAACCACAACCCG

AAAAAAACTATATATTACCATACTAATCCTACTACAACTATTCCTAATTATAACCTTCACCGCCACCGAACTAATCTTATTCTATATCCTATT

CGAAGCAACACTAGTACCCACACTAATCATCATCACACGCTGAGGAAACCAAACAGAACGACTCAATGCAGGACTTTATTTCCTATTCTAC

ACCCTAGCAGGATCCCTACCACTGCTAGTAGCACTAGTTTATATCCAAAACACTACAGGCTCACTAAACTTCTTAATTATCCATTACTGATCCCACC

CATTATCCAACTCTTGATCAAACATTTTTATATGATTAGCATGCATCATAGCCTTCATAGTAAAAATACCTCTATACGGACTCCATCTTTGACTGCCAA

AAGCCCATGTAGAAGCCCCTATTGCAGGTTCAATAGTACTTGCAGCCGTACTGCTAAAACTCGGAGGCTATGGCATAATACGAATCACTACTATTCTA

AACCCACTAACAAACTACATAGCCTATCCATTCCTCATGCTTTCCATATGAGGTATAATCATAACCAGCTCTATCTGCTTACGTCAAACCGACCTAAAA

TCCTTAATCGCTTATTCATCAGTAAGTCATATAGCACTTGTAATCGTAGCAATCATAATTCAAACCCCCTGAAGCTTCATAGGAGCCACAGCTCTCATA

ATTGCCCACGGACTAACATCCTCCATACTATTCTGCCTAGCCAACACTAACTATGAACGAGTACACAGCCGAACCATAATCCTAGCCCGAGGACTGCA

AACACTCCTACCACTCATAGCAACATGATGACTAATAGCAAGCCTCACAAACCTAGCCCTACCCCCATCCATCAATCTAATCGGAGAATTATTTATCA

TTACAGCATCATTTTCATGATCCAACATCACAATTATTCTCATAGGAATAAACATAATAATTACAGCTCTCTACTCTCTCTACATACTAATTATTACAC

AACGAGGAAAATACACCCACCACATTAACAACATCAAASCCTCATTCACACGAGAAAACGCCCTCATAGCCCTACATATTCTACCACTACTACTACTG

ACCTTAAACCCTAAAATAATCCTAGGACCCCTTTACTGTAGATATAGTTTAATAAAAACCCTAGATTGTGAATCTAGTAATAGAAAATTAAATATTCTT

ATCTACCGAAAAAGTTTGCAAGAACTGCTAACTCATGCTTCCACACTTAAAAATGTGGCTTTTTCAACTTTTAAAGGATAGCAGTTATCCGTTGGTCTT

AGGAACCAAAAAATTGGTGCAACTCCAAATAAAAGTAATAAACCCATTCGCCTCACTCACATTAACCACACTGACTATTCTAACCATCCCAATTATAA

TATCCAACTCAAACATCTACAAAACTAACCTTTACCCTAACTACGTAAAAACCACCGTATCCTACGCCTTCACTCTCAGCCTAGTCCCCTTACTAATAT

TTATACACACAGGCCAAGAAATAATCATTTCAAACTGACATTGAATAACCCTACAGACCGTAGAACTCTCTCTTAGCTTTAAAATAGACTATTTCTCA

GTAATATTCATTCCCGTAGCACTATTCGTCACATGATCAATTATAGAATTCTCCATATGATACATACACTCAGACCCCTTCATCAACCGATTCTTTAAA

TACCTACTACTATTCTTAATCACTATAATAATCCTCGTAACCGCCAACAACCTCTTCCAACTCTTTATCGGATGAGAAGGCGTAGGAATCATATCATTC

CTGCTAATCGGATGATGACACGGACGAACAGACGCCAACACAGCTGCACTACAAGCAATCCTATACAACCGCATCGGAGACATTGGATTTGTCCTAT

CCATAGCATGATTCTTAACCCACTCAAACGCATGAGATTTTCAACAAATCTTTATACTAAACAATGAATGCCCAAACATACCATTAATCGGCCTACTC

CTAGCTGCAGCAGGAAAATCAGCTCAATTCGGACTACATCCCTGATTGCCCTCAGCAATAGAAGGCCCAACTCCCGTATCAGCATTACTACACTCCAG

TACAATAGTAGTAGCAGGGGTATTTCTACTCATCCGCTTCTACCCCTTAATAGAAACTAACAAACTAGTTCAAACCATAACACTATGCCTAGGAGCTA

TCACCACCTTATTTACAGCACTATGTGCAATCACACAAAATGATATCAAAAAAATCGTAGCCTTCTCAACTTCAAGCCAACTAGGCTTGATAATAGTG

ACAATCGGCATCAACCAACCCCACCTAGCATTTCTTCATATCTGCATGCACGCTTTCTTCAAAGCAATACTATTCATATGCTCCGGATCCATTATCCAC

AGCCTCAATGACGAACAAGACATCCGAAAAATAGGCGGACTGTATAAAGCAATACCATTCACAACAACAGCACTAATTATTGGAAGCCTGGCATTAA

CAGGAATGCCTTATCTCACAGGATTCTACTCAAAAGACCTTATTATTGAAGCAGCAAACATATCCTACACAAACGCCTGAGCCCTACTAATAACATTA

ATTGCCACATCCCTAACCGCTGCCTACAGCACTCGAATTATCTTCTTTGCATTCCTAGGGCAACCACGTTTCCCACCCCTAGTCCTAATTAATGAAAAT

AACCCCCTACTAATTAACTCTATTAAACGCCTTTTAATCGGAAGCATCTTCGCTGGCTTTATCATCTCCAACAACATCCCACCAATAACAGTACCAAAC

ACAACAATACCCCTTTACATAAAAATAACAGCCCTAATCGTAACCATCATAGGATTCATACTAGCCCTAGAGCTAAACAACACAACCTACTACCTGAA

ATTTAAATACCCATCACAAACATACAAATTTTCCAACATACTAGGATATTATCCCTCCATCATACACCGCCTACCAACATACCACAACCTGTCTATAAG

137 CCAAAAATCCGCATCATCATTACTAGACTTAATTTGACTAGAAACTATTCTACCAAAAACAACCTCTTTCATCCAAATAAAAATATCAATTATAGTATC

AAATCAAAAAGGCCTAATCAAACTATACTTTCTCTCCTTCCTAATCACTATTATAATCAGCATAATACTATTTAATTACCACGAGTAATCTCCATAATA

ACAACAACTCCAATAAGCAATGATCAACCAGTAACAATAACTAATCAAGTACCATAACTATATAAAGCAGCAATCCCCATAGCTTCCTCACTAAAAA

ACCCTGAATCACCCGTATCATAAATTACTCAATCCCCAAGCCCATTAAACTTAAAAATAATTTCTACTTCCTCTTCCTTCAATGCATAATAAACCATAC

AAAACTCCATTATTAAACCAGAAACAAATGCTCCAAAAACAGTCTTATTAGAAACTCAAACCTCAGGGTACATCTCAGTAGCCATGGCAGTAGTATA

ACCAAAAACCACTAACATACCCCCCAAATAAATCAAAAACACCATTAAACCTAAAAAAGACCCACCAAAATTCAATACAATGCCACAACCAACTCCA

CCACTTACAATCAACCCAAGTCCACCATAAATAGGAGAGGGTTTAGAAGAAAAACCAACAAACCCAATAACAAAAATAGTACTTAAAATAAATGCA

ATATATATTGTCATTATTCTCACATGGAATCTAACCACGACCAATGACATGAAAAATCATCGTTGTACTTCAACTACAAGAACCTTAATGACCAACAT

CCGAAAATCACACCCACTAATAAAAATTATCAACAACGCATTCATTGACCTCCCAGCCCCCTCAAACATCTCATCATGATGAAACTTCGGTTCCCTCTT

AGGCATCTGCCTAATCTTGCAAATCCTAACAGGCCTGTTCTTAGCAATACATTACACATCAGACACAACAACAGCTTTCTCATCAGTTACACACATCTG

TCGAGACGTAAATTACGGATGAGTTATTCGCTACCTACATGCAAACGGAGCAYMYATGTTCTTTATTTGCCTATTCATCCACGTAGGCCGAGGCCTAT

ACTACGGATCCTATATATTCCTAGAAACATGAAACATTGGAGTAGTCCTACTATTTACCGTTATAGCAACAGCCTTCATAGGCTACGTCCTGCCCTGAG

GACAAATATCATTCTGAGGAGCTACGGTCATCACAAATCTACTATCAGCTATCCCTTATATCGGAACAGACCTCGTAGAATGAATCTGAGGGGGCTTT

TCCGTCGACAAAGCAACCCTCACACGATTCTTCGCCTTTCACTTTATCCTGCCATTCATCATTACCGCCCTCGCAGCCGTACATCTCCTATTCCTGCACG

AAACCGGATCCAACAACCCTACCGGAATCTCATCAGACATAGACAAAATTCCATTTCACCCATACTACACTATTAAAGACATTCTAGGGGCCTTATTT

ATAATACTAATCCTACTAATCCTTGTACTATTCTCACCAGACCTACTAGGAGACCCAGACAACTACACCCCAGCAAACCCACTAAACACCCCACCCCA

TATTAAACCAGAATGATATTTCTTATTCGCCTACGCTATCCTACGTTCAATTCCTAATAAACTAGGTGGAGTGCTAGCTCTAATAGCCTCCATCCTAAT

CCTAATTTTAATGCCCATACTACACACATCCAAACAACGAAGCATAATATTTCGACCACTAAGTCAATGCCTATTCTGAATACTAGTAGCAGACCTCA

TTACACTAACATGAATTGGAGGACAACCCGTAGAACACCCATTCATCATCATCGGCCAACTAGCCTCCATCTTATATTTCCTAATCATTCTAGTATTGA

TACCAATCACTAGCATCATCGAAAACAACCTATTAAAGTGAAGAGTCTTTGTAGTATATAAAATACCCTGGTCTTGTAAACCAGAAAAGGAGGACCA

CCCCTCCCCAAGACTCAAGGAAGGAGACTAACTCCGCCATCAGCACCCAAAGCTGAAATTCTAACTAAACTATTCCCTG

XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ GEN TY THỂ CỦA...

Documents

Transcript of XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ GEN TY THỂ CỦA...