KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT...

8
Kinh tế & Chính sách 140 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015 KHẢ NĂNG ỨNG DNG PHÂN LOI BMT LP PHBNG THUT TOÁN SUPPORT VECTOR MACHINE Nguyn ThOanh, Phùng Minh Tám KS. Trường Đại hc Lâm nghip TÓM TT Lp phbmt phản ánh các điều kin và trng thái tnhiên ca bmặt trái đất, ví dụ đất rng, thm c, sa mc, v.v. Sdng dliu nh vin thám có thgiải đoán, phân tích và đánh giá biến động ca lp phbmt trong nhng phm vi rt rng vi hiu qukinh tế cao theo thi gian và không gian. Trên thế gii hin nay thut toán Support Vector Machine (SVM) đã được ng dụng để phân loi lp phbmt từ tư liệu nh vin thám. Cơ sở để thc hin bài toán phân loi lp phbmt tnh viễn thám chính là đặc trưng phổ ca tm nh vin thám. Thut toán SVM cũng thực hin bài toán phân loi này da trên đặc trưng phổ ca nh vin thám đa phổ. Quá trình phân loi lp phtnh vin thám sdụng SVM được thc hiện theo 4 bước: Định nghĩa các mẫu lp ph, chn vùng mu, hun luyn mu, phân loi các dliu mi. Tiến hành thc nghim trên phn mm Envi 4.7 v i nh phca hãng Quickbird độ phân gii ph2,4 m (mt phn khu vc Mỹ Đình – Hà Nội) và các phương pháp phân loại khác nhau ri tiến hành so sánh, phân tích, tng hp các kết quthu được. Nhn thấy, phương pháp phân loại SVM phân loi với độ chính xác tt và ổn định hơn các phương pháp khác khi số lượng mu thc tế thay đổi. Ngoài ra, sdụng phương pháp SVM ranh giới gia các lp phcũng được thhin rõ ràng hơn. Tkhóa: Phân loi nh, phân loi bmt lp ph, Support Vector Machine, thut toán phân loi có giám sát, thut toán SVM, ng dng ca thut toán SVM. I. ĐẶT VẤN ĐỀ Thut toán Support Vector Machine – SVM đã và đang được ng dng trong rt nhiu lĩnh vực như: Nhận din khuôn mt (Osuna, Freund và Girosi, 1997), phân loại văn bản (Joachims, 1997), nhn dng chviết tay, phân loi Email – lọc thư rác. Trên thế giới SVM đã được ng dụng để phân loi lp phbmt từ tư liệu nh vin thám trong nhiu nghiên cu ca Brown và những người khác (1997) và đã cho thấy độ chính xác ca vic phân loại được nâng cao rõ rt so với các phương pháp phân loại thông thường. Tuy nhiên, hin nay Vit Nam vic sdụng phương pháp phân loại nh vin thám bằng SVM chưa được nghiên cu và áp dng. Mặc dù đã có nghiên cu ca Nguyễn Đức Lc và Nguyn Quang Minh (2013) chng minh rng thut toán SVM có nhiều điểm mnh so vi các thun toán phân loại thông thường mang tính truy n thng ở nước ta như phương pháp hình hộp, phương pháp khoảng cách nhnhất, phương pháp xác suất cực đại với độ chính xác phân loi lp phbmt chỉ đạt khong 70 - 80 % và không ổn định, phương pháp phân loi bng thuật toán SVM chưa được sdng phbiến trong phân loi lp ph. Chính vì vy, vic nghiên cu thnghim sdng thut toán SVM cũng như khả năng ng dng phân loi bmt lp phlà cn thiết làm cơ sở để thc hiện phương pháp phân tích nh vin thám hiu quả hơn với độ chính xác cao hơn. II. ĐỐI TƯỢNG, PHƯƠNG PHÁP NGHIÊN CỨ U 2.1. Đối tượng và phm vi nghiên cu - Thut toán SVM - Chức năng phân loại ca phn mm Envi - ng dng SVM trong phân loi dliu l p phsdng tnh vin thám. Đề tài chlà nghiên cu khả năng phân loại lp phbmt ca SVM trong phn mm Envi và so sánh kết quphân loại đó với các phương pháp khác. 2.2. Phương pháp nghiên cứu Trong đề tài nghiên cu có th sdng các phương pháp nghiên cứu sau:

Transcript of KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT...

Page 1: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

140 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

KHẢ NĂNG ỨNG DỤNG PHÂN LOẠI BỀ MẶT LỚP PHỦ BẰNG THUẬT TOÁN SUPPORT VECTOR MACHINE

Nguyễn Thị Oanh, Phùng Minh Tám

KS. Trường Đại học Lâm nghiệp

TÓM TẮT

Lớp phủ bề mặt phản ánh các điều kiện và trạng thái tự nhiên của bề mặt trái đất, ví dụ đất rừng, thảm cỏ, sa mạc, v.v. Sử dụng dữ liệu ảnh viễn thám có thể giải đoán, phân tích và đánh giá biến động của lớp phủ bề mặt trong những phạm vi rất rộng với hiệu quả kinh tế cao theo thời gian và không gian. Trên thế giới hiện nay thuật toán Support Vector Machine (SVM) đã được ứng dụng để phân loại lớp phủ bề mặt từ tư liệu ảnh viễn thám. Cơ sở để thực hiện bài toán phân loại lớp phủ bề mặt từ ảnh viễn thám chính là đặc trưng phổ của tấm ảnh viễn thám. Thuật toán SVM cũng thực hiện bài toán phân loại này dựa trên đặc trưng phổ của ảnh viễn thám đa phổ. Quá trình phân loại lớp phủ từ ảnh viễn thám sử dụng SVM được thực hiện theo 4 bước: Định nghĩa các mẫu lớp phủ, chọn vùng mẫu, huấn luyện mẫu, phân loại các dữ liệu mới. Tiến hành thực nghiệm trên phần mềm Envi 4.7 với ảnh phổ của hãng Quickbird độ phân giải phổ 2,4 m (một phần khu vực Mỹ Đình – Hà Nội) và các phương pháp phân loại khác nhau rồi tiến hành so sánh, phân tích, tổng hợp các kết quả thu được. Nhận thấy, phương pháp phân loại SVM phân loại với độ chính xác tốt và ổn định hơn các phương pháp khác khi số lượng mẫu thực tế thay đổi. Ngoài ra, sử dụng phương pháp SVM ranh giới giữa các lớp phủ cũng được thể hiện rõ ràng hơn.

Từ khóa: Phân loại ảnh, phân loại bề mặt lớp phủ, Support Vector Machine, thuật toán phân loại có giám sát, thuật toán SVM, ứng dụng của thuật toán SVM.

I. ĐẶT VẤN ĐỀ

Thuật toán Support Vector Machine – SVM đã và đang được ứng dụng trong rất nhiều lĩnh vực như: Nhận diện khuôn mặt (Osuna, Freund và Girosi, 1997), phân loại văn bản (Joachims, 1997), nhận dạng chữ viết tay, phân loại Email – lọc thư rác.

Trên thế giới SVM đã được ứng dụng để phân loại lớp phủ bề mặt từ tư liệu ảnh viễn thám trong nhiều nghiên cứu của Brown và những người khác (1997) và đã cho thấy độ chính xác của việc phân loại được nâng cao rõ rệt so với các phương pháp phân loại thông thường. Tuy nhiên, hiện nay ở Việt Nam việc sử dụng phương pháp phân loại ảnh viễn thám bằng SVM chưa được nghiên cứu và áp dụng. Mặc dù đã có nghiên cứu của Nguyễn Đức Lộc và Nguyễn Quang Minh (2013) chứng minh rằng thuật toán SVM có nhiều điểm mạnh so với các thuận toán phân loại thông thường mang tính truyền thống ở nước ta như phương pháp hình hộp, phương pháp khoảng cách nhỏ nhất, phương pháp xác suất cực đại với độ

chính xác phân loại lớp phủ bề mặt chỉ đạt khoảng 70 - 80 % và không ổn định, phương pháp phân loại bằng thuật toán SVM chưa được sử dụng phổ biến trong phân loại lớp phủ. Chính vì vậy, việc nghiên cứu thử nghiệm sử dụng thuật toán SVM cũng như khả năng ứng dụng phân loại bề mặt lớp phủ là cần thiết làm cơ sở để thực hiện phương pháp phân tích ảnh viễn thám hiệu quả hơn với độ chính xác cao hơn. II. ĐỐI TƯỢNG, PHƯƠNG PHÁP NGHIÊN CỨU 2.1. Đối tượng và phạm vi nghiên cứu

- Thuật toán SVM - Chức năng phân loại của phần mềm Envi - Ứng dụng SVM trong phân loại dữ liệu lớp

phủ sử dụng từ ảnh viễn thám. Đề tài chỉ là nghiên cứu khả năng phân loại

lớp phủ bề mặt của SVM trong phần mềm Envi và so sánh kết quả phân loại đó với các phương pháp khác. 2.2. Phương pháp nghiên cứu

Trong đề tài nghiên cứu có thể sử dụng các phương pháp nghiên cứu sau:

Page 2: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

141 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

- Phương pháp thu thập số liệu thứ cấp: Đây là phương pháp được áp dụng nhằm thu thập các số liệu đã được công bố như các đề tài nghiên cứu về nội dung và khả năng ứng dụng của thuật toán SVM vào các lĩnh vực khác nhau.

- Phương pháp thực nghiệm: Sử dụng công cụ phân loại trong phần mềm Envi tiến hành phân loại có kiểm định bằng các phương pháp khác nhau, mỗi phương pháp tiến hành phân loại nhiều lần với số mẫu thay đổi (tăng dần các vùng mẫu – tăng các pixel ảnh).

- Phương pháp phân tích và xử lí số liệu: Trên cơ sở số liệu thu thập được và kết quả thực nghiệm, tiến hành phân tích, so sánh độ chính phân loại của chúng dựa vào các mẫu thực tế, trong phần mềm Envi có công cụ tính ma trận sai số để đánh giá độ chính xác tồng thể Overall Accuracy và Kappa Coefficient. Dựa vào kết quả đánh giá độ chính xác tổng thể kết hợp với quan sát bằng mắt làm căn cứ để đưa ra kết luận.

III. KẾT QUẢ NGHIÊN CỨU

3.1. Giới thiệu chung về SVM Máy vectơ hỗ trợ (SVM - từ viết tắt của tên

tiếng Anh: Support Vector Machine) là một khái niệm trong thống kê và khoa học máy tính cho một tập hợp các phương pháp học có giám sát liên quan đến nhau để phân loại và phân tích hồi quy. Thuật toán SVM ban đầu được tìm ra bởi Vladimir N.Vapnik và dạng chuẩn hiện nay sử dụng lề mềm được tìm ra bởi Vapnik và Corinna Cortes năm 1995.

SVM dạng chuẩn nhận dữ liệu vào và phân loại chúng vào hai lớp khác nhau. SVM đó là một thuật toán phân loại nhị phân. Với một bộ các mẫu huấn luyện thuộc hai thể loại cho trước, thuật toán huấn luyện SVM xây dựng một mô hình SVM để phân loại các dữ liệu khác vào hai thể loại đó.

Một mô hình SVM là một cách biểu diễn các điểm trong không gian và lựa chọn ranh giới giữa hai thể loại sao cho khoảng cách từ

các mẫu huấn luyện tới ranh giới là xa nhất có thể. Các dữ liệu mới cũng được biểu diễn trong cùng một không gian và được thuật toán dự đoán thuộc một trong hai thể loại tùy vào dữ liệu đó nằm ở phía nào của ranh giới.

Hình 01. H2 là tốt nhất

3.2. Nội dung của phương pháp SVM

Đặc trưng cơ bản quyết định khả năng phân loại của một bộ phân loại là hiệu suất tổng quát hóa, hay là khả năng phân loại những dữ liệu mới dựa vào những tri thức đã tích lũy được trong quá trình huấn luyện. Thuật toán huấn luyện được đánh giá là tốt nếu sau quá trình huấn luyện, hiệu suất tổng quát hóa của bộ phân loại nhận được cao.

Hiệu suất tổng quát hóa phụ thuộc vào hai tham số là sai số huấn luyện và năng lực của máy học. Trong đó sai số huấn luyện là tỷ lệ lỗi phân loại trên tập dữ liệu huấn luyện. Còn năng lực của máy học được xác định bằng kích thước Vapnik-Chervonenkis (kích thước VC).

Kích thước VC là một khái niệm quan trọng đối với một họ hàm phân tách (hay là bộ phân loại). Đại lượng này được xác định bằng số điểm cực đại mà họ hàm có thể phân tách hoàn toàn trong không gian đối tượng. Một bộ phân loại tốt là bộ phân loại có năng lực thấp nhất (có nghĩa là đơn giản nhất) và đảm bảo sai số huấn luyện nhỏ. Phương pháp SVM được xây dựng dựa trên ý tưởng này. Phân loại SVM chuẩn theo phân loại hai lớp:

Ý tưởng của phương pháp là cho trước một tập mẫu huấn luyện đã được biểu diễn trong

Page 3: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

142 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

không gian vector, trong đó mỗi dữ liệu là một điểm. Phương pháp sẽ tìm ra một siêu phẳng f tốt nhất có thể chia các điểm đó thành hai lớp riêng biệt. Chất lượng của siêu phẳng này sẽ được quyết định bởi khoảng cách, gọi là lề, của điểm dữ liệu gần nhất của mỗi lớp đến mặt phẳng này. Khi đó, khoảng cách lề càng lớp thì mặt phẳng quyết định càng tốt, đồng thời việc phân loại càng chính xác.

Mục đích của phương pháp là tìm ra được khoảng cách lề là lớn nhất. Để các dữ liệu được phân loại vào các lớp khác nhau.

Hình 02. Nguyên lý của SVM

Nhưng nếu dữ liệu không được phân loại vào lớp nào thì dữ liệu đó được gọi là không phân tách tuyến tính. Lúc này, SVM sẽ có hai cách giải quyết:

- Cách thứ nhất sử dụng một mặt siêu phẳng lề mềm, nghĩa là cho phép một số mẫu huấn luyện nằm về phía sai của mặt siêu phẳng phân tách hoặc vẫn ở vị trí đúng nhưng rơi vào vùng giữa mặt siêu phẳng phân tách và mặt siêu phẳng hỗ trợ tương ứng.

- Cách thứ hai sử dụng một ánh xạ phi tuyến Φ để ánh xạ các điểm dữ liệu đầu vào sang một không gian mới có số chiều cao hơn. Trong không gian này, các điểm dữ liệu trở thành khả tách tuyến tính, hoặc có thể phân tách với ít lỗi hơn so với trường hợp sử dụng không gian ban đầu. Một mặt quyết định tuyến tính trong không gian mới sẽ tương ứng với một mặt quyết định phi tuyến trong không gian ban đầu.

Nếu càng nhiều mẫu thì sẽ có nhiều lớp cho nên ý tưởng của bài toán phân loại nhiều lớp là chuyển về bài toán phân loại hai lớp bằng cách xây dựng nhiều bộ phân loại hai lớp để giải quyết.

3.3. Ứng dụng SVM trong phân loại lớp phủ từ ảnh vệ tinh

Phân loại trong xử lý tư liệu ảnh viễn thám là gán các khoảng cấp độ xám nhất định thuộc một nhóm đối tượng nào đó có tính chất tương đối đồng nhất nhằm phân biệt các nhóm đó với nhau trong khuôn khổ ảnh cho trước. Dựa vào các tính chất phổ hoặc cấu trúc không gian đặc tính của đối tượng ta có thể phân loại theo một quy luật nào đó.

Phân loại có thể được thực hiện theo phương pháp giải đoán bằng mắt hoặc nhờ sự trợ giúp của máy tính. Kỹ thuật phân loại nhờ sự trợ giúp của máy tính ngày càng được áp dụng trong thực tế với hai phương pháp cơ bản là phân loại có kiểm định (Supervised Classification) và phân loại không kiểm định (Unsupervised Classification).

Cơ sở để thực hiện bài toán phân loại lớp phủ bề mặt từ ảnh viễn thám chính là đặc trưng phổ của tấm ảnh viễn thám. Thuật toán SVM cũng thực hiện bài toán phân loại này dựa trên đặc trưng phổ của ảnh viễn thám đa phổ. Quá trình phân loại lớp phủ từ ảnh viễn thám sử dụng SVM được thực hiện theo các bước sau:

Bước 1: Định nghĩa các mẫu lớp phủ - Các mẫu lớp phủ đưa vào cần có sự khác biệt về phổ và cấu trúc tự nhiên của chúng. Đặc biệt là đầy đủ và thỏa mãn với yêu cầu phân loại đặt ra.

Bước 2: Chọn vùng mẫu - vùng mẫu lựa chọn cần có tính đặc thù trên tư liệu ảnh và số lượng vùng mẫu càng nhiều thì càng chính xác.

Bước 3: Huấn luyện mẫu - Dựa vào các mẫu đã chọn SVM sẽ “huấn luyện” để xác định đặc trưng về phổ và định hình cấu trúc của mẫu lớp phủ đó.

Page 4: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

143 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

Bước 4: Phân loại các dữ liệu mới: Tất cả các pixel có trên ảnh sẽ được phân loại vào các lớp phủ đã định nghĩa bằng thuật toán SVM.

3.4. Thực nghiệm

Khu vực thực nghiệm: Một phần của khu vực Mỹ Đình - Hà Nội

Khu vực thực nghiệm nằm ở phía Đông của xã Mỹ Đình, Từ Liêm, Hà Nội. Với diện tích 400 m2 .

Khu vực là vùng trũng thấp trên nền đất yếu, có nhiều hồ, đầm, nên khó khăn trong việc tiêu thoát nước, gây úng ngập cục bộ thường xuyên vào mùa mưa.

Thành phần lớp phủ của khu vực chọn làm thực nghiệm khá phong phú, gồm có: Đường giao thông, thực vật, nhà ở và mặt nước.

Phần mềm sử dụng: Envi 4.7 Tư liệu viễn thám: Ảnh phổ của hãng

Quickbird với độ phân giải phổ là 2,4 m.

Hình 03. Ảnh phổ của hãng Quickbird một phần khu vực Mỹ Đình – Hà Nội

Hình 04. Huấn luyện mẫu SVM

Nguyên tắc thực hiện phân loại theo phương pháp SVM

Trong giới hạn đề tài chúng tôi xin trình bày phương pháp phân loại lớp phủ bề mặt có kiểm định và sử dụng thuật toán Support Vector Machine. Phương pháp này sẽ thực hiện hai

giai đoạn chính để phân loại lớp phủ cụ thể là huấn luyện mẫu và tiến hành phân loại.

Huấn luyện mẫu đối với phân loại lớp phủ bề mặt từ tư liệu ảnh viễn thám được diễn ra như sau:

Page 5: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

144 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

Lấy mẫu Việc lấy mẫu có thể được tiến hành ngay

trên ảnh hoặc tiến hành ngoài thực địa, để hạn chế sai số, đảm bảo khách quan chính xác thì chúng ta phải đi thực địa để lấy mẫu là tốt nhất. Các mẫu lớp phủ đưa vào cần có sự khác biệt về phổ và cấu trúc tự nhiên.

Nhưng do không điều kiện nên bài nghiên cứu chúng tôi đã sử dụng 1 tấm ảnh vệ tinh tương đối rõ nét và lấy mẫu trên ảnh.

Ta chọn 5 lớp phủ bề mặt gồm: Mặt nước (Mat Nuoc), đường giao thông (Duong GT), nhà ở (Dat o), ruộng và thảm thực vật (Ruong). Để phân biệt các mẫu và các lớp phủ khác nhau ta chọn màu cho các lớp phủ: Red, Green, Blue, Yellow, Cyan….

Ở thực nghiệm này, ta lấy 04 mẫu lớp Mat Nuoc, 07 mẫu lớp Tham TV, 05 mẫu lớp

Duong GT, 07 mẫu lớp Dat o và 03 mẫu lớp Ruong. Từ các vùng mẫu đã lựa chọn ta sẽ có được tổng số pixel của từng loại mẫu.

Tiến hành phân loại Sử dụng các mẫu đã chọn tiến hành phân loại

theo phương pháp phân loại có kiểm định. Các lấy mẫu đã chọn sử dụng chung cho tất cả các phương pháp phân loại (Phương pháp SVM, xác suất cực đại và khoảng cách nhỏ nhất).

Với phương pháp SVM, thuật toán SVM sẽ “huấn luyện” để xác định đặc trưng về phổ và định hình cấu trúc của mẫu lớp phủ đó. Tất cả các pixel có trên ảnh sẽ được phân loại vào các lớp phủ đã định nghĩa.

Kết quả sau phân loại, ta thu được lớp phủ bề mặt với các lớp mặt nước (Blue), thảm thực vật (Green), đường giao thông (Red), nhà ở (Yellow), ruộng (Cyam) như sau:

Hình 05. Kết quả phân loại theo

phương pháp SVM Hình 06. Kết quả phân loại theo phương pháp Xác suất

cực đại

Hình 07. Kết quả phân loại theo phương pháp Khoảng cách

nhỏ nhất

Kết quả sau khi phân loại của các phương pháp thể hiện ở hình 06, hình 07, hình 08 và so sánh với kết quả chuẩn đoán bằng mắt trên ảnh ta có thể thấy rằng: Tất cả các phương pháp đều có một vài sự nhầm lẫn về lớp đường giao thông và lớp nhà ở, thảm thực vật và mặt nước do phổ phản xạ của chúng có giá trị độ xám tương tự nhau.

Đánh giá độ chính xác Dựa vào ma trận sai số và hệ số Kappa

để đánh giá tương đối độ chính xác kết quả phân loại.

Nhìn vào ma trận sai số để biết được độ chính xác của kết quả phân loại bằng cách so sánh ảnh đã phân loại với các tài liệu bề mặt thực tế đã biết. ENVI có thể thành lập ma trận

Page 6: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

145 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

sai số sử dụng hoặc là ảnh bề mặt thực tế, hoặc sử dụng các mẫu ROIs thực tế.

Kết quả so sánh sẽ xuất hiện trên màn hình

dưới dạng một ma trận sai số, trên bảng ma trận kết quả này bao gồm cả độ chính xác của kết quả phân loại.

Support Vector Machine

Bảng 01. Ma trận sai số của phương pháp SVM Class GT Nha Ruong ThamTV MN Duong GT 17 12 0 0 0 Nha o 2 33 0 0 0 Ruong 1 0 33 0 0 Tham TV 0 0 3 86 0 Mat Nuoc 0 1 0 0 184 Total 20 46 36 86 184

Độ chính xác Overall Accuracy = (353/372) 94.8925%, Hệ số Kappa = 0.9242

Maximum Likelihood (Xác suất cực đại )

Bảng 02. Ma trận sai số của phương pháp Xác suất cực đại

Class GT Nha Ruong Tham TV MN Duong GT 17 9 0 0 0 Nha o 3 37 0 0 27 Ruong 0 0 34 0 9 Tham TV 0 0 2 86 0 Mat Nuoc 0 0 0 0 148

Total 20 46 36 86 184

Overall Accuracy = (322/372) 86.5591% Hệ số Kappa = 0.8110

Minimum Distance (Khoảng cách nhỏ nhất)

Bảng 03. Ma trận sai số của phương pháp Khoảng cách nhỏ nhất

Class GT Nha Ruong Tham TV MN Duong GT 16 20 0 0 0 Nha o 4 18 1 0 0 Ruong 1 4 29 0 0 Tham TV 0 0 6 86 0 Mat Nuoc 0 4 0 0 184 Total 20 46 36 86 184

Overall Accuracy = (333/372) 89.5161% Hệ số Kappa = 0.8439 Kết quả và một số nhận xét Chuẩn đoán ảnh bằng mắt và so sánh với kết

quả khi thực hiện các phương pháp phân loại khác nhau ta thấy: Các phương pháp đều có một vài sự nhầm lẫn giữa các lớp phủ có thành phần

cấu tạo khá giống nhau, dẫn đến phổ phản xạ của chúng có giá trị độ xám tương tự nhau. Vậy nên, điều quan trọng trong khi phân loại ảnh viễn thám là lựa chọn mẫu sao cho lớp mẫu thể hiện rõ nhất tính đặc thù của nó.

Xét hệ số Kappa của các phương pháp: - Phương pháp SVM: Hệ số Kappa =

0.9242;

Page 7: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

146 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

- Phương pháp xác suất cực đại: Hệ số Kappa = 0.8110;

- Phương pháp khoảng cách nhỏ nhất: Hệ số Kappa = 0.8439.

Kết hợp với ma trận sai số ta có thể dễ dàng nhận thấy khả năng phân loại của phương pháp SVM có độ chính xác cao hơn các phương pháp khác. Hơn nữa, nhìn vào kết quả phân loại, bằng mắt thường ta cũng có thể dễ dàng nhận ra, ranh giới giữa các đối tượng trong phân loại SVM rất rõ nét và chính xác.

Ta có thể nhận thấy SVM có đặc trưng cơ bản sau:

- Thứ nhất, nó luôn kết hợp với dữ liệu có ý nghĩa về mặt vậy lý.

- Thứ hai, nó cần một tập các mẫu thực tế

để huấn luyện rất nhỏ. Để đánh giá khách quan về độ chính xác

của các phương pháp phân loại chúng tôi đã thực hiện phân loại với một tấm ảnh khác và phân loại nhiều lần, với số lượng mẫu thực tế thay đổi (tăng dần số vùng lấy mẫu trên ảnh – các pixel ảnh tăng lên). Đối với các phương pháp phân loại thông thường thì độ chính xác (Overall Accuracy, Kappa Coefficient) không ổn định và hầu như tăng nếu số lượng mẫu tăng lên và sự khác biệt giữa các mẫu lớn. Nhưng với phương pháp SVM độ chính xác cao và rất ổn khi thay đổi số lượng mẫu thực tế. Ta có thể quan sát đồ thị sự biến đổi của Kappa để thấy rõ hơn.

Đồ thị sự biến động của Kappa như sau:

Hình 09. Sự thay đổi của độ chính xác Kappa khi số lượng mẫu thay đổi

Với ưu điển của phương pháp SVM chỉ cần số lượng mẫu thực tế ít mà độ chính xác phân loại lớp phủ vẫn cao.

IV. KẾT LUẬN Phương pháp phân loại SVM phân loại với

độ chính xác tốt và ổn định hơn các phương pháp khác khi số lượng mẫu thực tế thay đổi. Hơn nữa, khi nhìn bằng mắt vào bề mặt lớp phủ sau khi phân loại đối chiếu với ảnh ban đầu ta có thể dễ dàng thấy phương pháp SVM ranh giới giữa các lớp phủ rất rõ ràng.

- Thuật toán SVM có độ chính xác cao hơn so với thuật toán thông thường

- Thuật toán SVM có ưu điểm trong trường

hợp thực địa khó lấy mẫu, khu vực rộng lớn và tiết kiệm được chi phí và thời gian.

TÀI LIỆU THAM KHẢO

1. Trần Đình Trí (2010), Giáo trình Cơ Sở Viễn Thám, bộ môn Đo Ảnh Và Viễn Thám, Đại học Mỏ - Địa Chất.

2. Trần Vân Anh, Nguyễn Thị Yên Giang, Hướng dẫn sử dụng ENVI 4.3, bộ môn Đo Ảnh Và Viễn Thám, Đại học Mỏ - Địa Chất.

3. Trần Vân Anh, Giáo trình Viễn thám, bộ môn Đo Ảnh Và Viễn Thám, Đại học Mỏ - Địa Chất.

4. Thái Sơn (2006), Luận văn thạc sĩ khoa học “Kỹ thuật support vector machines và ứng dụng”, Đại học Bách Khoa Hà Nội.

5. Nguyễn Minh Giang, Nguyễn Mạnh Hiền (2005), Phân loại văn bản tiếng Việt với bộ vector hỗ trợ SVM.

Page 8: KHẢ NĂNG ỨNG DỤNG PHÂN LO I B M T L P PH BẰNG THUẬT …vnuf.edu.vn/documents/454250/1803845/17.Oanh.pdf · nghiệm, tiến hành phân tích, so sánh độ chính phân

Kinh tế & Chính sách

147 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ LÂM NGHIỆP SỐ 1-2015

USING OF SUPPORT VECTOR MACHINE ALGORITHM FOR LAND COVER CLASSIFICATION

Nguyen Thi Oanh, Phung Minh Tam

SUMMARY

Land covers reflects the natural condition of the earth's surface, for example, forests, grasslands, deserts, etc. Thanks to satellite remote sensing data it is possible to analyze and evaluate fluctuations of the land cover in a wide area with high economic efficiency over time and space. The world nowadays, algorithm support vector machine (SVM) has been applied to classify land cover from remote sensing imagery. In this paper, Basic classifications of land covers products for remote sensing imagery based on spectral characteristic of remote sensing imagery. SVM algorithm also based on the spectral characteristics of the multispectral remote sensing images. The process of classification uses SVM was a four steps: Define overlay template, select the template, sample training, classifies the new data. Conducting experiments on Envi 4.7 software for its popular image Quickbird spectral resolution of 2.4 m (one area My Dinh – Ha Noi) uses different classification methods, and conducting comparative taxonomy analysis and synthesis of the results obtained. SVM methodis better than the accuracy and stability by any method when the actual model number change. In addition, the use of SVM method boundaries very clear coating.

Keywords: Application of SVM algorithm, image classification, land cover classification, Supervised classification algorithm, Support Vector Machine, SVM algorithm.

Người phản biện : PGS.TS. Nguyễn Quang Minh Ngày nhận bài : 29/9/2014 Ngày phản biện : 17/10/2014 Ngày quyết định đăng : 15/3/2015