BẢN CAM ĐOANlib.uet.vnu.edu.vn/bitstream/123456789/1071/1/[Nguyễn...i BẢN CAM ĐOAN Tôi xin...

i

BẢN CAM ĐOAN

Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng cá nhân tôi, kết quả

của luận văn hoàn toàn là kết quả của tự bản thân tôi tìm hiểu, nghiên cứu dưới sự hướng

dẫn của giáo viên hướng dẫn PGS.TS. Đặng Văn Đức.

Tôi hoàn toàn chịu trách nhiệm về tính pháp lý quá trình nghiên cứu khoa học

của luận văn này.

Hà Nội, ngày 10 tháng 11 năm 2019

Học viên

Nguyễn Thị Thanh Huyền

ii

LỜI CẢM ƠN

Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS .TS Đặng Văn Đức người

đã tận tình hướng dẫn, chỉ bảo, giúp đỡ em trong suốt quá trình làm luận văn.

Em cũng xin gửi lời cảm ơn đến các thầy cô giáo trường Đại học Công nghệ

thông tin - Đại học Quốc Gia Hà Nội đã truyền đạt những kiến thức và giúp đỡ em

trong suốt quá trình học của mình.

Học viên cũng xin gửi lời cảm ơn tới Ban giám hiệu trường Cao đẳng nghề Hòa

Bình đã tạo điều kiện thuận lợi cho học viên tham gia khóa học và quá trình hoàn

thành luận văn.

Và học viên cũng xin gửi lời cảm ơn tới các đồng nghiệp, gia đình và bạn bè

những người đã ủng hộ, động viên tạo mọi điều kiện giúp đỡ để học viên có được kết

quả như ngày hôm nay.

iii

MỤC LỤC

MỞ ĐẦU ................................................................................................................... 1

1. Đặt vấn đề ........................................................................................................ 1

2. Những nội dung nghiên cứu chính .................................................................. 3

CHƯƠNG 1: ............................................................................................................. 4

GIỚI THIỆU VỀ CÔNG NGHỆ LIDAR VÀ CÁC ỨNG DỤNG ............................. 4

1.1 Tổng quan về công nghệ LiDAR ................................................................... 4

1.1.1 Cấu trúc hệ thống LiDAR ......................................................................... 4

1.1.2 Đặc điểm cơ bản của công nghệ LiDAR ................................................... 5

1.2. Khả năng ứng dụng của LiDAR .................................................................. 7

1.3. Bài toán phân loại dữ liệu LiDAR.............................................................. 13

1.3.2 Cơ bản về tệp tin .LAS ............................................................................ 14

1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS ................................ 16

1.4 Kết chương: ................................................................................................. 18

CHƯƠNG 2: ........................................................................................................... 19

MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR .......................................... 19

2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale Curvature

Classification) và K-Means trong phân loại dữ liệu LiDAR............................ 19

2.1.1 Thuật toán MCC (Multiscale Curvature Classification) .......................... 19

2.1.2 Thuật toán K-Means ............................................................................... 21

2.2. Đánh giá kết quả phân loại LiDAR ............................................................ 23

2.2.1 Thuật toán MCC ..................................................................................... 23

2.2.2 Thuật toán K-Means ............................................................................... 26

iv

2.3. Kết chương .................................................................................................. 30

CHƯƠNG 3: ........................................................................................................... 32

XÂY DỰNG ỨNG DỤNG THỰC NGHIỆM.......................................................... 32

3.1 Giới thiệu bài toán thử nghiệm ................................................................... 32

3.2 Lựa chọn thuật toán phân loại và dữ liệu thử nghiệm ............................... 32

3.3 Môi trường và các công cụ sử dụng để xây dựng chương trình ................ 34

3.4 Phát triển chương trình ............................................................................... 37

3.5 Đánh giá kết quả thu được .......................................................................... 39

3.5.1 Phân loại với MCC ................................................................................. 39

3.5.2 Phân loại đám mây điểm với K-means .................................................... 41

3.5.3 Đánh giá ................................................................................................. 42

KẾT LUẬN ............................................................................................................. 46

LIỆU THAM KHẢO ............................................................................................... 47

v

DANH MỤC CHỮ VIẾT TẮT

LiDAR: Light Detection And Ranging

Laser: Light amplification by stimulated emission of radiation

GNSS: Global Navigation Sattelite System

ASPRS: American Society for Photogrammetry and Remote Sensing

INS: Inertial Navigation System

DEM: Digital Elevation Model

DTM: Digital Terrain Model

DSM: Digital Surface Model

MCC: Multiscale Curvature Classification

BCAL: Boise Center Aerospace Laboratory LiDAR

vi

DANH MỤC BẢNG BIỂU

Bảng 1. Thuộc tính của dữ liệu LiDAR .......................................................... 13

Bảng 3.1 Thông số của file las ....................................................................... 33

Bảng 3.2: Số lượng điểm của mỗi cụm ........................................................... 44

Bảng 3.3:Các độ đo đánh giá độ chính xác phân loại...................................... 44

vii

DANH MỤC HÌNH ẢNH

Hình 1. 1: Tổng quan về hệ thống LiDAR ........................................................ 5

Hình 1. 2: Ứng dụng LiDAR trong khảo sát địa hình và lập bản đồ ................. 8

Hình 1. 3: Ứng dụng LiDAR trong lâm nghiệp ................................................ 8

Hình 1. 4: Ứng dụng LiDAR trong lập bản đồ ngập úng .................................. 9

Hình 1. 5: Ứng dụng LiDAR cho đới duyên hải ............................................... 9

Hình 1. 6:Ứng dụng LiDAR trong lập bản đồ địa hình ven biển ..................... 10

Hình 1. 7: Ứng dụng LiDAR trong quan trắc dự báo trượt lở ......................... 10

Hình 1. 8: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải ...................... 11

Hình 1. 9: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải ...................... 11

Hình 1. 10: Ứng dụng LiDAR trong quy hoạch và quản lý mạng điện thoại di

động ............................................................................................................... 12

Hình 1. 11: Ứng dụng LiDAR trong lập mô hình đô thị và mô phỏng đô thị .. 12

Hình 1. 12: Hiển thị dữ liệu trong tệp tin LAS ............................................... 15

Hình 1. 13: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D ...... 17

Hình 1. 14: Quy trình phân loại đám mây điểm LiDAR ................................. 18

Hình 2. 1: Mô tả thuật toán K-Means ............................................................. 21

Hình 2. 2: Ví dụ phân loại với K-Means ......................................................... 22

Hình 2. 3: Sơ đồ khối của giải thuật MCC trong phân lớp dữ liệu LiDAR ..... 24

Hình 2. 4: Khu vực thực nghiệm trong nghiên cứu ......................................... 25

Hình 2. 5: Tỉ lệ các điểm thuộc hai lớp sau phân loại ..................................... 25

Hình 2. 6: Pseudo code của thuật toán K-means trong phân loại đám mây điểm

LiDAR ........................................................................................................... 27

Hình 2. 7: Sơ đồ phân loại đám mây điểm LiDAR với K-means .................... 27

Hình 2. 8: Kết quả phân loại với k=5.............................................................. 28

viii

Hình 2. 9: Kết quả phân loại với k=7.............................................................. 29

Hình 3. 1: Đám mây điểm khu vực khảo sát ................................................... 33

Hình 3. 2: Ảnh vệ tinh của khu vực đo vẽ ...................................................... 34

Hình 3. 3: Giao diện GUI của lastool ............................................................. 36

Hình 3. 4: Công cụ của LASTool trong ARCGIS ........................................... 36

Hình 3. 5: Giao diện chương trình .................................................................. 37

Hình 3. 6: Đám mây điểm LiDAR được hiển thị dưới dạng 3D ..................... 37

Hình 3. 7: Phân loại với MCC ........................................................................ 38

Hình 3. 8: Các điểm được gán nhãn sau phân loại với MCC .......................... 38

Hình 3. 9 Kết quả phân loại với K-means ....................................................... 39

Hình 3. 10: Tham số được lựa chọn trong giải thuật MCC ............................. 40

Hình 3. 11: Các điểm được gán nhãn sau phân loại với MCC ........................ 41

Hình 3. 12: Kết quả phân loại với K-means .................................................... 42

Hình 3. 13: Tỉ lệ phân loại trong mỗi miền tỉ lệ với MCC .............................. 43

Hình 3. 14: Lịch sử lặp của K-means ............................................................. 43

Hình 3. 15: Mô hình DEM của khu vực ......................................................... 45

Hình 3. 16: Mô hình DSM.............................................................................. 45

1

MỞ ĐẦU

1. Đặt vấn đề

Từ những năm đầu của thập niên 60 của thế kỷ 20, sự ra đời của bộ khuếch đại

ánh sáng bằng phát xạ kích thích – laser đã mở rất nhiều ứng dụng mới, trong đó phải

kể đến kỹ thuật khảo sát từ xa sử dụng nguồn kích thích bằng tia laser gọi là LiDAR

(Light Detection And Ranging). Hệ thống LiDAR là một hệ thống tích hợp từ 3 thành

phần chính: Hệ thống thiết bị Laser (Light amplification by stimulated emission of

radiation), hệ thống định vị vệ tinh GNSS (Global Navigation Sattelite System) và hệ

thống đạo hàng quán tính INS (Inertial Navigation System). Tổ hợp các thiết bị này

trong mối quan hệ hữu cơ, tác động chi phối lẫn nhau, tạo nên hệ thống LiDAR.

Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian

GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được phát hướng

xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất hay từ

các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được thời

gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối tượng.

Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định vị trí

không gian của điểm phát, và hệ thống đạo hàng quán tính sẽ xác định các góc định

hướng trong không gian của tia quét. Với các giá trị đo tổng hợp đó tính được vị trí

(tọa độ không gian) của các điểm trên bề mặt đất.

Công nghệ LiDAR là một công nghệ tiên tiến hàng đầu trong hệ thống các công

nghệ thu thập dữ liệu không gian trên thế giới. Với khả năng trực tiếp thu nhận đám

mây điểm 3D với độ chính xác cao, LiDAR được áp dụng rộng rãi trong việc thành

lập mô hình số độ cao (Digital Elevation Model - DEM) của bề mặt địa hình, dựa vào

đó có thể theo dõi được dòng chảy của nước hay giám sát di chuyển khối, thành lập

bản đồ và viễn thám. Công nghệ LiDAR là sự phát triển và ứng dụng các thiết bị

laser, định vị vệ tinh và đo quán tính để thu thập dữ liệu địa lý trên bề mặt trái đất. So

sánh với các phương pháp thu nhận và xử lý trắc địa ảnh truyền thống, xử lý dữ liệu

2

LiDAR dễ dàng hơn, thành lập chính xác mô hình DEM. Hơn thế nữa, xung laser có

thể xuyên qua các địa hình, địa vật như lá, mặt đất dưới tán cây.

Để thành lập ra được DEM từ tập hợp điểm này, ta phải phân biệt được điểm

mặt đất và điểm không mặt đất. Quá trình này gọi là phân loại dữ liệu LiDAR. Việc

phân loại dữ liệu tự động của đám mây điểm được thực hiện bằng phép giải các bài

toán lọc điểm, trên cơ sở kết hợp sử dụng ảnh cường độ, kết quả đo vẽ các bãi kiểm

định chuẩn trên thực địa và ảnh số chụp được (nếu có trong công nghệ có lắp thêm

hệ thống máy chụp ảnh kỹ thuật số).

Bài toán phân loại đám mây điểm LiDAR thuộc vào bài toán lọc và phân tách

đưa các điểm về các lớp riêng biệt. Việc phân loại dữ liệu tự động của đám mây điểm

phải tách được đám mây dữ liệu thành các lớp khác nhau theo các tính chất riêng như:

Lớp chứa điểm mặt đất, Lớp chứa điểm thực phủ, Lớp chứa điểm trên mái nhà tường

nhà và các công trình xây dựng, Lớp chứa các điểm trên không, Lớp chứa các điểm

bị lỗi, Lớp chứa các điểm trên mặt nước …. Từ đó xây dựng ra lớp Ground và Non-

Ground. Trên thế giới có nhiều chương trình lọc điểm theo các thuật toán khác nhau

đã được giới thiệu và áp dụng. Trong số đó có Vosselman và Sithole (Hà Lan) có

thuật toán “mô hình góc nghiêng di động” hay mô hình “độ chênh cao cực đại”,

Axelsson đưa ra thuật toán “mô hình TIN di động “, Kraus (Áo) đưa ra thuật toán lọc

theo lý thuyết nội suy thống kê, hãng ToyEye (Thụy Điển), TopoSys (Đức) có chương

trình lọc đám mây điểm của LiDAR cung cấp kèm với hệ thống thiết bị… Hiện nay,

với các thuật toán lọc ngày càng hoàn thiện, công tác lọc điểm đã tự động hóa được

khoảng 90-95%, tuy nhiên để đánh giá, so sánh chất lượng giữa các thuật toán thì còn

nhiều vấn đề phải tranh luận và kiểm chứng trong thực tế sản xuất. Các phần mềm xử

lý dữ liệu LiDAR rất đắt được bán kèm theo thiết bị, hoàn toàn là phần mềm thương

mại đóng như ENVI LiDAR.

Với mục đích nghiên cứu, tìm hiểu các thuật toán hiện đang được sử dụng trong

việc phân loại dữ liệu LiDAR, đồng thời thử nghiệm các kỹ thuật phân loại dữ liệu

3

LiDAR trên những bộ dữ liệu cụ thể, học viên lựa chọn nội dung: “Nghiên cứu kỹ

thuật phân loại dữ liệu LiDAR” làm đề tài thực hiện khóa luận thạc sĩ của mình.

2. Những nội dung nghiên cứu chính

Ngoài phần mở đầu trình bày lý do chọn đề tài và phần kết luận trình bày các

kết quả đạt được của luận văn này, nội dung nghiên cứu chính được trình bày trong

ba chương như sau:

Chương 1: Trình bày khái quát về công nghệ LiDAR và các ứng dụng, phát

biểu bài toán phân loại dữ liệu LiDAR.

Chương 2: Trình bày phương pháp phân loại dữ liệu LiDAR với 2 thuật toán

MCC (Multiscale Curvature Classification) và thuật toán K-Means.

Chương 3: Xây dựng chương trình thử nghiệm phân loại dữ liệu LiDAR bao

gồm: Giới thiệu bài toán thử nghiệm, lựa chọn thuật toán phân loại và dữ liệu thử

nghiệm, môi trường và các công cụ sử dụng để xây dựng chương trình, phát triển

chương trình và đánh giá kết quả thu được.

4

CHƯƠNG 1:

GIỚI THIỆU VỀ CÔNG NGHỆ LIDAR VÀ CÁC ỨNG DỤNG

1.1 Tổng quan về công nghệ LiDAR

1.1.1 Cấu trúc hệ thống LiDAR

LiDAR, Light Detection And Ranging, là thuật ngữ để chỉ một công nghệ viễn

thám mới, chủ động, sử dụng các loại tia laser để khảo sát đối tượng từ xa. Dữ liệu

thu được của hệ thống là tập hợp đám mây điểm phản xạ 3 chiều của tia laser từ đối

tượng được khảo sát. Công nghệ này cũng mới được áp dụng tại Việt Nam, nó cho

phép đo đạc độ cao chi tiết địa hình một cách chính xác và nhanh chóng.

Hệ thống LiDAR bao gồm bộ đầu quyết (bộ cảm biến), hệ thống đo quán tính

(IMU), hệ thống GPS, hệ thống quản lý bay, hệ thống camera số và hệ thống các thiết

bị lưu trữ dữ liệu.

Bộ máy quét Laser (bộ cảm biến): Gồm hai bộ phận được gắn vào bên dưới máy

bay; một bộ phận có vai trò phát xung laser hẹp đến bề mặt trái đất trong khi máy bay

di chuyển với tốc độ nhất định. Một máy thu gắn trên máy bay sẽ thu nhận phản hồi

của những xung này khi chúng đập vào bề mặt trái đất và quay trở lại thiết bị thu trên

máy bay. Hầu hết các hệ thống LiDAR đều sử dụng gương quét để tạo ra một dải

xung. Sóng Laser nằm trong dải sóng cận hồng ngoại để phục vụ công tác đo đạc địa

hình, bề mặt trái đất, còn với laser dải sóng xanh lá cây phục vụ công tác đo sâu mặt

nước. Độ rộng của dải quét phụ thuộc vào góc dao động của gương, và mật độ điểm

mặt đất phụ thuộc vào các yếu tố như tốc độ máy bay và tốc độ gương. Tốc độ dao

động được xác định bằng cách tính toán tổng thời gian tia laser rời máy bay, đi đến

mặt đất và trở lại bộ cảm biến.

Hệ thống xác định quán tính IMU: Các giá trị góc xoay, góc nghiêng dọc, nghiêng

ngang, hướng bay quét của hệ thống LiDAR được xác định chính xác bằng thiết bị

đạo hàng, góc quay gương tức thời và các khoảng cách thu nhận và dữ liệu GPS được

dùng để tính toán toạ độ ba chiều của các điểm LiDAR.

5

Hệ thống GPS: Dữ liệu LiDAR được kết hợp với các thông tin vị trí chính xác

thu nhận từ thiết bị GPS và hệ thống thiết bị xác định các thông số định hướng góc

xoay, góc nghiêng dọc, nghiêng ngang cùng đặt trên máy bay. Các thông tin này được

lưu trữ và xử lý, để xác định giá trị toạ độ (x,y,z) chính xác của mỗi điểm trên mặt

đất. Hệ thống GPS gồm một máy thu đặt trên máy bay và một máy thu đặt tại mặt

đất, quá trình xử lý dữ liệu này cho ra kết quả vị trí điểm có độ chính xác cao (+/- vài

cm đến vài chục cm).

Hệ thống quản lý bay: Cho phép lập kế hoạch, thiết kế tuyến bay và theo dõi quá

trình bay quét LiDAR.

Hình 1. 1: Tổng quan về hệ thống LiDAR

1.1.2 Đặc điểm cơ bản của công nghệ LiDAR

Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian

GPS/INS và sự nhận biết cường độ phản xạ ánh sáng [3]. Xung của laser được phát

hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất

hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được

thời gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối

tượng. Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định

6

vị trí không gian của điểm phát, và hệ thống đạo hàng quán tính sẽ xác định các góc

định hướng trong không gian của tia quét. Với các trị đo tổng hợp đó tính được vị trí

(tọa độ không gian) của các điểm trên bề mặt đất.

Công nghệ LiDAR có nhiều tính năng vượt trội so với các công nghệ đo đạc

truyền thống, nó có những đặc điểm cơ bản như:

- Độ chính xác xác định vị trí không gian của các đối tượng địa lý rất cao. Độ

chính xác độ cao < 20cm, độ chính xác mặt phẳng < 25cm.

- Thời gian thu thập và xử lý dữ liệu cực nhanh. Thời gian bay quét LiDAR với

khoảng 1000km2 là khoảng 25-30 giờ, thời gian xử lý tạo DEM với 1000km2

là khoảng 10 ngày.

- Không giống như các phương pháp đo ảnh hay đo đạc ngoài trời khác, công

nghệ LiDAR chủ yếu là tự động hóa, ít có sự can thiệp trực tiếp của con người.

Thành quả dữ liệu rất khách quan, mức độ tin cậy cao.

- Hệ thống LiDAR thu thập dữ liệu không phụ thuộc vào ánh sáng mặt trời, có

thể thực hiện cả ngày và đêm, điều kiện thời tiết không đòi hỏi khắt khe.

- Xung ánh sáng của hệ thống LiDAR có thể đi qua đối tượng vòm như tán cây,

mặt nước, mái che kính, tấm ni lông mỏng … và phản xạ tới 4 lần. Mỗi lần

phản xạ là một mức truyền khác nhau và ghi nhận một giá trị tọa độ (XYZ)

khác nhau. Đây là một tính năng đặc biệt mà công nghệ đo vẽ ảnh khác không

thể thực hiện được. Với tính năng này việc thực hiện bay quét ở vùng rừng cây

hoặc nơi có thực phủ không quá dày đặc vẫn có thể thi công và thể hiện được

bề mặt đất.

- Điểm phân giải điểm đo chi tiết cao, khi đầu phát đạt 150.000 xung trên 1 giây,

độ cao bay 1000m thì mật độ khoảng 3 điểm trên 1m2. Hiện nay có nhiều hệ

thống LiDAR có đầu phát đạt 240.000 xung trên 1 giây. Công nghệ LiDAR

với khả năng đo điểm trực tiếp ngoại nghiệp mật độ rất cao, độ chính xác lớn,

tốc độ nhanh.

- Điểm khống chế mặt đất rất ít, có thể chỉ 1 điểm cho mục đích cải chính DGPS.

Công nghệ LiDAR đặc biệt lợi ích là công cụ lý tưởng khi nó được áp dụng

7

cho các vùng xa xăm, hẻo lánh khi mà con người rất khó tiếp cận trong triển

khai đo đạc ngoại nghiệp.

- Công nghệ LiDAR ghi nhận được các giá trị mức phản xạ ánh sáng của các

đối tượng trên mặt đất, dữ liệu này có thể được dùng để tạo ra ảnh cường độ

xám, phân loại đối tượng, chiết xuất đối tượng trên mặt đất. Đây là một đặc

tính có giá trị gia tăng của dữ liệu LiDAR.

- Một số hệ thống LiDAR ngoài chức năng đo quét trên mặt đất, còn có thể thực

hiện chức năng đo sâu (hiện nay có thể đo sâu đến 40m).

- Tổ chức thi công đơn giản, gọn nhẹ hơn các phương pháp khác, số người cần

tham gia rất ít (khoảng 10-15 người).

- Hiệu quả kinh tế rất cao khi ứng dụng công nghệ LiDAR cho mục đích thu

thập dữ liệu không gian với yêu cầu thời gian ngắn, độ chính xác cao và mật

độ dày đặc [3].

1.2. Khả năng ứng dụng của LiDAR

Công nghệ LiDAR đã thể hiện nhiều ưu thế vượt trội hơn với các công nghệ

khác trong việc đo đạc thành lập bản đồ, xây dựng cơ sở dữ liệu hay mô phỏng không

gian ba chiều. Các nguồn dữ liệu thu nhận được có thể được ứng dụng trong nhiều

lĩnh vực khác nhau như giáo dục, viễn thông, theo dõi đánh giá khai thác mỏ, quân

sự, nghiên cứu lập bản đồ khu vực ngập lụt, dự báo thảm hoạ, bản đồ địa hình dải ven

biển, quy hoạch đô thị, lập bản đồ đường dây tải điện,…

a) Khảo sát địa hình và lập bản đồ:

Kết quả đầu ra cơ bản là các mô hình số địa hình (DEM – Digital Elavation

Model) và mô hình số bề mặt (DSM – Digital Surface Model) với độ phân giải và độ

chính xác cao, LiDAR rất phù hợp để ứng dụng trong việc thành lập bản đồ tỷ lệ lớn,

các ứng dụng liên quan đến phát triển hoặc quản lý duy trì hạ tầng cơ sở.

8

Hình 1. 2: Ứng dụng LiDAR trong khảo sát địa hình và lập bản đồ

b) Lâm nghiệp:

Trong lĩnh vực lâm nghiệp, công nghệ LiDAR chủ yếu được sử dụng để đánh

giá, thống kê, phân tích điều kiện sống hoang dã, tương quan của các yếu tố như tán,

độ dày tán, dạng lá,… hay sản lượng gỗ rừng; ước tính sinh khối, trữ lượng gỗ và các

tham số lâm nghiệp khác.

Hình 1. 3: Ứng dụng LiDAR trong lâm nghiệp

c) Lập bản đồ ngập úng:

Dữ liệu LiDAR được sử dụng hiệu quả trong xây dựng các mô hình ngập úng,

xác định ranh giới ngập úng, cung cấp thêm nhiều thông tin về các đối tượng/địa vật

chịu ảnh hưởng; từ đó thành lập bản đồ nguy cơ ngập úng, vùng ưu tiên sơ tán.

9

Hình 1. 4: Ứng dụng LiDAR trong lập bản đồ ngập úng

d) Các ứng dụng cho đới duyên hải:

Do dữ liệu LiDAR có độ chính xác cao cùng mật độ điểm dữ liệu dày đặc

trong thời gian thu thập dữ liệu ngắn. Dữ liệu này rất phù hợp cho các ứng dụng để

quản lý và dự báo xói mòn bờ biển; giúp đánh giá và dự báo bồi lắng, quan trắc cũng

như lập dự báo ngập lụt ven biển…

Hình 1. 5: Ứng dụng LiDAR cho đới duyên hải

e) Địa hình ven biển:

Công nghệ LiDAR có thể giúp lập bản đồ địa hình đáy biển độ sâu tới 70m,

hữu ích trong các dự án xác định luồng lạch tàu vào, thiết kế quy hoạch cảng và các

kênh giao thông thuỷ.

10

Hình 1. 6:Ứng dụng LiDAR trong lập bản đồ địa hình ven biển

f) Trượt lở:

LiDAR có thể sử dụng để quan trắc và dự báo trượt lở, đặc biệt với ác sườn

dốc, nhờ đặc điểm thu thập dữ liệu nhanh chóng với độ chính các cao và mật độ dữ

liệu dày đặc. Công nghệ này cũng có thể được sử dụng để đánh giá nhanh thiệt hại và

thiết lập bản đồ thể hiện tình trạng hậu trượt lở nhanh chóng chính xác.

Hình 1. 7: Ứng dụng LiDAR trong quan trắc dự báo trượt lở

g) Các tuyến truyền tải:

LiDAR được áp dụng trong việc lập bản đồ các tuyến truyền tải trải dài, giúp

thể hiện chính xác vị trí các tháp truyền tải hoặc cột điện, phân định địa hình của hành

lang truyền tải và các loại đối tượng tồn tại trong hành lang (cây xanh…) giúp điều

chỉnh, sửa chữa duy tu và thiết kế nâng cấp.

11

Hình 1. 8: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải

h) Lập bản đồ giao thông:

Công nghệ LiDAR thường được sử dụng để: quan trắc, giám sát, duy tu bảo

dưỡng và quản lý các đối tượng như đường sắt, đường bộ, hệ thống tín hiệu biển báo,

các trạm dừng đỗ, nhà ga bến cảng, sự xuống cấp mặt đường, điểm tai nạn, mật độ

giao thông, bùng binh,… mà không cần làm gián đoạn các dịch vụ liên quan.

Hình 1. 9: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải

12

i)Mạng điện thoại di động:

Một trong những yêu cầu của việc quy hoạch và quản lý các mạng điện thoại

di động đó là cần có thông tin bề mặt địa hình, lớp phủ thực vật, các toà nhà và công

trình một cách chi tiết. Công nghệ LiDar xác định cơ sở dữ liệu chính xác và chi tiết

các thông tin về các chướng ngại vật tự nhiên và nhân tạo là cực kỳ quan trọng.

Hình 1. 10: Ứng dụng LiDAR trong quy hoạch và quản lý mạng điện thoại di động

j) Lập mô hình đô thị và mô phỏng đô thị:

Lidar thường được ứng dụng để tạo ra mô hình thành phố ảo với nền địa lý và

các công trình xây dựng, kiến trúc, như đô thị thực. Mô hình này có thể được khai

thác phục vụ rất nhiều đối tượng từ quy hoạch kiến trúc, xây dựng, giao thông. Mô

hình này cũng được chia sẻ dưới các cách linh động khác nhau như: ứng dụng

desktop, ứng dụng web, sử dụng các chuẩn mở, dễ trao đổi và dễ cấu hình phù hợp

với từng đối tượng sử dụng.

Hình 1. 11: Ứng dụng LiDAR trong lập mô hình đô thị và mô phỏng đô thị

13

1.3. Bài toán phân loại dữ liệu LiDAR

1.3.1 Khái niệm

Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không

gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được

phát hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ

mặt đất hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi

xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ

nguồn phát laser tới đối tượng. Ở mỗi thời điểm phát xung laser, hệ thống định

vị vệ tinh GNSS sẽ xác định vị trí không gian của điểm phát, và hệ thống đạo

hàng quán tính sẽ xác định các góc định hướng trong không gian của tia quét.

Với các giá trị đo tổng hợp đó sẽ tính được vị trí (tọa độ không gian) của các

điểm trên bề mặt đất. Một tín hiệu phát đi, sẽ có một hay nhiều tín hiệu phản

xạ. Kết quả cuối cùng, sẽ có được đám mây điểm.

Dữ liệu điểm của LiDAR sẽ được tiền xử lý sau khi hệ thống thu nhận

được hệ tọa độ x, y, z có độ chính xác cao của đối tượng bằng cách phân tích

thời gian tia quét phản xạ, góc quét, vị trí thu nhận từ GPS, và thông tin INS.

Thuộc tính của dữ liệu LiDAR ghi nhận được cho mỗi xung bao gồm: cường

độ, số lượng xung phản hồi, giá trị điểm phân loại, góc quét của đường bay

chụp, giá trị RGB, thời gian định vị, góc quét và hướng quét.

Bảng 1. Thuộc tính của dữ liệu LiDAR

STT Tên thuộc tính Mô tả

1 Cường độ Độ đậm nhạt của xung dữ liệu LiDAR phản xạ ghi

nhận được từ điểm LiDAR.

14

2 Số lượng xung

phản xạ

Tổng số lượng xung phản hồi.

3 Điểm phân loại Mọi điểm LiDAR đều được phân loại trong quá

trình tiền xử lý để xác định được loại đối tượng

phản xạ.

4 Góc của đường

quét

Các điểm sẽ được ký hiệu với giá trị 0 và 1. Những

điểm theo đường góc quét sẽ được gán giá trị là 1,

những điểm còn lại được gán giá trị là 0

5 RGB Dữ liệu LiDAR có thể được gán với kênh phổ R,

G, B. Giá trị này thường được thu nhận từ ảnh

cùng thời gian với đo LiDAR

6 Thời gian định vị Giờ được thu nhận từ hệ thống GPS được phát ra

từ hệ thống không vận

7 Góc quét Giá trị của góc quét thường từ - 900 đến + 900

8 Hướng quét Hướng quét là hướng gương chụp laser đang di

chuyển tại thời điểm xung laser phát ra

9 x, y, z Tọa độ và độ cao của điểm phản xạ

Dữ liệu đám mây điểm LiDAR thường rất lớn, từ vài ngàn đến vài chục triệu

điểm tùy thuộc vào độ rộng của khu vực đo vẽ và sự phức tạp của khu vực đo vẽ.

Định dạng đám mây điểm thường là .las hay .laz.

1.3.2 Cơ bản về tệp tin .LAS

Bộ dữ liệu LAS lưu trữ một hoặc nhiều tệp LAS trên đĩa, cũng như các tính

năng bề mặt bổ sung. Tệp LAS là định dạng nhị phân chuẩn công nghiệp để lưu trữ

15

dữ liệu LiDAR trong không khí. Bộ dữ liệu LAS cho phép kiểm tra các tệp LAS, ở

định dạng gốc, nhanh chóng và dễ dàng, cung cấp số liệu thống kê chi tiết và vùng

phủ sóng của dữ liệu LiDAR chứa trong các tệp LAS.Một tập dữ liệu LAS cũng có

thể lưu trữ tham chiếu đến các lớp đối tượng có chứa các ràng buộc bề mặt. Các ràng

buộc bề mặt là đường nét, đa giác nước, ranh giới khu vực, hoặc bất kỳ loại tính năng

bề mặt nào khác được thực thi trong bộ dữ liệu LAS.

Bộ dữ liệu LAS cung cấp quyền truy cập ngay vào dữ liệu LiDAR mà không

cần chuyển đổi hoặc nhập dữ liệu. Các thuộc tính điểm LAS có thể được sử dụng để

lọc ra nội dung và tượng trưng cho các điểm trong 2D và 3D. Ngoài ra, dữ liệu LiDAR

thường xuất hiện dưới dạng một nhóm tệp, tập dữ liệu LAS cung cấp khả năng xác

định tập hợp các tệp LAS hợp lý để làm việc trong các dự án được bản địa hóa.

Hình 1. 12: Hiển thị dữ liệu trong tệp tin LAS

Bộ dữ liệu LAS tương tự như một tập dữ liệu địa hình với các chế độ xem trên

bề mặt, nhưng nó cũng có thể được sử dụng để xem điểm và không yêu cầu tiền xử

lý. Người dùng không bắt buộc phải thực hiện bất kỳ quá trình xử lý nào để nhanh

chóng hiểu dữ liệu LiDAR đang làm việc. Có thể làm việc trực tiếp trên các tệp LAS,

dưới dạng tập hợp hoặc dưới dạng tệp riêng lẻ. Bộ dữ liệu LAS hỗ trợ đường viền

hoặc các ràng buộc bề mặt khác sẽ được thêm vào mô hình bề mặt. Nó được hiển thị

16

như một bề mặt hoặc một đám mây điểm, cho phép nhanh chóng đánh giá và hiểu dữ

liệu LiDAR.

Có thể hiển thị bất kỳ sai sót hoặc vấn đề dữ liệu nào một cách nhanh chóng

do hiển thị nhanh và phân tích thống kê. Phân tích có thể được tiến hành trên mỗi và

mọi tập tinLAS hoặc trên toàn bộ tập dữ liệu LAS. Nếu có lỗi trong phân loại, có thể

sửa đổi việc phân loại các tập tin LAS bằng cách sử dụng LAS Dataset 2D Profile

View.

Bộ dữ liệu LAS có thể mở rộng, cho phép làm việc với các đám mây điểm lớn

một cách nhanh chóng và hiệu quả. Đại diện bộ dữ liệu LAS tự động cập nhật khi

xoay và thu phóng xung quanh màn hình. Bộ dữ liệu LAS là một bổ sung tuyệt vời

cho luồng công việc cho bộ dữ liệu địa hình và bộ dữ liệu mosaic, có thể xem nhanh

các tệp LiDAR trước khi nhập, phân tích hoặc chia sẻ dữ liệu LiDAR.

1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS

Dữ liệu LiDAR được lưu trong tệp tin LAS thường là đám mây điểm. Các đám

mây điểm là tập hợp các điểm thể hiện hình dạng hoặc tính năng 3D. Mỗi điểm có

tập hợp các tọa độ X, Y, Z riêng và trong một số trường hợp có thêm các thuộc tính

bổ sung. Các điểm LiDAR được lưu trữ trong các tệp LAS thường được phân thành

các loại khác nhau bằng cách sử dụng các công cụ phân loại chuyên biệt bên ngoài

ArcGIS. Phân loại này thường được hoàn thành bằng cách đặt thông số dựa trên địa

hình, sau đó chạy thuật toán trên đám mây điểm để xác định loại đối tượng được liên

kết với mỗi điểm. Mã phân loại được gán cho mỗi điểm được ghi vào tệp LAS và,

trong hầu hết các trường hợp, tuân theo tiêu chuẩn ASPRS. Khi phân loại tự động

được thực hiện trên dữ liệu LiDAR, chúng thường không phân loại hoàn toàn tất cả

các điểm một cách chính xác nhưng thường chính xác đến khoảng 90 phần trăm của

các điểm. Để đảm bảo rằng 100% các điểm LiDAR được phân loại chính xác, cần

phân loại thủ công và dọn sạch dữ liệu. Đây là một công việc rất tốn thời gian, và một

số nhà cung cấp có thể yêu cầu một chi phí bổ sung để thực hiện phân loại thủ công.

17

Hình 1. 13: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D

Phân loại đám mây điểm là quá trình phân chia các điểm thành các lớp điểm

chuyên biệt như mặt đất, nước, thảm thực vật, xây dựng, đường dây điện…Phân loại

có thể là một hoạt động chuyên sâu xử lý và nhiều bộ dữ liệu LIDAR đã trải qua phân

loại hạn chế. Mặt đất hầu như luôn được bao gồm trong một tệp LAS, vì nó là cần

thiết để tạo ra một DTM. Các phiên bản thường dùng của định dạng LAS (1.2 và 1.3)

có 8 loại phân loại được xác định trước và có thể xử lý lên đến 32; phiên bản mới hơn

(1.4), vẫn chưa được sử dụng rộng rãi, có khoảng 20 lớp được định trước và có thể

xử lý 256.

18

Đám mây

điểm

LiDAR

Tiền xử lý Lọc điểm Lựa chọn

thuật toán Phân loại

Đánh giá độ

chính xác

Hình 1. 14: Quy trình phân loại đám mây điểm LiDAR

Việc phân loại đám mây điểm LiDAR thường được thực hiện theo quy trình

sau:

Sau quá trình phân loại đám mây điểm LiDAR sẽ được sử dụng để

thành lập DEM/DTM và được ứng dụng trong những bài toán cụ thể.

1.4 Kết chương:

Với mục đích sử dụng triệt để các dữ liệu quét LiDAR, việc phân loại các lớp

điểm theo từng lớp đặc trưng, theo mục đích nghiên cứu từng loại đối tượng, việc

“Nghiên cứu phương pháp phân loại dữ liệu LiDAR” sẽ góp phần mở rộng ứng

dụng công nghệ LiDAR trong nghiên cứu cấu trúc không gian của lớp phủ mặt đất.

Điều này là hoàn toàn cần thiết và mang tính thực tiễn cao, đặc biệt có ý nghĩa khi sử

dụng công nghệ LiDAR trong nghiên các thảm thực vật, nghiên cứu sinh khối và tầng

thứ của rừng đa tầng nhiệt đới, nghiên cứu bờ biển hay thay đổi của bề mặt phủ.

19

CHƯƠNG 2:

MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR

2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale

Curvature Classification) và K-Means trong phân loại dữ liệu LiDAR

2.1.1 Thuật toán MCC (Multiscale Curvature Classification)

Thuật toán MCC (Multiscale Curvature Classification) là thuật toán được sử

dụng để phân loại đám mây điểm LiDAR 3D được phát triển bởi Moscow Forestry

Sciences Laboratory, sử dụng chủ yếu để phân loại các tia phản xạ LiDAR trong môi

trường rừng. Thuật toán này được sử dụng để phân loại các điểm thành hai lớp là mặt

đất (ground) và không mặt đất (non-ground). Đây là thuật toán phân loại đám mây

điểm LiDAR tự động. MCC là thuật toán lặp đa tỉ lệ để phân loại tín hiệu phản xạ

LiDAR mà vượt quá ngưỡng độ cong của bề mặt, cách tiếp cận đa tỉ lệ sẽ xác định

độ lệch của các điểm cần phân loại với bề mặt trung bình và loại bỏ dần những điểm

trên bề mặt khỏi nhóm mặt đất. Quá trình phân loại bắt đầu bằng việc xác định xem

các điểm thuộc những tia phản xạ đơn hay phản xạ cuối cùng cũng như phản xạ đầu

tiên từ thực vật. Thuật toán MCC sẽ tính toán bề mặt trung bình từ những điểm mặt

đất đặc trưng bằng phép lặp TPS (Thin Plate Spline), sau đó sẽ hiệu chỉnh nó thông

qua một lõi lọc. Những tính năng của thuật toán MCC sử dụng để phân loại đám mây

điểm LiDAR hỗ trợ cho quá trình lặp để tìm kiếm bề mặt thật của Trái đất với độ

phân giải tương ứng với mẫu.

Có bai cải tiến của thuật toán, đó là:

- Phép lặp TPS (Thin Plate Spline)

- Sử dụng cách tiếp cận đa tỉ lệ với bề mặt chuẩn được nội suy với các độ

phân giải khác nhau

- Lũy tiến độ cong mở [6]

20

Thuật toán MCC có hai tham số là s (scale - biểu thị cho tỉ lệ) và t là ngưỡng

độ cong (curvature threshold), trong đó tham số tỉ lệ là hàm của tỉ lệ các đối tượng

trên mặt đất và khoảng lấy mẫu (khoảng cách sau) của dữ liệu LiDAR [9].

Thuật toán MCC được mô tả như sau:

Input: đám mây điểm LiDAR

Output: điểm sau phân loại với hai lớp mặt đất và không mặt đất

Initial: U0 đám mây điểm LiDAR

U = {P1, P2, …, Pn} – chứa các điểm chưa được phân loại

Pj(xj, yj, zj) – điểm LiDAR rời rạc

int l[1 … 3] – miền tỉ lệ

tl – độ cong cho miền tỉ lệ l – khởi tạo bởi người dùng

l – độ phân giải cho l

Procedure:

Phân loại những điểm có độ cao trong U0 và gán chúng vào lớp không

mặt đất

For l = 1 to 3

Repeat

Lặp tìm S = TPS(U, l, f)

Lặp tìm S’ = 3x3

For each Pj Î U

If zj > S’(xj, yj) + tli then

Phân Pj vào lớp không mặt đất

Loại Pj khỏi U

Untill điểm không thuộc U < 10% tổng số điểm

của nó

Phân lớp các điểm còn lại của U vào lớp mặt đất

End

21

2.1.2 Thuật toán K-Means

Thuật toán K-means là tìm phương pháp phân nhóm các đối tượng (objects)

đã cho vào K cụm (K là số các cụm được xác định trước, K > 0) sao cho tổng bình

phương khoảng cách giữa các đối tượng đến tâm nhóm là nhỏ nhất. Thuật toán K-

means được mô tả trên hình 2.1 và hình 2.2.

Hình 2. 1: Mô tả thuật toán K-Means

22

Hình 2. 2: Ví dụ phân loại với K-Means

Trong bài toán phân loại dữ liệu, thuật toán K-means được triển khai theo các bước:

Bước 1: Chọn K cụm trọng tâm khởi tạo, z1, z2, z3, …, zn, với 0 < K ≤ n

Bước 2: Phân phối mẫu trong K-means. Mẫu thường được gán với cụm trung tâm

gần nhất theo công thức: x Î Si(n) nếu |x – zi(n)| ≤ |x – zj(n)| với j = 1, 2, 3, …, k; i

≠ j; Si(n) là bộ mẫu của trọng tâm zi(n), trong đó n chỉ số bước lặp của bài toán.

Bước 3: Tính toán trọng tâm cụm mới từ mỗi cụm Si(n). Tìm giá trị mới cho mỗi zi.

Trọng tâm cụm mới, zi(n+1) sẽ là giá trị trung bình của các điểm trong Si(n) như:

zi(n+1) = (1/𝑐) ∑𝑥 𝜖𝑆𝑖(𝑛) 𝑥

Trong đó ci là tập điểm thuộc về cụm thứ i

Bước 4: So sánh zi(n) và zi(n+1) với mọi i.

Tính toán khoảng cách giữa mỗi cặp điểm trong mỗi lần lặp liên tiếp:

23

a. Nếu không có sự thay đổi đáng kể, kết thúc phương pháp, một vài tiêu chí cho kết

thúc như:

+ Nếu |zi(n+1) – zi(n)| < T với mọi i

+ N ế u ∑ 𝑘𝑗 = 1 | 𝑧 𝑖 ( 𝑛 + 1 ) − 𝑧 𝑖 ( 𝑛 ) | < 𝑇 với mọi i

b. Nếu không thì tiếp tục lặp các lần lặp tiếp theo từ bước 2.

Trong thuật toán K-means việc chọn được giá trị k sẽ có thể giúp tăng tốc được thuật

toán, tối ưu và cải tiến thuật toán tốt hơn. Có nhiều phương pháp để có thể lựa chọn

được giá trị k như sử dụng ý kiến của chuyên gia, thử mô hình với các giá trị của k

và từ đó chọn k tốt nhất hay sử dụng kỹ thuật CV (Cross - Validation), ….

2.2. Đánh giá kết quả phân loại LiDAR

2.2.1 Thuật toán MCC

Trên thế giới, các nghiên cứu được công bố về MCC trong phân loại dữ liệu

LiDAR tương đối hạn chế, trong đó nổi bật nhất là nghiên cứu của tác giả Jeffrey

S.Evans và Andrew T.Hudak sử dụng phương pháp MCC trong phân loại tín hiệu

phản hồi LiDAR trong môi trường rừng. Thuật toán MCC được các tác giả giới thiệu

sử dụng phép lặp TPS để loại bỏ những điểm không thuộc nhóm mặt đất để từ đó có

thể thành lập được DEM của khu vực khảo sát. TPS là phép lặp cho phép đánh giá

trạng thái giữa các điểm, tuân thủ các dữ liệu đầu vào và kiểm soát khoảng cách các

điểm mẫu ảnh hưởng đến bề mặt ước lượng [6].

Triển khai thuật toán MCC các tác giả định nghĩa một vevtor Z(s) chứa giá trị

tọa độ của tất cả các điểm LiDAR. Vector này sẽ được sử dụng trong phép lặp bề mặt

raster sử dụng phép lặp TPS với độ phân giải theo tỉ lệ l. Một lõi lọc có kích thước

3x3 duyệt qua tất cả các phép lọc để tìm một vector mới x(s). Miền tỉ lệ l là mô hình

lặp được thiết lập với tham số của mô hình chạy đến khi hội tụ. l và t sẽ được định

nghĩa bởi người dùng [6].

24

Dung sai độ cong t sẽ được thêm vào x(s), và các điểm sẽ được phân lớp vào

lớp không mặt đất bằng việc sử dụng điều kiện

If Z(s) > c then phân lớp không mặt đất

Trong đó c là độ cong của miền tỉ lệ l.

Tiến trình phân loại sử dụng MCC được các tác giả sử dụng thể hiện trong sơ

đồ khối sau:

Hình 2. 3: Sơ đồ khối của giải thuật MCC trong phân lớp dữ liệu LiDAR

Để đánh giá thuật toán, các tác giả đã sử dụng bộ dữ liệu thu được từ phía Bắc

của Idaho. Đây là khu vực rừng phức tạp với diện tích 88ha, với các loại rừng khác

nhau như rừng trồng, rừng tư nhân, ….

25

Hình 2. 4: Khu vực thực nghiệm trong nghiên cứu

Thuật toán MCC khi áp dụng vào phân loại tín hiệu phản hồi LiDAR được

thực hiện một cách tự động, kết quả tín hiệu phản hồi LiDAR được phân thành hai

loại mặt đất và không mặt đất. Lỗi khi phân loại điểm mặt đất được đánh giá qua 204

điểm trong đó có 165 điểm GPS, 39 điểm của NOAA, và sử dụng sai số trung bình

để đánh giá số điểm bị mất trong quá trình phân loại. Công thức tính toán sai số trung

bình được thể hiện [6]:

𝑅𝑀𝑆𝐸 = 0∑ (345678):;8<=

>6? (1)

Với các tham số được lựa chọn lần lượt là l = 1.5, t = 0.3, với ba miền tỉ lệ để

phân loại điểm, kết quả được các tác giả thực nghiệm:

Hình 2. 5: Tỉ lệ các điểm thuộc hai lớp sau phân loại

Trong đó, sai số trung bình RMSE với hai khu vực thực nghiệm là 0.306 và

0.166. Kết quả chỉ ra rằng, MCC giúp cực tiểu sai số, trong khi vẫn còn tồn tại tỉ lệ

cao của điểm mặt đất và độ tin cậy cao của các điểm được cung cấp.

26

Trong khi đó nhóm tác giả Wade T.Tinkham và Hongyu Huang đã có nghiên

cứu so sánh về mức độ hiệu quả của hai thuật toán MCC và BCAL (Boise Center

Aerospace Laboratory LiDAR) trong phân loại dữ liệu LiDAR để thành lập DTM.

Độ chính xác của hai thuật toán được đánh giá qua hơn 7000 điểm đo có độ chính

xác cao với 6 kiểu dữ liệu khác nhau. Khu vực nghiên cứu được tác giả sử dụng trong

quá trình đánh giá là lưu vực RME, là một phần của Reynold. Khi đánh giá hiệu suất

tổng thể của MCC và BCAL với mỗi độ phân giải khác nhau sẽ cho ngưỡng sai số là

khác nhau. Tại độ phân giải là 1m, trị số ANOVA cho thấy không có sự khác biệt

đáng kể giữa MCC và BCAL. Tại độ phân giải 0,5m, với các loại độ phủ khác nhau

BCAL trội hơn hẳn MCC. Sau đó các tác giả tiến hành so sánh tạo DTM của hai thuật

toán là không khác biệt. Nhưng khi kết hợp hai thuật toán MCC và BCAL thì việc

tạo DTM có độ chính xác cao hơn. Sau quá trình thử nghiệm, các tác giả chỉ ra rằng

thuật toán BCAL thích hợp với khu vực có mật độ điểm dày đặc, thảm thực vật liên

tục. Ở những nơi có độ dốc thay đổi liên tục MCC sẽ có độ chính xác cao hơn [10].

Với thuật toán MCC được các tác giả giới thiệu trong nghiên cứu sử dụng phép

lặp TPS trong phân chia các tín hiệu phản xạ LiDAR. Tác giả đã chỉ ra rằng, thuật

toán MCC hoạt động tốt nhất ở tỉ lệ 1.0 và giá trị độ cong 0.05.

2.2.2 Thuật toán K-Means

Mỗi điểm LiDAR trong quá trình phân loại được gán vào một lớp được định

nghĩa trong quá trình phân loại. Các điểm này có thể được phân vào một số lớp như:

đất trống, thực vật cao, thực vật thấp, và nước .... Thông thường, các mã phân loại đại

diện cho kiểu đối tượng được thu nhận trong tín hiệu phản hồi. Phân loại đám mây

điểm là bước quan trọng trong quá trình trích xuất thông tin của các lớp như tòa nhà,

thực vật, giao thông và mặt nước. Thuật toán phân loại sử dụng K-means sẽ lựa chọn

các điểm mẫu trong mẫu ngẫu nhiên từ toàn bộ đám mây điểm. Phương pháp phân

loại được thể hiện qua sơ đồ hình 2.6 và hình 2.7.

27

Hình 2. 6: Pseudo code của thuật toán K-means trong phân loại đám mây điểm LiDAR

Hình 2. 7: Sơ đồ phân loại đám mây điểm LiDAR với K-means

Để có thể đánh giá được khả năng phân loại đám mây điểm LiDAR của hai

thuật toán K-means, nhóm tác giả đã thử nghiệm phân loại với bộ dữ liệu được đo tại

28

Nghệ An, với 485 điểm thử nghiệm, mỗi điểm được thể hiện với 3 thuộc tính (x, y,

z), trong đó thuộc tính được sử dụng để phân loại là Z (giá trị độ cao của điểm). Hai

thuật toán được chạy với phần mềm SPSS 20 của IBM.

Với thuật toán K-means, việc lựa chọn số lượng cụm thích hợp cho một bộ dữ liệu

nhất định trong thuật toán K-Means sẽ quyết định đến cụm trong quá trình phân cụm.

Đây là một quá trình khó khăn vì kết quả của quá trình phân cụm do người sử dụng

quyết định. Sự lựa chọn chính xác K thường không rõ ràng, do sự phân bố và quy mô

của các điểm trong bộ dữ liệu và độ phân giải của người dùng. Để có thể tìm được K

phù hợp với bộ dữ liệu, thông thường người dùng sẽ chạy thuật toán K-Means với

các giá trị K khác nhau và so sánh kết quả để lựa chọn được K phù hợp. Để thử

nghiệm với bộ dữ liệu, tác giả đưa ra hai giá trị K để tiến hành phân loại là K = 5 và

K = 7.

Với lựa chọn k = 5, kết quả phân loại được thể hiện như sau:

Hình 2. 8: Kết quả phân loại với k=5

Với k = 5, qua 10 lần lặp thuật toán đã phân chia được 332 điểm vào 5 cụm, có

153 giá trị lỗi (điểm không được phân về cụm nào). Với trọng tâm của 5 cụm được

khởi tạo như trong bảng số cụm khởi tạo (hình 2.5), với 10 lần lặp, trọng tâm của 5

cụm được tính toán lại như trong bảng số lần lặp của thuật toán. Kết quả trong tổng

số 332 điểm có 2 điểm thuộc về cụm 1, 2 điểm cụm 2, 208 điểm cụm 3, 110 điểm

cụm 4 và 10 điểm cụm 5.

Với k = 7, kết quả phân loại được thể hiện như sau:

29

2.9a: Tâm khởi tạo của các cụm

2.9b: Lịch sử lặp của thuật toán

2.9c: Tâm mới của cụm 2.9d: Số lượng điểm được phân vào mỗi

nhóm sau phân loại

Hình 2. 9: Kết quả phân loại với k=7

Khi tăng số cụm lên là 7, giá trị điểm không được gán vào cụm nào không thay

đổi là 153 điểm, trọng tâm của cụm được lựa chọn như trong hình 7.a, qua số lần lặp

là 10, trọng tâm của cụm được tính toán lại như trong hình 7.c. Kết quả có 12 điểm

được gán vào cụm 1, 8 điểm được gán vào cụm 2, 179 điểm cụm 3, 99 điểm cụm 4,

2 điểm cụm 5, 30 điểm cụm 6 và 2 điểm cụm 7.

30

Sau khi thử nghiệm với bộ dữ liệu trên hai thuật toán K-means, nhận thấy đây

là thuật toán phân loại dựa hoàn toàn vào khoảng cách. Các điểm được gán vào cụm

(lớp) phụ thuộc vào khoảng cách của nó tới tâm cụm (với K-means).

Thuật toán K-means có sự thay đổi rõ ràng nhất về sự thay đổi của phân bố

các điểm trong cụm và trọng tâm được tính toán trong mỗi cụm khi có sự thay đổi

của số cụm khởi tạo.

Tuy nhiên, với cả 2 giá trị k số lượng điểm lỗi chiếm tỉ lệ khá lớn 153/485

điểm (31.5%). Do vậy, K-means là thuật toán có độ chính xác phụ thuộc vào quá trình

tính toán trọng tâm của cụm qua mỗi lần lặp.

2.3. Kết chương

Từ các nghiên cứu của các nhóm tác giả trên thế giới về thuật toán MCC và

K-Means trong phân loại dữ liệu LiDAR có thể thấy rằng:

Với thuật toán MCC:

- Dữ liệu LiDAR xác định nhãn cho các đối tượng điểm với thuật toán MCC chỉ

dừng lại ở phân thành hai lớp mặt đất và không mặt đất.

- Ứng dụng của dữ liệu sau phân loại chỉ thành lập DTM hoặc DEM.

- Khu vực thử nghiệm trong nghiên cứu chủ yếu là rừng hoặc khu vực có mật độ

thực vật cao.

- Độ chính xác sau phân loại mới chỉ sử dụng sai số RMSE để đánh giá.

Với thuật toán K-Means:

- Sử dụng thuật toán K-means có ưu điểm là giải thuật dễ hiểu và dễ cài đặt.

- Khi số cụm tăng dần, giá trị missing của thuật toán không thay đổi, vì thế thuật

toán K-means hoàn toàn phù hợp với bài toán phân cụm dữ liệu đám mây điểm

LiDAR.

- Một số hạn chế của K-Means là hiệu quả của thuật toán phụ thuộc vào việc

chọn số nhóm K (phải xác định trước) và chi phí cho thực hiện vòng lặp tính

toán khoảng cách lớn khi số cụm K và dữ liệu phân cụm lớn.

31

Với các tài liệu trong nước và ngoài về phương pháp và thuật toán được sử dụng

trong quá trình phân loại điểm LiDAR, học viên nhận thấy:

Bộ dữ liệu sau khi phân loại hầu hết chỉ lưu giữ thông tin của các lớp mặt đất,

cây cối, nhà cao tầng, giao thông, … trong khi dữ liệu phản xạ về khu vực quét từ

LiDAR là tương đối phong phú do đặc tính không bị hấp thụ bởi địa vật của LiDAR.

32

CHƯƠNG 3:

XÂY DỰNG ỨNG DỤNG THỰC NGHIỆM

3.1 Giới thiệu bài toán thử nghiệm

Dữ liệu điểm có giá trị tọa độ ba chiều (x, y, z) được tạo bởi công nghệ LiDAR

thường có mật độ dày đặc và chứa những thông tin cực kỳ hữu ích về bề mặt địa hình

của khu vực đo vẽ. Nhưng để xác định được nhãn lớp mà mỗi điểm thuộc về lại khá

khó khăn khi một đối tượng có nhiều điểm trả về. Để làm được công việc này, cần

phải tiến hành bài toán phân loại đám mây điểm để có thể sử dụng những điểm có giá

trị trong đám mây điểm LiDAR.

Bài toán phân loại đám mây điểm LiDAR thuộc vào bài toán lọc và phân tách

đưa các điểm về các lớp riêng biệt. Việc phân loại dữ liệu tự động của đám mây điểm

phải tách được đám mây dữ liệu thành các lớp khác nhau theo các tính chất riêng như:

Lớp chứa điểm mặt đất, Lớp chứa điểm thực phủ, Lớp chứa điểm trên mái nhà tường

nhà và các công trình xây dựng, Lớp chứa các điểm trên không, Lớp chứa các điểm

bị lỗi, Lớp chứa các điểm trên mặt nước …. Từ đó xây dựng ra lớp Ground và Non-

Ground.

Bài toán thực nghiệm của luận văn tập trung vào ứng dụng hai thuật toán MCC

và K-means trong phân loại đám mây điểm LiDAR, từ đó đánh giá độ chính xác của

hai thuật toán trên bộ dữ liệu thử nghiệm.

3.2 Lựa chọn thuật toán phân loại và dữ liệu thử nghiệm

Trong bài toán phân loại, lựa chọn thuật toán là quan trọng và quyết định đến

độ chính xác của bài toán phân loại. Hai thuật toán được lựa chọn trong luận văn là

MCC và K-means.

Bộ dữ liệu thử nghiệm được thu nhận tại khu vực quận Marlborough, New

Zealand và được download tại trang web www.opentopo.sdsc.edu. Thời gian đo vẽ

từ 2/2014 – 3/2014. Công nghệ LiDAR sử dụng là ALS (Aerial Scanning Laser), trên

một khu vực rộng 404,72 km2, với góc quét là 200, tần số của gương quét là 40Hz,

33

mật độ xung phản hồi là 1.4pls/m2, mật độ điểm là 2,69pt/m2. Dữ liệu sau khi thu

nhận được lưu dưới dạng file .las với chuẩn 1.2. Các tham số của dữ liệu được thể

hiện trong bảng 3.1.

Bảng 3.2 Thông số của file las STT Thuộc tính Giá trị

1 Cường độ (min, max) 0, 4538

2 Màu R, G, B 0, 0, 0

3 Thứ tự của góc quét (min, max) -32, 31

4 Số lượng tia phản xạ (min, max) 0, 4

5 Tọa độ điểm x, y, z

6 Góc bay (min, max) 0, 1

Đám mây điểm LiDAR được thể hiện trong hình vẽ 3.1 và ảnh vệ tinh khu vực

khảo sát được thể hiện trong hình 3.2.

Hình 3. 1: Đám mây điểm khu vực khảo sát

34

Hình 3. 2: Ảnh vệ tinh của khu vực đo vẽ

3.3 Môi trường và các công cụ sử dụng để xây dựng chương trình

Chương trình được xây dựng trên ngôn ngữ C# của bộ Visual Studio 2015 và

được tích hợp với công cụ LASTools.

C# là một ngôn ngữ lập trình hướng đối tượng được phát triển bởi Microsoft,

là phần khởi đầu cho kế hoạch .NET của họ. Tên của ngôn ngữ bao gồm ký tự thăng

theo Microsoft nhưng theo ECMA là C#, chỉ bao gồm dấu số thường. Microsoft phát

triển C# dựa trên C++ và Java. C# được miêu tả là ngôn ngữ có được sự cân bằng

giữa C++, Visual Basic, Delphi và Java.

LASTools là một tập hợp các công cụ dòng lệnh để phân loại, xếp, chuyển đổi,

lọc, raster, tam giác, đường viền, clip và đa giác dữ liệu LiDAR (để chỉ một vài chức

năng). Tất cả các công cụ cũng có thể được chạy qua GUI và có sẵn dưới dạng hộp

công cụ xử lý LiDAR cho các phiên bản ArcGIS 9.3, 10.0 và 10.1 của ESRI.

Quản lý dự án đầy đủ bao gồm các công cụ:

- Mã hóa dữ liệu địa lý và chuyển đổi

- Theo dõi liên kết

- Lọc và phân loại nâng cao

- Tạo DSM / DTM

35

- Phát hiện đột phá và tính năng

- Nhiều định dạng đầu vào và đầu ra (bao gồm cả định dạng LAS)

- Thế hệ chỉnh hình thực sự

- Tích hợp đầy đủ dữ liệu Dạng sóng của Lidar

- Và trình xem và trình chỉnh sửa rất linh hoạt để hiển thị và thao tác dữ liệu

hình ảnh và dữ liệu hình ảnh.

LasTools cung cấp các công cụ cần thiết để tạo DSM và DTM từ dữ liệu khai

thác thô hoặc cơ bản được xử lý trước một cách độc lập ứng dụng. Nó có tính năng

quản lý thông minh dữ liệu dự án, nhập và mã hóa địa lý dữ liệu hình ảnh và dữ liệu

thô, hiệu chuẩn hệ thống, lọc và phân loại dữ liệu LiDAR, tạo mô hình độ cao và xuất

kết quả theo các định dạng phổ biến khác nhau. Sự nhấn mạnh đặc biệt được đặt vào

giao diện người dùng đồ họa trực quan và quy trình làm việc hợp lý để cho phép tạo

mô hình nhanh chóng và hiệu quả. Ngoài ra, LasTools cung cấp các tính năng để xử

lý và xử lý dữ liệu khai thác tiên tiến như dạng sóng tín hiệu trở lại và màu sắc bề mặt

thật, cũng như sự tích hợp nhanh chóng của dữ liệu LiDAR và ảnh kỹ thuật số vào

ảnh ortho.

LASTool có các công cụ sau:

- API để đọc/ghi file LAS

- lasinfo

- lasview

- las2txt và txt2las

- laszip

- las2las

36

Hình 3. 3: Giao diện GUI của lastool

Hình 3. 4: Công cụ của LASTool trong ARCGIS

37

3.4 Phát triển chương trình

Chương trình sau khi được xây dựng với ngôn ngữ C# và công cụ LASTool

có giao diện như sau:

Hình 3. 5: Giao diện chương trình

Các chức năng chính của chương trình gồm có:

a) Xem file las

Hình 3. 6: Đám mây điểm LiDAR được hiển thị dưới dạng 3D

b) Phân loại với MCC

38

Hình 3. 7: Phân loại với MCC

Hình 3. 8: Các điểm được gán nhãn sau phân loại với MCC

c) Phân loại với K-means

39

Hình 3. 9 Kết quả phân loại với K-means

3.5 Đánh giá kết quả thu được

Sau khi xây dựng chương trình tiến hành phân loại đám mây điểm với thuật

toán MCC và K-means.

3.5.1 Phân loại với MCC

Dữ liệu đầu vào của thuật toán MCC là bộ dữ liệu file .las lấy tại trang

www.opentopo.sdsc.edu như đã trình bày ở trên. Tham số đầu vào với ứng dụng là

toạ độ x,y,z trong bộ dữ liệu LiDAR.

Chương trình sẽ sử dụng thuật toán MCC trong việc khai thác toạ độ Z

để tiến hành gán nhãn cho các điểm trong đám mây điểm với hai nhóm mặt đất

và không mặt đất.

Do giá trị thuộc tính mật độ xung trên m2 là 1.4 nên theo công thức lựa chọn

tham số s của thuật toán MCC:

s = 1/(sprt(pulse/m2)) = 1/sprt(1.4) = 0.8

40

Trong khi đó, giá trị t lựa chọn theo đề xuất là 0.3.

Hình 3. 10: Tham số được lựa chọn trong giải thuật MCC

Qua 3 miền tỉ lệ với miền tỉ lệ đầu có giá trị 0.4, miền tỉ lệ thứ hai có giá trị

0.8 và miền tỉ lệ thứ 3 có giá trị 1.2. Trong đó, miền tỉ lệ đầu qua 7 lần lặp, thứ hai là

6 lần lặp và thứ 3 là 8 lần lặp có 184902 điểm trong tổng số 369750 điểm được gán

vào lớp mặt đất còn lại là lớp không mặt đất.

41

Hình 3. 11: Các điểm được gán nhãn sau phân loại với MCC

3.5.2 Phân loại đám mây điểm với K-means

Từ kết quả của thuật toán MCC, đám mây điểm đã được dán nhãn thành hai

loại điểm mặt đất nhãn 2 và không mặt đất có nhãn là 1.

Lấy các điểm có nhãn là 1 (không mặt đất) tiến hành phân cụm với thuật toán

K-Means.

Để phân loại với K-means lựa chọn số cụm k = 2, thuộc tính đươc sử dụng để

phân loại là độ cao z, kết quả phân loại được thể hiện trong hình 3.12.

42

Hình 3. 12: Kết quả phân loại với K-means

Sau phân loại, đám mây điểm được chia thành hai cụm, với giá trị tâm cụm

khởi tạo như sau:

- Cụm 0 có tâm khởi tạo là 18.72

- Cum 1 có tâm khởi tạo là 20.53

Qua 8 lần lặp tâm cụm mới được ghi nhận là:

- Cụm 0 có tâm là 17.69

- Cụm 1 có tâm là 20.6

Sau phân loại với K-means có 184811 điểm được gán vào cụm 0 trong tổng

số 369750 điểm.

3.5.3 Đánh giá

Với thuật toán MCC, qua 3 miền tỉ lệ với tổng số 21 lần lặp tỉ lệ phân loại

được thay đổi như sau:

43

% phân loại SD1 28% 14% 6.80% 3.60% 2.10% 1.50% 0.91% SD2 2.50% 1.10% 0.61% 0.530% 0.13% 0.03%

SD3 0.82000

0% 0.37000

0% 0.10000

0% 0.18000

0% 0.03700

0% 0.01300

0% 0.00380

0%

Hình 3. 13: Tỉ lệ phân loại trong mỗi miền tỉ lệ với MCC

Với thuật toán K-means, các lần lặp được thể hiện trong hình 3.14

Hình 3. 14: Lịch sử lặp của K-means

44

Bảng 3.3: Số lượng điểm của mỗi cụm

Number of Cases in each Cluster

Cluster 0 184811.000

1 184900.000

Valid 369750.000 Missing 39.000

Số lượng điểm được chia về cụm được thể hiện trong bảng 3.2, có thể thấy với

K-means có 69 trong tổng số 369750 điểm lỗi (điểm không thuộc về cụm nào).

Để đánh giá được độ chính xác của hai thuật toán sau phân loại, tác giả đã so

sánh kết quả với giải thuật được sử dụng trên trang Opentopo để tính toán độ đo cho

giải thuật MCC và K-means. Kết quả được thể hiện trong bảng 3.3.

Bảng 4.3:Các độ đo đánh giá độ chính xác phân loại

STT Thuật

toán

Số lần

lặp

Độ

chính

xác

Độ bao

phủ

Thời gian

chạy

F1

1 MCC 21 99.8% 99.9% 110s 99.85%

2 K-means 8 96% 92% 104s 93.96%

3 Opentopo 12 99.9% 99.9% 122s 99.9%

Qua đó có thể thấy, thuật toán MCC và K-means có thể đáp ứng được yêu cầu

của bài toán phân loại đám mây điểm LiDAR, phù hợp với mục tiêu và yêu cầu đặt

ra.

Dữ liệu sau phân loại có thể được sử dụng để thành lập DEM/DSM như trong

hình 3.15 và 3.16.

45

Hình 3. 15: Mô hình DEM của khu vực

Hình 3. 16: Mô hình DSM

46

KẾT LUẬN

Hiện nay, ở Việt Nam công nghệ LiDAR được ứng dụng rộng rãi trong nhiều

lĩnh vực như: Trắc địa bản đồ, trong kỹ thuật môi trường, vật lý, khảo cổ học, …. Tuy

nhiên, những việc áp dụng này chỉ dừng lại ở việc ứng dụng công nghệ LiDAR xây

dựng bản đồ địa hình, lập bản đồ ngập úng, dự báo trượt lở, lập bản đồ giao thông,

tạo mô hình DTM, DSM, lập bản đồ các tuyến truyền tải dài, …. Việc đi sâu nghiên

cứu giải quyết các bài toán phân loại điểm nhằm mở rộng khả năng ứng dụng của

công nghệ LiDAR hiện nay vẫn chưa có sản phẩm nào được công bố tại Việt Nam.

Do đó, đề tài nghiên cứu góp phần làm rõ hiệu quả, độ chính xác khi sử dụng một số

thuật toán trong việc giải quyết bài toán phân loại đám mây điểm đồng thời là cơ sở

để mở rộng các ứng dụng khai thác dữ liệu LiDAR.

47

LIỆU THAM KHẢO

TRONG NƯỚC

[1]. TS. Lương Chính Kế, “Thành lập DEM/DTM/DSM bằng công nghệ LiDAR”,

2005.

[2]. TS. Trần Đình Luật, Th.S Nguyễn Thị Kim Dung, Th.S Lưu Thị Thu Thủy, Th.S

Trần Hồng Hạnh, “Khả năng ứng dụng công nghệ LiDAR xây dựng mô hình số địa

hình vùng bãi bồi cửa sông ven biển trong điều kiện Việt Nam”, Tạp chí Tài nguyên

và Môi trường, vol.1, pp. 24-28, 2015.

[3]. Trần Đình Trí, “Công nghệ LiDAR”, Bài giảng dành cho cao học, Trường Đại

học Mỏ - Địa chất, 2013.

NƯỚC NGOÀI.

[4]. J.Niemeyer, C.Mallet, F.Rottensteiner, U.Sorgel, "CRF for the classification of

LiDAR point cloud," Remote Sensing, 2011.

[5]. J. Kunapo, "Spatial data integration for classification of 3D point cloud from

digital photogrammetry," Applied GIS, Monash University Express, vol. 3, no. 3, pp.

26.1-26.15, 2005.

[6]. Jeffrey S.Evans, Andrew T.Hudak, "A multiscale curvature algorithm for

classifying discrete return LiDAR in forested environments," IEEE, vol. 45, pp. 1029-

1038, 2007.

[7]. N.El-Ashmawy, A.Shaker, "Raster vs Point cloud LiDAR data classification,"

The International Archives of the Photogrammetry, RS and Spatial Information

Sciences, Vols. XL-7, pp. 79-83, 2014.

[8]. N.Yastikli, Z.Cetin, "Classification of LiDAR data with point based

classification methods," vol. 3, 2015.

[9]. S. forge, "SourceForge," [Online].

Available: http://sourceforge.net/projects/mcclidar.

[10]. Wade T.Tinkham, Hongyu Huang, "A comparision of two open source LiDAR

surface classification algorithm," Remote Sensing, vol. 3, pp. 638-649, 2011.

BẢN CAM ĐOANlib.uet.vnu.edu.vn/bitstream/123456789/1071/1/[Nguyễn...i BẢN CAM ĐOAN Tôi xin...

Documents

Transcript of BẢN CAM ĐOANlib.uet.vnu.edu.vn/bitstream/123456789/1071/1/[Nguyễn...i BẢN CAM ĐOAN Tôi xin...