BẢN CAM ĐOANlib.uet.vnu.edu.vn/bitstream/123456789/1071/1/[Nguyễn...i BẢN CAM ĐOAN Tôi xin...
Transcript of BẢN CAM ĐOANlib.uet.vnu.edu.vn/bitstream/123456789/1071/1/[Nguyễn...i BẢN CAM ĐOAN Tôi xin...
i
BẢN CAM ĐOAN
Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng cá nhân tôi, kết quả
của luận văn hoàn toàn là kết quả của tự bản thân tôi tìm hiểu, nghiên cứu dưới sự hướng
dẫn của giáo viên hướng dẫn PGS.TS. Đặng Văn Đức.
Tôi hoàn toàn chịu trách nhiệm về tính pháp lý quá trình nghiên cứu khoa học
của luận văn này.
Hà Nội, ngày 10 tháng 11 năm 2019
Học viên
Nguyễn Thị Thanh Huyền
ii
LỜI CẢM ƠN
Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS .TS Đặng Văn Đức người
đã tận tình hướng dẫn, chỉ bảo, giúp đỡ em trong suốt quá trình làm luận văn.
Em cũng xin gửi lời cảm ơn đến các thầy cô giáo trường Đại học Công nghệ
thông tin - Đại học Quốc Gia Hà Nội đã truyền đạt những kiến thức và giúp đỡ em
trong suốt quá trình học của mình.
Học viên cũng xin gửi lời cảm ơn tới Ban giám hiệu trường Cao đẳng nghề Hòa
Bình đã tạo điều kiện thuận lợi cho học viên tham gia khóa học và quá trình hoàn
thành luận văn.
Và học viên cũng xin gửi lời cảm ơn tới các đồng nghiệp, gia đình và bạn bè
những người đã ủng hộ, động viên tạo mọi điều kiện giúp đỡ để học viên có được kết
quả như ngày hôm nay.
iii
MỤC LỤC
MỞ ĐẦU ................................................................................................................... 1
1. Đặt vấn đề ........................................................................................................ 1
2. Những nội dung nghiên cứu chính .................................................................. 3
CHƯƠNG 1: ............................................................................................................. 4
GIỚI THIỆU VỀ CÔNG NGHỆ LIDAR VÀ CÁC ỨNG DỤNG ............................. 4
1.1 Tổng quan về công nghệ LiDAR ................................................................... 4
1.1.1 Cấu trúc hệ thống LiDAR ......................................................................... 4
1.1.2 Đặc điểm cơ bản của công nghệ LiDAR ................................................... 5
1.2. Khả năng ứng dụng của LiDAR .................................................................. 7
1.3. Bài toán phân loại dữ liệu LiDAR.............................................................. 13
1.3.2 Cơ bản về tệp tin .LAS ............................................................................ 14
1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS ................................ 16
1.4 Kết chương: ................................................................................................. 18
CHƯƠNG 2: ........................................................................................................... 19
MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR .......................................... 19
2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale Curvature
Classification) và K-Means trong phân loại dữ liệu LiDAR............................ 19
2.1.1 Thuật toán MCC (Multiscale Curvature Classification) .......................... 19
2.1.2 Thuật toán K-Means ............................................................................... 21
2.2. Đánh giá kết quả phân loại LiDAR ............................................................ 23
2.2.1 Thuật toán MCC ..................................................................................... 23
2.2.2 Thuật toán K-Means ............................................................................... 26
iv
2.3. Kết chương .................................................................................................. 30
CHƯƠNG 3: ........................................................................................................... 32
XÂY DỰNG ỨNG DỤNG THỰC NGHIỆM.......................................................... 32
3.1 Giới thiệu bài toán thử nghiệm ................................................................... 32
3.2 Lựa chọn thuật toán phân loại và dữ liệu thử nghiệm ............................... 32
3.3 Môi trường và các công cụ sử dụng để xây dựng chương trình ................ 34
3.4 Phát triển chương trình ............................................................................... 37
3.5 Đánh giá kết quả thu được .......................................................................... 39
3.5.1 Phân loại với MCC ................................................................................. 39
3.5.2 Phân loại đám mây điểm với K-means .................................................... 41
3.5.3 Đánh giá ................................................................................................. 42
KẾT LUẬN ............................................................................................................. 46
LIỆU THAM KHẢO ............................................................................................... 47
v
DANH MỤC CHỮ VIẾT TẮT
LiDAR: Light Detection And Ranging
Laser: Light amplification by stimulated emission of radiation
GNSS: Global Navigation Sattelite System
ASPRS: American Society for Photogrammetry and Remote Sensing
INS: Inertial Navigation System
DEM: Digital Elevation Model
DTM: Digital Terrain Model
DSM: Digital Surface Model
MCC: Multiscale Curvature Classification
BCAL: Boise Center Aerospace Laboratory LiDAR
vi
DANH MỤC BẢNG BIỂU
Bảng 1. Thuộc tính của dữ liệu LiDAR .......................................................... 13
Bảng 3.1 Thông số của file las ....................................................................... 33
Bảng 3.2: Số lượng điểm của mỗi cụm ........................................................... 44
Bảng 3.3:Các độ đo đánh giá độ chính xác phân loại...................................... 44
vii
DANH MỤC HÌNH ẢNH
Hình 1. 1: Tổng quan về hệ thống LiDAR ........................................................ 5
Hình 1. 2: Ứng dụng LiDAR trong khảo sát địa hình và lập bản đồ ................. 8
Hình 1. 3: Ứng dụng LiDAR trong lâm nghiệp ................................................ 8
Hình 1. 4: Ứng dụng LiDAR trong lập bản đồ ngập úng .................................. 9
Hình 1. 5: Ứng dụng LiDAR cho đới duyên hải ............................................... 9
Hình 1. 6:Ứng dụng LiDAR trong lập bản đồ địa hình ven biển ..................... 10
Hình 1. 7: Ứng dụng LiDAR trong quan trắc dự báo trượt lở ......................... 10
Hình 1. 8: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải ...................... 11
Hình 1. 9: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải ...................... 11
Hình 1. 10: Ứng dụng LiDAR trong quy hoạch và quản lý mạng điện thoại di
động ............................................................................................................... 12
Hình 1. 11: Ứng dụng LiDAR trong lập mô hình đô thị và mô phỏng đô thị .. 12
Hình 1. 12: Hiển thị dữ liệu trong tệp tin LAS ............................................... 15
Hình 1. 13: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D ...... 17
Hình 1. 14: Quy trình phân loại đám mây điểm LiDAR ................................. 18
Hình 2. 1: Mô tả thuật toán K-Means ............................................................. 21
Hình 2. 2: Ví dụ phân loại với K-Means ......................................................... 22
Hình 2. 3: Sơ đồ khối của giải thuật MCC trong phân lớp dữ liệu LiDAR ..... 24
Hình 2. 4: Khu vực thực nghiệm trong nghiên cứu ......................................... 25
Hình 2. 5: Tỉ lệ các điểm thuộc hai lớp sau phân loại ..................................... 25
Hình 2. 6: Pseudo code của thuật toán K-means trong phân loại đám mây điểm
LiDAR ........................................................................................................... 27
Hình 2. 7: Sơ đồ phân loại đám mây điểm LiDAR với K-means .................... 27
Hình 2. 8: Kết quả phân loại với k=5.............................................................. 28
viii
Hình 2. 9: Kết quả phân loại với k=7.............................................................. 29
Hình 3. 1: Đám mây điểm khu vực khảo sát ................................................... 33
Hình 3. 2: Ảnh vệ tinh của khu vực đo vẽ ...................................................... 34
Hình 3. 3: Giao diện GUI của lastool ............................................................. 36
Hình 3. 4: Công cụ của LASTool trong ARCGIS ........................................... 36
Hình 3. 5: Giao diện chương trình .................................................................. 37
Hình 3. 6: Đám mây điểm LiDAR được hiển thị dưới dạng 3D ..................... 37
Hình 3. 7: Phân loại với MCC ........................................................................ 38
Hình 3. 8: Các điểm được gán nhãn sau phân loại với MCC .......................... 38
Hình 3. 9 Kết quả phân loại với K-means ....................................................... 39
Hình 3. 10: Tham số được lựa chọn trong giải thuật MCC ............................. 40
Hình 3. 11: Các điểm được gán nhãn sau phân loại với MCC ........................ 41
Hình 3. 12: Kết quả phân loại với K-means .................................................... 42
Hình 3. 13: Tỉ lệ phân loại trong mỗi miền tỉ lệ với MCC .............................. 43
Hình 3. 14: Lịch sử lặp của K-means ............................................................. 43
Hình 3. 15: Mô hình DEM của khu vực ......................................................... 45
Hình 3. 16: Mô hình DSM.............................................................................. 45
1
MỞ ĐẦU
1. Đặt vấn đề
Từ những năm đầu của thập niên 60 của thế kỷ 20, sự ra đời của bộ khuếch đại
ánh sáng bằng phát xạ kích thích – laser đã mở rất nhiều ứng dụng mới, trong đó phải
kể đến kỹ thuật khảo sát từ xa sử dụng nguồn kích thích bằng tia laser gọi là LiDAR
(Light Detection And Ranging). Hệ thống LiDAR là một hệ thống tích hợp từ 3 thành
phần chính: Hệ thống thiết bị Laser (Light amplification by stimulated emission of
radiation), hệ thống định vị vệ tinh GNSS (Global Navigation Sattelite System) và hệ
thống đạo hàng quán tính INS (Inertial Navigation System). Tổ hợp các thiết bị này
trong mối quan hệ hữu cơ, tác động chi phối lẫn nhau, tạo nên hệ thống LiDAR.
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian
GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được phát hướng
xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất hay từ
các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được thời
gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối tượng.
Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định vị trí
không gian của điểm phát, và hệ thống đạo hàng quán tính sẽ xác định các góc định
hướng trong không gian của tia quét. Với các giá trị đo tổng hợp đó tính được vị trí
(tọa độ không gian) của các điểm trên bề mặt đất.
Công nghệ LiDAR là một công nghệ tiên tiến hàng đầu trong hệ thống các công
nghệ thu thập dữ liệu không gian trên thế giới. Với khả năng trực tiếp thu nhận đám
mây điểm 3D với độ chính xác cao, LiDAR được áp dụng rộng rãi trong việc thành
lập mô hình số độ cao (Digital Elevation Model - DEM) của bề mặt địa hình, dựa vào
đó có thể theo dõi được dòng chảy của nước hay giám sát di chuyển khối, thành lập
bản đồ và viễn thám. Công nghệ LiDAR là sự phát triển và ứng dụng các thiết bị
laser, định vị vệ tinh và đo quán tính để thu thập dữ liệu địa lý trên bề mặt trái đất. So
sánh với các phương pháp thu nhận và xử lý trắc địa ảnh truyền thống, xử lý dữ liệu
2
LiDAR dễ dàng hơn, thành lập chính xác mô hình DEM. Hơn thế nữa, xung laser có
thể xuyên qua các địa hình, địa vật như lá, mặt đất dưới tán cây.
Để thành lập ra được DEM từ tập hợp điểm này, ta phải phân biệt được điểm
mặt đất và điểm không mặt đất. Quá trình này gọi là phân loại dữ liệu LiDAR. Việc
phân loại dữ liệu tự động của đám mây điểm được thực hiện bằng phép giải các bài
toán lọc điểm, trên cơ sở kết hợp sử dụng ảnh cường độ, kết quả đo vẽ các bãi kiểm
định chuẩn trên thực địa và ảnh số chụp được (nếu có trong công nghệ có lắp thêm
hệ thống máy chụp ảnh kỹ thuật số).
Bài toán phân loại đám mây điểm LiDAR thuộc vào bài toán lọc và phân tách
đưa các điểm về các lớp riêng biệt. Việc phân loại dữ liệu tự động của đám mây điểm
phải tách được đám mây dữ liệu thành các lớp khác nhau theo các tính chất riêng như:
Lớp chứa điểm mặt đất, Lớp chứa điểm thực phủ, Lớp chứa điểm trên mái nhà tường
nhà và các công trình xây dựng, Lớp chứa các điểm trên không, Lớp chứa các điểm
bị lỗi, Lớp chứa các điểm trên mặt nước …. Từ đó xây dựng ra lớp Ground và Non-
Ground. Trên thế giới có nhiều chương trình lọc điểm theo các thuật toán khác nhau
đã được giới thiệu và áp dụng. Trong số đó có Vosselman và Sithole (Hà Lan) có
thuật toán “mô hình góc nghiêng di động” hay mô hình “độ chênh cao cực đại”,
Axelsson đưa ra thuật toán “mô hình TIN di động “, Kraus (Áo) đưa ra thuật toán lọc
theo lý thuyết nội suy thống kê, hãng ToyEye (Thụy Điển), TopoSys (Đức) có chương
trình lọc đám mây điểm của LiDAR cung cấp kèm với hệ thống thiết bị… Hiện nay,
với các thuật toán lọc ngày càng hoàn thiện, công tác lọc điểm đã tự động hóa được
khoảng 90-95%, tuy nhiên để đánh giá, so sánh chất lượng giữa các thuật toán thì còn
nhiều vấn đề phải tranh luận và kiểm chứng trong thực tế sản xuất. Các phần mềm xử
lý dữ liệu LiDAR rất đắt được bán kèm theo thiết bị, hoàn toàn là phần mềm thương
mại đóng như ENVI LiDAR.
Với mục đích nghiên cứu, tìm hiểu các thuật toán hiện đang được sử dụng trong
việc phân loại dữ liệu LiDAR, đồng thời thử nghiệm các kỹ thuật phân loại dữ liệu
3
LiDAR trên những bộ dữ liệu cụ thể, học viên lựa chọn nội dung: “Nghiên cứu kỹ
thuật phân loại dữ liệu LiDAR” làm đề tài thực hiện khóa luận thạc sĩ của mình.
2. Những nội dung nghiên cứu chính
Ngoài phần mở đầu trình bày lý do chọn đề tài và phần kết luận trình bày các
kết quả đạt được của luận văn này, nội dung nghiên cứu chính được trình bày trong
ba chương như sau:
Chương 1: Trình bày khái quát về công nghệ LiDAR và các ứng dụng, phát
biểu bài toán phân loại dữ liệu LiDAR.
Chương 2: Trình bày phương pháp phân loại dữ liệu LiDAR với 2 thuật toán
MCC (Multiscale Curvature Classification) và thuật toán K-Means.
Chương 3: Xây dựng chương trình thử nghiệm phân loại dữ liệu LiDAR bao
gồm: Giới thiệu bài toán thử nghiệm, lựa chọn thuật toán phân loại và dữ liệu thử
nghiệm, môi trường và các công cụ sử dụng để xây dựng chương trình, phát triển
chương trình và đánh giá kết quả thu được.
4
CHƯƠNG 1:
GIỚI THIỆU VỀ CÔNG NGHỆ LIDAR VÀ CÁC ỨNG DỤNG
1.1 Tổng quan về công nghệ LiDAR
1.1.1 Cấu trúc hệ thống LiDAR
LiDAR, Light Detection And Ranging, là thuật ngữ để chỉ một công nghệ viễn
thám mới, chủ động, sử dụng các loại tia laser để khảo sát đối tượng từ xa. Dữ liệu
thu được của hệ thống là tập hợp đám mây điểm phản xạ 3 chiều của tia laser từ đối
tượng được khảo sát. Công nghệ này cũng mới được áp dụng tại Việt Nam, nó cho
phép đo đạc độ cao chi tiết địa hình một cách chính xác và nhanh chóng.
Hệ thống LiDAR bao gồm bộ đầu quyết (bộ cảm biến), hệ thống đo quán tính
(IMU), hệ thống GPS, hệ thống quản lý bay, hệ thống camera số và hệ thống các thiết
bị lưu trữ dữ liệu.
Bộ máy quét Laser (bộ cảm biến): Gồm hai bộ phận được gắn vào bên dưới máy
bay; một bộ phận có vai trò phát xung laser hẹp đến bề mặt trái đất trong khi máy bay
di chuyển với tốc độ nhất định. Một máy thu gắn trên máy bay sẽ thu nhận phản hồi
của những xung này khi chúng đập vào bề mặt trái đất và quay trở lại thiết bị thu trên
máy bay. Hầu hết các hệ thống LiDAR đều sử dụng gương quét để tạo ra một dải
xung. Sóng Laser nằm trong dải sóng cận hồng ngoại để phục vụ công tác đo đạc địa
hình, bề mặt trái đất, còn với laser dải sóng xanh lá cây phục vụ công tác đo sâu mặt
nước. Độ rộng của dải quét phụ thuộc vào góc dao động của gương, và mật độ điểm
mặt đất phụ thuộc vào các yếu tố như tốc độ máy bay và tốc độ gương. Tốc độ dao
động được xác định bằng cách tính toán tổng thời gian tia laser rời máy bay, đi đến
mặt đất và trở lại bộ cảm biến.
Hệ thống xác định quán tính IMU: Các giá trị góc xoay, góc nghiêng dọc, nghiêng
ngang, hướng bay quét của hệ thống LiDAR được xác định chính xác bằng thiết bị
đạo hàng, góc quay gương tức thời và các khoảng cách thu nhận và dữ liệu GPS được
dùng để tính toán toạ độ ba chiều của các điểm LiDAR.
5
Hệ thống GPS: Dữ liệu LiDAR được kết hợp với các thông tin vị trí chính xác
thu nhận từ thiết bị GPS và hệ thống thiết bị xác định các thông số định hướng góc
xoay, góc nghiêng dọc, nghiêng ngang cùng đặt trên máy bay. Các thông tin này được
lưu trữ và xử lý, để xác định giá trị toạ độ (x,y,z) chính xác của mỗi điểm trên mặt
đất. Hệ thống GPS gồm một máy thu đặt trên máy bay và một máy thu đặt tại mặt
đất, quá trình xử lý dữ liệu này cho ra kết quả vị trí điểm có độ chính xác cao (+/- vài
cm đến vài chục cm).
Hệ thống quản lý bay: Cho phép lập kế hoạch, thiết kế tuyến bay và theo dõi quá
trình bay quét LiDAR.
Hình 1. 1: Tổng quan về hệ thống LiDAR
1.1.2 Đặc điểm cơ bản của công nghệ LiDAR
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian
GPS/INS và sự nhận biết cường độ phản xạ ánh sáng [3]. Xung của laser được phát
hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất
hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được
thời gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối
tượng. Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định
6
vị trí không gian của điểm phát, và hệ thống đạo hàng quán tính sẽ xác định các góc
định hướng trong không gian của tia quét. Với các trị đo tổng hợp đó tính được vị trí
(tọa độ không gian) của các điểm trên bề mặt đất.
Công nghệ LiDAR có nhiều tính năng vượt trội so với các công nghệ đo đạc
truyền thống, nó có những đặc điểm cơ bản như:
- Độ chính xác xác định vị trí không gian của các đối tượng địa lý rất cao. Độ
chính xác độ cao < 20cm, độ chính xác mặt phẳng < 25cm.
- Thời gian thu thập và xử lý dữ liệu cực nhanh. Thời gian bay quét LiDAR với
khoảng 1000km2 là khoảng 25-30 giờ, thời gian xử lý tạo DEM với 1000km2
là khoảng 10 ngày.
- Không giống như các phương pháp đo ảnh hay đo đạc ngoài trời khác, công
nghệ LiDAR chủ yếu là tự động hóa, ít có sự can thiệp trực tiếp của con người.
Thành quả dữ liệu rất khách quan, mức độ tin cậy cao.
- Hệ thống LiDAR thu thập dữ liệu không phụ thuộc vào ánh sáng mặt trời, có
thể thực hiện cả ngày và đêm, điều kiện thời tiết không đòi hỏi khắt khe.
- Xung ánh sáng của hệ thống LiDAR có thể đi qua đối tượng vòm như tán cây,
mặt nước, mái che kính, tấm ni lông mỏng … và phản xạ tới 4 lần. Mỗi lần
phản xạ là một mức truyền khác nhau và ghi nhận một giá trị tọa độ (XYZ)
khác nhau. Đây là một tính năng đặc biệt mà công nghệ đo vẽ ảnh khác không
thể thực hiện được. Với tính năng này việc thực hiện bay quét ở vùng rừng cây
hoặc nơi có thực phủ không quá dày đặc vẫn có thể thi công và thể hiện được
bề mặt đất.
- Điểm phân giải điểm đo chi tiết cao, khi đầu phát đạt 150.000 xung trên 1 giây,
độ cao bay 1000m thì mật độ khoảng 3 điểm trên 1m2. Hiện nay có nhiều hệ
thống LiDAR có đầu phát đạt 240.000 xung trên 1 giây. Công nghệ LiDAR
với khả năng đo điểm trực tiếp ngoại nghiệp mật độ rất cao, độ chính xác lớn,
tốc độ nhanh.
- Điểm khống chế mặt đất rất ít, có thể chỉ 1 điểm cho mục đích cải chính DGPS.
Công nghệ LiDAR đặc biệt lợi ích là công cụ lý tưởng khi nó được áp dụng
7
cho các vùng xa xăm, hẻo lánh khi mà con người rất khó tiếp cận trong triển
khai đo đạc ngoại nghiệp.
- Công nghệ LiDAR ghi nhận được các giá trị mức phản xạ ánh sáng của các
đối tượng trên mặt đất, dữ liệu này có thể được dùng để tạo ra ảnh cường độ
xám, phân loại đối tượng, chiết xuất đối tượng trên mặt đất. Đây là một đặc
tính có giá trị gia tăng của dữ liệu LiDAR.
- Một số hệ thống LiDAR ngoài chức năng đo quét trên mặt đất, còn có thể thực
hiện chức năng đo sâu (hiện nay có thể đo sâu đến 40m).
- Tổ chức thi công đơn giản, gọn nhẹ hơn các phương pháp khác, số người cần
tham gia rất ít (khoảng 10-15 người).
- Hiệu quả kinh tế rất cao khi ứng dụng công nghệ LiDAR cho mục đích thu
thập dữ liệu không gian với yêu cầu thời gian ngắn, độ chính xác cao và mật
độ dày đặc [3].
1.2. Khả năng ứng dụng của LiDAR
Công nghệ LiDAR đã thể hiện nhiều ưu thế vượt trội hơn với các công nghệ
khác trong việc đo đạc thành lập bản đồ, xây dựng cơ sở dữ liệu hay mô phỏng không
gian ba chiều. Các nguồn dữ liệu thu nhận được có thể được ứng dụng trong nhiều
lĩnh vực khác nhau như giáo dục, viễn thông, theo dõi đánh giá khai thác mỏ, quân
sự, nghiên cứu lập bản đồ khu vực ngập lụt, dự báo thảm hoạ, bản đồ địa hình dải ven
biển, quy hoạch đô thị, lập bản đồ đường dây tải điện,…
a) Khảo sát địa hình và lập bản đồ:
Kết quả đầu ra cơ bản là các mô hình số địa hình (DEM – Digital Elavation
Model) và mô hình số bề mặt (DSM – Digital Surface Model) với độ phân giải và độ
chính xác cao, LiDAR rất phù hợp để ứng dụng trong việc thành lập bản đồ tỷ lệ lớn,
các ứng dụng liên quan đến phát triển hoặc quản lý duy trì hạ tầng cơ sở.
8
Hình 1. 2: Ứng dụng LiDAR trong khảo sát địa hình và lập bản đồ
b) Lâm nghiệp:
Trong lĩnh vực lâm nghiệp, công nghệ LiDAR chủ yếu được sử dụng để đánh
giá, thống kê, phân tích điều kiện sống hoang dã, tương quan của các yếu tố như tán,
độ dày tán, dạng lá,… hay sản lượng gỗ rừng; ước tính sinh khối, trữ lượng gỗ và các
tham số lâm nghiệp khác.
Hình 1. 3: Ứng dụng LiDAR trong lâm nghiệp
c) Lập bản đồ ngập úng:
Dữ liệu LiDAR được sử dụng hiệu quả trong xây dựng các mô hình ngập úng,
xác định ranh giới ngập úng, cung cấp thêm nhiều thông tin về các đối tượng/địa vật
chịu ảnh hưởng; từ đó thành lập bản đồ nguy cơ ngập úng, vùng ưu tiên sơ tán.
9
Hình 1. 4: Ứng dụng LiDAR trong lập bản đồ ngập úng
d) Các ứng dụng cho đới duyên hải:
Do dữ liệu LiDAR có độ chính xác cao cùng mật độ điểm dữ liệu dày đặc
trong thời gian thu thập dữ liệu ngắn. Dữ liệu này rất phù hợp cho các ứng dụng để
quản lý và dự báo xói mòn bờ biển; giúp đánh giá và dự báo bồi lắng, quan trắc cũng
như lập dự báo ngập lụt ven biển…
Hình 1. 5: Ứng dụng LiDAR cho đới duyên hải
e) Địa hình ven biển:
Công nghệ LiDAR có thể giúp lập bản đồ địa hình đáy biển độ sâu tới 70m,
hữu ích trong các dự án xác định luồng lạch tàu vào, thiết kế quy hoạch cảng và các
kênh giao thông thuỷ.
10
Hình 1. 6:Ứng dụng LiDAR trong lập bản đồ địa hình ven biển
f) Trượt lở:
LiDAR có thể sử dụng để quan trắc và dự báo trượt lở, đặc biệt với ác sườn
dốc, nhờ đặc điểm thu thập dữ liệu nhanh chóng với độ chính các cao và mật độ dữ
liệu dày đặc. Công nghệ này cũng có thể được sử dụng để đánh giá nhanh thiệt hại và
thiết lập bản đồ thể hiện tình trạng hậu trượt lở nhanh chóng chính xác.
Hình 1. 7: Ứng dụng LiDAR trong quan trắc dự báo trượt lở
g) Các tuyến truyền tải:
LiDAR được áp dụng trong việc lập bản đồ các tuyến truyền tải trải dài, giúp
thể hiện chính xác vị trí các tháp truyền tải hoặc cột điện, phân định địa hình của hành
lang truyền tải và các loại đối tượng tồn tại trong hành lang (cây xanh…) giúp điều
chỉnh, sửa chữa duy tu và thiết kế nâng cấp.
11
Hình 1. 8: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải
h) Lập bản đồ giao thông:
Công nghệ LiDAR thường được sử dụng để: quan trắc, giám sát, duy tu bảo
dưỡng và quản lý các đối tượng như đường sắt, đường bộ, hệ thống tín hiệu biển báo,
các trạm dừng đỗ, nhà ga bến cảng, sự xuống cấp mặt đường, điểm tai nạn, mật độ
giao thông, bùng binh,… mà không cần làm gián đoạn các dịch vụ liên quan.
Hình 1. 9: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải
12
i)Mạng điện thoại di động:
Một trong những yêu cầu của việc quy hoạch và quản lý các mạng điện thoại
di động đó là cần có thông tin bề mặt địa hình, lớp phủ thực vật, các toà nhà và công
trình một cách chi tiết. Công nghệ LiDar xác định cơ sở dữ liệu chính xác và chi tiết
các thông tin về các chướng ngại vật tự nhiên và nhân tạo là cực kỳ quan trọng.
Hình 1. 10: Ứng dụng LiDAR trong quy hoạch và quản lý mạng điện thoại di động
j) Lập mô hình đô thị và mô phỏng đô thị:
Lidar thường được ứng dụng để tạo ra mô hình thành phố ảo với nền địa lý và
các công trình xây dựng, kiến trúc, như đô thị thực. Mô hình này có thể được khai
thác phục vụ rất nhiều đối tượng từ quy hoạch kiến trúc, xây dựng, giao thông. Mô
hình này cũng được chia sẻ dưới các cách linh động khác nhau như: ứng dụng
desktop, ứng dụng web, sử dụng các chuẩn mở, dễ trao đổi và dễ cấu hình phù hợp
với từng đối tượng sử dụng.
Hình 1. 11: Ứng dụng LiDAR trong lập mô hình đô thị và mô phỏng đô thị
13
1.3. Bài toán phân loại dữ liệu LiDAR
1.3.1 Khái niệm
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không
gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được
phát hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ
mặt đất hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi
xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ
nguồn phát laser tới đối tượng. Ở mỗi thời điểm phát xung laser, hệ thống định
vị vệ tinh GNSS sẽ xác định vị trí không gian của điểm phát, và hệ thống đạo
hàng quán tính sẽ xác định các góc định hướng trong không gian của tia quét.
Với các giá trị đo tổng hợp đó sẽ tính được vị trí (tọa độ không gian) của các
điểm trên bề mặt đất. Một tín hiệu phát đi, sẽ có một hay nhiều tín hiệu phản
xạ. Kết quả cuối cùng, sẽ có được đám mây điểm.
Dữ liệu điểm của LiDAR sẽ được tiền xử lý sau khi hệ thống thu nhận
được hệ tọa độ x, y, z có độ chính xác cao của đối tượng bằng cách phân tích
thời gian tia quét phản xạ, góc quét, vị trí thu nhận từ GPS, và thông tin INS.
Thuộc tính của dữ liệu LiDAR ghi nhận được cho mỗi xung bao gồm: cường
độ, số lượng xung phản hồi, giá trị điểm phân loại, góc quét của đường bay
chụp, giá trị RGB, thời gian định vị, góc quét và hướng quét.
Bảng 1. Thuộc tính của dữ liệu LiDAR
STT Tên thuộc tính Mô tả
1 Cường độ Độ đậm nhạt của xung dữ liệu LiDAR phản xạ ghi
nhận được từ điểm LiDAR.
14
2 Số lượng xung
phản xạ
Tổng số lượng xung phản hồi.
3 Điểm phân loại Mọi điểm LiDAR đều được phân loại trong quá
trình tiền xử lý để xác định được loại đối tượng
phản xạ.
4 Góc của đường
quét
Các điểm sẽ được ký hiệu với giá trị 0 và 1. Những
điểm theo đường góc quét sẽ được gán giá trị là 1,
những điểm còn lại được gán giá trị là 0
5 RGB Dữ liệu LiDAR có thể được gán với kênh phổ R,
G, B. Giá trị này thường được thu nhận từ ảnh
cùng thời gian với đo LiDAR
6 Thời gian định vị Giờ được thu nhận từ hệ thống GPS được phát ra
từ hệ thống không vận
7 Góc quét Giá trị của góc quét thường từ - 900 đến + 900
8 Hướng quét Hướng quét là hướng gương chụp laser đang di
chuyển tại thời điểm xung laser phát ra
9 x, y, z Tọa độ và độ cao của điểm phản xạ
Dữ liệu đám mây điểm LiDAR thường rất lớn, từ vài ngàn đến vài chục triệu
điểm tùy thuộc vào độ rộng của khu vực đo vẽ và sự phức tạp của khu vực đo vẽ.
Định dạng đám mây điểm thường là .las hay .laz.
1.3.2 Cơ bản về tệp tin .LAS
Bộ dữ liệu LAS lưu trữ một hoặc nhiều tệp LAS trên đĩa, cũng như các tính
năng bề mặt bổ sung. Tệp LAS là định dạng nhị phân chuẩn công nghiệp để lưu trữ
15
dữ liệu LiDAR trong không khí. Bộ dữ liệu LAS cho phép kiểm tra các tệp LAS, ở
định dạng gốc, nhanh chóng và dễ dàng, cung cấp số liệu thống kê chi tiết và vùng
phủ sóng của dữ liệu LiDAR chứa trong các tệp LAS.Một tập dữ liệu LAS cũng có
thể lưu trữ tham chiếu đến các lớp đối tượng có chứa các ràng buộc bề mặt. Các ràng
buộc bề mặt là đường nét, đa giác nước, ranh giới khu vực, hoặc bất kỳ loại tính năng
bề mặt nào khác được thực thi trong bộ dữ liệu LAS.
Bộ dữ liệu LAS cung cấp quyền truy cập ngay vào dữ liệu LiDAR mà không
cần chuyển đổi hoặc nhập dữ liệu. Các thuộc tính điểm LAS có thể được sử dụng để
lọc ra nội dung và tượng trưng cho các điểm trong 2D và 3D. Ngoài ra, dữ liệu LiDAR
thường xuất hiện dưới dạng một nhóm tệp, tập dữ liệu LAS cung cấp khả năng xác
định tập hợp các tệp LAS hợp lý để làm việc trong các dự án được bản địa hóa.
Hình 1. 12: Hiển thị dữ liệu trong tệp tin LAS
Bộ dữ liệu LAS tương tự như một tập dữ liệu địa hình với các chế độ xem trên
bề mặt, nhưng nó cũng có thể được sử dụng để xem điểm và không yêu cầu tiền xử
lý. Người dùng không bắt buộc phải thực hiện bất kỳ quá trình xử lý nào để nhanh
chóng hiểu dữ liệu LiDAR đang làm việc. Có thể làm việc trực tiếp trên các tệp LAS,
dưới dạng tập hợp hoặc dưới dạng tệp riêng lẻ. Bộ dữ liệu LAS hỗ trợ đường viền
hoặc các ràng buộc bề mặt khác sẽ được thêm vào mô hình bề mặt. Nó được hiển thị
16
như một bề mặt hoặc một đám mây điểm, cho phép nhanh chóng đánh giá và hiểu dữ
liệu LiDAR.
Có thể hiển thị bất kỳ sai sót hoặc vấn đề dữ liệu nào một cách nhanh chóng
do hiển thị nhanh và phân tích thống kê. Phân tích có thể được tiến hành trên mỗi và
mọi tập tinLAS hoặc trên toàn bộ tập dữ liệu LAS. Nếu có lỗi trong phân loại, có thể
sửa đổi việc phân loại các tập tin LAS bằng cách sử dụng LAS Dataset 2D Profile
View.
Bộ dữ liệu LAS có thể mở rộng, cho phép làm việc với các đám mây điểm lớn
một cách nhanh chóng và hiệu quả. Đại diện bộ dữ liệu LAS tự động cập nhật khi
xoay và thu phóng xung quanh màn hình. Bộ dữ liệu LAS là một bổ sung tuyệt vời
cho luồng công việc cho bộ dữ liệu địa hình và bộ dữ liệu mosaic, có thể xem nhanh
các tệp LiDAR trước khi nhập, phân tích hoặc chia sẻ dữ liệu LiDAR.
1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS
Dữ liệu LiDAR được lưu trong tệp tin LAS thường là đám mây điểm. Các đám
mây điểm là tập hợp các điểm thể hiện hình dạng hoặc tính năng 3D. Mỗi điểm có
tập hợp các tọa độ X, Y, Z riêng và trong một số trường hợp có thêm các thuộc tính
bổ sung. Các điểm LiDAR được lưu trữ trong các tệp LAS thường được phân thành
các loại khác nhau bằng cách sử dụng các công cụ phân loại chuyên biệt bên ngoài
ArcGIS. Phân loại này thường được hoàn thành bằng cách đặt thông số dựa trên địa
hình, sau đó chạy thuật toán trên đám mây điểm để xác định loại đối tượng được liên
kết với mỗi điểm. Mã phân loại được gán cho mỗi điểm được ghi vào tệp LAS và,
trong hầu hết các trường hợp, tuân theo tiêu chuẩn ASPRS. Khi phân loại tự động
được thực hiện trên dữ liệu LiDAR, chúng thường không phân loại hoàn toàn tất cả
các điểm một cách chính xác nhưng thường chính xác đến khoảng 90 phần trăm của
các điểm. Để đảm bảo rằng 100% các điểm LiDAR được phân loại chính xác, cần
phân loại thủ công và dọn sạch dữ liệu. Đây là một công việc rất tốn thời gian, và một
số nhà cung cấp có thể yêu cầu một chi phí bổ sung để thực hiện phân loại thủ công.
17
Hình 1. 13: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D
Phân loại đám mây điểm là quá trình phân chia các điểm thành các lớp điểm
chuyên biệt như mặt đất, nước, thảm thực vật, xây dựng, đường dây điện…Phân loại
có thể là một hoạt động chuyên sâu xử lý và nhiều bộ dữ liệu LIDAR đã trải qua phân
loại hạn chế. Mặt đất hầu như luôn được bao gồm trong một tệp LAS, vì nó là cần
thiết để tạo ra một DTM. Các phiên bản thường dùng của định dạng LAS (1.2 và 1.3)
có 8 loại phân loại được xác định trước và có thể xử lý lên đến 32; phiên bản mới hơn
(1.4), vẫn chưa được sử dụng rộng rãi, có khoảng 20 lớp được định trước và có thể
xử lý 256.
18
Đám mây
điểm
LiDAR
Tiền xử lý Lọc điểm Lựa chọn
thuật toán Phân loại
Đánh giá độ
chính xác
Hình 1. 14: Quy trình phân loại đám mây điểm LiDAR
Việc phân loại đám mây điểm LiDAR thường được thực hiện theo quy trình
sau:
Sau quá trình phân loại đám mây điểm LiDAR sẽ được sử dụng để
thành lập DEM/DTM và được ứng dụng trong những bài toán cụ thể.
1.4 Kết chương:
Với mục đích sử dụng triệt để các dữ liệu quét LiDAR, việc phân loại các lớp
điểm theo từng lớp đặc trưng, theo mục đích nghiên cứu từng loại đối tượng, việc
“Nghiên cứu phương pháp phân loại dữ liệu LiDAR” sẽ góp phần mở rộng ứng
dụng công nghệ LiDAR trong nghiên cứu cấu trúc không gian của lớp phủ mặt đất.
Điều này là hoàn toàn cần thiết và mang tính thực tiễn cao, đặc biệt có ý nghĩa khi sử
dụng công nghệ LiDAR trong nghiên các thảm thực vật, nghiên cứu sinh khối và tầng
thứ của rừng đa tầng nhiệt đới, nghiên cứu bờ biển hay thay đổi của bề mặt phủ.
19
CHƯƠNG 2:
MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR
2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale
Curvature Classification) và K-Means trong phân loại dữ liệu LiDAR
2.1.1 Thuật toán MCC (Multiscale Curvature Classification)
Thuật toán MCC (Multiscale Curvature Classification) là thuật toán được sử
dụng để phân loại đám mây điểm LiDAR 3D được phát triển bởi Moscow Forestry
Sciences Laboratory, sử dụng chủ yếu để phân loại các tia phản xạ LiDAR trong môi
trường rừng. Thuật toán này được sử dụng để phân loại các điểm thành hai lớp là mặt
đất (ground) và không mặt đất (non-ground). Đây là thuật toán phân loại đám mây
điểm LiDAR tự động. MCC là thuật toán lặp đa tỉ lệ để phân loại tín hiệu phản xạ
LiDAR mà vượt quá ngưỡng độ cong của bề mặt, cách tiếp cận đa tỉ lệ sẽ xác định
độ lệch của các điểm cần phân loại với bề mặt trung bình và loại bỏ dần những điểm
trên bề mặt khỏi nhóm mặt đất. Quá trình phân loại bắt đầu bằng việc xác định xem
các điểm thuộc những tia phản xạ đơn hay phản xạ cuối cùng cũng như phản xạ đầu
tiên từ thực vật. Thuật toán MCC sẽ tính toán bề mặt trung bình từ những điểm mặt
đất đặc trưng bằng phép lặp TPS (Thin Plate Spline), sau đó sẽ hiệu chỉnh nó thông
qua một lõi lọc. Những tính năng của thuật toán MCC sử dụng để phân loại đám mây
điểm LiDAR hỗ trợ cho quá trình lặp để tìm kiếm bề mặt thật của Trái đất với độ
phân giải tương ứng với mẫu.
Có bai cải tiến của thuật toán, đó là:
- Phép lặp TPS (Thin Plate Spline)
- Sử dụng cách tiếp cận đa tỉ lệ với bề mặt chuẩn được nội suy với các độ
phân giải khác nhau
- Lũy tiến độ cong mở [6]
20
Thuật toán MCC có hai tham số là s (scale - biểu thị cho tỉ lệ) và t là ngưỡng
độ cong (curvature threshold), trong đó tham số tỉ lệ là hàm của tỉ lệ các đối tượng
trên mặt đất và khoảng lấy mẫu (khoảng cách sau) của dữ liệu LiDAR [9].
Thuật toán MCC được mô tả như sau:
Input: đám mây điểm LiDAR
Output: điểm sau phân loại với hai lớp mặt đất và không mặt đất
Initial: U0 đám mây điểm LiDAR
U = {P1, P2, …, Pn} – chứa các điểm chưa được phân loại
Pj(xj, yj, zj) – điểm LiDAR rời rạc
int l[1 … 3] – miền tỉ lệ
tl – độ cong cho miền tỉ lệ l – khởi tạo bởi người dùng
l – độ phân giải cho l
Procedure:
Phân loại những điểm có độ cao trong U0 và gán chúng vào lớp không
mặt đất
For l = 1 to 3
Repeat
Lặp tìm S = TPS(U, l, f)
Lặp tìm S’ = 3x3
For each Pj Î U
If zj > S’(xj, yj) + tli then
Phân Pj vào lớp không mặt đất
Loại Pj khỏi U
Untill điểm không thuộc U < 10% tổng số điểm
của nó
Phân lớp các điểm còn lại của U vào lớp mặt đất
End
21
2.1.2 Thuật toán K-Means
Thuật toán K-means là tìm phương pháp phân nhóm các đối tượng (objects)
đã cho vào K cụm (K là số các cụm được xác định trước, K > 0) sao cho tổng bình
phương khoảng cách giữa các đối tượng đến tâm nhóm là nhỏ nhất. Thuật toán K-
means được mô tả trên hình 2.1 và hình 2.2.
Hình 2. 1: Mô tả thuật toán K-Means
22
Hình 2. 2: Ví dụ phân loại với K-Means
Trong bài toán phân loại dữ liệu, thuật toán K-means được triển khai theo các bước:
Bước 1: Chọn K cụm trọng tâm khởi tạo, z1, z2, z3, …, zn, với 0 < K ≤ n
Bước 2: Phân phối mẫu trong K-means. Mẫu thường được gán với cụm trung tâm
gần nhất theo công thức: x Î Si(n) nếu |x – zi(n)| ≤ |x – zj(n)| với j = 1, 2, 3, …, k; i
≠ j; Si(n) là bộ mẫu của trọng tâm zi(n), trong đó n chỉ số bước lặp của bài toán.
Bước 3: Tính toán trọng tâm cụm mới từ mỗi cụm Si(n). Tìm giá trị mới cho mỗi zi.
Trọng tâm cụm mới, zi(n+1) sẽ là giá trị trung bình của các điểm trong Si(n) như:
zi(n+1) = (1/𝑐) ∑𝑥 𝜖𝑆𝑖(𝑛) 𝑥
Trong đó ci là tập điểm thuộc về cụm thứ i
Bước 4: So sánh zi(n) và zi(n+1) với mọi i.
Tính toán khoảng cách giữa mỗi cặp điểm trong mỗi lần lặp liên tiếp:
23
a. Nếu không có sự thay đổi đáng kể, kết thúc phương pháp, một vài tiêu chí cho kết
thúc như:
+ Nếu |zi(n+1) – zi(n)| < T với mọi i
+ N ế u ∑ 𝑘𝑗 = 1 | 𝑧 𝑖 ( 𝑛 + 1 ) − 𝑧 𝑖 ( 𝑛 ) | < 𝑇 với mọi i
b. Nếu không thì tiếp tục lặp các lần lặp tiếp theo từ bước 2.
Trong thuật toán K-means việc chọn được giá trị k sẽ có thể giúp tăng tốc được thuật
toán, tối ưu và cải tiến thuật toán tốt hơn. Có nhiều phương pháp để có thể lựa chọn
được giá trị k như sử dụng ý kiến của chuyên gia, thử mô hình với các giá trị của k
và từ đó chọn k tốt nhất hay sử dụng kỹ thuật CV (Cross - Validation), ….
2.2. Đánh giá kết quả phân loại LiDAR
2.2.1 Thuật toán MCC
Trên thế giới, các nghiên cứu được công bố về MCC trong phân loại dữ liệu
LiDAR tương đối hạn chế, trong đó nổi bật nhất là nghiên cứu của tác giả Jeffrey
S.Evans và Andrew T.Hudak sử dụng phương pháp MCC trong phân loại tín hiệu
phản hồi LiDAR trong môi trường rừng. Thuật toán MCC được các tác giả giới thiệu
sử dụng phép lặp TPS để loại bỏ những điểm không thuộc nhóm mặt đất để từ đó có
thể thành lập được DEM của khu vực khảo sát. TPS là phép lặp cho phép đánh giá
trạng thái giữa các điểm, tuân thủ các dữ liệu đầu vào và kiểm soát khoảng cách các
điểm mẫu ảnh hưởng đến bề mặt ước lượng [6].
Triển khai thuật toán MCC các tác giả định nghĩa một vevtor Z(s) chứa giá trị
tọa độ của tất cả các điểm LiDAR. Vector này sẽ được sử dụng trong phép lặp bề mặt
raster sử dụng phép lặp TPS với độ phân giải theo tỉ lệ l. Một lõi lọc có kích thước
3x3 duyệt qua tất cả các phép lọc để tìm một vector mới x(s). Miền tỉ lệ l là mô hình
lặp được thiết lập với tham số của mô hình chạy đến khi hội tụ. l và t sẽ được định
nghĩa bởi người dùng [6].
24
Dung sai độ cong t sẽ được thêm vào x(s), và các điểm sẽ được phân lớp vào
lớp không mặt đất bằng việc sử dụng điều kiện
If Z(s) > c then phân lớp không mặt đất
Trong đó c là độ cong của miền tỉ lệ l.
Tiến trình phân loại sử dụng MCC được các tác giả sử dụng thể hiện trong sơ
đồ khối sau:
Hình 2. 3: Sơ đồ khối của giải thuật MCC trong phân lớp dữ liệu LiDAR
Để đánh giá thuật toán, các tác giả đã sử dụng bộ dữ liệu thu được từ phía Bắc
của Idaho. Đây là khu vực rừng phức tạp với diện tích 88ha, với các loại rừng khác
nhau như rừng trồng, rừng tư nhân, ….
25
Hình 2. 4: Khu vực thực nghiệm trong nghiên cứu
Thuật toán MCC khi áp dụng vào phân loại tín hiệu phản hồi LiDAR được
thực hiện một cách tự động, kết quả tín hiệu phản hồi LiDAR được phân thành hai
loại mặt đất và không mặt đất. Lỗi khi phân loại điểm mặt đất được đánh giá qua 204
điểm trong đó có 165 điểm GPS, 39 điểm của NOAA, và sử dụng sai số trung bình
để đánh giá số điểm bị mất trong quá trình phân loại. Công thức tính toán sai số trung
bình được thể hiện [6]:
𝑅𝑀𝑆𝐸 = 0∑ (345678):;8<=
>6? (1)
Với các tham số được lựa chọn lần lượt là l = 1.5, t = 0.3, với ba miền tỉ lệ để
phân loại điểm, kết quả được các tác giả thực nghiệm:
Hình 2. 5: Tỉ lệ các điểm thuộc hai lớp sau phân loại
Trong đó, sai số trung bình RMSE với hai khu vực thực nghiệm là 0.306 và
0.166. Kết quả chỉ ra rằng, MCC giúp cực tiểu sai số, trong khi vẫn còn tồn tại tỉ lệ
cao của điểm mặt đất và độ tin cậy cao của các điểm được cung cấp.
26
Trong khi đó nhóm tác giả Wade T.Tinkham và Hongyu Huang đã có nghiên
cứu so sánh về mức độ hiệu quả của hai thuật toán MCC và BCAL (Boise Center
Aerospace Laboratory LiDAR) trong phân loại dữ liệu LiDAR để thành lập DTM.
Độ chính xác của hai thuật toán được đánh giá qua hơn 7000 điểm đo có độ chính
xác cao với 6 kiểu dữ liệu khác nhau. Khu vực nghiên cứu được tác giả sử dụng trong
quá trình đánh giá là lưu vực RME, là một phần của Reynold. Khi đánh giá hiệu suất
tổng thể của MCC và BCAL với mỗi độ phân giải khác nhau sẽ cho ngưỡng sai số là
khác nhau. Tại độ phân giải là 1m, trị số ANOVA cho thấy không có sự khác biệt
đáng kể giữa MCC và BCAL. Tại độ phân giải 0,5m, với các loại độ phủ khác nhau
BCAL trội hơn hẳn MCC. Sau đó các tác giả tiến hành so sánh tạo DTM của hai thuật
toán là không khác biệt. Nhưng khi kết hợp hai thuật toán MCC và BCAL thì việc
tạo DTM có độ chính xác cao hơn. Sau quá trình thử nghiệm, các tác giả chỉ ra rằng
thuật toán BCAL thích hợp với khu vực có mật độ điểm dày đặc, thảm thực vật liên
tục. Ở những nơi có độ dốc thay đổi liên tục MCC sẽ có độ chính xác cao hơn [10].
Với thuật toán MCC được các tác giả giới thiệu trong nghiên cứu sử dụng phép
lặp TPS trong phân chia các tín hiệu phản xạ LiDAR. Tác giả đã chỉ ra rằng, thuật
toán MCC hoạt động tốt nhất ở tỉ lệ 1.0 và giá trị độ cong 0.05.
2.2.2 Thuật toán K-Means
Mỗi điểm LiDAR trong quá trình phân loại được gán vào một lớp được định
nghĩa trong quá trình phân loại. Các điểm này có thể được phân vào một số lớp như:
đất trống, thực vật cao, thực vật thấp, và nước .... Thông thường, các mã phân loại đại
diện cho kiểu đối tượng được thu nhận trong tín hiệu phản hồi. Phân loại đám mây
điểm là bước quan trọng trong quá trình trích xuất thông tin của các lớp như tòa nhà,
thực vật, giao thông và mặt nước. Thuật toán phân loại sử dụng K-means sẽ lựa chọn
các điểm mẫu trong mẫu ngẫu nhiên từ toàn bộ đám mây điểm. Phương pháp phân
loại được thể hiện qua sơ đồ hình 2.6 và hình 2.7.
27
Hình 2. 6: Pseudo code của thuật toán K-means trong phân loại đám mây điểm LiDAR
Hình 2. 7: Sơ đồ phân loại đám mây điểm LiDAR với K-means
Để có thể đánh giá được khả năng phân loại đám mây điểm LiDAR của hai
thuật toán K-means, nhóm tác giả đã thử nghiệm phân loại với bộ dữ liệu được đo tại
28
Nghệ An, với 485 điểm thử nghiệm, mỗi điểm được thể hiện với 3 thuộc tính (x, y,
z), trong đó thuộc tính được sử dụng để phân loại là Z (giá trị độ cao của điểm). Hai
thuật toán được chạy với phần mềm SPSS 20 của IBM.
Với thuật toán K-means, việc lựa chọn số lượng cụm thích hợp cho một bộ dữ liệu
nhất định trong thuật toán K-Means sẽ quyết định đến cụm trong quá trình phân cụm.
Đây là một quá trình khó khăn vì kết quả của quá trình phân cụm do người sử dụng
quyết định. Sự lựa chọn chính xác K thường không rõ ràng, do sự phân bố và quy mô
của các điểm trong bộ dữ liệu và độ phân giải của người dùng. Để có thể tìm được K
phù hợp với bộ dữ liệu, thông thường người dùng sẽ chạy thuật toán K-Means với
các giá trị K khác nhau và so sánh kết quả để lựa chọn được K phù hợp. Để thử
nghiệm với bộ dữ liệu, tác giả đưa ra hai giá trị K để tiến hành phân loại là K = 5 và
K = 7.
Với lựa chọn k = 5, kết quả phân loại được thể hiện như sau:
Hình 2. 8: Kết quả phân loại với k=5
Với k = 5, qua 10 lần lặp thuật toán đã phân chia được 332 điểm vào 5 cụm, có
153 giá trị lỗi (điểm không được phân về cụm nào). Với trọng tâm của 5 cụm được
khởi tạo như trong bảng số cụm khởi tạo (hình 2.5), với 10 lần lặp, trọng tâm của 5
cụm được tính toán lại như trong bảng số lần lặp của thuật toán. Kết quả trong tổng
số 332 điểm có 2 điểm thuộc về cụm 1, 2 điểm cụm 2, 208 điểm cụm 3, 110 điểm
cụm 4 và 10 điểm cụm 5.
Với k = 7, kết quả phân loại được thể hiện như sau:
29
2.9a: Tâm khởi tạo của các cụm
2.9b: Lịch sử lặp của thuật toán
2.9c: Tâm mới của cụm 2.9d: Số lượng điểm được phân vào mỗi
nhóm sau phân loại
Hình 2. 9: Kết quả phân loại với k=7
Khi tăng số cụm lên là 7, giá trị điểm không được gán vào cụm nào không thay
đổi là 153 điểm, trọng tâm của cụm được lựa chọn như trong hình 7.a, qua số lần lặp
là 10, trọng tâm của cụm được tính toán lại như trong hình 7.c. Kết quả có 12 điểm
được gán vào cụm 1, 8 điểm được gán vào cụm 2, 179 điểm cụm 3, 99 điểm cụm 4,
2 điểm cụm 5, 30 điểm cụm 6 và 2 điểm cụm 7.
30
Sau khi thử nghiệm với bộ dữ liệu trên hai thuật toán K-means, nhận thấy đây
là thuật toán phân loại dựa hoàn toàn vào khoảng cách. Các điểm được gán vào cụm
(lớp) phụ thuộc vào khoảng cách của nó tới tâm cụm (với K-means).
Thuật toán K-means có sự thay đổi rõ ràng nhất về sự thay đổi của phân bố
các điểm trong cụm và trọng tâm được tính toán trong mỗi cụm khi có sự thay đổi
của số cụm khởi tạo.
Tuy nhiên, với cả 2 giá trị k số lượng điểm lỗi chiếm tỉ lệ khá lớn 153/485
điểm (31.5%). Do vậy, K-means là thuật toán có độ chính xác phụ thuộc vào quá trình
tính toán trọng tâm của cụm qua mỗi lần lặp.
2.3. Kết chương
Từ các nghiên cứu của các nhóm tác giả trên thế giới về thuật toán MCC và
K-Means trong phân loại dữ liệu LiDAR có thể thấy rằng:
Với thuật toán MCC:
- Dữ liệu LiDAR xác định nhãn cho các đối tượng điểm với thuật toán MCC chỉ
dừng lại ở phân thành hai lớp mặt đất và không mặt đất.
- Ứng dụng của dữ liệu sau phân loại chỉ thành lập DTM hoặc DEM.
- Khu vực thử nghiệm trong nghiên cứu chủ yếu là rừng hoặc khu vực có mật độ
thực vật cao.
- Độ chính xác sau phân loại mới chỉ sử dụng sai số RMSE để đánh giá.
Với thuật toán K-Means:
- Sử dụng thuật toán K-means có ưu điểm là giải thuật dễ hiểu và dễ cài đặt.
- Khi số cụm tăng dần, giá trị missing của thuật toán không thay đổi, vì thế thuật
toán K-means hoàn toàn phù hợp với bài toán phân cụm dữ liệu đám mây điểm
LiDAR.
- Một số hạn chế của K-Means là hiệu quả của thuật toán phụ thuộc vào việc
chọn số nhóm K (phải xác định trước) và chi phí cho thực hiện vòng lặp tính
toán khoảng cách lớn khi số cụm K và dữ liệu phân cụm lớn.
31
Với các tài liệu trong nước và ngoài về phương pháp và thuật toán được sử dụng
trong quá trình phân loại điểm LiDAR, học viên nhận thấy:
Bộ dữ liệu sau khi phân loại hầu hết chỉ lưu giữ thông tin của các lớp mặt đất,
cây cối, nhà cao tầng, giao thông, … trong khi dữ liệu phản xạ về khu vực quét từ
LiDAR là tương đối phong phú do đặc tính không bị hấp thụ bởi địa vật của LiDAR.
32
CHƯƠNG 3:
XÂY DỰNG ỨNG DỤNG THỰC NGHIỆM
3.1 Giới thiệu bài toán thử nghiệm
Dữ liệu điểm có giá trị tọa độ ba chiều (x, y, z) được tạo bởi công nghệ LiDAR
thường có mật độ dày đặc và chứa những thông tin cực kỳ hữu ích về bề mặt địa hình
của khu vực đo vẽ. Nhưng để xác định được nhãn lớp mà mỗi điểm thuộc về lại khá
khó khăn khi một đối tượng có nhiều điểm trả về. Để làm được công việc này, cần
phải tiến hành bài toán phân loại đám mây điểm để có thể sử dụng những điểm có giá
trị trong đám mây điểm LiDAR.
Bài toán phân loại đám mây điểm LiDAR thuộc vào bài toán lọc và phân tách
đưa các điểm về các lớp riêng biệt. Việc phân loại dữ liệu tự động của đám mây điểm
phải tách được đám mây dữ liệu thành các lớp khác nhau theo các tính chất riêng như:
Lớp chứa điểm mặt đất, Lớp chứa điểm thực phủ, Lớp chứa điểm trên mái nhà tường
nhà và các công trình xây dựng, Lớp chứa các điểm trên không, Lớp chứa các điểm
bị lỗi, Lớp chứa các điểm trên mặt nước …. Từ đó xây dựng ra lớp Ground và Non-
Ground.
Bài toán thực nghiệm của luận văn tập trung vào ứng dụng hai thuật toán MCC
và K-means trong phân loại đám mây điểm LiDAR, từ đó đánh giá độ chính xác của
hai thuật toán trên bộ dữ liệu thử nghiệm.
3.2 Lựa chọn thuật toán phân loại và dữ liệu thử nghiệm
Trong bài toán phân loại, lựa chọn thuật toán là quan trọng và quyết định đến
độ chính xác của bài toán phân loại. Hai thuật toán được lựa chọn trong luận văn là
MCC và K-means.
Bộ dữ liệu thử nghiệm được thu nhận tại khu vực quận Marlborough, New
Zealand và được download tại trang web www.opentopo.sdsc.edu. Thời gian đo vẽ
từ 2/2014 – 3/2014. Công nghệ LiDAR sử dụng là ALS (Aerial Scanning Laser), trên
một khu vực rộng 404,72 km2, với góc quét là 200, tần số của gương quét là 40Hz,
33
mật độ xung phản hồi là 1.4pls/m2, mật độ điểm là 2,69pt/m2. Dữ liệu sau khi thu
nhận được lưu dưới dạng file .las với chuẩn 1.2. Các tham số của dữ liệu được thể
hiện trong bảng 3.1.
Bảng 3.2 Thông số của file las STT Thuộc tính Giá trị
1 Cường độ (min, max) 0, 4538
2 Màu R, G, B 0, 0, 0
3 Thứ tự của góc quét (min, max) -32, 31
4 Số lượng tia phản xạ (min, max) 0, 4
5 Tọa độ điểm x, y, z
6 Góc bay (min, max) 0, 1
Đám mây điểm LiDAR được thể hiện trong hình vẽ 3.1 và ảnh vệ tinh khu vực
khảo sát được thể hiện trong hình 3.2.
Hình 3. 1: Đám mây điểm khu vực khảo sát
34
Hình 3. 2: Ảnh vệ tinh của khu vực đo vẽ
3.3 Môi trường và các công cụ sử dụng để xây dựng chương trình
Chương trình được xây dựng trên ngôn ngữ C# của bộ Visual Studio 2015 và
được tích hợp với công cụ LASTools.
C# là một ngôn ngữ lập trình hướng đối tượng được phát triển bởi Microsoft,
là phần khởi đầu cho kế hoạch .NET của họ. Tên của ngôn ngữ bao gồm ký tự thăng
theo Microsoft nhưng theo ECMA là C#, chỉ bao gồm dấu số thường. Microsoft phát
triển C# dựa trên C++ và Java. C# được miêu tả là ngôn ngữ có được sự cân bằng
giữa C++, Visual Basic, Delphi và Java.
LASTools là một tập hợp các công cụ dòng lệnh để phân loại, xếp, chuyển đổi,
lọc, raster, tam giác, đường viền, clip và đa giác dữ liệu LiDAR (để chỉ một vài chức
năng). Tất cả các công cụ cũng có thể được chạy qua GUI và có sẵn dưới dạng hộp
công cụ xử lý LiDAR cho các phiên bản ArcGIS 9.3, 10.0 và 10.1 của ESRI.
Quản lý dự án đầy đủ bao gồm các công cụ:
- Mã hóa dữ liệu địa lý và chuyển đổi
- Theo dõi liên kết
- Lọc và phân loại nâng cao
- Tạo DSM / DTM
35
- Phát hiện đột phá và tính năng
- Nhiều định dạng đầu vào và đầu ra (bao gồm cả định dạng LAS)
- Thế hệ chỉnh hình thực sự
- Tích hợp đầy đủ dữ liệu Dạng sóng của Lidar
- Và trình xem và trình chỉnh sửa rất linh hoạt để hiển thị và thao tác dữ liệu
hình ảnh và dữ liệu hình ảnh.
LasTools cung cấp các công cụ cần thiết để tạo DSM và DTM từ dữ liệu khai
thác thô hoặc cơ bản được xử lý trước một cách độc lập ứng dụng. Nó có tính năng
quản lý thông minh dữ liệu dự án, nhập và mã hóa địa lý dữ liệu hình ảnh và dữ liệu
thô, hiệu chuẩn hệ thống, lọc và phân loại dữ liệu LiDAR, tạo mô hình độ cao và xuất
kết quả theo các định dạng phổ biến khác nhau. Sự nhấn mạnh đặc biệt được đặt vào
giao diện người dùng đồ họa trực quan và quy trình làm việc hợp lý để cho phép tạo
mô hình nhanh chóng và hiệu quả. Ngoài ra, LasTools cung cấp các tính năng để xử
lý và xử lý dữ liệu khai thác tiên tiến như dạng sóng tín hiệu trở lại và màu sắc bề mặt
thật, cũng như sự tích hợp nhanh chóng của dữ liệu LiDAR và ảnh kỹ thuật số vào
ảnh ortho.
LASTool có các công cụ sau:
- API để đọc/ghi file LAS
- lasinfo
- lasview
- las2txt và txt2las
- laszip
- las2las
36
Hình 3. 3: Giao diện GUI của lastool
Hình 3. 4: Công cụ của LASTool trong ARCGIS
37
3.4 Phát triển chương trình
Chương trình sau khi được xây dựng với ngôn ngữ C# và công cụ LASTool
có giao diện như sau:
Hình 3. 5: Giao diện chương trình
Các chức năng chính của chương trình gồm có:
a) Xem file las
Hình 3. 6: Đám mây điểm LiDAR được hiển thị dưới dạng 3D
b) Phân loại với MCC
38
Hình 3. 7: Phân loại với MCC
Hình 3. 8: Các điểm được gán nhãn sau phân loại với MCC
c) Phân loại với K-means
39
Hình 3. 9 Kết quả phân loại với K-means
3.5 Đánh giá kết quả thu được
Sau khi xây dựng chương trình tiến hành phân loại đám mây điểm với thuật
toán MCC và K-means.
3.5.1 Phân loại với MCC
Dữ liệu đầu vào của thuật toán MCC là bộ dữ liệu file .las lấy tại trang
www.opentopo.sdsc.edu như đã trình bày ở trên. Tham số đầu vào với ứng dụng là
toạ độ x,y,z trong bộ dữ liệu LiDAR.
Chương trình sẽ sử dụng thuật toán MCC trong việc khai thác toạ độ Z
để tiến hành gán nhãn cho các điểm trong đám mây điểm với hai nhóm mặt đất
và không mặt đất.
Do giá trị thuộc tính mật độ xung trên m2 là 1.4 nên theo công thức lựa chọn
tham số s của thuật toán MCC:
s = 1/(sprt(pulse/m2)) = 1/sprt(1.4) = 0.8
40
Trong khi đó, giá trị t lựa chọn theo đề xuất là 0.3.
Hình 3. 10: Tham số được lựa chọn trong giải thuật MCC
Qua 3 miền tỉ lệ với miền tỉ lệ đầu có giá trị 0.4, miền tỉ lệ thứ hai có giá trị
0.8 và miền tỉ lệ thứ 3 có giá trị 1.2. Trong đó, miền tỉ lệ đầu qua 7 lần lặp, thứ hai là
6 lần lặp và thứ 3 là 8 lần lặp có 184902 điểm trong tổng số 369750 điểm được gán
vào lớp mặt đất còn lại là lớp không mặt đất.
41
Hình 3. 11: Các điểm được gán nhãn sau phân loại với MCC
3.5.2 Phân loại đám mây điểm với K-means
Từ kết quả của thuật toán MCC, đám mây điểm đã được dán nhãn thành hai
loại điểm mặt đất nhãn 2 và không mặt đất có nhãn là 1.
Lấy các điểm có nhãn là 1 (không mặt đất) tiến hành phân cụm với thuật toán
K-Means.
Để phân loại với K-means lựa chọn số cụm k = 2, thuộc tính đươc sử dụng để
phân loại là độ cao z, kết quả phân loại được thể hiện trong hình 3.12.
42
Hình 3. 12: Kết quả phân loại với K-means
Sau phân loại, đám mây điểm được chia thành hai cụm, với giá trị tâm cụm
khởi tạo như sau:
- Cụm 0 có tâm khởi tạo là 18.72
- Cum 1 có tâm khởi tạo là 20.53
Qua 8 lần lặp tâm cụm mới được ghi nhận là:
- Cụm 0 có tâm là 17.69
- Cụm 1 có tâm là 20.6
Sau phân loại với K-means có 184811 điểm được gán vào cụm 0 trong tổng
số 369750 điểm.
3.5.3 Đánh giá
Với thuật toán MCC, qua 3 miền tỉ lệ với tổng số 21 lần lặp tỉ lệ phân loại
được thay đổi như sau:
43
% phân loại SD1 28% 14% 6.80% 3.60% 2.10% 1.50% 0.91% SD2 2.50% 1.10% 0.61% 0.530% 0.13% 0.03%
SD3 0.82000
0% 0.37000
0% 0.10000
0% 0.18000
0% 0.03700
0% 0.01300
0% 0.00380
0%
Hình 3. 13: Tỉ lệ phân loại trong mỗi miền tỉ lệ với MCC
Với thuật toán K-means, các lần lặp được thể hiện trong hình 3.14
Hình 3. 14: Lịch sử lặp của K-means
44
Bảng 3.3: Số lượng điểm của mỗi cụm
Number of Cases in each Cluster
Cluster 0 184811.000
1 184900.000
Valid 369750.000 Missing 39.000
Số lượng điểm được chia về cụm được thể hiện trong bảng 3.2, có thể thấy với
K-means có 69 trong tổng số 369750 điểm lỗi (điểm không thuộc về cụm nào).
Để đánh giá được độ chính xác của hai thuật toán sau phân loại, tác giả đã so
sánh kết quả với giải thuật được sử dụng trên trang Opentopo để tính toán độ đo cho
giải thuật MCC và K-means. Kết quả được thể hiện trong bảng 3.3.
Bảng 4.3:Các độ đo đánh giá độ chính xác phân loại
STT Thuật
toán
Số lần
lặp
Độ
chính
xác
Độ bao
phủ
Thời gian
chạy
F1
1 MCC 21 99.8% 99.9% 110s 99.85%
2 K-means 8 96% 92% 104s 93.96%
3 Opentopo 12 99.9% 99.9% 122s 99.9%
Qua đó có thể thấy, thuật toán MCC và K-means có thể đáp ứng được yêu cầu
của bài toán phân loại đám mây điểm LiDAR, phù hợp với mục tiêu và yêu cầu đặt
ra.
Dữ liệu sau phân loại có thể được sử dụng để thành lập DEM/DSM như trong
hình 3.15 và 3.16.
45
Hình 3. 15: Mô hình DEM của khu vực
Hình 3. 16: Mô hình DSM
46
KẾT LUẬN
Hiện nay, ở Việt Nam công nghệ LiDAR được ứng dụng rộng rãi trong nhiều
lĩnh vực như: Trắc địa bản đồ, trong kỹ thuật môi trường, vật lý, khảo cổ học, …. Tuy
nhiên, những việc áp dụng này chỉ dừng lại ở việc ứng dụng công nghệ LiDAR xây
dựng bản đồ địa hình, lập bản đồ ngập úng, dự báo trượt lở, lập bản đồ giao thông,
tạo mô hình DTM, DSM, lập bản đồ các tuyến truyền tải dài, …. Việc đi sâu nghiên
cứu giải quyết các bài toán phân loại điểm nhằm mở rộng khả năng ứng dụng của
công nghệ LiDAR hiện nay vẫn chưa có sản phẩm nào được công bố tại Việt Nam.
Do đó, đề tài nghiên cứu góp phần làm rõ hiệu quả, độ chính xác khi sử dụng một số
thuật toán trong việc giải quyết bài toán phân loại đám mây điểm đồng thời là cơ sở
để mở rộng các ứng dụng khai thác dữ liệu LiDAR.
47
LIỆU THAM KHẢO
TRONG NƯỚC
[1]. TS. Lương Chính Kế, “Thành lập DEM/DTM/DSM bằng công nghệ LiDAR”,
2005.
[2]. TS. Trần Đình Luật, Th.S Nguyễn Thị Kim Dung, Th.S Lưu Thị Thu Thủy, Th.S
Trần Hồng Hạnh, “Khả năng ứng dụng công nghệ LiDAR xây dựng mô hình số địa
hình vùng bãi bồi cửa sông ven biển trong điều kiện Việt Nam”, Tạp chí Tài nguyên
và Môi trường, vol.1, pp. 24-28, 2015.
[3]. Trần Đình Trí, “Công nghệ LiDAR”, Bài giảng dành cho cao học, Trường Đại
học Mỏ - Địa chất, 2013.
NƯỚC NGOÀI.
[4]. J.Niemeyer, C.Mallet, F.Rottensteiner, U.Sorgel, "CRF for the classification of
LiDAR point cloud," Remote Sensing, 2011.
[5]. J. Kunapo, "Spatial data integration for classification of 3D point cloud from
digital photogrammetry," Applied GIS, Monash University Express, vol. 3, no. 3, pp.
26.1-26.15, 2005.
[6]. Jeffrey S.Evans, Andrew T.Hudak, "A multiscale curvature algorithm for
classifying discrete return LiDAR in forested environments," IEEE, vol. 45, pp. 1029-
1038, 2007.
[7]. N.El-Ashmawy, A.Shaker, "Raster vs Point cloud LiDAR data classification,"
The International Archives of the Photogrammetry, RS and Spatial Information
Sciences, Vols. XL-7, pp. 79-83, 2014.
[8]. N.Yastikli, Z.Cetin, "Classification of LiDAR data with point based
classification methods," vol. 3, 2015.
[9]. S. forge, "SourceForge," [Online].
Available: http://sourceforge.net/projects/mcclidar.
[10]. Wade T.Tinkham, Hongyu Huang, "A comparision of two open source LiDAR
surface classification algorithm," Remote Sensing, vol. 3, pp. 638-649, 2011.