Chi tiết bài viết

Image

Ước tính giá trị các thông số phân mảnh ảnh hướng đối tượng phù hợp trên phần mềm eConigtion

ƯỚC TÍNH GIÁ TRỊ CÁC THÔNG SỐ PHÂN MẢNH ẢNH HƯỚNG ĐỐI TƯỢNG PHÙ HỢP TRÊN PHẦN MỀM ECOGNITION: THỬ NGHIỆM TRÊN ẢNH VỆ TINH SPOT6

1. ĐẶT VẤN ĐỀ
Hiện nay, việc chiết tách thông tin lớp phủ bề mặt từ dữ liệu viễn thám chủ yếu sử dụng hai phương pháp chính: (1) Phương pháp phân loại dựa vào đặc trưng phổ của từng điểm ảnh (phương pháp phân loại truyền thống) thường được sử dụng để phân loại ảnh có độ phân giải không gian thấp và trung bình; (2) Phương pháp phân loại hướng đối tượng được phát triển và ứng dụng trong những năm gần đây, thường sử dụng để phân loại ảnh có độ phân giải không gian cao và siêu cao.
Phân loại định hướng đối tượng không dựa trên các điểm ảnh đơn lẻ mà dựa vào toàn bộ đối tượng mà mắt người có thể nhận biết được từ tập hợp các điểm trên ảnh, nên ngoài giá trị phổ thì hình dạng của đối tượng (shape), kiến trúc của đối tượng (texture) và mối quan hệ giữa các đối tượng cũng được xem xét phân tích trong phân loại. Quá trình phân loại này có thể chia thành 2 bước chính: (1) Phân mảnh ảnh; (2) Giải đoán ảnh sau phân mảnh để xác định đặc điểm của các đối tượng lớp phủ. Trong đó công tác phân mảnh ảnh có tác động rất lớn đến độ chính xác của kết quả giải đoán theo phương pháp phân loại hướng đối tượng.
Neubert et al, 2008 và Marpu et al, 2010 so sánh hơn mười phần mềm khác nhau kết luận rằng eCognition là một trong những phần mềm phân loại ảnh hướng đối tượng tốt nhất hiện nay. Trong đó, kỹ thuật phân mảnh ảnh đa độ phân giải (multiresolution) trên eCognition là phổ biến nhất. Nhưng việc phân mảnh ảnh theo kỹ thuật này lại phụ thuộc vào ba thông số: Scale parameter, Shape và Compactness (Hay et al, 2003; Maxwell, 2005; Marpu et al, 2010). Quá trình phân mảnh ảnh hiện nay chủ yếu được thực hiện bằng cách lựa chọn tập hợp các thông số sau đó chạy và kiểm tra bằng mắt đến khi tìm ra các thông số được cho là tốt nhất trên từng cảnh ảnh (Flanders et al., 2003; Maxwell, 2005; Platt và Rapoza, 2008). Quá trình này mất nhiều thời gian, chất lượng phân mảnh phụ thuộc nhiều vào kinh nghiệm của người giải đoán và việc đưa ra các thông số phân mảnh hiệu quả cho cảnh ảnh là thiếu sự thuyết phục.
Để góp phần giải quyết tồn tại trong công tác phân mảnh ảnh nêu trên việc: “Ước tính giá trị các thông số phân mảnh ảnh hướng đối tượng phù hợp trên phần mềm eCognition: thử nghiệm phân mảnh cho đối tượng rừng trên ảnh vệ tinh SPOT6 tại Đắk Nông” được thực hiện.
2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Vật liệu nghiên cứu:
Vật liệu nghiên cứu chủ yếu được sử dụng của bài báo gồm: (1) Ảnh vệ tinh SPOT6 chụp khu vực tỉnh Đắk Nông ngày 12 tháng 02 năm 2013, độ phân giải không gian là 6m với kênh đa phổ và 1,5m với kênh toàn sắc được nắn chỉnh trực giao phù hợp với địa hình ở mức xử lý 1T; (2) Các bài báo và công trình của các nhà khoa học đã công bố về vấn đề xác định thông số cho phân đoạn ảnh trên phần mềm eCognition.
2.2. Phương pháp nghiên cứu.
2.2.1. Phương pháp nghiên cứu nguyên lý phân mảnh ảnh đa độ phân giải trên phần mềm eCognition
Trong xử lý ảnh, sự chia nhỏ hình ảnh thành các phần dựa trên các tiêu chí: màu sắc (color), hình dạng (shape), độ chặt (compactness), độ trơn (smoothness) gọi là phân mảnh ảnh (Segment). Sản phẩm của công tác phân mảnh ảnh tạo ra các đối tượng ảnh gọi là các đối tượng nguyên thủy hay đối tượng chưa phân loại và là đầu vào của quá trình phân loại (giải đoán) ảnh. Mỗi đối tượng ảnh là một hoặc một nhóm Pixel có thể chứa các loại thông tin sau: (1) Thông tin về đặc trưng phổ ảnh của đối tượng; (2) Thông tin về các yếu tố hình dạng của đối tượng; (3) Thông tin về quan hệ của đối tượng với các đối tượng khác liền kề trên ảnh và; (4) Thông tin về quan hệ của đối tượng trên ảnh với các đối tượng bên ngoài ảnh lấy từ các nguồn thông tin khác như: bản đồ địa hình, bản đồ đất, bản đồ thuỷ văn, bản đồ hiện trạng...
Phần mềm eCognition cung cấp một số thuật toán cho phân mảnh ảnh như: chessboard segmentation, quatree based segmentation, multiresolution segmentation. Tuy nhiên, thuật toán thường xuyên được sử dụng trong quá tình xử lý ảnh là phân mảnh đa độ phân giải (Multi-segmentation). Nguyên nhân thuật toán này hay được sử dụng do: (1) Thuật toán cho phép làm giảm thiểu mức độ bất đồng nhất của đối tượng ảnh cho một độ phân giải nhất định; (2) Thuật toán có thể ứng dụng ở cả mức Pixel hoặc mức đối tượng ảnh; (3) Dễ sử dụng vì được thực hiện dựa theo việc lựa chọn các thông số về hình dạng (shape), màu sắc (color), độ chặt (compactness), độ trơn (smothness) của người phân loại. Như vậy, để phân mảnh theo thuật toán Multi-segmentation, các thông số phân mảnh được lựa chọn bởi người sử dụng. Giá trị của các thông số này phụ thuộc vào: (1) Loại ảnh; (2) thời gian chụp ảnh của từng loại ảnh; (3) đối tượng cần phân loại trên ảnh. Do đó, việc xác định các thông số này cần thực hiện cho từng cảnh ảnh cụ thể. Nghĩa là không thể xác định thông số chung áp dụng cho từng loại ảnh nhất định hoặc từng đối tượng nhất định trên ảnh.
Từ các phân tích trên, phương pháp tiếp cận trong nghiên cứu xác định các thông số phân mảnh phù hợp với đối tượng trên ảnh của bài báo này như sau: Giả sử có một đối tượng trên ảnh (một mảnh rừng, một hồ nước…) về nguyên tắc khi phân mảnh thì mỗi đối tượng này là một khoanh vi. Tuy nhiên, do chưa lựa chọn được các thông số phân mảnh phù hợp nên khi phân mảnh một đối tượng trên ảnh lại chứa nhiều khoanh vi hoặc khoanh vi không bám sát với đối tượng. Nếu coi đối tượng trên ảnh (Mảnh rừng, hồ nước…) là đối tượng đào tạo, khi phân mảnh ảnh theo các thông số mặc định của phần mềm (Scale parameter=10; Shape=0,1; Compactness=0,5) một đối tượng đào tạo thường chứa nhiều đối tượng con. Khi xác định được đối tượng đào tạo và đối tượng con của nó sẽ xác định được giá trị: (1) Thông tin về đặc trưng phổ ảnh; (2) Thông tin về các yếu tố hình dạng; (3) Thông tin về quan hệ của đối tượng với các đối tượng khác liền kề trên ảnh cho từng đối tượng con và đối tượng đào tạo. Từ các thông tin trên, kết hợp với thông số phân mảnh cho đối tượng con (theo mặc định của phần mềm) cần xác định các thông số phân mảnh (Scale parameter, Shape, Compactness) phù hợp cho đối tượng đào tạo để khi phân mảnh theo các thông số này sẽ tạo ra các đối tượng giống như đối tượng đào tạo.
Để xác định được các thông số phân mảnh ảnh phù hợp cần phải nắm rõ nguyên lý phân mảnh ảnh của phần mềm eCognition. Nguyên lý phân mảnh ảnh được nghiên cứu bằng phương pháp chuyên gia thông qua việc kế thừa các nghiên cứu của các tác giả đã công bố về vấn đề này. Trong đó, tập trung vào hai vấn đề chính: (1) Nguyên lý phân mảnh ảnh theo giá trị phổ và; (2) Nguyên lý phân mảnh ảnh theo hình dạng đối tượng là hai vấn đề đặc trưng của phân mảnh ảnh hướng đối tượng. Các công thức, nguyên lý rút ra từ nội dung này sẽ được sử dụng làm cơ sở để xác định các thông số phân mảnh ảnh hướng đối tượng phù hợp cho nội dung tiếp theo.
2.2.2. Phương pháp nghiên cứu xác định các thông số phân mảnh ảnh phù hợp
Từ nguyên lý phân mảnh ảnh căn cứ vào giá trị phổ và hình dạng đối tượng xác định được ở nội dung trên, thiết lập công thức tính toán ba thông số: Scale parameter, Shape, Compactness cho đối tượng đào tạo từ: (1) giá trị của các thông số ban đầu (Scale parameter=10, Shape=0,1, Compactness=0,5); (2) Sai tiêu chuẩn về phổ, giá trị đồng nhất về phổ của đối tượng với các đối tượng liền kề, độ sáng chung và số lượng Pixel của từng đối tượng con; (3) Sai tiêu chuẩn về phổ, giá trị đồng nhất về phổ của đối tượng với các đối tượng liền kề, độ sáng chung và số lượng Pixel của đối tượng đào tạo (chứa các đối tượng con).
Kết quả nghiên cứu được áp dụng để thử nghiệm xác định các thông số phân mảnh phù hợp và phân mảnh cho đối tượng rừng trên ảnh SPOT6 tại Đắk Nông.
3. KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN
3.1. Nguyên lý phân mảnh ảnh đa độ phân giải trên phần mềm eCognition.
Việc phân mảnh ảnh đa độ phân giải trên eCognition được thực hiện theo nguyên lý sau: ban đầu coi từng điểm ảnh (pixel) như một đối tượng riêng biệt sau đó từng đối tượng nhỏ kề nhau được hợp nhất thành đối tượng lớn hơn. Sự hợp nhất này dựa trên tiêu chuẩn không đồng nhất về: giá trị phổ (hspectral) và hình dạng (hshape) của đối tượng.
Sự không đồng nhất về phổ của hai đối tượng liền kề được định nghĩa là:

Trong đó: m là số lớp hình ảnh được lựa chọn cho phân mảnh, wi là trọng số của lớp i tham gia phân mảnh – thông thường giá trị này được chọn là 1, obj1 và obj2 là hai đối tượng liền kề được lựa chọn cho việc sáp nhập thành 1 đối tượng, n là số lượng điểm ảnh của đối tượng, obj1 + obj2 đại diện cho các đối tượng hợp nhất tạo thành từ sự kết hợp của hai đối tượng liền kề obj1 và obj2, và σi là độ lệch chuẩn của các đối tượng của lớp i (Benz et al, 2004).
Trong khi sự không đồng nhất về phổ chỉ sử dụng chỉ tiêu độ lệch chuẩn phổ, sự không đồng nhất về hình dạng (hshape) bao gồm: sự không đồng nhất về tính nhỏ gọn (hcompactness) và sự không đồng nhất về độ trơn của đối tượng (hsmoothness). Sự không đồng nhất về hình dạng được định nghĩa như sau: Trong đó: wcompactness là giá trị do người dùng định nghĩa có giá trị trong khoảng từ 0 đến 1, hcompactness là sự không đồng nhất về tính nhỏ gọn, hsmoothness là sự không đồng nhất về độ trơn của hai đối tượng liền kề được xác định theo các công thức sau (Benz et al, 2004):
Trong đó: lobj là chu vi của đối tượng; nobj là số lượng điểm ảnh của đối tượng, bobj là chu vi của khung giới hạn của đối tượng.
Sự không đồng nhất tổng thể do việc sáp hai đối tượng liền kề thành một đối tượng là tổng trọng số của hspectral và hshape được xác định theo công thức: Trong đó: wshape là tham số do người dùng định nghĩa cho sự thay đổi hình dạng không đồng nhất có giá trị từ 0,0-0,9.
Hai đối tượng liền kề trong quá trình phân mảnh đủ điều kiện để sáp nhập vào nhau nếu Mc xác định từ công thức (3.5) nhỏ hơn bình phương giá trị Scale parameter (S) do người dùng định nghĩa (Mc <S2). Quá trình sáp nhập cũng đòi hỏi bốn thông số người dùng xác định theo quy định của phương trình (3.1), (3.2), (3.4), (3.5) và (3.6). Những thông số người dùng định nghĩa là: S, wshape, wcompactness, và wi (i = 1 đến n).
3.2. Kết quả nghiên cứu lựa chọn các thông số phân mảnh ảnh phù hợp.
Mục đích của phân mảnh ảnh là lựa chọn được các thông số để khoanh vẽ các đối tượng có ý nghĩa trên ảnh, nghĩa là: đối tượng khoanh vẽ trên ảnh có hình dạng và kích thước giống với đối tượng che phủ đất ngoài thực tế. Vì vậy, việc phân mảnh hiệu quả cần xác định đối tượng chính cần quan tâm phân mảnh: nếu nghiên cứu xây dựng bản đồ hiện trạng rừng thì đối tượng quan tâm phân mảnh là các trạng thái rừng, nếu nghiên cứu xây dựng bản đồ thủy văn thì đối tượng quan tâm phân mảnh là hệ thống: hồ, sông, suối trên ảnh… Mặt khác, việc phân mảnh ảnh phụ thuộc vào ba thông số chính gồm: Scale parameter, Shape và compactness. Do đó, phân mảnh ảnh hiệu quả cần xác định các thông số phân mảnh phù hợp với đối tượng quan tâm nghiên cứu trên ảnh để cho số đối tượng tạo ra sau phân mảnh là nhỏ nhất. Phương pháp ước lượng tham số phân mảnh phải có khả năng ước tính giá trị khác nhau cho việc xác định các đối tượng ở những kích cỡ khác nhau. Từ các phân tích trên, tác giả đề xuất cách thức ước tính giá trị các tham số phân mảnh cho một đối tượng che phủ đất như sau:
- Cắt một phần ảnh khu vực nghiên cứu đặc trưng cho đối tượng (các trạng thái rừng) cần phân mảnh để ước tính các thông số phân mảnh (gọi là ảnh A).
- Phân mảnh cho ảnh A theo các thông số mặc định của phần mềm (Scale parameter=10; Shape=0,1; Compactness=0,5) đảm bảo tất cả các đối tượng trên ảnh được phân mảnh tương đối phù hợp nhưng nhược điểm là số lượng phân mảnh tạo ra rất lớn (Nếu áp dụng cho cả cảnh ảnh lớn có thể không thực hiện được vì dung lượng quá lớn).
- Lựa chọn các mảnh ảnh liền kề (đối tượng con) của một đối tượng quan tâm nghiên cứu trên ảnh (các mảnh ảnh của một đám rừng đồng nhất, các mảnh ảnh của một hồ nước đồng nhất…gọi là đối tượng đào tạo) để tính toán các giá trị về sai tiêu chuẩn giá trị phổ, sự khác biệt giá trị phổ trung bình giữa đối tượng lựa chọn với các đối tượng xung quanh, kích thước cho từng mảnh ảnh (đối tượng con) và cho đối tượng đào tạo (đối tượng to). + Trên hình 3.1 là kết quả lựa chọn các mảnh liền kề tạo nên đối tượng đào tạo là một mảnh rừng trên kết quả phân đoạn theo thông số mặc định ban đầu.
+ Trên hình 3.2 là đối tượng đào tạo cần xác định các thông số phân mảnh từ việc ghép các đối tượng con ban đầu.
- Mỗi đối tượng con (SO) và đối tượng đào tạo (TO) cần tính toán các chỉ tiêu sau:
+ Giá trị đồng nhất về phổ của một đối tượng: được xác định bằng độ lệch chuẩn và kích thước của đối tượng (phương trình 3.1). Độ lệch chuẩn của một đối tượng (σi) cho thấy sai số về phổ nội bộ của đối tượng và được (Maxwell, 2005) xác định theo công thức sau:

Trong đó: m là số band ảnh tham gia phân mảnh; σiobj là độ lệch chuẩn giá trị phổ của đối tượng tại band ảnh thứ i.
+ Giá trị đồng nhất về phổ của một đối tượng với các đối tượng liền kề (Spectral stability) được (Maxwell, 2005) xác định theo công thức sau:

Trong đó: m là số band ảnh tham gia phân mảnh; Dsiobj là giá trị đồng nhất về phổ của một đối tượng với các đối tượng liền kề tại band ảnh thứ i. Công thức xác định Dsiobj như sau: Trong đó: l là chu vi của đối tượng; p là số đối tượng liền kề; lsobjp là chiều dài của đường biên giới chung giữa đối tượng và một đối tượng liền kề p; là giá trị phổ trung bình của đối tượng; và là giá trị phổ trung bình của đối tượng liền kề p.
Một giá trị giá trị đồng nhất về phổ của đối tượng và giữa đối tượng với các đối tượng liền kề thấp hơn so với đối tượng đào tạo là cơ sở cho việc sáp nhập của các đối tượng con với nhau và ngược lại.
- Ước lượng các tham số: Scale parameter, shape, Compactness:
+ Uớc lượng tham số Scale parameter: là tham số quan trọng nhất vì nó quyết định kích thước trung bình của kết quả phân mảnh, là ngưỡng sáp nhập (hoặc không sáp nhập) của quá trình phân chia nhỏ một đối tượng (phương trình 3.5). Do đó, để ước lượng tham số Scale parameter cần sử dụng các thông tin kích thước của các đối tượng. Công thức ước lượng giá trị Scale parameter căn cứ vào các giá trị tính toán cho đối tượng con, đối tượng đào tạo và giá trị Scale parameter ban đầu (mặc định trong eCognition là 10) như sau:
S = S1 + (1-Wshape)*Sqrt(σTO - σSO)+ Sqrt(mTO - max(mSO)) (3.9)
Trong đó: S là thông số Scale parameter cần ước lượng; S1 là thống số Scale parameter ban đầu chạy tạo các đối tượng con; Wshape là giá trị tham số hình dạng Shape; σTO là giá trị đồng nhất về phổ của đối tượng đào tạo được xác định bằng công thức (3.6); σTO là trung bình giá trị đồng nhất về phổ của các đối tượng con; mTO là số điểm ảnh của đối tượng đào tạo; max(mSO) là số điểm ảnh của đối tượng con có kích thước lớn nhất.
- Ước lượng tham số hình dạng (Shape): Đối với việc sáp nhập các đối tượng con, có hai lựa chọn: (1) Tăng giá trị Scale parameter và giữ nguyên giá trị shape nhằm tăng mức độ không đồng nhất giá trị phổ; (2) Tăng cả giá trị Scale parameter và giá trị shape để giảm tác dụng của mức độ không đồng nhất giá trị phổ. Tham số hình dạng (Shape) được xem như là một cách để giảm bớt sự đóng góp của giá trị phổ trong công thức (3.5). Khác với giá trị của thông số Scale parameter được xác định thông qua sự đồng nhất giá trị phổ, kích thước của đối tượng đào tạo và các đối tượng con của nó thì giá trị của thông số Shape được xác định thông qua giá trị đồng nhất về phổ của đối tượng với đối tượng lền kề. Cụ thể:
+ Tính giá trị ki= Spectral stabilityi*mSOi cho tất cả các đối tượng con với: Spectral stabilityi là giá trị đồng nhất về phổ của đối tượng con i với các đối tượng liền kề (xác định theo công thức 3.7); mSOi là số điểm ảnh của đối tượng con thứ i. Các giá trị ki của đối tượng con và trung bình các giá trị này có liên quan đến hình dạng của đối tượng đào tạo. Nếu giá trị ki lớn nhất là lớn hơn nhiều so với giá trị ki trung bình thì giá trị WShape cần được tăng lên. Từ đó, giá trị WShape được ước lượng thông qua công thức sau:
WShape/(1-WShape) = ki(max)/ki(TB) (3.10)
Tuy nhiên, công thức (3.10) có nhược điểm là ki(max)/ki(TB) luôn lớn hơn 1, do đó giá trị WShape luôn lớn hơn 0,5 là không phù hợp với thực tế. (Dey Vivek, 2011) sử dụng giá trị ki(max) hiệu chỉnh bằng cách tính giá trị Yi là sự khác biệt độ sáng (Brightness) đối với độ sáng trung bình cho tất cả các đối tượng con, giá trị ki(max) chỉ xác định cho các đối tượng có Yi > Max(Yi) – Std(Yi). Sau đó sử dụng công thức (3.10) để xác định (WShape).
+ Ước lượng tham số Compactness: theo (Dey Vivek, 2011) giá trị WCompactness phụ thuộc tuyến tính vào giá trị Compactness của đối tượng đào tạo. Công thức xác định giá trị Compactness như sau: Trong đó: lobj là chu vi của đối tượng; nobj là số lượng điểm ảnh của đối tượng.
Dey Vivek, 2011 đưa ra công thức tính WCompactness như sau: Trong đó: CompactnessTO là giá trị Compactness xác định theo công thức (3.11) cho đối tượng đào tạo.
Sau khi tìm được các thông số phân mảnh phù hợp, sử dụng các thông số này để phân mảnh cho toàn cảnh ảnh.
3.3. Kết quả thử nghiệm xác định các thông số phân mảnh phù hợp cho ảnh SPOT6.
Trong nghiên cứu, sử dụng ảnh vệ tinh SPOT6 chụp ngày 12/2/2013 khu vực huyện Đắk Song, tỉnh Đắk Nông, mã hiệu DS_SPOT6_201302120247497, độ che phủ của mây 0,2%, góc thiên đỉnh 127,6990, góc cao mặt trời 47,40, gồm 4 band đa phổ và 1 band toàn sắc (Panchromatic) để thử nghiệm phân mảnh ảnh. Quá trình xác định các thông số phân mảnh được thực hiện như sau:
Bước 1: Mở ảnh cần phân mảnh trên ArcGIS, số hóa một mảnh rừng tương đối đồng nhất trên ảnh và lưu lại dưới dạng Shape file. Ranh giới mảnh rừng này được gọi là đối tượng đào tạo (đối tượng đích).
Bước 2: Mở ảnh và lựa chọn một khu vực chứa đối tượng đào tạo (đối tượng đích) cần thử nghiệm xác định các thông số phân mảnh phù hợp trên phần mềm eCognition (Hình 3.3).
Bước 3: Phân mảnh cho khu vực lựa chọn ở bước 2 với các tham số mặc định của phần mềm: (Scale parameter=10; Shape=0,1; Compactness=0,5) và trọng số của cả 4 band ảnh (Image Layer Weights) bằng 1 (Hình 3.4).
 
Bước 4: Lựa chọn tất cả các khoanh vi của đám rừng trong khung tại hình 3.5 và chuyển kết quả sang phần mềm ArcGIS định dạng Vector với các dữ liệu thuộc tính: Sai tiêu chuẩn (Standard deviation), giá trị đồng nhất về phổ của đối tượng với các đối tượng liền kề (Mean Diff. to neighbors) của từng band ảnh, độ sáng chung (Brightness) và số lượng Pixel (Area).
 
Bước 5: Ghép các khoanh vi ở bước 4 bằng công cụ Meger objects trên eCognition tạo thành khoanh vi tổng chưa toàn bộ mảnh rừng (hình 3.7) và chuyển kết quả sang phần mềm ArcGIS với dữ liệu thuộc tính tương tự như thực hiện tại bước 4.
Bước 6: Tính toán giá trị các thông số theo trình tự như sau: (1) Xác định giá trị trung bình về độ sáng (Brightness) của các đối tượng con; (2) Xác định sự khác biệt độ sáng với độ sáng trung bình (Yi) cho từng đối tượng con bằng hiệu của giá trị cấp độ sáng của đối tượng trừ đi giá trị cấp độ sáng trung bình; (3) Xác định giá trị lớn nhất của sự khác biệt cấp độ sáng Max(Yi) và sai tiêu chuẩn của sự khác biệt cấp độ sáng Std(Yi) sau đó lựa chọn các đối tượng con có Yi > Max(Yi) – Std(Yi); (4) Sử dụng công thức (3.7) để xác định giá trị đồng nhất về phổ của đối tượng với các đối tượng liền kề cho từng đối tượng con và đối tượng đào tạo; (5) Tính giá trị ki=Spectral stabilityi*mSOi cho tất cả các đối tượng con với: Spectral stabilityi là giá trị đồng nhất về phổ của đối tượng con thứ i với các đối tượng liền kề xác định theo công thức (3.7); mSOi là số điểm ảnh của đối tượng con thứ I sau đó tính giá trị trung bình của ki; (6) Xác định giá trị ki lớn nhất cho đối tượng con thỏa mãn điều kiện Yi >Max(Yi)–Std(Yi) xác định tại bước 3; (7) Sử dụng công thức (3.6) để xác định giá trị đồng nhất về phổ của từng đối tượng con và đối tượng đào tạo; (8) Sử dụng công thức (3.10) để xác định giá trị thông số Wshape (thông số Shape); (9) Sử dụng công thức (3.9) để xác định giá trị thông số S (Thông số Scale parameter); (10) Sử dụng công thức (3.11) và (3.12) để xác định giá trị thông số WCompactness (Thông số Compactness).
Kết quả ước lượng các thông số phân mảnh phù hợp cho đối tượng đào tạo tại hình 3.7 được tập hợp tại bảng sau:
Bảng 3.1. Kết quả ước lượng các thông số phân mảnh phù hợp cho đối tượng đào tạo
Thông số Giá trị các thông số phân mảnh ban đầu theo mặc định Giá trị các thông số xác định theo phương pháp nghiên cứu
Scale parameter 10 146
Shape 0,1 0,61
Compactness 0,5 0,40
 
Bước 7. Sử dụng các thông số ước tính được để phân mảnh cho toàn cảnh ảnh.
Kết quả sử dụng các thông số ước tính để phân mảnh ảnh cho cảnh ảnh được minh họa cho đối tượng đào tạo tại hình 3.8 và toàn cảnh ảnh tại hình 3.9. Kết quả phân mảnh theo các thông số ước tính được cho thấy: đối tượng tạo ra khi phân mảnh tại hình 3.8 sát và phù hợp với ranh giới của mảnh rừng là đối tượng đào tạo tại hình 3.5 chứng tỏ các thông số xác định được phù hợp với đối tượng đào tạo. Mặt khác, kết quả phân mảnh cho toàn bộ cảnh ảnh tại hình 3.9 cho thấy: ranh giới phân mảnh bám sát với ranh giới của các đám rừng trên ảnh. Như vậy, có thể sử dụng phương pháp này để xác định các thông số phân mảnh phù hợp cho từng loại đối tượng trên ảnh thông qua các bước công việc nêu trên.
 
Bước 7 đánh dấu sự chấm dứt của công việc với các thông số được chấp nhận và kết quả phân mảnh phù hợp với đối tượng cho toàn cảnh ảnh được tạo ra. Tuy nhiên, nếu kết quả phân mảnh chưa phù hợp thì có thể thay đổi các đối tượng đào tạo và thực hiện lại các bước công việc một lần nữa để lựa chọn ra các thông số phân mảnh phù hợp hơn.
Trong trường hợp đối tượng tạo ra sau phân mảnh khác với đối tượng đào tạo ban đầu chủ yếu do việc lựa chọn đối tượng đào tạo và đối tượng con ban đầu chưa phù hợp (một đối tượng đào tạo chứa nhiều trạng thái rừng) cần lựa chọn lại đối tượng đào tạo và các đối tượng con sau đó thực hiện lại các bước công việc để xác định các thông số phân mảnh phù hợp hơn.
Trong trường hợp kết quả phân mảnh theo các thông số ước tính còn chứa nhiều đối tượng liền kề có cùng trạng thái rừng thì lựa chọn lại đối tượng đào tạo với đối tượng con là kết quả phân mảnh theo các thông số ước tính. Trong trường hợp này, giá trị các thông số ước tính được coi là giá trị phân mảnh ban đầu thay cho giá trị mặc định của phần mềm và thực hiện lại các bước công việc để xác định lại các thông số phân mảnh lần thứ 2, thứ 3 cho đến khi kết quả phân mảnh cho đối tượng phù hợp.
Với người chưa có nhiều kinh nghiệm lựa chọn các thông số phân mảnh phù hợp cho đối tượng trên ảnh, có thể sử dụng giá trị thông số phân mảnh ban đầu theo mặc định của phần mềm như trong kết quả nghiên cứu (Scale parameter=10; Shape=0,1; Compactness=0,5).
Đối với người đã có nhiều kinh nghiệm về lựa chọn các thông số phân mảnh, có thể sử dụng các thông số ban đầu theo kinh nghiệm sau đó thực hiện các bước theo phương pháp này để xác định các thông số phù hợp sẽ giảm được số đối tượng con trong đối tượng đào tạo và quá trình tính toán các thông số phù hợp sẽ tiết kiệm được thời gian hơn. Để minh họa cho nhận định này, tác giả sử dụng thông số kinh nghiệm (Scale parameter=200; Shape=0,5; Compactness=0,8) để phân mảnh cho ảnh SPOT6 khu vực huyện Đắk G’Long, tỉnh Đắk Nông và lựa chọn một đối tượng trong khoanh tròn trên hình 3.10 làm đối tượng đào tạo. Các thông số phân mảnh phù hợp với đối tượng như sau: Scale parameter=464; Shape=0,597; Compactness=0,359. Kết quả phân mảnh theo các thông số ước tính minh họa tại hình 3.11. Nếu đường khoanh theo các thông số kinh nghiệm không bám sát đối tượng đào tạo có thể sử dụng chức năng Cut an Object Manually để tách một đối tượng thành hai đối tượng trước khi lựa chọn đối tượng con phù hợp với đối tượng đào tạo.
Mỗi đối tượng trên ảnh sẽ có thông số phân mảnh khác nhau. Do đó không thể có thông số phân mảnh nào phù hợp với tất cả các loại đối tượng trên ảnh. Vì vậy, để phân mảnh hiệu quả cho các loại đối tượng trên ảnh cần phải thực hiện theo phương pháp phân mảnh đa cấp theo loại đối tượng.
4. KẾT LUẬN
Việc phân mảnh ảnh đa độ phân giải trên eCognition được thực hiện theo nguyên lý: ban đầu coi từng điểm ảnh (pixel) như một đối tượng riêng biệt sau đó từng đối tượng nhỏ kề nhau được hợp nhất thành đối tượng lớn hơn. Sự hợp nhất này dựa trên tiêu chuẩn không đồng nhất về: giá trị phổ (hspectral) và hình dạng (hshape) của đối tượng.
Hai đối tượng liền kề trong quá trình phân mảnh đủ điều kiện để sáp nhập vào nhau nếu Mc xác định từ công thức (3.5) nhỏ hơn bình phương giá trị Scale parameter (S) do người dùng định nghĩa (Mc <S2). Quá trình sáp nhập cũng đòi hỏi bốn thông số người dùng xác định theo quy định của phương trình (3.1), (3.2), (3.4), (3.5) và (3.6). Những thông số người dùng định nghĩa là: S, wshape, wcompactness, và wi (i = 1 đến n).
Các bước thực hiện để ước tính giá trị các thông số phân mảnh gồm: (1) Mở ảnh cần phân mảnh trên ArcGIS hoặc Mapinfo, số hóa một đối tượng tương đối đồng nhất trên ảnh và lưu lại dưới dạng Shape file gọi là đối tượng đào tạo (đối tượng đích); (2) Mở ảnh và lựa chọn khu vực chứa đối tượng đào tạo (đối tượng đích) trên phần mềm eCognition; (3) Phân mảnh cho khu vực lựa chọn với các tham số mặc định của phần mềm: (Scale parameter=10; Shape=0,1; Compactness=0,5) hoặc theo các tham số kinh nghiệm và trọng số của các band ảnh bằng 1; (4) Lựa chọn tất cả các khoanh vi nằm trong đối tượng đào tạo và chuyển kết quả sang phần mềm ArcGIS định dạng Vector với các dữ liệu thuộc tính: Sai tiêu chuẩn (Standard deviation), giá trị đồng nhất về phổ của một đối tượng với các đối tượng liền kề (Mean Diff. to neighbors) của từng band ảnh, độ sáng chung (Brightness) và số lượng Pixel (Area) của từng đối tượng con; (5) Ghép các đối tượng con nằm trong đối tượng đào tạo bằng công cụ Meger objects trên eCognition tạo thành khoanh vi tổng và chuyển kết quả sang phần mềm ArcGIS với dữ liệu thuộc tính tương tự như thực hiện tại bước 4; (6) Từ mối quan hệ về phổ và hình dạng của đối tượng con và đối tượng đào tạo, tính toán giá trị các tham số: Scale parameter, Shape, Compactness. (7) Sử dụng các thông số xác định được để phân mảnh cho toàn bộ cảnh ảnh và đánh giá kết quả.
Kết quả nghiên cứu cho phép nhanh chóng ước tính được giá trị các thông số phân mảnh phù hợp với đối tượng kể cả với người chưa có nhiều kinh nghiệm về phân mảnh ảnh nên sẽ tiết kiệm được thời gian so với phương pháp phân mảnh truyền thống.

Bình luận (3)

zbdrariI

04-12-2024 13:33:24

555

zbdrariI

04-12-2024 13:32:41

555

zbdrariI

04-12-2024 13:32:14

555

Viết bình luận

Image Image

Đăng ký nhận thông tin

Đăng ký để nhận các thông tin cập nhật mới nhất về các sản phẩm của chúng tôi

Image