Geo Crowd

7
Tóm tắt: (crowdsourcing : nguồn lực đám đông) Với sự phổ biến của các thiết bị di động, Crowdsourcing đang nổi lên như một nền tảng mới và nó cho phép thực hiện các nhiệm vụ về không gian được giao và được thực hiện bởi worker. Trong paper này, lần đầu tiên chúng tôi giới thiệu một nguyên tắc phân loại về spatial crowdsourcing. Sau đó, chúng tôi sẽ tập trung vào một lớp của sự phân loại này, mà ở trong đấy, worker sẽ gửi thông tin vị trí của họ tới máy chủ tập trung, sau đó, máy chủ sẽ yêu cầu xác nhận tới những worker ở cạnh worker đc vừa gửi thông tin với mục tiêu tối đa hóa số lượng tổng thể nhiệm vụ được giao tới worker. Chúng tôi định nghĩa vấn đề tối đa hóa giao yêu cầu tới worker (MTA) trong spatial crowdsourcing và xác định những thách thức của nó. Chúng tôi đề xuất các giải pháp thay thế để giải quyết những thách thức trên bằng cách khai thác thuộc tính không gian của các vấn đề. Cuối cùng, đánh giá thực nghiệm của chúng ôi trên thế giới thực và cả dữ liệu tổng hợp để xác minh khả năng áp dụng các phương pháp đề xuất của chúng tôi , sau đó so sánh chúng bằng cách đo số lượng được giao và chi phí đi lại của worker. I. Giới thiệu Do sự phổ biến của cảm biến, mội người có 1 điện thoại di dộng có thể hoạt động như một điện thoại di động có thể hoạt động như cảm biến đa phương thức để thu thập dữ liệu ngay lập tức.( hình ảnh, âm thanh , tốc độ, gia tốc, hướng…) Nhiều nghiên cứu cho thấy sự tăng trưởng trong tương lai về số lượng worker điện thoại thông minh, các tính năng của phần cứng và phần mềm, bang thông rộng. Vì vậy, nó là rất quan trọng để sử dụng đầy đủ nền tảng mới cho các nhiệm vụ khác nhau, trong đó có triển vọng nhất là spatial crowdsourcing . Trong paper này, chúng tôi giới thiệu spatial crowdsourcing như là quá trình thu thập dữ liệu từ đám đông nhờ vào các nhiệm vụ/yêu cầu đc trả lời bời worker khi được yêu cầu. Xem xét trong 1 tình huống cụ thể là khi yêu caaif những hình ảnh, video từ một cuộc biểu tình phản đối chính phủ từ nhiều địa điểm khác nhau trong cùng 1 thành phố. Thay vì chúng ta phải tự mình đi tới các địa điểm của mỗi sự kiện, chúng ta chỉ cần gửi yêu cầu lên máy chủ. Từ đó, máy chủ sẽ truy vấn các worker trong vùng lân cận đó để xử lý thông tin trả lại cho người gửi yêu cầu.

description

Geo Crowd

Transcript of Geo Crowd

Page 1: Geo Crowd

Tóm tắt: (crowdsourcing : nguồn lực đám đông)

Với sự phổ biến của các thiết bị di động, Crowdsourcing đang nổi lên như một nền tảng mới và nó cho phép thực hiện các nhiệm vụ về không gian được giao và được thực hiện bởi worker. Trong paper này, lần đầu tiên chúng tôi giới thiệu một nguyên tắc phân loại về spatial crowdsourcing. Sau đó, chúng tôi sẽ tập trung vào một lớp của sự phân loại này, mà ở trong đấy, worker sẽ gửi thông tin vị trí của họ tới máy chủ tập trung, sau đó, máy chủ sẽ yêu cầu xác nhận tới những worker ở cạnh worker đc vừa gửi thông tin với mục tiêu tối đa hóa số lượng tổng thể nhiệm vụ được giao tới worker. Chúng tôi định nghĩa vấn đề tối đa hóa giao yêu cầu tới worker (MTA) trong spatial crowdsourcing và xác định những thách thức của nó. Chúng tôi đề xuất các giải pháp thay thế để giải quyết những thách thức trên bằng cách khai thác thuộc tính không gian của các vấn đề. Cuối cùng, đánh giá thực nghiệm của chúng ôi trên thế giới thực và cả dữ liệu tổng hợp để xác minh khả năng áp dụng các phương pháp đề xuất của chúng tôi , sau đó so sánh chúng bằng cách đo số lượng được giao và chi phí đi lại của worker.

I. Giới thiệu

Do sự phổ biến của cảm biến, mội người có 1 điện thoại di dộng có thể hoạt động như một điện thoại di động có thể hoạt động như cảm biến đa phương thức để thu thập dữ liệu ngay lập tức.( hình ảnh, âm thanh , tốc độ, gia tốc, hướng…) Nhiều nghiên cứu cho thấy sự tăng trưởng trong tương lai về số lượng worker điện thoại thông minh, các tính năng của phần cứng và phần mềm, bang thông rộng. Vì vậy, nó là rất quan trọng để sử dụng đầy đủ nền tảng mới cho các nhiệm vụ khác nhau, trong đó có triển vọng nhất là spatial crowdsourcing .

Trong paper này, chúng tôi giới thiệu spatial crowdsourcing như là quá trình thu thập dữ liệu từ đám đông nhờ vào các nhiệm vụ/yêu cầu đc trả lời bời worker khi được yêu cầu. Xem xét trong 1 tình huống cụ thể là khi yêu caaif những hình ảnh, video từ một cuộc biểu tình phản đối chính phủ từ nhiều địa điểm khác nhau trong cùng 1 thành phố. Thay vì chúng ta phải tự mình đi tới các địa điểm của mỗi sự kiện, chúng ta chỉ cần gửi yêu cầu lên máy chủ. Từ đó, máy chủ sẽ truy vấn các worker trong vùng lân cận đó để xử lý thông tin trả lại cho người gửi yêu cầu.

Trong khi crowdsourcing gần đây cũng đã thu hút cả 2 cộng đồng nghiên cứu( ví dụ, cơ sở dữ liệu, xử lý ảnh, công nghiệp,) nhưng chỉ có 1 vài công việc đã nghiên cứu spatial crowdsourcing. Hơn nữa, hầu hết công việc hiện có trên spatial crowdsourcing tập trung vào lớp spatial crowdsourcing được gọi là participatory sensing. Với participatory sensing, mục đích là để khai thác thông tin tư worker điện thoại cho một chiến dịch nhất định, bằng cách tận dụng các thiết bị di động trang bị cảm biến của họ để thu thập và chia sẻ dữ liệu. Một số ví dụ thực tế về participatory sensing như báo cáo tuyến đường đi xe của họ đến một một máy chủ trong quá trình chuyển hàng.cùng với thông tin về chất chượng không khí, nguy hiểm, trạng thái giao thông, tai nạn… , . Thu thập thông tin lưu lượng và tải của xe vận chuyển lên server trong thời gian thực, => máy chủ tính toán, ước lượng lưu lượng, dự đoán trở lại cho worker…

Các nghiên cứu được ví dụ ở trên tập trung vào từng chiến dịch đơn lẻ và giải quyết từng thách thức cụ thể với từng chiến dịch. Ví dụ 18,29 là chiến dịch để theo dõi ô nhiễm không khí trong đô thị. Tuy nhiên chúng tôi tập trung vào việc đưa ra khuôn khổ chung trong crowdsourcing, tương tự như Amazon Turk nhưng cụ thể là spatial, nơi mà nhiều chiến dịch cần phải xử lý đồng thời. Hơn nữa, hầu hết các nghiên cứu hiện tại về sự tham gia của cảm biến tập trung vào các chiến dịch nhỏ với số lượng hạn chế của

Page 2: Geo Crowd

worker và không có khả năng mở rộng thành các ứng dụng lớn về spatial crowsourcing. Cuối cùng, spatial crowdsourcing subsumes participatory sensing bằng cách giới thiệu một khuôn khổ chung sẽ cho phép giải quyết bất kỳ hình thức nào nhiệm vụ không gian được giao được thực hiện bởi con người.

Trong paper này, lần đầu tiên chúng tôi giưới thiệu một nguyên tắc phân loại cho SC . Đầu tiên , chúng tối dựa vào động lực của người dân. Sau đó, chúng tôi định nghĩa 2 phương thức cho 2 phương thức cho 2 nhiệm vụ không gian công bố. Cuối cùng, chúng ta định nghia 2 cách để phân công nhiệm vụ (thu thập dữ liệu đám đông) . CHúng ta tập trung vào 1 lớp của SC, trong đó 1 tập hợp worker gửi yêu cầu tới máy chủ SC. Nhiệm vụ vụ yêu cầu của worker, mà trong đó bao gồm địa điểm anh ấy cùng với 1 tập các rang buộc khác -> để thông báo cho máy chủ . Do đó, máy chủ SC nhận được vị trí của worker đấy, phân công nhiệm vụ cho các worker khác ở cạnh . Trong lớp này của SC, mục tiêu tối ưu hóa chính là để tối đa hóa nhiệm vụ tổng thể phù hợp với những rang buộc của mỗi worker. Chúng tôi đề cập tới vấn đề này như vấn đề MTA . Giải pháp cho MTA có thể là đơn giản nếu máy chủ SC đã có một kiến thức chung của cả nhiệm vụ không gian lẫn worker. Tuy nhiên, máy chủ SC luôn liên tục nhận đc các nhiệm vụ không fian được yêu cầu và cũng liên tục gửi các yêu cầu đi tới worker khác. Do đó, máy chủ SC chỉ có thể tối đa hóa việc giao nhiệm vụ tại mỗi trường hợp và không biết tới tương lai.

Chúng tôi đề xuất 3 giải pháp thay thế cho các vấn đề MTA. Phương pháp tiếp cận đầu tiên là Greedy(GR-> tham lam), sau đây các chiến lược tối ưu hóa địa phương bằng cách tối đa hóa nhiệm vụ tại mỗi trường hợp. Phương pháp GR sử dụng những rang buộc của worker để gán nhiệm vụ cho mỗi công nhân gần đó. Phương pháp tiếp cận thứ 2 được gọi là Least Location Entropy Priority.(LLEP). Phương pháp này cỉa thiện GR bằng cách sử dụng các dữ liệu địa điểm ngẫu nhiên Thuật toán địa điểm ngẫu nhiên dựa vào trực giác rằng nhiệm vụ không gian có nhiều khả năng sẽ đc thực hiện trong tương lai nếu chúng ta đặt trong khu vực có lượng worker nhiều hơn. Vì vậy cách tiếp cận LLEP cải thiện việc giao nhiệm vụ tổng thể bằng cách gán ưu tiên cao hơn cho nhiệm vụ không gian nằm ở những nơi có ít hơn số vị trí ngẫu nhiên vì họ có ít khả năng hoàn thành công việc được giao trong tương lai. Với CS, kể từ khi worker nên đi đến một địa điểm để thực hiện nhiệm vụ của mình, chi phí đi lại của worker cũng là 1 yếu tố quan trọng VÌ vậy, cách tiếp cân thứ 3 của chúng tôi được gọi là hang xóm gần nhất ưu tiên(NNP), kết hợp với chi phí đi lại của người lao động vào việc giao nhiệm vụ bằng cách gán ưu tiên cao hơn cho chu trình có chi phí thấp hơn. Thí nghiệm rộng lớn của chúng tôi trên cả dữ liệu thực thế và tổng hợp cho thấy LLEP có thể cải thiện số lượng các nhiệm vụ đc giao lên tới 36%, trong khi NNP có thể lên tới 41%. Do đó, dựa vào mục tiêu của các ứng dụng, hoặc là LLEP hay NNP có thể đc áp dụng để giải quyết MTA

Phần 2: giới thiệu về phân loại cho SC,phần 3, thảo luận về tập hợp sơ đồ chung của SC và đặt ra vấn đề MTA, phần 4 giải thích giải pháp phân công nhiệm vụ, phần 5, kết quả thí nghiệm. Phần 6, các công việc liên quan, phần 7, kết luận vào thảo luận về định hướng tương lai

II. Phân loại SCII.1. Phân loại SC

- Reward-based SC: mỗi worker sẽ nhận đc 1 vài phần thưởng nào đấy khi hoàn thành chính xác nhiệm vụ. Ví dụ 37.

- Self-incentivised SC : worker hoàn thành nhiệm vụ 1 cách tự nguyện.Ở đây, mọi người thường có đc những sự khuyến khác hơn là phần thưởng như ghi lại một sự kiện hoặc quảng bá một quan điểm văn hóa,chính trị, tôn giáo của họ. Ví dụ như chiến dịch participatory sensing ở ghi chú 2,10. Worker di động tự nguyện chia sẻ thông tin về giao thông. Paper này sẽ tập trung vào phần này

Page 3: Geo Crowd

2.2. Spatial Task publishing modes- Worker selected Tasks (WST) mode Với chế độ này, máy chủ SC công khai tuyên bố nhiệm vụ không gian. Worker online có thể chọn bất cứ công việc không gian trong vùng lân cận của họ mà khòng cần phải phối hợp với các máy chủ SC. Một lợi thế của chế độ này là kể từ khi worker có thể chọn bất cứ công việc tùy tiền ở gần chúng một cách chủ động. ĐIều này dẫn đến một số nhiệm vụ không gian có thể sẽ không bao giờ đc chọn, một số nhiệm vụ khác có thể bị thừa. Một nhược điểm nữa của WST là worker sẽ chọn những nhiệm vụ dựa trên các tiêu chí trên của họ (ví dụ chọn k nhiệm vụ không gian gần nhất để giảm thiểu chi phí du lịch) mà không nhất thiết giảm thiểu chi phí tổng thể(nhiệm vụ cuối cùng của máy chủ SC). Một ví dụ về WST là ở 12, nơi worker duyệt có sẵn

- Server Assigned Tasks(SAT) mode Với chế độ này, máy chủ SC sẽ không công bố nhiệm vụ cho worker. Thay bào đó, bất kì một worker online nào đó gửi thông tin vị trí của mình tới máy chủ SC. Máy chủ sau khi nhận được địa điểm của tất cả các công nhân online sẽ chỉ định cho mỗi worker nhiệm vụ ở gần đấy.(do worker khác truy vấn ở gần đó). Ưu điểm của SAT không giống WST, SAT có được cái nhìn tổng quát, do đó có thể gán cho mỗi công nhân nhiệm vụ closeby mình -> tối ưu hóa được việc giao nhiệm vụ tổng thể. Tuy nhiên, nhược điểm của SAT là những worker nên báo cáo địa điểm của họ tới máy chủ SC cho mỗi một nhiệm vụ, cái có thể gây ra mối đe dọa về bảo mật thông tin cá nhân worker. Ví dụ về chế độ SAT là 23. Trong đó đề xuất 1 khuôn khổ cho các chiến dịch nhỏ, nơi các worker được giao nhiệm vụ sensor gần họ. Trọng tâm của chúng tôi trong paper này là chế độ này của spatial crowdsourcing.

2.3. Spatial task assignment modes

Tới đây, chúng ta mới chỉ bàn luaajnveef sự khác nhau giữa các kiểu SC và làm thể nào để nhiệm vụ không gian có thể được công bố. Tuy nhiên, chúng ta chưa bàn đến việc làm thế nào để xác minh tính đúng đắn của các nhiệm vụ đc hoàn thành bởi worker. Worker ác ý sẽ có thể đẩy thông tin sai lệch (ví dụ đưa ra thông tin sai của hiện trạng giao thông tại địa điểm đó). Trong phần này, chung ta sẽ định nghĩa 2 cách để phân công việc làm thế nào để xác minh tính hợp lệ của các nhiệm vụ không gian được giao “single-based task assignment” và “redundant-based task assignment”

+) Sigle Task AssigenmentCác giả định chung ở đây là worker được tin tưởng và do đó họ hoàn thành các nhiệm vụ không

gian một cách chính xác mà không có bất kỳ ý định xẫu nào. Do đó mỗi nhiệm vụ không gian chỉ được giao cho một công nhân (tốt cho worker gần nhất). Ví dụ của lớp này là 15 và 23. Trong paper này chúng ta tập trung vào cách phân công này

+) Redundant Task Assignmentở đây, giả thuyết trực quan, dựa trên ý tưởng khôn ngoan của đám đông [33] , là phần lớn các công nhân có thể được tin cậy. Do đó các dữ liệu với đa số phiếu được xác minh sẽ là đúng. Điều này chỉ ra rằng thay vì mỗi công việc được hoàn thành bởi một nhân viên cụ thể, nó sẽ được hoàn thành dựa bào k worker gần đó, nơi mà k được xác định bởi yêu cầu của người đưa ra truy vấn. Do đó, với một giá trị K cao hơn thì cơ hội nhận được kết quả chính xác sẽ hơn.Ví dụ ở [1]

Page 4: Geo Crowd

III. Chuẩn bị

+) ĐỊnh nghĩa 1: (Spatial task) một nhiệm vụ không gian với form <l, q, s, δ> là một truy vấn q, được trả lời tại vị trí l (1 điểm thuộc không gian 2 chiều) .tại thời điểm s và yêu cầu phải thực hiện với thời gian tối đa δ.

+) Định nghĩa 2: (Spatial crowdsourcing query – SC query) : form (<t1, t2, ...> , k) là một tập hợp các nhiệm vụ không gian và mỗi nhiệm vụ không gian với k phản hồi từ worker.

CHÚ Ý: với Chế độ phân công single task assigenemt mode, máy chủ SC nên chủ phân công mỗi task là 1 worker phản hồi. ( k = 1)

+) ĐỊnh nghĩa 3: (Worker) kí hiệu là w như là 1 người sử dụng thiết bị di động, người tình nguyện thực hiện nhiệm vụ không gian. Một worker có thể được 1 trong 2 chế độ online hoặc offline. Một worker online khi sẵn sàng chấp nhận nhiệm vụ. Worker sẽ gửi Task inquiry – TI tới máy chủ SC như hình 2)

+) ĐỊnh nghĩa 4: (Task Inquiry– TI – nhiệm vụ điều tra) .là yêu cầu mà 1 worker online gửi tới máy chủ SC khi sẵn sang hoạt động. TI bao gồm vị trí của w là l cùng với 2 ràng buộc: một khi vực không gian R, số nhiệm vụ tối đa có thêt chấp nhân đc maxT. Các khu vực được biểu diễn bằng 1 hình chữ nhật là vùng mà worker có thể accept nhiệm vụ. Nói cách khác, bất cứ công việc bên ngoài khu vực sẽ bị từ chối bởi worker. Hơn nữa, maxT là số lượng tối đa các công việc mà người lao động sẵn sàng để thực hiện.

Chú ý: TI được định nghĩa bởi SAT mode, nơi worker nên gửi dữ liệu vị trí của họ tới máy chủ SC để được phân công nhiệm vụ thích hợp. những worker cũng có thể chỉ ra các rang buộc khác trong TI của họ (ví dụ loại việc, số lượng thời gian họ có..). Tuy nhiên, trong công việc này, chúng ta chỉ xem xét 2 ràng buộc R và maxT cho mỗi worker.

Một khi worker gửi TI của họ , máy chủ sẽ gán cho mỗi worker một tập hợp các nhiệm vụ, trong khi đáp ứng các rang buộc của công nhân. Tuy nhiên, việc giao nhiệm vụ không phải là một quá trình một lần. Các máy chủ SC sẽ liên tục nhận được yêu cầu từ người truy vấn và TI từ worker. Do đó, chúng ta định nghĩa khái niệm về vuệc phân công nhiệm vụ ví dụ như tập hợp, là tập hợp các nhiệm vụ được giao cho từng trường hợp nhất định.

+) Định nghĩa 5: (Task assignment instance set - I i) . Gọi tập Wi={w1, w2, ...} là tập hợp worker online tại thời điểm si, Ti={t1, t2, ...} là tập các nhiệm vụ sẵn có tại thời điểm si. Ii là tập hợp của form <w, t> ,nơi 1 nhiệm vụ t được gán cho 1 worker w và phải thỏa mãn các rang buộc TI của công nhân đó. Ngoài ra, | I i | biểu thị số lượng các nhiệm vụ được giao tại thời điểm si.

Ta có mỗi tuple <w,t> ∈I i, nhiệm vụ t phải nằm trong vùng R, 1 công nhân thực hiện nhiều nhất maxT nhiệm vụ

+) Định nghĩa 6: MTA : Với mỗi khoảng thời gian ϕ = {s1, s2, ..., sn}, với | I i| là số lượng nhiệm vụ được giao tại thời điểm si. Vấn đề MTA là quá trình của việc giao nhiệm vụ tới worker trong

quãng thời gian ϕ để cho số lượng tổng nhiệm vụ được giao là max (∑1

n

|I i| là max)

Page 5: Geo Crowd

IV. Giao thức giao nhiệm vụ