paint-brush
Kiến trúc FaaS và tính công bằng có thể kiểm chứng cho hệ thống MLby@escholar
266

Kiến trúc FaaS và tính công bằng có thể kiểm chứng cho hệ thống ML

Phần này trình bày kiến trúc của Dịch vụ công bằng (FaaS), một hệ thống mang tính cách mạng nhằm đảm bảo sự tin cậy vào các cuộc kiểm tra tính công bằng trong học máy. Cuộc thảo luận bao gồm mô hình mối đe dọa, tổng quan về giao thức và các giai đoạn thiết yếu: thiết lập, tạo mật mã và đánh giá tính công bằng. FaaS giới thiệu một cách tiếp cận mạnh mẽ, kết hợp các bằng chứng mật mã và các bước có thể xác minh, cung cấp nền tảng an toàn để đánh giá công bằng trong bối cảnh ML.
featured image - Kiến trúc FaaS và tính công bằng có thể kiểm chứng cho hệ thống ML
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

Bài viết này có sẵn trên arxiv theo giấy phép CC BY 4.0 DEED.

tác giả:

(1) Ehsan Toreini, Đại học Surrey, Anh;

(2) Maryam Mehrnezhad, Đại học Hoàng gia Holloway Luân Đôn;

(3) Aad Van Moorsel, Đại học Birmingham.

Bảng liên kết

Tóm tắt & Giới thiệu

Bối cảnh và công việc liên quan

Kiến trúc FaaS

Phân tích thực hiện và hiệu suất

Phần kết luận

Lời cảm ơn và tài liệu tham khảo

3 Kiến trúc FaaS

Trong Phần này, chúng tôi trình bày kiến trúc hệ thống của chúng tôi (Hình 1) và mô tả các tính năng của nó. Kiến trúc FaaS bao gồm các bên liên quan với ba vai trò: A) Hệ thống ML: hệ thống sở hữu dữ liệu và thuật toán ML, B) Dịch vụ kiểm toán công bằng: dịch vụ tính toán hiệu suất hợp lý của hệ thống ML và C) Trình xác minh toàn cầu: bất kỳ ai người có chuyên môn kỹ thuật và động lực để xác minh quá trình kiểm toán.

3.1 Mô hình mối đe dọa

Việc thiết kế và triển khai bảo mật của các bên thực hiện vai trò giao thức tương ứng (hệ thống ML, Dịch vụ kiểm toán công bằng và Trình xác minh toàn cầu) (Hình 1) độc lập với nhau. Việc giao tiếp giữa các vai trò diễn ra không có sự tin tưởng giữa các bên; do đó, tất cả các khiếu nại của họ phải kèm theo bằng chứng xác thực (mà chúng tôi sẽ sử dụng ZKP). Chúng tôi cho rằng Hệ thống kiểm toán dễ bị tấn công bởi các cuộc tấn công khác nhau và không đáng tin cậy. Do đó, dữ liệu được lưu trữ trên Hệ thống kiểm toán công bằng phải được mã hóa, chống giả mạo và có thể xác minh ở tất cả các giai đoạn. Hơn nữa, chúng tôi cho rằng kênh liên lạc giữa hệ thống ML và kiểm toán viên công bằng không được bảo vệ. Do đó, dữ liệu nhạy cảm phải được mã hóa trước khi quá trình truyền bắt đầu. Tuy nhiên, sẽ có một thỏa thuận về các nguyên tắc mã hóa nguyên thủy ở giai đoạn cài đặt trước trong trình tự giao thức.


Trong FaaS, chúng tôi giả định rằng hệ thống ML trung thực trong việc gửi mật mã nhãn gốc của các mẫu tập dữ liệu. Người ta có thể lập luận chống lại giả định đó và thảo luận rằng hệ thống ML có thể có ý định đánh lừa Dịch vụ kiểm toán và bằng cách mở rộng những người xác minh, bằng cách sửa đổi nhãn thực tế của tập dữ liệu. Ví dụ: hệ thống ML sẽ cung cấp mật mã của các nhãn thực tế và các nhãn được dự đoán giống nhau nhất có thể để kiểm toán viên kết luận các thuật toán là công bằng. Đây là một lĩnh vực thú vị để nghiên cứu thêm. Ví dụ: vấn đề này có thể được giải quyết bằng cách cung cấp mật mã của các nhãn thực tế cho Dịch vụ kiểm toán một cách độc lập, ví dụ: người xác minh có thể sở hữu tập dữ liệu mà nó cung cấp cho hệ thống ML. Sau đó, trình xác minh sẽ quyết định riêng các giá trị mong muốn cho nhãn thực tế và cung cấp các giá trị này cho dịch vụ Kiểm tra viên. Theo cách này, hệ thống ML không rõ ràng lắm về cách thao tác dữ liệu mà nó gửi cho kiểm toán viên, vì một số nhãn đến từ nơi khác.


Tính bảo mật nội bộ của các vai trò vượt xa FaaS. Bản thân hệ thống ML cần xem xét các biện pháp bổ sung để bảo vệ dữ liệu và thuật toán của mình. Chúng tôi cho rằng hệ thống ML trình bày dữ liệu và dự đoán một cách trung thực. Đây là một giả định hợp lý vì động cơ khuyến khích thực hiện có đạo đức trái ngược với hành vi không trung thực khi tham gia vào quá trình kiểm toán tính công bằng. Điều này được thảo luận nhiều hơn trong Phần thảo luận.


Bảng 2: Các hoán vị có thể có của cách biểu diễn 3 bit của một mục trong dữ liệu gốc.

3.2 Tổng quan về giao thức

Trình tự giao thức bảo mật chính nằm giữa hệ thống ML và Dịch vụ kiểm toán công bằng hoặc đơn vị kiểm tra ở dạng ngắn gọn. Lưu ý rằng mặc dù chúng tôi đề xuất ba vai trò trong kiến trúc của mình, nhưng hoạt động liên lạc chủ yếu diễn ra giữa hai vai trò trên và bất kỳ người xác minh phổ quát nào cũng có thể chuyển sang dịch vụ kiểm toán viên (đại diện cho hội đồng công bằng) nếu họ muốn thách thức các tính toán.


Hệ thống ML chịu trách nhiệm triển khai và thực thi thuật toán ML. Nó có dữ liệu làm đầu vào và thực hiện một số dự đoán (tùy thuộc vào trường hợp và mục đích sử dụng) để tạo thành đầu ra (Hình 1). Dịch vụ Kiểm toán Công bằng nhận thông tin từ hệ thống ML, đánh giá hiệu suất công bằng của nó bằng cách tính toán số liệu công bằng. Sau đó, nó trả về kết quả của số liệu cho hệ thống ML. Nó cũng công bố các tính toán trong một bảng công bằng để công chúng xác minh. Hội đồng công bằng công khai là một hội đồng công bằng chỉ có thể đọc và có thể truy cập công khai (ví dụ: một trang web). Kiểm toán viên chỉ có quyền bổ sung dữ liệu (và các bằng chứng đầy đủ) vào hội đồng công bằng. Ngoài ra, kiểm toán viên xác minh tính xác thực, tính chính xác và tính toàn vẹn của dữ liệu trước khi xuất bản nó.

3.3 Trình tự giao thức

Giao thức này có ba giai đoạn: thiết lập, tạo mật mã và tính toán số liệu công bằng.

3.3.1 Giai đoạn I: Thiết lập

Trong giai đoạn này, Hệ thống ML và Kiểm toán viên thống nhất về các cài đặt ban đầu. Chúng tôi giả sử các chức năng giao thức trong cài đặt nhóm tuần hoàn nhân (tức là nhóm giống như Thuật toán chữ ký số (DSA) [18]), nhưng nó cũng có thể hoạt động trong các nhóm tuần hoàn phụ gia (ví dụ: các nhóm giống như Thuật toán chữ ký số đường cong Elliptic (ECDSA) [18 ]). Kiểm toán viên và hệ thống ML đồng ý công khai về (p, q, g) trước khi bắt đầu giao thức. Cho p và q là hai số nguyên tố lớn trong đó q|(p − 1). Trong nhóm tuần hoàn nhân (Z ∗ p ), Gq là nhóm con cấp nguyên tố q và g là nhóm sinh của nó. Để đơn giản, chúng tôi giả sử bài toán Quyết định Diffie–Hellman (DDH) nằm ngoài phạm vi [31].

Tiếp theo, hệ thống ML tạo khóa cặp công khai/riêng bằng cách sử dụng DSA hoặc ECDSA và xuất bản khóa chung trong bảng công bằng. Khả năng bảo vệ cặp khóa riêng phụ thuộc vào kiến trúc bảo mật của hệ thống ML và chúng tôi giả sử khóa riêng được lưu trữ an toàn theo tiêu chuẩn công nghiệp (ví dụ: sử dụng mô-đun bộ nhớ an toàn trên bo mạch).


Bảng mật mã: Sau các thỏa thuận ban đầu, hệ thống ML tạo ra một bảng mật mã có n hàng tương ứng với số lượng mẫu trong tập dữ liệu thử nghiệm của chúng. Chúng ta sẽ gọi bảng này là bảng mật mã trong phần còn lại của bài viết này. Trong trường hợp hệ thống ML không muốn tiết lộ số lượng mẫu trong bộ kiểm tra, kiểm toán viên và hệ thống ML có thể thỏa thuận công khai về n. Trong trường hợp này, n phải đủ lớn để những người xác minh tổng thể hài lòng với kết quả.


Mỗi hàng trong bảng mật mã tóm tắt ba tham số: (1) trạng thái thành viên nhóm được bảo vệ, (2) nhãn thực tế của nó và (3) nhãn được dự đoán theo mô hình ML. Mỗi hàng chứa định dạng được mã hóa của ba tham số cùng với bằng chứng về tính chính xác của nó. Bảng mật mã trong giai đoạn thiết lập được hiển thị trong Bảng 3. Trong trường hợp đơn giản nhất, mỗi tham số là nhị phân. Do đó, các tham số kết hợp sẽ tạo ra tổng cộng tám hoán vị. Trong giai đoạn thiết lập, bảng được tạo để chứa tất cả tám hoán vị có thể có và cách chứng minh chúng cho từng mẫu dữ liệu. Cấu trúc tổng thể của các hoán vị được trình bày trong Bảng 2. Mỗi hàng sẽ thỏa mãn bốn thuộc tính: (a) người ta có thể dễ dàng xác minh xem một mật mã đơn lẻ có phải là phiên bản được mã hóa của một trong tám hoán vị có thể hay không, (b) trong khi có thể kiểm chứng được, nếu chỉ một mật mã duy nhất được chọn, người ta không thể thực hiện các hoán vị mà mật mã hiện tại đại diện, (c) đối với mỗi hai mật mã được chọn từ một hàng, bất kỳ ai cũng có thể phân biệt từng mật mã với nhau và (d) đưa ra một bộ mật mã được chọn tùy ý từ mỗi hàng dưới dạng một tập hợp, người ta có thể dễ dàng kiểm tra xem có bao nhiêu trường hợp cho mỗi “hoán vị” trong tập hợp đó.


Việc tạo ra các hàm bảng mật mã dựa trên trình tự sau:


Bước (1): Với mỗi n mẫu, hệ thống tạo một khóa chung ngẫu nhiên g xi trong đó xi là khóa riêng và xi ∈ [1, q − 1].


Bước (3): Số cột tương ứng bằng giá trị thập phân của bảng mã nhị phân được chọn từ bảng mật mã để hoàn thành bảng kiểm tra tính công bằng (như trong Bảng 2).


Cuối cùng, bảng kiểm tra tính công bằng được tạo ra sẽ được hệ thống ML ký điện tử và sau đó được gửi qua dịch vụ kiểm tra tính công bằng.

3.3.3 Giai đoạn III: Đánh giá tính công bằng

Đầu tiên, dịch vụ kiểm toán công bằng nhận bảng kiểm tra công bằng, xác minh chữ ký số và ZKP, đồng thời công bố nội dung trong bảng công bằng.


Tại thời điểm này, chúng tôi mở rộng từng thành phần phương trình này để so sánh chúng với nhau.


Quá trình này nặng về mặt tính toán, đặc biệt khi số lượng mẫu dữ liệu trong bảng kiểm tra tính công bằng lớn. Trong trường hợp này, kiểm toán viên công bằng có thể ủy quyền khai báo số hoán vị cho hệ thống ML. Kiểm toán viên vẫn nhận được bảng kiểm toán công bằng và các ZKP liên quan. Nó có thể lưu bảng kiểm tra tính công bằng vào bảng công bằng, tính toán tính công bằng và xác minh tính chính xác của các số hoán vị đã khai báo. Người xác minh chung có thể làm theo các bước tương tự để xác minh việc tính toán số liệu công bằng thông qua bảng kiểm tra tính công bằng có thể truy cập công khai qua bảng công bằng.


Khi kết thúc giai đoạn này, kiểm toán viên sử dụng các con số thu được để tính toán thước đo công bằng và công bố thông tin một cách công khai. Số lượng mỗi hoán vị biểu thị hiệu suất tổng thể của thuật toán ML cho từng nhóm có thuộc tính được bảo vệ. Bảng 4 trình bày các hoán vị và cách nó liên quan đến thước đo tính công bằng của hệ thống ML. Bảng mật mã và kết quả sẽ được công bố trên bảng công bằng (Hình 1)