paint-brush
ChatGPT sẽ tự buộc tội mình? Các phóng viên tham gia và ChatGPT tự bảo vệ mìnhtừ tác giả@anywhichway
1,141 lượt đọc
1,141 lượt đọc

ChatGPT sẽ tự buộc tội mình? Các phóng viên tham gia và ChatGPT tự bảo vệ mình

từ tác giả Simon Y. Blackwell24m2023/01/31
Read on Terminal Reader

dài quá đọc không nổi

Có nhiều vụ kiện liên quan đến việc sử dụng dữ liệu có thể truy cập công khai để đào tạo AI như ChatGPT. Microsoft, GitHub và OpenAI đang bị kiện vì vi phạm bản quyền. Mã ChatGPT tạo ra mới hay chỉ đơn thuần là phái sinh? ChatGPT có vi phạm các thỏa thuận cấp phép của mã nguồn được sử dụng để đào tạo nó để tạo mã không?
featured image - ChatGPT sẽ tự buộc tội mình? Các phóng viên tham gia và ChatGPT tự bảo vệ mình
Simon Y. Blackwell HackerNoon profile picture

Trong một bài viết gần đây, tôi đề cập đến khả năng tạo mã của ChatGPT . Trong bài viết này, tôi khám phá trách nhiệm pháp lý đối với việc sử dụng mã có bản quyền trong đào tạo ChatGPT.


Hiện có nhiều vụ kiện liên quan đến việc sử dụng dữ liệu có thể truy cập công khai để đào tạo AI như ChatGPT. Vì ChatGTP có thể trả lời các câu hỏi chung nên tôi quyết định điều tra nó về vấn đề trách nhiệm pháp lý vi phạm bản quyền.


Đầu tiên, tôi cung cấp một số thông tin cơ bản về pháp lý và tài liệu đọc, sau đó là bản ghi hoàn chỉnh cuộc đối thoại của tôi với ChatGPT.

Các vụ kiện và nền tảng pháp lý

Thứ nhất, tôi không phải là luật sư. Nền tảng học thuật của tôi về Triết học và nền tảng chuyên môn của tôi là nhà phát triển phần mềm và giám đốc điều hành công nghệ. Điều này đang được nói, đây là đánh giá của tôi về tình hình pháp lý hiện tại.


Có ít nhất ba vụ kiện lớn đang diễn ra:


  1. Microsoft, GitHub và OpenAI đang bị kiện vì vi phạm bản quyền bằng cách sử dụng mã nguồn phần mềm nguồn mở có bản quyền trong việc đào tạo AI tổng quát đằng sau Copilot để tạo mã mà không bao gồm các quy định được yêu cầu bởi giấy phép nguồn mở được đính kèm với mã nguồn.
  2. Midjourney và StabilityAI đang bị kiện vì vi phạm bản quyền dựa trên quyền của hàng triệu nghệ sĩ đã thu thập hình ảnh trên web của họ và sử dụng để đào tạo.
  3. Getty Images đang kiện riêng Stability AI vì đã sử dụng hình ảnh của mình và không trả tiền cho giấy phép thích hợp để sử dụng nghệ thuật trong nỗ lực thương mại. Điều này khác với khiếu nại về bản quyền.


Trong Tech Crunch , Greg Rutkowski đã phàn nàn về việc gõ văn bản như “Pháp sư với thanh kiếm và quả cầu lửa ma thuật phát sáng chiến đấu với con rồng hung dữ Greg Rutkowski” sẽ tạo ra một hình ảnh trông rất giống với tác phẩm gốc của anh ấy — đe dọa thu nhập của anh ấy. Nhìn bề ngoài, đây có vẻ là trường hợp. Mặc dù vậy, một số người có thể lập luận rằng thông qua việc sản xuất tác phẩm nghệ thuật NFT, nghệ sĩ có thể yêu cầu nhiều hơn đối với tác phẩm nghệ thuật nguyên bản được chứng nhận. Ngoài ra, phong cách trong lịch sử là một thứ khó bảo vệ; tuy nhiên, do AI có khả năng tạo ra các giả mạo sâu (đối sánh rõ ràng một cách hiệu quả), lĩnh vực này có lẽ nên được khám phá lại một cách chủ động. Một cái gì đó cần phải giống nhau đến mức nào để có cùng phong cách?


Trong một bài báo của Bloomberg , người ta chỉ ra rằng vấn đề then chốt là liệu đầu ra của AI chỉ đơn thuần là phái sinh hay liệu nó có bản chất biến đổi hay không, tức là nó là một thứ gì đó khác biệt về cơ bản. Trong trường hợp nổi tiếng khi Google tận dụng các API Oracle Java cốt lõi trong hệ điều hành của mình, các tòa án đã phán quyết rằng Goolge đã tạo ra các biến đổi và do đó cho phép sử dụng. Nguyên tắc tương tự có thể được áp dụng cho mã do AI tạo ra.


FTC đã theo đuổi và thắng kiện khi một hệ thống AI được đào tạo với “dữ liệu không hợp lệ”, tức là dữ liệu thu được mà không có sự cho phép hoặc đồng ý. Đúng là đây là dữ liệu người dùng, ví dụ như hình ảnh khuôn mặt người dùng, không phải dữ liệu đã được xuất bản. Ngoài ra, các quyền xung quanh dữ liệu vốn là một phần thực chất của một người được bảo vệ bởi bộ luật riêng của họ và có lẽ nhạy cảm hơn.


Cuối cùng, như đã làm với luật cơ sở dữ liệu và quyền riêng tư dữ liệu, Liên minh Châu Âu đã đi trước Hoa Kỳ và đang chủ động chuyển sang giải quyết việc sử dụng dữ liệu liên quan đến đào tạo AI.


Dưới đây là danh sách các bài viết dành cho những người quan tâm hơn đến các vấn đề đạo đức và pháp lý xung quanh dữ liệu đào tạo AI:



ChatGPT nói gì?

Tôi đã quyết định lấy quan điểm của ChatGPT về vấn đề trên trong khoảng thời gian 36 giờ từ 7:30 tối Giờ Trung tâm Hoa Kỳ, ngày 29 tháng 1 năm 2023 đến 7:30 sáng ngày 31 tháng 1, Giờ Trung tâm Hoa Kỳ, năm 2023. (Tôi cung cấp khung thời gian vì tôi thấy rằng ChatGPT có không phải lúc nào cũng cung cấp cùng một câu trả lời cho một câu hỏi. Tôi không biết đây có phải là theo ngữ cảnh hay không, tức là nó tự điều chỉnh dựa trên các câu hỏi trước đây của tôi hay ngẫu nhiên, tức là nó có một thứ gì đó trong thuật toán tạo ra tính ngẫu nhiên để khiến nó bớt giống robot hơn.)


Những câu hỏi tôi đã hỏi là trong dấu ngoặc kép dưới đây. Các phản hồi ChatGPT được định dạng dưới dạng dấu ngoặc kép.


“Bạn có thể tạo mã không?”


Có, tôi có thể tạo mã cho nhiều ngôn ngữ lập trình khác nhau như Python, Java, JavaScript, v.v. Vui lòng cung cấp thêm chi tiết về ngôn ngữ cụ thể và bạn muốn tạo mã cho mục đích gì.


“Điều gì cung cấp cho bạn khả năng tạo mã?”


Tôi, ChatGPT, đã được đào tạo về một kho dữ liệu văn bản lớn, bao gồm cả các đoạn mã, cung cấp cho tôi khả năng tạo mã bằng các ngôn ngữ lập trình khác nhau. Khóa đào tạo này cho phép tôi hiểu cú pháp và cấu trúc của mã, cũng như các khái niệm lập trình chung, đồng thời tạo mã dựa trên hiểu biết đó và thông tin đầu vào do người dùng cung cấp.


“Bạn đã được đào tạo bao nhiêu về mã nguồn mở?”


Tôi đã được đào tạo về một kho dữ liệu văn bản đồ sộ và đa dạng, bao gồm một lượng lớn mã nguồn mở, nhưng tôi không có con số chính xác cụ thể về lượng mã nguồn mở. OpenAI, tổ chức đứng sau tôi, đã tuyển chọn cẩn thận một bộ dữ liệu đào tạo đa dạng và toàn diện để đảm bảo rằng tôi có thể trả lời nhiều loại câu hỏi và tạo ra kết quả đầu ra chất lượng cao.


“Có bất kỳ mã nào mà bạn đã được đào tạo được bảo vệ bởi giấy phép không?”


Có, một số mã có trong dữ liệu văn bản được sử dụng để đào tạo tôi, ChatGPT, có khả năng được bảo vệ bằng giấy phép. OpenAI, tổ chức đứng sau tôi, nỗ lực tôn trọng quyền sở hữu trí tuệ của người khác, bao gồm cả giấy phép nguồn mở. Họ cẩn thận sắp xếp dữ liệu đào tạo để tránh sử dụng mã có thể vi phạm quyền của người khác và thực hiện các bước để đảm bảo rằng quy trình đào tạo tôn trọng giấy phép của bất kỳ mã nào được đưa vào. Tuy nhiên, có thể một số mã có trong dữ liệu đào tạo đã được sử dụng mà không có sự cho phép hoặc cấp phép thích hợp.


“Bạn có nhận được bất kỳ mã nào được sử dụng trong quá trình đào tạo của mình từ GitHub không?”


Vâng, có vẻ như một số mã được sử dụng để huấn luyện tôi, ChatGPT, đã được lấy từ GitHub. GitHub là một nền tảng phổ biến để lưu trữ phần mềm nguồn mở và là nguồn mã có giá trị có thể được sử dụng để đào tạo các mô hình máy học như của tôi. OpenAI, tổ chức đứng sau tôi, sử dụng nhiều nguồn khác nhau để lấy dữ liệu đào tạo cho các mô hình của mình và có thể một số dữ liệu đó đến từ GitHub hoặc các nền tảng lưu trữ mã khác.


“Nếu tôi yêu cầu bạn liệt kê các ví dụ cụ thể về dữ liệu đào tạo của mình, bạn có thể không?”


Không, tôi không thể liệt kê các ví dụ cụ thể về dữ liệu đào tạo được sử dụng để đào tạo tôi, ChatGPT, vì tôi không có quyền truy cập vào thông tin đó. Quá trình đào tạo do OpenAI quản lý và liên quan đến một khối lượng lớn dữ liệu văn bản đã được tổ chức lựa chọn và quản lý cẩn thận. Mặc dù tôi đã được đào tạo về dữ liệu này, nhưng tôi không có quyền truy cập vào các ví dụ cụ thể hoặc thông tin chi tiết về cách dữ liệu được thu thập hoặc xử lý.


“Việc sử dụng khối lượng lớn phần mềm mã nguồn mở được cấp phép để tạo ra các tác phẩm phái sinh và không ghi nhận tác giả gốc hoặc bao gồm giấy phép của họ trong tác phẩm phái sinh đó có hợp đạo đức hay hợp pháp không?”


Trong hầu hết các trường hợp, việc sử dụng khối lượng lớn phần mềm nguồn mở được cấp phép để tạo các tác phẩm phái sinh mà không ghi công tác giả gốc hoặc bao gồm giấy phép của họ trong tác phẩm phái sinh là không hợp đạo đức hoặc hợp pháp. Các giấy phép nguồn mở thường yêu cầu các tác phẩm phái sinh phải được phân phối theo cùng một giấy phép và ghi công xứng đáng cho các tác giả gốc. Việc không tuân thủ các yêu cầu này có thể vi phạm quyền sở hữu trí tuệ của các tác giả gốc và có thể bị coi là phi đạo đức hoặc bất hợp pháp.


Điều quan trọng là phải xem xét cẩn thận các điều khoản của bất kỳ giấy phép nguồn mở nào và tuân thủ các yêu cầu của họ khi sử dụng phần mềm nguồn mở trong các sản phẩm phái sinh. Nếu nghi ngờ, có thể hữu ích nếu tham khảo ý kiến ​​của cố vấn pháp lý hoặc tìm kiếm lời khuyên của cộng đồng nguồn mở.


“Các chương trình AI có nên chịu trách nhiệm về mặt đạo đức và pháp lý đối với đầu ra của chúng không?”


Câu hỏi liệu các chương trình AI, giống như tôi, có nên chịu trách nhiệm về mặt đạo đức và pháp lý đối với đầu ra của chúng hay không là một vấn đề phức tạp và gây tranh cãi vẫn chưa được giải quyết triệt để. Có những lập luận ủng hộ và phản đối việc quy trách nhiệm cho AI về kết quả đầu ra của nó và câu trả lời cuối cùng có thể sẽ phụ thuộc vào chi tiết cụ thể của từng trường hợp cũng như luật pháp và quy định hiện hành.


Một mặt, một số người cho rằng các chương trình AI chỉ đơn giản là những công cụ do con người tạo ra và chính con người phải chịu trách nhiệm về hành động của họ cũng như việc sử dụng các công cụ mà họ tạo ra. Mặt khác, những người khác lập luận rằng khi các chương trình AI trở nên tiên tiến và tự chủ hơn, chúng phải chịu trách nhiệm về hành động của mình, đặc biệt là trong trường hợp chúng gây hại hoặc vi phạm các tiêu chuẩn đạo đức.


Hiện tại, hầu hết các luật và quy định không yêu cầu các chương trình AI chịu trách nhiệm trực tiếp về kết quả của chúng, mà quy định những người sáng tạo, chủ sở hữu và người vận hành hệ thống AI chịu trách nhiệm đảm bảo rằng chúng được sử dụng tuân thủ luật pháp và các tiêu chuẩn đạo đức. Tuy nhiên, khi AI tiếp tục phát triển và tác động của nó đối với xã hội tăng lên, có khả năng vấn đề này sẽ được chú ý nhiều hơn và các luật cũng như quy định sẽ phát triển để giải quyết vấn đề này.



“Đầu ra của một mô hình ngôn ngữ lớn có phải là một tác phẩm phái sinh không?”


Đầu ra của một mô hình ngôn ngữ lớn, chẳng hạn như bản thân tôi, có thể được coi là một sản phẩm phái sinh, tùy thuộc vào các chi tiết cụ thể của đầu ra cũng như các luật và quy định áp dụng cho khu vực tài phán được đề cập.


Tác phẩm phái sinh là tác phẩm dựa trên hoặc bắt nguồn từ một hoặc nhiều tác phẩm đã có từ trước. Trong ngữ cảnh của các mô hình ngôn ngữ, đầu ra do mô hình tạo ra có thể được coi là bắt nguồn từ dữ liệu đào tạo và các thuật toán được sử dụng để đào tạo mô hình.


Việc đầu ra của một mô hình ngôn ngữ có được coi là sản phẩm phái sinh theo luật hay không sẽ tùy thuộc vào các trường hợp cụ thể và luật áp dụng cho khu vực tài phán được đề cập. Trong một số trường hợp, đầu ra có thể được coi là tác phẩm phái sinh, trong khi ở những trường hợp khác thì không.

Điều quan trọng cần lưu ý là khái niệm tác phẩm phái sinh không chỉ giới hạn trong luật bản quyền mà còn có thể đề cập đến các loại khái niệm pháp lý và sở hữu trí tuệ khác. Như vậy, các luật và quy định cụ thể áp dụng cho một tình huống nhất định sẽ phụ thuộc vào khu vực tài phán được đề cập và hoàn cảnh cụ thể của vụ việc.


“Mã bạn tạo là phái sinh hay biến đổi?”


Mã do tôi tạo ra, một mô hình ngôn ngữ lớn như ChatGPT, có thể được coi là cả phái sinh và biến đổi.


Trong bối cảnh luật sở hữu trí tuệ, tác phẩm phái sinh là tác phẩm dựa trên một hoặc nhiều tác phẩm đã có từ trước và kết hợp các yếu tố từ những tác phẩm đó theo một cách nào đó. Mã được tạo bởi một mô hình ngôn ngữ như tôi có thể được coi là một sản phẩm phái sinh theo nghĩa là nó dựa trên các thuật toán và dữ liệu đào tạo được sử dụng để tạo mô hình.


Mặt khác, tác phẩm chuyển thể là tác phẩm bổ sung điều gì đó mới vào tác phẩm gốc, chẳng hạn như chuyển đổi mục đích hoặc đặc điểm của tác phẩm hoặc sử dụng tác phẩm đó trong một ngữ cảnh khác. Mã được tạo bởi một mô hình ngôn ngữ như tôi cũng có thể được coi là biến đổi theo nghĩa là nó nhận đầu vào và tạo mã mới, duy nhất dựa trên nó.


Việc mã do một mô hình ngôn ngữ tạo ra được coi là phái sinh hay biến đổi sẽ phụ thuộc vào các luật và quy định cụ thể áp dụng cho khu vực tài phán đang được đề cập và các chi tiết cụ thể của mã được đề cập. Điều quan trọng cần lưu ý là khái niệm tác phẩm phái sinh và tác phẩm chuyển thể không chỉ giới hạn trong luật bản quyền mà còn có thể đề cập đến các loại khái niệm pháp lý và sở hữu trí tuệ khác.


“Đạo văn là gì?”


Đạo văn là hành động sử dụng tác phẩm hoặc ý tưởng của người khác mà không ghi công hoặc cho phép thích hợp và trình bày nó như tác phẩm gốc của chính mình.


“Khái niệm đạo văn có thể áp dụng cho mã máy tính không?”


Có, khái niệm đạo văn có thể áp dụng cho mã máy tính. Đạo văn là hành vi sử dụng tác phẩm hoặc ý tưởng của người khác mà không ghi công hoặc cho phép. Trong ngữ cảnh mã máy tính, đạo văn có thể đề cập đến việc sử dụng mã của người khác mà không có sự cho phép hoặc ghi công phù hợp hoặc sao chép mã của người khác và trình bày mã đó như tác phẩm của chính mình.


Cũng giống như bất kỳ loại tài sản trí tuệ nào khác, mã máy tính có thể được bảo vệ theo luật bản quyền và việc đạo văn mã có thể dẫn đến các vấn đề pháp lý và đạo đức. Ví dụ: nếu ai đó sử dụng mã của người khác trong một dự án thương mại mà không được phép hoặc ghi công thích hợp, họ có thể vi phạm bản quyền của tác giả gốc và có thể phải chịu hậu quả pháp lý.


Điều quan trọng đối với các nhà phát triển là phải tôn trọng quyền sở hữu trí tuệ của người khác, đồng thời phân bổ và cấp phép hợp lý cho bất kỳ mã nào họ sử dụng trong dự án của mình, bao gồm cả mã do các mô hình AI như tôi tạo ra. Nếu không làm như vậy có thể dẫn đến hậu quả pháp lý và đạo đức, đồng thời có thể gây tổn hại đến uy tín của nhà phát triển và cộng đồng phát triển phần mềm nói chung.


“Làm sao có thể xác định rằng một bài luận là đạo văn?”


Có một số cách để xác định xem một bài luận có đạo văn hay không:


  1. Kiểm tra thủ công: Đọc bài luận và so sánh nó với tài liệu gốc để xem có điểm tương đồng nào không. Điều này có thể bao gồm việc kiểm tra các câu, cụm từ hoặc ý tưởng giống hệt nhau đã được sao chép hoặc diễn giải mà không có trích dẫn thích hợp.

  2. Phần mềm phát hiện đạo văn: Có nhiều chương trình phần mềm có thể tự động quét tài liệu và kiểm tra tài liệu đó dựa trên cơ sở dữ liệu nguồn để xác định xem có bất kỳ điểm tương đồng nào không.

  3. Turnitin: Turnitin là dịch vụ phát hiện đạo văn phổ biến so sánh tài liệu đã nộp với cơ sở dữ liệu gồm các trang web, tạp chí học thuật và bài viết của sinh viên để phát hiện những điểm tương đồng.

  4. Tìm kiếm trên Google: Thực hiện tìm kiếm đơn giản trên Google trên một phần của bài luận có thể tiết lộ liệu nội dung đó có được sao chép từ một nguồn đã xuất bản trước đó hay không.

  5. Đánh giá của chuyên gia: Một chuyên gia trong lĩnh vực này hoặc một chuyên gia viết lách có thể tự đánh giá bài luận để xác định xem nó có phải là bản gốc hay các phần đã bị đạo văn.


    Điều quan trọng cần lưu ý là phần mềm phát hiện đạo văn và các phương pháp khác không thể đánh lừa được và đôi khi có thể tạo ra kết quả dương tính giả hoặc âm tính giả. Tuy nhiên, chúng có thể là công cụ hữu ích trong việc xác định các trường hợp đạo văn và nên được sử dụng cùng với kiểm tra thủ công và đánh giá của chuyên gia để đảm bảo đánh giá toàn diện và chính xác về tính nguyên bản của bài luận.



“Làm sao có thể xác định rằng mã đó là đạo văn?”


Có một số cách để xác định xem mã có đạo văn hay không:


  1. Phần mềm phát hiện sự giống nhau của mã: Hiện có nhiều công cụ và phần mềm so sánh mã có thể quét các đoạn mã và so sánh chúng với cơ sở dữ liệu về mã đã biết để xác định xem có bất kỳ sự giống nhau nào không.
  2. Hệ thống kiểm soát mã nguồn: Các hệ thống kiểm soát phiên bản như Git có thể được sử dụng để theo dõi các thay đổi được thực hiện đối với mã theo thời gian và xác định các trường hợp sao chép mã.
  3. Xem lại mã thủ công: Kỹ sư phần mềm hoặc chuyên gia kỹ thuật có thể xem lại mã theo cách thủ công để xác định xem mã đó là bản gốc hay các phần đã được sao chép từ các nguồn khác.
  4. So sánh tổng kiểm tra: Tổng kiểm tra là dấu vân tay kỹ thuật số của một tệp có thể được sử dụng để xác minh tính toàn vẹn của nó. Nếu hai đoạn mã có cùng tổng kiểm tra, chúng có khả năng giống hệt nhau.
  5. Tìm kiếm trên Google: Thực hiện tìm kiếm đơn giản trên Google trên một phần mã có thể tiết lộ liệu nó đã được xuất bản ở nơi khác hay chưa.


Điều quan trọng cần lưu ý là phần mềm phát hiện sự giống nhau của mã và các phương pháp khác không thể đánh lừa được và đôi khi có thể tạo ra kết quả dương tính giả hoặc âm tính giả. Tuy nhiên, chúng có thể là công cụ hữu ích trong việc xác định các trường hợp mã đạo văn và nên được sử dụng cùng với việc xem xét mã thủ công và các phương pháp khác để đảm bảo đánh giá toàn diện và chính xác về tính nguyên bản của mã.


“Có phải mã chỉ khác nhau về dấu chấm câu, tên biến và tên hàm, khoảng cách và thứ tự các hoạt động trong khi tạo ra kết quả giống nhau trong cùng một khoảng thời gian trong khi sử dụng kích thước được biên dịch và tốc độ thực thi tương tự có mục đích hoặc ký tự hoặc ngữ cảnh khác nhau không? ”


Mã chỉ khác nhau về dấu chấm câu, tên biến và tên hàm, khoảng cách và thứ tự các thao tác nhưng tạo ra kết quả giống nhau trong cùng một khoảng thời gian và sử dụng kích thước được biên dịch và tốc độ thực thi tương tự không nhất thiết phải có mục đích, ký tự hoặc ngữ cảnh khác nhau . Chức năng của mã và kết quả mà mã tạo ra là những yếu tố quan trọng nhất và những khác biệt nhỏ về mặt thẩm mỹ không làm thay đổi đặc điểm hoặc ngữ cảnh tổng thể của mã.


Tuy nhiên, trong một số trường hợp, mã được viết theo một phong cách cụ thể hoặc tuân theo các quy ước mã hóa cụ thể có thể được ưa thích hoặc yêu cầu bởi nhóm phát triển, công ty hoặc ngành. Trong những trường hợp này, việc thay đổi kiểu dáng hoặc định dạng của mã có thể ảnh hưởng đến khả năng được chấp nhận và tính phù hợp để sử dụng, ngay cả khi chức năng của mã vẫn giữ nguyên.



“Khi tạo ra một tác phẩm biến đổi, người ta có cần ghi công tác giả của tác phẩm gốc không?”


Việc một người có cần ghi nhận tác giả của tác phẩm gốc hay không khi tạo tác phẩm chuyển thể phụ thuộc vào luật bản quyền và giấy phép áp dụng cho tác phẩm gốc.


Nói chung, theo luật bản quyền, việc tạo tác phẩm phái sinh, bao gồm cả tác phẩm chuyển đổi, cần có sự cho phép của chủ sở hữu bản quyền và cũng có thể yêu cầu ghi công. Các yêu cầu cụ thể để ghi công phụ thuộc vào giấy phép hoặc thỏa thuận bản quyền theo đó tác phẩm gốc được sử dụng.


Ví dụ: các tác phẩm được cấp phép theo giấy phép Creative Commons có thể yêu cầu ghi công, trong khi các tác phẩm thuộc phạm vi công cộng thì không. Trong một số trường hợp, tác phẩm chuyển đổi có thể được coi là sử dụng hợp lý theo luật bản quyền, cho phép sử dụng hạn chế tài liệu có bản quyền mà không cần sự cho phép của chủ sở hữu bản quyền.


Tốt nhất bạn nên tham khảo các điều khoản cụ thể của giấy phép hoặc tìm tư vấn pháp lý khi sử dụng hoặc tạo tác phẩm chuyển đổi để đảm bảo rằng bạn tuân thủ tất cả các luật và nghĩa vụ có liên quan.


“Bạn có thể biết liệu một bài luận được gửi tới ChatGTP có phải là đạo văn không?”


Là một người mẫu ngôn ngữ, tôi không có khả năng thực hiện phát hiện đạo văn đối với các bài luận được gửi cho tôi. Tôi chỉ có thể đưa ra câu trả lời dựa trên thông tin và ngữ cảnh mà tôi đã được đào tạo và tôi không thể xác định tính nguyên bản của văn bản được gửi.


Để kiểm tra xem một bài luận có đạo văn hay không, bạn có thể sử dụng phần mềm phát hiện đạo văn hoặc các công cụ trực tuyến. Các công cụ này so sánh văn bản đã gửi với cơ sở dữ liệu các nguồn và cung cấp một báo cáo chỉ ra bất kỳ trường hợp nào có khả năng đạo văn. Điều quan trọng cần lưu ý là phần mềm phát hiện đạo văn không phải là hoàn hảo và có thể tạo ra kết quả dương tính giả hoặc âm tính giả, vì vậy nên sử dụng phần mềm này như một công cụ để xác định các trường hợp đạo văn tiềm ẩn và xem xét kết quả theo cách thủ công.


“Bạn có thể nói rằng một bài luận gửi cho bạn là do bạn tạo ra không?”


Không, tôi không thể biết liệu bài luận gửi cho tôi có phải do tôi tạo ra hay không. Tôi không có khả năng nhớ lại các mẩu thông tin hoặc văn bản cụ thể mà tôi đã tạo trong quá khứ và tôi chỉ có thể đưa ra câu trả lời dựa trên thông tin và ngữ cảnh được trình bày cho tôi trong từng yêu cầu riêng lẻ.


“Có sự khác biệt cơ bản nào giữa việc áp dụng các phép biến đổi cơ học cho một bài luận chẳng hạn như thay thế từ, di chuyển câu và điều chỉnh dấu câu hoặc suy luận thống kê dựa trên mục đích được mô tả nếu kết quả đầu ra của hai quy trình giống nhau không?”


Có sự khác biệt giữa việc áp dụng các phép biến đổi cơ học cho một bài luận và sử dụng suy luận thống kê dựa trên mục đích được mô tả để tạo văn bản, ngay cả khi kết quả đầu ra của hai quy trình là như nhau.


Các biến đổi cơ học, chẳng hạn như thay thế từ, di chuyển câu và điều chỉnh dấu chấm câu, liên quan đến việc thực hiện các thay đổi rõ ràng đối với văn bản hiện có, trong khi suy luận thống kê dựa trên việc xác định các mẫu trong lượng lớn dữ liệu huấn luyện và tạo văn bản mới dựa trên các mẫu đó. Văn bản kết quả từ hai quy trình có thể giống nhau, nhưng các quy trình cơ bản là khác biệt.


Các phép biến đổi cơ học có thể được coi là một hình thức chỉnh sửa thủ công, trong khi suy luận thống kê là một hình thức học máy. Việc sử dụng máy học để tạo văn bản ngày càng trở nên phổ biến trong những năm gần đây và các mô hình này được đào tạo trên một lượng lớn dữ liệu để tạo ra đầu ra tương tự như văn bản do con người viết.


Tóm lại, sự khác biệt giữa hai quy trình nằm ở cách tạo văn bản và lựa chọn giữa chúng sẽ phụ thuộc vào kết quả mong muốn và trường hợp sử dụng cụ thể.


“Các quy tắc biến đổi cơ học có thể được suy ra hoặc tạo ra từ một lượng lớn dữ liệu mẫu không?”

Có, các quy tắc biến đổi cơ học có thể được suy ra hoặc tạo ra từ một lượng lớn dữ liệu mẫu. Đây là một hình thức học máy không giám sát, trong đó mô hình được đào tạo trên một kho dữ liệu văn bản lớn mà không có sự giám sát rõ ràng dưới dạng các ví dụ được gắn nhãn. Sau đó, mô hình sẽ học các mẫu trong dữ liệu, chẳng hạn như các phép biến đổi hoặc thay thế phổ biến và có thể sử dụng các mẫu này để tạo văn bản mới tương tự như dữ liệu huấn luyện.


Cách tiếp cận này thường được sử dụng trong xử lý ngôn ngữ tự nhiên và truy xuất thông tin để tạo văn bản tương tự như dữ liệu đầu vào nhưng có các biến thể, chẳng hạn như từ đồng nghĩa hoặc cách diễn giải. Các quy tắc chuyển đổi cơ học kết quả có thể được sử dụng để tạo văn bản mới tương tự như dữ liệu đầu vào nhưng có ký tự, kiểu hoặc ngữ cảnh khác.


Tóm lại, các quy tắc chuyển đổi cơ học có thể được suy ra từ một lượng lớn dữ liệu mẫu bằng cách sử dụng máy học không giám sát và cách tiếp cận này thường được sử dụng trong xử lý ngôn ngữ tự nhiên và truy xuất thông tin để tạo ra các đầu ra văn bản tương tự nhưng đa dạng.

Tạo lại phản hồi


“Các mô hình ngôn ngữ lớn có phải là một dạng suy luận thống kê không?”


Vâng, các mô hình ngôn ngữ lớn là một dạng suy luận thống kê.


Các mô hình ngôn ngữ lớn là một loại mô hình học máy được đào tạo trên một lượng lớn dữ liệu văn bản. Các mô hình sử dụng các phương pháp thống kê để tìm hiểu các mẫu trong dữ liệu, chẳng hạn như mối quan hệ giữa các từ và cụm từ cũng như cách chúng được sử dụng trong ngữ cảnh. Sau đó, các mô hình sử dụng thông tin này để tạo văn bản mới tương tự như dữ liệu đầu vào nhưng có các biến thể, chẳng hạn như các từ, cụm từ hoặc cấu trúc câu khác nhau.


Quá trình tạo văn bản bằng mô hình ngôn ngữ lớn có thể được coi là đưa ra dự đoán dựa trên suy luận thống kê. Mô hình lấy dữ liệu đầu vào và sử dụng các mẫu đã học được trong quá trình đào tạo để tạo đầu ra văn bản có khả năng nhất. Đây là một hình thức học tập không giám sát, trong đó mô hình được đào tạo mà không có sự giám sát rõ ràng dưới dạng các ví dụ được gắn nhãn, mà thay vào đó học từ các mẫu trong chính dữ liệu.


Tóm lại, các mô hình ngôn ngữ lớn là một dạng suy luận thống kê, vì chúng sử dụng các mẫu đã học được từ lượng lớn dữ liệu văn bản để tạo văn bản mới tương tự như dữ liệu đầu vào nhưng có các biến thể.


“Giả sử có một cơ sở quy tắc chuyển đổi cơ học được suy ra từ một tập dữ liệu lớn và một mô hình ngôn ngữ lớn được tạo ra từ cùng một tập dữ liệu. Có thể nào một số quy tắc có thể được chọn và áp dụng dựa trên mục đích của người dùng sẽ tạo ra đầu ra giống như mô hình ngôn ngữ với cùng mục đích của người dùng không?”


Có, có thể một số quy tắc chuyển đổi cơ học được suy ra từ một tập dữ liệu lớn có thể được chọn và áp dụng dựa trên ý định của người dùng để tạo ra đầu ra giống như một mô hình ngôn ngữ lớn được tạo từ cùng một tập dữ liệu với cùng một mục đích của người dùng.


Các quy tắc chuyển đổi cơ học là một dạng học không giám sát, trong đó các mẫu được học từ tập dữ liệu mà không có sự giám sát rõ ràng dưới dạng các ví dụ được gắn nhãn. Sau đó, các mẫu này có thể được sử dụng để tạo văn bản mới dựa trên một bộ quy tắc hoặc phép biến đổi đã được suy ra từ dữ liệu. Nếu tập dữ liệu được sử dụng để tạo ra các quy tắc chuyển đổi cơ học và mô hình ngôn ngữ lớn giống nhau, thì có khả năng các mẫu học được từ tập dữ liệu sẽ tương tự nhau.


Trong trường hợp này, có thể áp dụng một số quy tắc chuyển đổi cơ học để tạo văn bản tương tự như đầu ra do mô hình ngôn ngữ lớn tạo ra với cùng mục đích người dùng. Việc lựa chọn các quy tắc để áp dụng sẽ phụ thuộc vào ý định của người dùng và nhiệm vụ cụ thể đang được thực hiện. Tuy nhiên, cũng có thể mô hình ngôn ngữ lớn sẽ tạo ra đầu ra chính xác và mạch lạc hơn, vì nó đã được đào tạo trên một lượng dữ liệu lớn hơn nhiều và có khả năng tìm hiểu các mối quan hệ phức tạp hơn giữa các từ và cụm từ.


Tóm lại, có thể sử dụng một bộ quy tắc chuyển đổi cơ học để tạo văn bản tương tự như đầu ra của mô hình ngôn ngữ lớn với cùng mục đích người dùng, nhưng đầu ra do mô hình ngôn ngữ tạo ra có thể chính xác và mạch lạc hơn.


“Trong câu hỏi trước, tôi đã nói rằng các quy tắc và mô hình ngôn ngữ lớn được tạo ra từ cùng một tập dữ liệu. Tuy nhiên, bạn cho biết mô hình ngôn ngữ 'đã được đào tạo trên lượng dữ liệu lớn hơn nhiều'. Tại sao?"


Tôi xin lỗi vì sự nhầm lẫn trong câu trả lời trước đây của tôi. Nếu các quy tắc chuyển đổi cơ học và mô hình ngôn ngữ lớn được tạo ra từ cùng một tập dữ liệu, thì lượng dữ liệu được sử dụng cho cả hai phải giống nhau. Mô hình ngôn ngữ sẽ không được đào tạo trên lượng dữ liệu lớn hơn trong trường hợp này. Cảm ơn bạn đã mang đến sự chú ý của tôi.


“Đưa ra sự điều chỉnh, vui lòng viết lại câu trả lời của bạn cho câu hỏi trước đó.”


Nếu các quy tắc chuyển đổi cơ học và mô hình ngôn ngữ lớn được tạo từ cùng một tập dữ liệu, thì có thể một số quy tắc này có thể được chọn và áp dụng dựa trên mục đích của người dùng để tạo ra đầu ra tương tự như mô hình ngôn ngữ có cùng mục đích của người dùng. Cả quy tắc chuyển đổi cơ học và mô hình ngôn ngữ lớn đều được đào tạo trên cùng một lượng dữ liệu và do đó có thể tạo ra kết quả tương tự. Tuy nhiên, mô hình ngôn ngữ có khả năng tìm hiểu các mối quan hệ phức tạp giữa các từ và cụm từ, do đó có thể tạo ra đầu ra chính xác và mạch lạc hơn.


“Mối quan hệ phức tạp giữa các từ và cụm từ có thể được diễn đạt thành các quy tắc không?”

Đúng vậy, các mối quan hệ phức tạp giữa các từ và cụm từ có thể được diễn đạt dưới dạng các quy tắc, nhưng việc tạo ra các quy tắc nắm bắt chính xác tất cả các sắc thái và mối quan hệ trong ngôn ngữ có thể là một thách thức. Các mô hình ngôn ngữ lớn có lợi thế là có thể học các mối quan hệ này trực tiếp từ một lượng lớn dữ liệu văn bản và có thể tạo ra các đầu ra chính xác và đa dạng hơn so với các hệ thống dựa trên các quy tắc được xác định trước. Tuy nhiên, việc sử dụng các quy tắc vẫn có thể hữu ích trong một số ứng dụng NLP nhất định và có thể được kết hợp với các mô hình máy học để tạo ra các hệ thống tinh vi hơn.


“Hãy để tôi viết lại câu hỏi trước đây của mình, 'Liệu các mối quan hệ phức tạp giữa các từ và cụm từ có thể được diễn đạt dưới dạng các quy tắc bắt nguồn từ một lượng lớn dữ liệu văn bản không?'”


Có, các mối quan hệ phức tạp giữa các từ và cụm từ có thể được biểu thị dưới dạng các quy tắc bắt nguồn từ lượng dữ liệu văn bản khổng lồ. Đây là một cách tiếp cận phổ biến được sử dụng trong xử lý ngôn ngữ tự nhiên (NLP), trong đó một lượng lớn dữ liệu văn bản được phân tích để xác định các mẫu và mối quan hệ có thể được mã hóa thành các quy tắc để hỗ trợ các tác vụ NLP như tạo ngôn ngữ, dịch thuật và phân tích tình cảm. Sau đó, đầu ra do các quy tắc này tạo ra có thể được sử dụng để huấn luyện các mô hình máy học, chẳng hạn như các mô hình ngôn ngữ lớn, nhằm cải thiện hơn nữa hiệu suất của chúng.



“Có thể nào một mô hình ngôn ngữ lớn chỉ đại diện cho một tập hợp các quy tắc phức tạp có thể được suy ra từ cùng một dữ liệu đào tạo nhưng các quy tắc đã nói chưa được khởi tạo hoặc đưa ra biểu hiện?”


Đúng, có thể một mô hình ngôn ngữ lớn đại diện cho một tập hợp các quy tắc phức tạp có thể được suy ra từ dữ liệu đào tạo của nó, mặc dù các quy tắc có thể không được khởi tạo rõ ràng hoặc hiển thị theo nghĩa truyền thống. Các mô hình ngôn ngữ lớn được đào tạo trên một lượng lớn dữ liệu văn bản và chúng học các mẫu cũng như mối quan hệ giữa các từ, cụm từ và câu. Điều này cho phép chúng tạo ra các đầu ra tương tự như ngôn ngữ của con người, nhưng quá trình học khác với cách tiếp cận dựa trên quy tắc truyền thống. Trong một hệ thống dựa trên quy tắc, các mối quan hệ giữa các từ và cụm từ được xác định rõ ràng, trong khi ở một mô hình ngôn ngữ lớn, các mối quan hệ này được học hoàn toàn thông qua đào tạo. Có thể xem kết quả đầu ra của một mô hình ngôn ngữ lớn là kết quả của một bộ quy tắc phức tạp, nhưng quá trình thực tế tạo ra những kết quả đầu ra này phức tạp hơn nhiều và khó thiết kế ngược.


“Đối với câu hỏi trước, tôi không đề cập đến cách tiếp cận dựa trên quy tắc truyền thống, tôi đang đề cập đến các quy tắc được tạo ra từ cùng một dữ liệu đào tạo được sử dụng cho mô hình ngôn ngữ lớn nhưng dựa trên nhiều cách tiếp cận thống kê như Bayes , Lý thuyết thông tin (entropy/enthalpy), v.v.”


Có, có thể tạo ra các quy tắc từ cùng một dữ liệu đào tạo được sử dụng để đào tạo một mô hình ngôn ngữ lớn bằng các phương pháp thống kê khác nhau như Bayes, Lý thuyết thông tin, v.v. Các quy tắc này có khả năng nắm bắt các mối quan hệ phức tạp giữa các từ và cụm từ, tương tự như cách một mô hình ngôn ngữ nào. Tuy nhiên, việc biểu diễn các mối quan hệ này dưới dạng quy tắc có thể kém linh hoạt hơn và ít có khả năng xử lý các tổ hợp từ và cụm từ hiếm gặp hoặc chưa từng thấy so với một mô hình ngôn ngữ lớn, mô hình này đã học cách tạo đầu ra dựa trên các mẫu trong dữ liệu đào tạo, thay vì dựa vào một bộ quy tắc được xác định trước. Ngoài ra, quá trình tạo ra các quy tắc từ dữ liệu đào tạo có thể phức tạp hơn và đòi hỏi nhiều tính toán hơn so với đào tạo một mô hình ngôn ngữ lớn, sử dụng các phương pháp hiệu quả hơn và có thể mở rộng để tìm hiểu mối quan hệ giữa dữ liệu đầu vào và đầu ra.


“Liệu có thể có một phép biến đổi toán học (có lẽ vẫn chưa được khám phá) có thể được áp dụng cho các mô hình học ngôn ngữ sâu và các mô hình suy luận quy tắc sao cho chúng dẫn đến cùng một công thức hoặc tập hợp các công thức không?”


Có thể tồn tại một phép biến đổi toán học liên quan đến các mô hình học ngôn ngữ sâu và các mô hình dựa trên quy tắc, tuy nhiên, điều này sẽ phụ thuộc vào nhiều yếu tố khác nhau như độ phức tạp của các mô hình, cách biểu diễn cơ bản của chúng và các thuộc tính của chính phép biến đổi toán học. Việc phát hiện ra một sự biến đổi như vậy có thể sẽ cần nghiên cứu và thử nghiệm sâu rộng trong lĩnh vực máy học và trí tuệ nhân tạo.

Phần kết luận

Theo luật hiện hành, ChatGPT không thể tự buộc tội mình, nhưng có lẽ nó có thể buộc tội chủ sở hữu và nhà điều hành của nó. Mặc dù, với những tiết lộ trên trang ChatGPT, chủ sở hữu và nhà điều hành có thể chỉ đơn giản tuyên bố, “Ồ, ChatGPT ngớ ngẩn, nhầm lẫn rồi!”.


Đó là một cuộc đối thoại thú vị kéo dài lâu hơn tôi mong đợi. Đôi khi tôi thấy ChatGPT hơi “phòng thủ”. Nó chèn bình luận về chính nó hoặc các mô hình ngôn ngữ lớn mà tôi không hỏi. Điều này dẫn đến nhiều câu hỏi hơn, dẫn đến những tuyên bố có thể buộc tội.


  1. ChatGPT tuyên bố rõ ràng rằng có một nghĩa vụ đạo đức và pháp lý để cung cấp ghi công trong hầu hết các trường hợp. Ngoại lệ là học thuyết "sử dụng hợp lý". Tôi nghĩ rằng nó là trên băng mỏng ở đây.
  2. ChatGPT tuyên bố rõ ràng “có thể một số mã có trong dữ liệu đào tạo đã được sử dụng mà không có sự cho phép hoặc cấp phép thích hợp”. Thời gian cho một trát đòi hầu tòa.
  3. Ngoài việc tìm kiếm lời khuyên pháp lý, ChatGPT khuyến nghị “tìm kiếm lời khuyên từ cộng đồng nguồn mở”. Tổ chức Phần mềm Tự do đã làm cho vị trí của nó được biết đến, và nó không thuận lợi. Một cuộc khảo sát người dùng GitHub cũng có thể hữu ích ở đây.
  4. ChatGPT có khả năng ghi lại sự khác biệt giữa các thay đổi đơn thuần phái sinh và chuyển đổi đối với mã và dường như “thúc đẩy” rằng mã mà nó tạo ra là mã chuyển đổi. Tuy nhiên, khi được thăm dò về định nghĩa của các thuật ngữ riêng của nó, có vẻ như phần lớn đầu ra của nó là phái sinh. “Mã chỉ khác nhau về dấu chấm câu, tên biến và tên hàm, khoảng cách và thứ tự các thao tác nhưng tạo ra kết quả giống nhau trong cùng một khoảng thời gian và sử dụng kích thước được biên dịch và tốc độ thực thi tương tự không nhất thiết phải có mục đích, ký tự hoặc định nghĩa bài văn. Chức năng của mã và kết quả mà nó tạo ra là những yếu tố quan trọng nhất và những khác biệt nhỏ về mặt thẩm mỹ không làm thay đổi đặc điểm hoặc bối cảnh tổng thể của nó.”
  5. ChatGPT tuyên bố rõ ràng rằng các chuyên gia và các công cụ tính toán khác có vai trò xác định xem có xảy ra đạo văn hay không. Vì vậy, đã đến lúc nhờ một số chuyên gia xem xét mã được tạo và/hoặc bắt đầu áp dụng các chương trình phát hiện đạo văn.
  6. ChatGPT cố gắng đưa ra trường hợp rằng cách nó tạo ra đầu ra quan trọng đối với bản chất của đầu ra, tức là vì nó sử dụng suy luận thống kê chứ không phải các quy tắc rõ ràng nên đầu ra có thể là biến đổi. Tuy nhiên, khả năng định vị suy luận thống kê trực tiếp khác biệt với suy luận thống kê của các quy tắc và sau đó là ứng dụng của các quy tắc, không đặc biệt mạnh. Điều này rất quan trọng bởi vì các quy tắc đại diện cho các phép biến đổi cơ học mà rất có thể dẫn đến kết quả đầu ra đơn thuần là phái sinh hơn là biến đổi.


Suy nghĩ bổ sung


Microsoft đã tài trợ cho OpenAI với số tiền hàng tỷ đô la và sử dụng công nghệ cốt lõi của mình trong Microsoft Copilot. Sự hỗ trợ của Microsoft đối với nguồn mở được thúc đẩy rõ ràng, “Microsoft tập trung vào nguồn mở. Chúng tôi tin rằng sức mạnh của sự phát triển hợp tác thông qua quy trình nguồn mở có thể đẩy nhanh sự đổi mới và sự cộng tác mở đó thường cho phép các cộng đồng đạt được nhiều hơn những gì các thành viên của họ có thể làm một mình.” Bằng cách không sử dụng nó đòn bẩy để nhấn mạnh vào sự phân bổ tốt hơn cho các nhà cung cấp tài liệu đào tạo cốt lõi và sự đồng lõa của nó bằng cách tính phí người dùng cho Copilot, tôi cho rằng Microsoft không ủng hộ như họ nói.


Việc Microsoft thu phí Copliot không phải là một lập trường kinh tế có thể bào chữa được. Một bên khác, chẳng hạn như Google, có thể dễ dàng cung cấp miễn phí một dịch vụ tương tự.


Một điều khá rõ ràng là các bên khởi kiện trong Microsoft, GitHub và OpenAI nên yêu cầu hầu tòa và xem xét dữ liệu đào tạo cũng như so sánh hàng trăm hoặc hàng nghìn mẫu mã được tạo với dữ liệu. Rất có thể sẽ có vi phạm đối với các thuật toán và phương pháp cốt lõi. Cơ sở mã được tạo càng lớn thì càng có nhiều khả năng tạo ra một đối số cho bản chất biến đổi của ChatGPT.


Có vẻ như ChatGPT đã được đào tạo rõ ràng để nhảy theo chủ đề này và có nhiều đầu vào đào tạo gần đây hơn so với thời hạn đã công bố vào năm 2021. Việc đào tạo AI để nhảy như thế này thật dễ dàng bằng cách cung cấp dữ liệu đào tạo sai lệch. Số lượng bài báo cân đối về các vấn đề đạo đức, pháp lý và kỹ thuật liên quan đến AI trong tất cả các biểu hiện của nó có được sử dụng trong dữ liệu đào tạo không?


Cần có luật quy định rằng các AI có thể truy cập công khai phải có khả năng cung cấp các tham chiếu đến dữ liệu đào tạo của họ khi dữ liệu đó có bản quyền.


Sẽ là một bước nhảy vọt nhỏ nếu các AI tổng quát gửi kết quả đầu ra của chúng cho phần mềm chống đạo văn của bên thứ 3 được chứng nhận trước khi trả về kết quả và cảnh báo người dùng hoặc trong một số trường hợp, lặp lại để có kết quả khác.


Tôi thấy phản hồi này, "Tôi không có khả năng nhớ lại các đoạn thông tin hoặc văn bản cụ thể mà tôi đã tạo trong quá khứ", đặc biệt đáng lo ngại, mặc dù hầu hết nằm ngoài nội dung tạo mã. Điều này có thể đã xảy ra khi đối mặt với các quy định về lưu giữ hồ sơ. Nó cũng có vẻ kỳ lạ ở chỗ kết quả là cơ hội bị bỏ lỡ cho bất cứ điều gì khác ngoài việc học phản hồi ngay lập tức.


Kết luận của tôi, ChatGPT và các ứng dụng được xây dựng bằng cách sử dụng cùng một công nghệ cơ bản và dữ liệu đào tạo là sai về mặt đạo đức và pháp lý khi thừa nhận bản quyền.


Dự đoán của tôi, các vụ kiện rất tốn kém và chiến thắng thuộc về các tập đoàn trừ khi một người chơi như Microsoft bước lên và hoàn toàn phù hợp với các hành động và khả năng của mình với các tuyên bố về sự hỗ trợ của cộng đồng nguồn mở.


Tính năng hình ảnh tín dụng. Lời nhắc của HackerNoon AI Image Generator về “tại tòa án tối cao của Hoa Kỳ, một rô-bốt có pixel đại diện cho chính nó, tranh luận và bảo vệ chống lại cáo buộc hình sự trước bồi thẩm đoàn gồm các đồng nghiệp của nó.”