Trong thế giới ngày nay, chúng ta có quyền truy cập vào một lượng dữ liệu khổng lồ nhờ các mô hình AI mạnh mẽ như   , cũng như các mô hình tầm nhìn và các công nghệ tương tự khác. Tuy nhiên, không chỉ về số lượng dữ liệu mà các mô hình này dựa vào mà còn về chất lượng. Tạo một tập dữ liệu tốt một cách nhanh chóng và ở quy mô lớn có thể là một nhiệm vụ đầy thách thức và tốn kém. ChatGPT  Đó là nơi học tập tích cực đến.  Nói một cách đơn giản, học tích cực nhằm mục đích tối ưu hóa chú thích của tập dữ liệu của bạn và đào tạo mô hình tốt nhất có thể bằng cách sử dụng ít dữ liệu đào tạo nhất.  Đó là phương pháp học tập có giám sát bao gồm quá trình lặp đi lặp lại giữa các dự đoán của mô hình và dữ liệu của bạn. Thay vì chờ đợi một bộ dữ liệu hoàn chỉnh, bạn có thể bắt đầu với một lô nhỏ dữ liệu có chú thích được sắp xếp và huấn luyện mô hình của mình với nó.  Sau đó, bằng cách sử dụng phương pháp học chủ động, bạn có thể tận dụng mô hình của mình để gắn nhãn dữ liệu chưa xem, đánh giá độ chính xác của các dự đoán và chọn tập hợp dữ liệu tiếp theo để chú thích dựa trên các chức năng thu thập.  Một lợi thế của học tích cực là bạn có thể phân tích mức độ tin cậy của các dự đoán trong mô hình của mình.  Nếu một dự đoán có độ tin cậy thấp, mô hình sẽ yêu cầu dán nhãn các hình ảnh bổ sung thuộc loại đó. Mặt khác, các dự đoán có độ tin cậy cao sẽ không yêu cầu thêm dữ liệu. Bằng cách chú thích tổng thể ít hình ảnh hơn, bạn tiết kiệm thời gian và tiền bạc trong khi đạt được mô hình tối ưu. Học tích cực là một cách tiếp cận đầy hứa hẹn để làm việc với các bộ dữ liệu quy mô lớn.   Có một vài điểm chính cần nhớ về học tập tích cực.  Đầu tiên, nó liên quan đến chú thích của con người, cho phép bạn kiểm soát chất lượng dự đoán của mô hình. Nó không phải là một hộp đen được đào tạo trên hàng triệu hình ảnh. Bạn tích cực tham gia vào sự phát triển của nó và hỗ trợ cải thiện hiệu suất của nó. Khía cạnh này làm cho việc học tích cực trở nên quan trọng và thú vị, mặc dù nó có thể làm tăng chi phí so với các phương pháp không giám sát. Tuy nhiên, thời gian tiết kiệm được trong đào tạo và triển khai mô hình thường lớn hơn các chi phí này.  Ngoài ra, bạn có thể sử dụng các công cụ chú thích tự động và sửa chúng theo cách thủ công, giúp giảm thêm chi phí.  Trong phương pháp học tích cực, bạn có một tập hợp dữ liệu được gắn nhãn mà mô hình của bạn được đào tạo trên đó, trong khi tập hợp không được gắn nhãn chứa dữ liệu tiềm năng chưa được chú thích. Một khái niệm quan trọng là các chiến lược truy vấn, xác định dữ liệu nào sẽ được gắn nhãn. Có nhiều cách tiếp cận khác nhau để tìm các tập hợp con có nhiều thông tin nhất trong nhóm lớn dữ liệu chưa được gắn nhãn. Ví dụ: lấy mẫu độ không đảm bảo liên quan đến việc kiểm tra mô hình của bạn trên dữ liệu chưa được gắn nhãn và chọn các ví dụ được phân loại kém tin cậy nhất để chú thích.     , trong đó nhiều mô hình, mỗi mô hình được đào tạo trên một tập hợp con dữ liệu được dán nhãn khác nhau, tạo thành một ủy ban. Những mô hình này có những quan điểm riêng biệt về vấn đề phân loại, giống như những người có kinh nghiệm khác nhau có cách hiểu khác nhau về các khái niệm nhất định. Dữ liệu được chú thích được chọn dựa trên sự bất đồng giữa các mô hình ủy ban, cho thấy sự phức tạp. Quá trình lặp lại này tiếp tục khi dữ liệu đã chọn được chú thích liên tục. Một kỹ thuật khác trong học tập tích cực là Truy vấn theo Ủy ban (QBC)  Đây chỉ là giải thích cơ bản về học tích cực, giới thiệu một ví dụ về chiến lược truy vấn.  Nếu bạn quan tâm, tôi có thể cung cấp thêm thông tin hoặc video về các chiến lược máy học khác. Một ví dụ thực tế về học tập tích cực là khi bạn trả lời hình ảnh xác thực trên Google. Bằng cách đó, bạn giúp họ xác định các hình ảnh phức tạp và xây dựng tập dữ liệu với đầu vào tập thể của nhiều người dùng, đảm bảo cả chất lượng tập dữ liệu và xác minh của con người. Vì vậy, lần tới khi bạn gặp một hình ảnh xác thực, hãy nhớ rằng bạn đang đóng góp vào sự phát triển của các mô hình AI!  Để tìm hiểu thêm và xem một ví dụ thực tế bằng cách sử dụng một công cụ tuyệt vời được phát triển bởi những người bạn của tôi tại Encord, hãy xem video:   https://youtu.be/Zv6UzuwUBd4?embedable=true&transcript=true

The writer is smart, but don't just like, take their word for it. #DoYourOwnResearch before making any investment decisions or decisions regarding you health or security. (Do not regard any of this content as professional investment advice, or health advice)

Walkthroughs, tutorials, guides, and tips. This story will teach you how to do something new or how to do something better.

The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.

This writer has a vested interested be it monetary, business, or otherwise, with 1 or more of the products or companies mentioned within.

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

2022 - HackerNoon Contributor of the Year - Google

2022 - HackerNoon Contributor of the Year - Innovation

2022 - HackerNoon Contributor of the Year - Machine Learning

2022 - HackerNoon Contributor of the Year - Natural Language Processing

2022 - Top Tech Youtuber

2021 - HackerNoon Contributor of the Year - DEEP-LEARNING

Nominated for 2022 - Best Data Science Newsletter

Nominated for 2022 - HackerNoon Contributor of the Year - Artificial Intelligence

Nominated for 2022 - Top Tech Youtuber

Nominated for 2022 - HackerNoon Contributor of the Year - Innovation

Nominated for 2022 - HackerNoon Contributor of the Year - Data Science

Nominated for 2022 - HackerNoon Contributor of the Year - Natural Language Processing

Nominated for 2022 - HackerNoon Contributor of the Year - Computer Vision

Nominated for 2022 - HackerNoon Contributor of the Year - Google

Nominated for 2022 - HackerNoon Contributor of the Year - Machine Learning

Nghe bài viết này bằng Tiếng Anh, đọc bởi robot thông minh của HackerNoon

Giới thiệu về Học tập tích cực

About Author

BÌNH LUẬN

chuyên mục

BÀI VIẾT NÀY CŨNG CÓ MẶT TẠI

Related Stories

85 Stories To Learn About Productivity Hacks

94 Stories To Learn About John Locke

189 Stories To Learn About Reading Books

309 Stories To Learn About Smart Contracts

85 Stories To Learn About Productivity Hacks

94 Stories To Learn About John Locke

189 Stories To Learn About Reading Books

309 Stories To Learn About Smart Contracts

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps