Xác suất luôn mê hoặc tôi. Nó tạo ra xương sống ẩn của Máy học và Trí tuệ nhân tạo. Tôi đã có cơ hội học nó ở trường và đại học. Nhưng chỉ đến khi tôi tham gia các khóa học về Thống kê Bayes, tôi mới nhận ra mình hiểu sai về nó như thế nào.
Bạn có thể đã bắt gặp câu hỏi, “Xác suất để được ngửa khi tung đồng xu” là bao nhiêu? Nếu câu trả lời của bạn là 1/2
, hãy suy nghĩ lại. Đó là nơi nó trở nên thú vị.
Toán học thường được xem xét dưới góc độ “nhất quán”. Chúng tôi cho rằng một vấn đề sẽ luôn có cùng một giải pháp cho dù chúng tôi giải quyết nó như thế nào. Đó là sự thật ngoại trừ khi nói đến xác suất.
Xác suất là một ngoại lệ ở chỗ nó có ba định nghĩa hoặc khuôn khổ khác nhau. Tiếp cận cùng một vấn đề với các định nghĩa này có thể mang lại các câu trả lời khác nhau (và hợp lệ).
Để thể hiện điều tương tự, chúng ta hãy xem xét vấn đề sau. Chúng tôi sẽ giải quyết nó bằng cách sử dụng cả ba khung Xác suất. Một điểm chung trong tất cả các khuôn khổ là tổng xác suất của tất cả các kết quả của một thử nghiệm luôn là 1
.
“Bạn tôi Sovit đã cho tôi một đồng xu. Anh ấy không nói với tôi liệu đồng xu có công bằng hay không. Xác suất để đồng xu này được ngửa là bao nhiêu?”
Đó là khuôn khổ đơn giản nhất trong xác suất. Nó cũng dễ hiểu nhất.
Khuôn khổ cổ điển nói rằng “Các kết quả có khả năng như nhau có xác suất như nhau”.
Trong bài toán trên, chúng ta không biết đồng xu có công bằng hay không. Chúng ta không thể nói liệu việc nhận được mặt ngửa có giống như việc nhận được các mặt sấp hay không. Vì vậy, chúng ta không thể giải quyết vấn đề này bằng khuôn khổ cổ điển.
Nhưng để giới thiệu cách sử dụng khuôn khổ này, hãy giả sử rằng đồng xu là công bằng. Điều đó có nghĩa là khả năng nhận được mặt ngửa cũng giống như khả năng nhận được mặt sấp. Vì đây là hai kết quả duy nhất có thể xảy ra và tổng xác suất là 1
nên xác suất mặt ngửa là 1/2
.
Khung cổ điển có thể trông thô sơ nhưng nó cũng là khung bị lạm dụng nhiều nhất. Những lập luận như “Hoặc có sự sống trên Sao Hỏa hoặc không có và vì vậy xác suất tồn tại sự sống trên Sao Hỏa là 1/2
” là sai. Bởi vì khuôn khổ cổ điển chỉ hoạt động khi các kết quả có khả năng xảy ra như nhau. Trong trường hợp này, sự tồn tại và không tồn tại của sự sống trên sao Hỏa không có khả năng như nhau.
Đó là một trong những khuôn khổ được sử dụng nhiều nhất trong xác suất. Nếu bạn đã giải quyết bất kỳ vấn đề nào trong xác suất, có thể bạn đã sử dụng khuôn khổ phổ biến để làm như vậy.
Khung phổ biến nói rằng để tính xác suất của một sự kiện, chúng ta cần tiến hành một thử nghiệm và quan sát kết quả. Lặp lại thí nghiệm vô số lần. Và, xác suất của sự kiện là P(E) = Count(favorable outcomes) / Count(total outcomes)
.
Trong thực tế, chúng ta không thể tiến hành một thí nghiệm vô số lần. Vì vậy, chúng tôi làm điều đó một số lần hữu hạn. Đối với vấn đề của chúng tôi, hãy tiến hành thử nghiệm 10
lần. Giả sử rằng chúng ta có 6
mặt ngửa và 4
mặt sấp. Vì vậy, xác suất để mặt ngửa là 0.6
.
Khuôn khổ thường xuyên cũng có những hạn chế. Xét bài toán tìm xác suất mưa vào ngày mai. Theo định nghĩa, chúng ta cần có vô số vũ trụ song song. Sau đó, chúng ta sẽ cần quan sát ngày mai trong mỗi vũ trụ này và đếm những vũ trụ có mưa.
Nhưng, nó không thể. Bên cạnh đó, tại sao chúng ta lại tính xác suất mưa vào ngày mai nếu chúng ta có thể quan sát ngày mai?
Đó là một trong những khuôn khổ được sử dụng nhiều nhất trong xác suất. Đây cũng là cách dễ hiểu nhất nhưng khó thực hiện.
Khung Bayesian nói rằng xác suất của một sự kiện là những gì bạn nghĩ. Đó là nhiều hơn về quan điểm cá nhân của bạn. Bạn đang xem môn cricket, và Sachin Tendulkar ở 94
. Bạn thốt lên rằng có 90%
khả năng anh ta sẽ đánh một thế kỷ. Đó là xác suất Bayes của bạn về sự kiện này.
Cho đến nay, trong hai khuôn khổ trên, chúng tôi đã bỏ lỡ việc tập trung vào thông tin quan trọng khác của vấn đề: “Bạn tôi Sovit đã cho tôi đồng xu.” Sovit là bạn tôi, và tôi biết anh ấy. Anh ấy đã đưa cho tôi những đồng tiền khác trong quá khứ. Giả sử rằng những đồng xu đó có xác suất quay đầu là 0.4
.
Nó được gọi là thông tin “trước”. Hai khung trên không có bất kỳ cách nào để sử dụng nó. Đó là nơi khuôn khổ Bayesian tỏa sáng. Nó cho phép chúng tôi sử dụng cả thông tin trước đó và dữ liệu, không giống như khuôn khổ thường xuyên chỉ dựa vào dữ liệu.
Chúng tôi sẽ phải giả định mức độ chúng tôi tin tưởng trước đó và mức độ chúng tôi tin tưởng vào dữ liệu của mình. Giả sử chúng ta tin tưởng cả 50%
(được gọi là trọng số). Xác suất của mặt ngửa sẽ là trung bình có trọng số của dữ liệu trước và sau: 0.5 * 0.4 + 0.5 * 0.6 = 0.5
.
Khung Bayesian có thể cung cấp câu trả lời thực tế hơn bằng cách sử dụng thông tin trước đó. Tuy nhiên, chúng ta phải đưa ra các giả định về trọng lượng. Đây chính là điểm mấu chốt của sự phê phán. Vì chúng tôi đưa ra các giả định, nên có thể làm sai lệch kết quả dựa trên thành kiến của chúng tôi.
Do đó, tuyên bố rằng xác suất nhận được mặt ngửa trên một đồng xu công bằng là 1/2 là không đúng. Nó chỉ đúng khi chúng ta nói về khuôn khổ cổ điển. Nói rằng xác suất để đồng xu có 6 mặt ngửa và 4 mặt ngửa trong một thử nghiệm tung 10 lần cũng là sai.
Điều đó chỉ đúng khi chúng ta đang nói về khuôn khổ thường xuyên. Bạn có được ý tưởng. Vì vậy, điều quan trọng là phải ghi nhớ các khuôn khổ mà chúng tôi đang sử dụng trong khi nêu xác suất của một sự kiện.
Đó là tất cả về xác suất và đó là các khuôn khổ khác nhau. Hãy cho tôi biết trong phần nhận xét nếu điều này khiến bạn suy nghĩ như nó đã làm với tôi. Hãy cho tôi một số vỗ tay nếu bạn thích bài viết.