Nếu bạn đã từng làm việc với dữ liệu, bạn gần như chắc chắn đã đưa ra những giả định hoặc niềm tin dựa trên thông tin không đầy đủ. Mỗi phân tích, mô hình hoặc dự đoán bắt đầu với một ý tưởng nào đó về những gì có khả năng xảy ra nhiều hơn và những gì có khả năng xảy ra ít hơn.
Trong lý thuyết xác suất, những niềm tin này thường được diễn đạt dưới dạng xác suất. Một trong những khuôn khổ mạnh mẽ nhất để làm việc với những niềm tin như vậy là suy diễn Bayes, một khái niệm được giới thiệu vào thế kỷ 18 bởi nhà thống kê và triết gia người Anh Thomas Bayes.
Trong tài chính, chúng ta hiếm khi biết được “sự thật.” Thị trường ồn ào, thông tin bị phân mảnh, và các tín hiệu thường mâu thuẫn. Thay vì sự chắc chắn, chúng ta hoạt động với những niềm tin cần được cập nhật liên tục khi có chứng cứ mới xuất hiện. Chúng ta thường làm điều này một cách trực giác.
Bài viết này cho thấy cách làm điều đó một cách có hệ thống, khoa học, và minh bạch bằng cách sử dụng định lý Bayes.
Ý tưởng cốt lõi: niềm tin như một đối tượng sống
Đặc biệt trong tài chính, chúng ta hiếm khi đối phó với những điều chắc chắn. Chúng ta xử lý với những niềm tin phát triển khi thông tin mới đến.
Suy diễn Bayesian hình thức hóa ý tưởng này với một quy tắc đơn giản nhưng mạnh mẽ:
Dữ liệu mới nên cập nhật, chứ không thay thế, những gì bạn đã tin.
Tại trung tâm của lý luận Bayesian là định lý Bayes:
P(Hᵢ | D) = (∑ⱼ P(D | Hⱼ) P(Hⱼ)) / (P(D | Hᵢ) P(Hᵢ))
Mặc dù công thức này có thể trông trừu tượng, nhưng mỗi thành phần có một cách giải thích rất tự nhiên trong lý luận tài chính.
Prior: những gì bạn tin trước khi có dữ liệu mới — P(Hi)
Prior đại diện cho niềm tin hiện tại của bạn về giả thuyết Hi trước khi quan sát bằng chứng mới.
Trong tài chính, một prior có thể đến từ:
các mẫu lịch sử,
các giả định vĩ mô dài hạn,
các mô hình cấu trúc,
hoặc thậm chí là phán đoán của chuyên gia.
Quan trọng là, prior không cần phải hoàn hảo. Nó chỉ đơn giản mã hóa vị trí của bạn ngay bây giờ.
Suy diễn Bayesian không trừng phạt các prior không hoàn hảo, mà tinh chỉnh chúng theo thời gian.
Likelihood: dữ liệu hỗ trợ một giả thuyết tốt như thế nào — P(D ∣ Hi)
Xác suất trả lời một câu hỏi rất cụ thể:
Nếu giả thuyết Hi là đúng, khả năng tôi quan sát được dữ liệu này là bao nhiêu?
Đây là nơi bằng chứng vào hệ thống.
Trong thực tế, các xác suất được xây dựng từ:
các bất ngờ vĩ mô,
các chỉ báo cảm xúc,
điểm số mô hình,
các lỗi dự đoán,
các biện pháp biến động,
hoặc bất kỳ tín hiệu định lượng nào bạn tin tưởng.
Điều quan trọng:
xác suất so sánh các giả thuyết tương đối với nhau,
chúng không tuyên bố sự thật tuyệt đối,
chúng chỉ đơn giản đo lường sự tương thích giữa dữ liệu và giả thuyết.
Posterior: niềm tin được cập nhật của bạn — P(Hi ∣ D)
Posterior là đầu ra của việc cập nhật Bayesian:
niềm tin của bạn sau khi thấy dữ liệu mới.
Nó kết hợp:
những gì bạn tin trước đó (prior),
dữ liệu có thông tin như thế nào (likelihood),
và một bước chuẩn hóa để đảm bảo xác suất vẫn nhất quán.
Về mặt khái niệm, posterior trả lời:
Dựa trên mọi thứ tôi biết trước đó và mọi thứ tôi vừa quan sát, tôi nên tin gì bây giờ?
Posterior này sau đó trở thành prior cho bản cập nhật tiếp theo, tạo ra một quá trình học liên tục.
Tại sao điều này quan trọng trong tài chính
Suy diễn Bayesian hoàn toàn phù hợp với cách mà các quyết định tài chính thực sự được đưa ra:
những niềm tin phát triển dần dần, không đột ngột,
thông tin mới hiếm khi thay thế mọi thứ ngay lập tức,
các tín hiệu mâu thuẫn có thể đồng tồn tại,
sự không chắc chắn được định lượng rõ ràng.
Thay vì hỏi:
“Giả thuyết này đúng hay sai?”
Các phương pháp Bayesian hỏi:
“Tôi nên tự tin bao nhiêu, dựa trên bằng chứng có sẵn?”
Sự chuyển đổi này — từ tư duy nhị phân sang niềm tin xác suất — là điều làm cho các phương pháp Bayesian trở nên mạnh mẽ trong các hệ thống ồn ào, phức tạp như thị trường tài chính.
Cập nhật niềm tin từ nhiều nguồn bằng chứng
Bây giờ hãy nói về việc cập nhật niềm tin bằng cách sử dụng nhiều nguồn bằng chứng.
Trong các quy trình tài chính thực tế, bạn hiếm khi cập nhật niềm tin từ một tín hiệu duy nhất. Bạn cập nhật từ một gói:
các thông báo vĩ mô (lạm phát, bất ngờ PMI),
cảm xúc (tin tức, xã hội, lệch tùy chọn),
các chỉ báo biến động/luồng,
các tín hiệu hiệu suất mô hình, v.v.
Suy diễn Bayesian xử lý điều này một cách tự nhiên.
nếu các nguồn bằng chứng độc lập có điều kiện cho một giả thuyết, thì:
P(D₁, … , Dₖ ∣ Hᵢ) = ∏ₛ₌₁ᵏ P(Dₛ ∣ Hᵢ)
Điều này có nghĩa là posterior trở thành: