R-squared (R²) là một chỉ số thống kê cho biết mức độ biến động của biến phụ thuộc được giải thích bởi (các) biến độc lập trong một mô hình thống kê. Giá trị này dao động từ 0 đến 1, trong đó 1 thể hiện sự phù hợp hoàn hảo của mô hình với dữ liệu.
Công thức tính R-squared là:
R² = 1 - (Biến động chưa giải thích/Tổng biến động)
R-squared là một chỉ số thống kê cho biết mức độ biến động của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình hồi quy.
Trong đầu tư, R-squared thường được hiểu là tỷ lệ phần trăm biến động giá của một quỹ hoặc chứng khoán có thể được giải thích bởi biến động của chỉ số tham chiếu.
R-squared 100% có nghĩa là tất cả các biến động của một chứng khoán đều được giải thích hoàn toàn bởi biến động của chỉ số (hoặc bất kỳ biến độc lập nào bạn quan tâm).
Việc tính toán R-squared yêu cầu một số bước. Điều này bao gồm việc lấy các điểm dữ liệu (quan sát) của các biến phụ thuộc và độc lập và tiến hành phân tích hồi quy để tìm đường phù hợp nhất, thường từ một mô hình hồi quy. Đường hồi quy này giúp trực quan hóa mối quan hệ giữa các biến. Từ đó, bạn sẽ:
Tính các giá trị dự đoán
Trừ đi giá trị thực tế
Bình phương kết quả
Các ước tính hệ số và dự đoán này rất quan trọng để hiểu mối quan hệ giữa các biến. Điều này tạo ra một danh sách các bình phương sai số, khi được tổng hợp sẽ bằng phương sai chưa giải thích (hoặc "biến động chưa giải thích" trong công thức trên).
R-squared thể hiện tỷ lệ phương sai trong biến phụ thuộc có thể dự đoán được từ các biến độc lập. Giá trị 1 có nghĩa là tất cả biến động trong biến phụ thuộc được giải thích bởi các biến độc lập, trong khi giá trị 0 cho thấy các biến độc lập không giải thích được bất kỳ biến động nào.
Trong đầu tư tại Việt Nam, R-squared thường được sử dụng để đánh giá mức độ biến động của một cổ phiếu hoặc quỹ đầu tư so với chỉ số VN-Index. Ví dụ, nếu một cổ phiếu có R-squared là 0.85 so với VN-Index, điều này có nghĩa là 85% biến động giá của cổ phiếu đó có thể được giải thích bởi biến động của VN-Index.
Giá trị R-squared dao động từ 0% đến 100%:
R-squared từ 85% đến 100%: Cho thấy cổ phiếu hoặc quỹ có xu hướng biến động khá sát với chỉ số.
R-squared 70% hoặc thấp hơn: Cho thấy cổ phiếu hoặc quỹ thường không theo sát biến động của chỉ số.
Phân tích VIC với ngành bất động sản:
Có thể tính R-squared giữa VIC với chỉ số ngành bất động sản (VNREAL)
Nếu R-squared thấp (ví dụ < 0.4), điều này có thể cho thấy VIC thực tế không còn thuần túy là cổ phiếu bất động sản, mà đã trở thành một tập đoàn đa ngành
Điều này phù hợp với thực tế khi VIC đã đa dạng hóa sang bán lẻ (VinMart), ô tô (VinFast), du lịch-nghỉ dưỡng (Vinpearl)...
Phân tích cổ phiếu dầu khí với giá dầu:
PVS (Dịch vụ kỹ thuật dầu khí) và PVD (Khoan dầu khí):
R-squared cao với giá dầu (> 0.7) sẽ xác nhận đây là cổ phiếu có độ nhạy cao với giá dầu
R-squared trung bình (0.4-0.7) có thể cho thấy công ty đã đa dạng hóa doanh thu từ các mảng khác
R-squared thấp (< 0.4) có thể ngụ ý rằng công ty đã giảm phụ thuộc vào giá dầu
Ứng dụng thực tế trong đầu tư:
Đa dạng hóa danh mục: Chọn các cổ phiếu có R-squared thấp với nhau để giảm rủi ro
Giao dịch theo xu hướng: Với cổ phiếu có R-squared cao với hàng hóa, có thể dự đoán xu hướng dựa trên biến động giá hàng hóa
Phân loại cổ phiếu: Xác định đúng nhóm ngành thực sự của cổ phiếu để có chiến lược đầu tư phù hợp
Lưu ý khi sử dụng:
Nên tính R-squared trong nhiều khung thời gian khác nhau (ngắn, trung, dài hạn)
Kết hợp với các chỉ số khác như Beta để có cái nhìn toàn diện
Chú ý đến các sự kiện đặc biệt có thể ảnh hưởng đến tương quan (như Covid-19)
Beta và R-squared là hai chỉ số tương quan có liên quan nhưng khác nhau:
Beta đo lường mức độ rủi ro tương đối
R-squared đo lường mức độ tương quan của các thay đổi giá
Trong thị trường Việt Nam, một quỹ đầu tư có R-squared cao với VN-Index và beta cũng cao có thể mang lại lợi nhuận cao hơn chỉ số này, đặc biệt trong thị trường tăng trưởng.
R-squared có một số hạn chế cần lưu ý:
Không cho biết mô hình được chọn tốt hay xấu
Không cho biết dữ liệu và dự đoán có bị thiên lệch hay không
Giá trị cao hoặc thấp không nhất thiết tốt hay xấu
Lựa chọn và xây dựng các biến phù hợp
Xử lý vấn đề đa cộng tuyến
Tinh chỉnh đặc điểm mô hình
Xem xét các mối quan hệ phi tuyến tính
Không, R-squared luôn nằm trong khoảng từ 0 đến 1.
Giá trị R-squared thấp có thể do:
Thiếu các biến quan trọng
Mối quan hệ phi tuyến tính
Biến động vốn có trong dữ liệu
Trong lĩnh vực tài chính tại Việt Nam:
Trên 0.7: Tương quan cao
Dưới 0.4: Tương quan thấp Tuy nhiên, đây không phải là quy tắc cứng nhắc và phụ thuộc vào từng phân tích cụ thể.
R-squared là công cụ hữu ích trong đầu tư và các bối cảnh khác, giúp xác định mức độ ảnh hưởng của một hoặc nhiều biến độc lập đến biến phụ thuộc. Tuy nhiên, nó có những hạn chế nhất định cần được xem xét khi sử dụng trong thực tế.