Quang Vu
Active Member
- 650
- 2,227
Update:
Tuyệt vời!
Con Agent đã bắt đầu biết tối ưu ở biểu đồ số số 4 ngoài cùng bên phải. Số lệnh nó thực hiện trong một đợt huấn luyện đã bắt đầu giảm xuống, đây là điều tôi cực kỳ mong đợi. Bởi vì tôi muốn càng thực hiện ít giao dịch càng tốt. Giao dịch nhiều đồng nghĩa với phải đối diện với rủi ro nhiều lần. Tôi không thích điều đó.
Biểu đồ số 3 cũng rất tuyệt, con Agent đang biết giảm lỗi trong các lần giao dịch.
Biểu đồ số 2 lại càng tuyệt vời, nó cho thấy con Agent vẫn đang cần mẫn học tập chăm chỉ, và đang tích lũy kinh nghiệm rất ổn định. Có vẻ như model này của tôi đang có chút hiệu quả.
Nói chung là một cảm giác thật tuyệt, hơn những gì tôi mong đợi. Tôi nghĩ rằng sẽ đạt được kết quả này ở đâu đó khoảng 100k episodes, nhưng hiện tại qua 20k episodes nó đã cho thấy tín hiệu mừng.
Những kết quả này vô cùng có ý nghĩa với tôi, ở mặt nghiên cứu, nó đang chứng minh rằng một chương trình máy tính hoàn toàn có khả năng tự học và tự rút kinh nghiệm. Điều này đem đến cho tôi một hi vọng lớn. Cuộc chơi này chắc sẽ thú vị. Có gì mới tôi lại tiếp tục cập nhật chia sẻ cùng các bạn nhé.
Chúc bạn một buổi tối vui khỏe và an lành.
Tuyệt vời!
Con Agent đã bắt đầu biết tối ưu ở biểu đồ số số 4 ngoài cùng bên phải. Số lệnh nó thực hiện trong một đợt huấn luyện đã bắt đầu giảm xuống, đây là điều tôi cực kỳ mong đợi. Bởi vì tôi muốn càng thực hiện ít giao dịch càng tốt. Giao dịch nhiều đồng nghĩa với phải đối diện với rủi ro nhiều lần. Tôi không thích điều đó.
Biểu đồ số 3 cũng rất tuyệt, con Agent đang biết giảm lỗi trong các lần giao dịch.
Biểu đồ số 2 lại càng tuyệt vời, nó cho thấy con Agent vẫn đang cần mẫn học tập chăm chỉ, và đang tích lũy kinh nghiệm rất ổn định. Có vẻ như model này của tôi đang có chút hiệu quả.
Nói chung là một cảm giác thật tuyệt, hơn những gì tôi mong đợi. Tôi nghĩ rằng sẽ đạt được kết quả này ở đâu đó khoảng 100k episodes, nhưng hiện tại qua 20k episodes nó đã cho thấy tín hiệu mừng.
Những kết quả này vô cùng có ý nghĩa với tôi, ở mặt nghiên cứu, nó đang chứng minh rằng một chương trình máy tính hoàn toàn có khả năng tự học và tự rút kinh nghiệm. Điều này đem đến cho tôi một hi vọng lớn. Cuộc chơi này chắc sẽ thú vị. Có gì mới tôi lại tiếp tục cập nhật chia sẻ cùng các bạn nhé.
Chúc bạn một buổi tối vui khỏe và an lành.