Một nghiên cứu gần đây đã chỉ ra rằng một mô hình ngôn ngữ AI, ChatGPT, vượt trội so với các bác sĩ con người về chất lượng và sự đồng cảm trong lời khuyên bằng văn bản của họ, The Guardian đưa tin.

Nghiên cứu cho thấy các trợ lý AI có khả năng đóng một vai trò quan trọng trong y học và có thể giúp cải thiện khả năng giao tiếp của bác sĩ với bệnh nhân của họ.

AI vượt qua bài kiểm tra chất lượng và sự đồng cảm dành cho bác sĩ!

Nghiên cứu, được công bố trên tạp chí JAMA Internal Medicine, đã kiểm tra dữ liệu từ cộng đồng AskDocs của Reddit, nơi các chuyên gia chăm sóc sức khỏe được chứng nhận trả lời các câu hỏi y tế của thành viên từ người dùng internet.

Các nhà nghiên cứu đã lấy một mẫu ngẫu nhiên gồm 195 trao đổi trên AskDocs, trong đó một bác sĩ được chứng nhận đã trả lời một câu hỏi công khai. Sau đó, truy vấn ban đầu được chuyển tiếp đến ChatGPT, được hướng dẫn trả lời.

Cũng đọc: Hệ thống AI của AdA DeepMind giải quyết các nhiệm vụ mới nhanh và chính xác như con người

Một nhóm gồm ba chuyên gia chăm sóc sức khỏe được cấp phép, những người không biết liệu câu trả lời đến từ bác sĩ thực sự hay ChatGPT, đã đánh giá các câu trả lời về chất lượng và sự đồng cảm.

Về cơ bản, các nhà nghiên cứu đang cố gắng chạy thử nghiệm Turing tương đương với các chatbot AI trong lĩnh vực y tế.

Kết quả tuyệt vời cho ChatGPT

Trước khi thảo luận về kết quả, điều đáng chú ý là ChatGPT của OpenAI trước đó đã trải qua một cuộc đánh giá tương tự. Vào tháng 1, ChatGPT đã thu hút sự chú ý với khả năng đạt điểm B/B trong kỳ thi MBA.

Vào tháng 2, ChatGPT đã đạt được tiến bộ đáng kể trong lĩnh vực trí tuệ nhân tạo khi vượt qua thành công giai đoạn phỏng vấn xin việc ban đầu cho vị trí kỹ sư phần mềm L3.

Đây là một thành tích đáng chú ý, vì các vị trí L3 thường được nắm giữ bởi những sinh viên mới tốt nghiệp đại học muốn bắt đầu sự nghiệp của họ trong lĩnh vực viết mã.

Trong cùng tháng đó, một nghiên cứu mới cho thấy ChatGPT của OpenAI đã đạt gần 60% ngưỡng vượt qua trong Kỳ thi cấp phép y tế của Hoa Kỳ (USMLE), cho thấy khả năng gần như vượt qua kỳ thi của nó.

Chuyển sang các bài kiểm tra chất lượng và sự đồng cảm, The Guardian nói với chúng tôi rằng hội thảo thích câu trả lời của ChatGPT hơn câu trả lời của bác sĩ con người trong 79% thời gian.

Phản hồi ChatGPT cũng được đánh giá là có chất lượng tốt hoặc rất tốt trong 79% thời gian, so với 22% phản hồi của bác sĩ và 45% phản hồi ChatGPT được đánh giá là đồng cảm hoặc rất đồng cảm so với chỉ 5% phản hồi của bác sĩ.

Bot AI có thể đã thất bại trong kỳ thi cấp phép y tế thực tế, nhưng điều này chứng tỏ nó có thể là một hướng dẫn đồng cảm cho bất kỳ ai nếu được nhắc đúng.

Đây là một tin tốt vì nhiều công ty đã bắt đầu tích hợp chatbot làm máy phản hồi trang web tự động.

ChatGPT hứa hẹn những cải tiến trong chăm sóc sức khỏe

tiến sĩ John Ayers của Đại học California San Diego, một trong những tác giả của nghiên cứu, cho biết kết quả nêu bật tiềm năng của các trợ lý AI trong việc cải thiện chăm sóc sức khỏe. Ông nói: “Cơ hội để cải thiện chăm sóc sức khỏe với AI là rất lớn.

tiến sĩ Christopher Longhurst của UC San Diego Health cũng nhận xét về kết quả, nói rằng nghiên cứu cho thấy rằng các công cụ như ChatGPT có thể soạn thảo lời khuyên y tế cá nhân hóa chất lượng cao một cách hiệu quả để các bác sĩ xem xét. Anh ấy nói thêm rằng họ đã bắt đầu quá trình sử dụng ChatGPT tại UCSD Health.

Vẫn được đăng ở đây tại Tech Times.

Bài viết liên quan: AI có thể ngăn chặn đại dịch tiếp theo—nhưng bằng cách nào?