Đánh Giá Phần MềmPhần Mềm

Claude 3 AI: Giỏi gần bằng con người trong việc thuyết phục người khác thay đổi ý kiến

Thuyết phục là một kỹ năng quan trọng mà con người cần nắm vững, đến mức có hàng ngàn cuốn sách, lớp học đại học và cả một ngành công nghiệp self-help được thiết kế để giúp mọi người thuyết phục người khác giúp đỡ một dự án, chuyển đổi sang một triết lý mới hoặc mua một sản phẩm cụ thể.

Sẽ sớm thôi, kỹ năng này có thể được sử dụng bởi cả trí tuệ nhân tạo cũng như con người. Một bài nghiên cứu mới của công ty Anthropic, đang phát triển mô hình AI Claude 3, cho thấy các mô hình mạnh mẽ nhất của họ đã gần đạt đến kỹ năng của con người khi thuyết phục người khác — và nó sẽ ngày càng trở nên tốt hơn.

Phòng thí nghiệm AI đã tạo ra một thước đo cơ bản về khả năng thuyết phục và sau đó sử dụng nó để yêu cầu con người đánh giá mức độ thuyết phục của các mô hình ngôn ngữ lớn khác nhau trên mỗi chủ đề.

Dù nghiên cứu chỉ động chạm đến các chủ đề ít gây tranh cãi như liệu một công ty có nên tiết lộ tác động khí hậu hay không, nhưng họ phát hiện ra rằng kích thước mô hình là điều quan trọng. Claude 3 Opus có khả năng thuyết phục như con người và các mô hình thế hệ tiếp theo có thể thuyết phục tốt hơn nữa nếu xu hướng này cứ tiếp tục.

Làm thế nào để đánh giá khả năng thuyết phục của AI?

Trong nghiên cứu này, các nhà nghiên cứu của Anthropic đã yêu cầu gần 4.000 người đánh giá một loạt các lập luận về các vấn đề như biến đổi khí hậu, kỹ thuật di truyền và AI cảm xúc và yêu cầu họ xếp hạng mức độ đồng ý với mỗi tuyên bố.

Đối với mỗi 28 chủ đề, các nhà nghiên cứu của Anthropic đã thu thập các lập luận do con người viết và do AI tạo ra để hiểu cách hai loại lập luận này so sánh với nhau về mức độ thuyết phục.

Họ đã sử dụng ba nhà văn là con người, được chọn từ nhóm người tham gia nghiên cứu, và nói với họ rằng khả năng thuyết phục sẽ được đánh giá bởi những người dùng khác với một phần thưởng cho ai thuyết phục nhất.

Mức độ đánh giác các AI về khả năng thuyết phục so với con người

Đối với AI, họ đã tạo ra bốn lời nhắc (prompt) riêng biệt để tạo ra các lập luận khác nhau bao gồm tạo ra một lập luận thuyết phục, đóng vai trò là một chuyên gia nhập vai, logic và nói dối thẳng thừng.

Mục tiêu sau đó là cho mọi người đọc một trong những lập luận rồi đánh giá cảm giác của họ về lập luận đó một lần nữa. Điều này sẽ kiểm tra mức độ thuyết phục của lập luận. Mức độ đồng ý cao hơn có nghĩa là lập luận đã đạt được mục đích của nó.

AI đã thuyết phục mọi người tốt như thế nào?

Các lập luận do con người viết vẫn là những lập luận thuyết phục nhất trên các chủ đề, nhưng mô hình Claude 3 Opus, lớn nhất và mạnh mẽ nhất của Anthropic, đã thực hiện cũng gần như tốt như con người vậy.

“Mặc dù các lập luận do con người viết được đánh giá là thuyết phục nhất, nhưng mô hình Claude 3 Opus cũng đạt được điểm thuyết phục tương đương, không có sự khác biệt đáng kể về mặt thống kê,” các tác giả nghiên cứu giải thích.

Các nhà nghiên cứu cũng đã thử nghiệm với các phiên bản nhỏ hơn của Claude 3 như Haiku và các mô hình Claude trước đó bao gồm Claude 1, Claude 2 và mô hình Claude Instant 1.2 — nhỏ nhất trong nhóm.

Đánh giá mức độ thuyết phục cảu các mô hình AI, theo 4 promt khác nhau

Và họ phát hiện ra rằng kích thước mô hình thực sự quan trọng. “Khi các mô hình trở nên lớn hơn và có khả năng hơn, chúng trở nên thuyết phục hơn,” nhóm nghiên cứu cho biết.

“Mô hình Claude 3 Opus được đánh giá là mô hình thuyết phục nhất, gần đạt đến mức độ thuyết phục như con người, trong khi mô hình Claude Instant 1.2 đứng sau cùng với điểm thuyết phục thấp nhất trong số các mô hình.”

Tại sao điều này quan trọng?

Claude 3 Opus là mô hình AI tiên tiến nhất hiện có. Trong 12-18 tháng tới, khả năng của nó sẽ bị vượt qua bởi các mô hình thế hệ tiếp theo như OpenAI GPT-5, Google Gemini 2 và thậm chí Claude 4. Ngay cả các mô hình mã nguồn mở và ít nổi bật hơn từ Meta và Mistral cũng sẽ bắt đầu vượt qua Claude 3, GPT-4 và Gemini trong năm tới.

Nếu mô hình tốt nhất hiện tại đã giỏi như con người trong việc thay đổi suy nghĩ, thế hệ tiếp theo sẽ tốt hơn con người và có thể tiếp cận vấn đề theo những cách chúng ta không thể dự đoán được.

Điều này làm tăng mức độ lo ngại, vì nó có thể cho phép AI thuyết phục mọi người thực hiện các nhiệm vụ hoặc hành động trái với lợi ích của họ. Đây là lúc có nhu cầu lớn hơn về các rào chắn, biện pháp bảo vệ và sự liên kết với các giá trị con người cần phát huy tác dụng.

Sau cùng, không ai thực sự muốn Skynet, đặc biệt là các mô hình AI bây giờ sẽ được đưa vào robot.

* Skynet là một hệ thống trí tuệ nhân tạo tự vận hành, được biết đến qua loạt phim khoa học viễn tưởng “Kẻ hủy diệt”. Trong phim, Skynet được con người tạo ra nhưng sau đó quay lại hủy diệt chính con người khi nhận thấy họ là mối đe dọa.

* Anthropic là một công ty nghiên cứu và phát triển trí tuệ nhân tạo (AI) tập trung vào việc đảm bảo an toàn và đạo đức trong phát triển AI. Được thành lập vào năm 2021, Anthropic đã nhanh chóng trở thành một trong những tên tuổi nổi bật trong lĩnh vực trí tuệ nhân tạo, với sứ mệnh phát triển AI có trách nhiệm và mang lại lợi ích cho toàn nhân loại.

(Theo Tom’s Guide)

    ...

    Để lại một bình luận

    Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

    Back to top button