OpenAI trình làng GPT-4 GA
OpenAI hôm nay thông báo sẽ cung cấp GPT-4 GA (General Availability), mô hình AI tạo văn bản mới nhất, thông qua API trả phí của hãng.
Bắt đầu từ chiều nay, tất cả các nhà phát triển API OpenAI hiện có “có lịch sử thanh toán thành công” đều có thể truy cập GPT-4. Công ty dự kiến sẽ mở cửa truy cập cho các nhà phát triển mới vào cuối tháng này, và sau đó bắt đầu nâng cao giới hạn khả dụng tùy thuộc vào “khả năng tính toán”.

“Hàng triệu nhà phát triển đã yêu cầu truy cập vào API GPT-4 kể từ tháng 3, và phạm vi các sản phẩm sáng tạo sử dụng GPT-4 ngày càng tăng,” OpenAI viết trong một bài đăng trên blog. “Chúng tôi hướng tới một tương lai nơi các mô hình AI dựa trên trò chuyện có thể hỗ trợ bất kỳ trường hợp sử dụng nào.”
GPT-4 có thể sinh văn bản (bao gồm cả mã lập trình) và chấp nhận dữ liệu đầu vào là hình ảnh và văn bản – một cải tiến so với GPT-3.5, tiền nhiệm của nó, chỉ chấp nhận văn bản – và hoạt động ở “mức con người” trên các tiêu chuẩn chuyên nghiệp và học thuật khác nhau. Giống như các mô hình GPT trước đây của OpenAI, GPT-4 được huấn luyện bằng dữ liệu công khai, bao gồm từ các trang web công khai, cũng như dữ liệu mà OpenAI đã cấp phép.
Khả năng hiểu hình ảnh không có sẵn cho tất cả khách hàng của OpenAI ngay lập tức. OpenAI đang thử nghiệm khả năng hiểu hình ảnh với một đối tác duy nhất, Be My Eyes, để bắt đầu. Nhưng OpenAI chưa chỉ ra khi nào hãng sẽ mở rộng cho lượng khách hàng rộng lớn hơn.
Đáng chú ý là, giống như ngay cả các mô hình AI tạo ra dữ liệu tốt nhất hiện nay, GPT-4 không hoàn hảo. Nó “ảo giác” sự thật và mắc lỗi suy luận, đôi khi với sự tự tin thái quá. Và nó không học từ kinh nghiệm của mình, thất bại ở các vấn đề khó như giới thiệu lỗ hổng bảo mật vào mã lập trình mà nó sinh ra.
Trong tương lai, OpenAI cho biết rằng sẽ cho phép các nhà phát triển tinh chỉnh GPT-3 và GPT-3.5 Turbo, một trong những mô hình tạo ra văn bản gần đây khác của nó nhưng ít có khả năng hơn, với dữ liệu của riêng họ, như đã có thể từ lâu với các mô hình sinh văn bản khác của OpenAI. Khả năng đó sẽ xuất hiện vào cuối năm nay, theo OpenAI.
Trong một thông báo liên quan, OpenAI cho biết rằng dự định loại bỏ các mô hình cũ có sẵn thông qua API để “tối ưu hóa khả năng tính toán của mình”. Bắt đầu từ ngày 4 tháng 1 năm 2024, các mô hình cũ – cụ thể là GPT-3 và một số phiên bản dẫn xuất của GPT-3 sẽ không còn nữa, và sẽ được thay thế bằng các mô hình “cơ bản GPT-3” mới có lẽ hiệu quả hơn về mặt tính toán.
Các nhà phát triển sử dụng các mô hình cũ sẽ phải nâng cấp thủ công tích hợp của họ trước ngày 4 tháng 1, và những người muốn tiếp tục sử dụng các mô hình tinh chỉnh cũ sau ngày 4 tháng 1 sẽ cần phải tinh chỉnh lại trên các mô hình GPT-3 cơ bản mới.
“Chúng tôi sẽ cung cấp hỗ trợ cho những người dùng đã tinh chỉnh các mô hình trước đó để làm cho quá trình chuyển đổi này trơn tru nhất có thể,” OpenAI viết. “Trong những tuần tới, chúng tôi sẽ liên lạc với các nhà phát triển đã sử dụng các mô hình cũ gần đây, và sẽ cung cấp thêm thông tin khi các mô hình mới hoàn thành sẵn sàng cho thử nghiệm sớm.”