Cạnh tranh với DeepSeek, OpenAI ra mắt loạt mô hình AI GPT-4.1 mới, rẻ hơn, thông minh hơn nhưng chỉ dành cho coder

Theo Nguyễn Hải - Đời sống pháp luật

Theo OpenAI, GPT-4.1 tốt hơn GPT-4o "ở hầu hết mọi khía cạnh", đặc biệt cải thiện về khả năng lập trình và tuân theo hướng dẫn.

OpenAI vừa chính thức giới thiệu GPT-4.1, phiên bản kế nhiệm của mô hình đa phương thức GPT-4o được ra mắt vào năm ngoái. Động thái này được xem là phản ứng trực tiếp với sự cạnh tranh ngày càng gay gắt từ các đối thủ, đặc biệt là DeepSeek của Trung Quốc với mô hình AI siêu hiệu quả về chi phí vừa ra mắt gần đây.

Trong buổi phát trực tiếp hôm thứ Hai, OpenAI tuyên bố GPT-4.1 vượt trội hơn GPT-4o "ở hầu hết mọi khía cạnh", với những cải tiến đáng kể về khả năng lập trình và tuân theo hướng dẫn. Đáng chú ý, GPT-4.1 rẻ hơn 26% so với người tiền nhiệm, một yếu tố quan trọng trong bối cảnh cạnh tranh về chi phí ngày càng gia tăng trong ngành công nghiệp AI.

Bên cạnh phiên bản tiêu chuẩn, OpenAI còn ra mắt hai phiên bản nhỏ hơn là GPT-4.1 Mini và GPT-4.1 Nano. Theo OpenAI, GPT-4.1 Mini có giá thành phải chăng hơn, phù hợp cho các nhà phát triển muốn thử nghiệm, trong khi GPT-4.1 Nano được mô tả là mô hình "nhỏ nhất, nhanh nhất và rẻ nhất" của công ty từ trước đến nay.

Điểm đáng chú ý nhất của dòng GPT-4.1, và cũng là một bước nhảy vọt so với GPT-4o, là khả năng xử lý lên đến 1 triệu token ngữ cảnh - bao gồm văn bản, hình ảnh hoặc video trong một prompt. Con số này cao hơn đáng kể so với giới hạn 128.000 token của GPT-4o, tương đương với khả năng xử lý khoảng 750.000 từ trong một lần (dài hơn cả tiểu thuyết "Chiến tranh và Hòa bình").

"Chúng tôi đã đào tạo GPT-4.1 để xử lý thông tin một cách đáng tin cậy trên toàn bộ độ dài ngữ cảnh 1 triệu token," OpenAI cho biết trong bài đăng công bố mô hình. "Chúng tôi cũng đã huấn luyện nó để đáng tin cậy hơn nhiều so với GPT-4o trong việc nhận biết văn bản liên quan và bỏ qua yếu tố gây nhiễu trong cả ngữ cảnh dài và ngắn."

Theo Sarah Friar, CFO của OpenAI, mô hình mới này đánh dấu một bước tiến quan trọng trong tham vọng tạo ra một "kỹ sư phần mềm tự động" của công ty. OpenAI khẳng định các mô hình trong tương lai của họ sẽ có khả năng lập trình toàn bộ ứng dụng từ đầu đến cuối, xử lý các khía cạnh như đảm bảo chất lượng, kiểm tra lỗi và viết tài liệu.

"Chúng tôi đã tối ưu hóa GPT-4.1 cho việc sử dụng trong thế giới thực dựa trên phản hồi trực tiếp để cải thiện các lĩnh vực mà nhà phát triển quan tâm nhất: lập trình giao diện người dùng, giảm thiểu chỉnh sửa không cần thiết, tuân theo định dạng một cách đáng tin cậy, tuân thủ cấu trúc và thứ tự phản hồi, sử dụng công cụ nhất quán, và nhiều hơn nữa," người phát ngôn của OpenAI cho biết qua email.

Về hiệu suất, OpenAI cho biết mô hình GPT-4.1 đầy đủ vượt trội hơn các mô hình GPT-4o và GPT-4o mini trên các tiêu chuẩn lập trình, bao gồm SWE-bench. Tuy nhiên, theo kiểm tra nội bộ của OpenAI, GPT-4.1 đạt điểm từ 52% đến 54,6% trên SWE-bench Verified, thấp hơn một chút so với Gemini 2.5 Pro của Google (63,8%) và Claude 3.7 Sonnet của Anthropic (62,3%) trên cùng một tiêu chuẩn.

Về giá cả, GPT-4.1 có mức giá $2 cho mỗi triệu token đầu vào và $8 cho mỗi triệu token đầu ra. GPT-4.1 mini có giá $0,40/triệu token đầu vào và $1,60/triệu token đầu ra, trong khi GPT-4.1 nano là $0,10/triệu token đầu vào và $0,40/triệu token đầu ra.

Mặc dù có những tiến bộ ấn tượng, OpenAI thừa nhận GPT-4.1 vẫn có một số hạn chế. Độ tin cậy của mô hình giảm khi xử lý nhiều token đầu vào. Trong một trong những bài kiểm tra của công ty, OpenAI-MRCR, độ chính xác của mô hình giảm từ khoảng 84% với 8.000 token xuống 50% với 1 triệu token. Ngoài ra, GPT-4.1 cũng có xu hướng "hiểu theo nghĩa đen" hơn GPT-4o, đôi khi đòi hỏi các prompt cụ thể và rõ ràng hơn.

Việc ra mắt GPT-4.1 cũng đánh dấu một bước ngoặt trong lịch trình phát hành của OpenAI. CEO Sam Altman đã thông báo trên nền tảng X rằng việc ra mắt GPT-5 bị trì hoãn và dự kiến sẽ đến "trong vài tháng tới", muộn hơn so với thời hạn tháng 5 được mong đợi trước đó. Altman cho biết sự chậm trễ một phần là do OpenAI "thấy việc tích hợp mọi thứ một cách suôn sẻ khó khăn hơn dự kiến".

Hiện tại, GPT-4.1 đã có sẵn cho các nhà phát triển thông qua API của OpenAI nhưng chưa được tích hợp vào ChatGPT, điều này cho thấy OpenAI đang tập trung vào việc phục vụ cộng đồng lập trình viên với mô hình mới nhất của mình.