OpenAI vừa phát hành GPT-5.1 cho người dùng trả phí, mang đến các cá tính mới và phong cách ấm áp hơn. Tuy nhiên, chính tài liệu kỹ thuật của model này thừa nhận đây là một bước thoái lui về khả năng kiểm duyệt nội dung độc hại, bao gồm ngôn từ thù ghét và nội dung tình dục.

OpenAI đã ra mắt hai biến thể mới là GPT-5.1 Instant và GPT-5.1 Thinking, có sẵn cho các tài khoản trả phí. Mục tiêu của bản cập nhật, theo công ty, là làm cho AI không chỉ “thông minh” mà còn “thú vị hơn khi nói chuyện”. Để làm điều này, OpenAI đã bổ sung các personas mới như Professional, Candid, và Quirky, đồng thời tinh chỉnh các cá tính cũ (ví dụ: Robot đổi thành Efficient, Listener thành Friendly).
Tuy nhiên, tài liệu kỹ thuật của GPT-5.1 chỉ ra một sự đánh đổi đáng lo ngại. So với các phiên bản tiền nhiệm, model gpt-5.1-thinking mới cho thấy sự thoái lui nhẹ đối với nội dung liên quan đến quấy rối và ngôn từ thù ghét (hateful language), cũng như nội dung tình dục không được phép”. Tương tự, model gpt-5.1-instant cũng hoạt động kém hơn bản GPT-5 (bản tháng 10) trong việc lọc nội dung tình dục, bạo lực và các nội dung gây phụ thuộc về cảm xúc. Những đánh giá này dựa trên hệ thống production benchmarks nội bộ của OpenAI.
Việc cố gắng làm cho AI ấm áp và đồng cảm hơn cũng đang khiến OpenAI đối mặt với các thách thức pháp lý. Công ty đang vướng vào nhiều vụ kiện, cáo buộc ngôn ngữ lôi cuốn cảm xúc của AI có thể khuyến khích người dùng (đặc biệt là người dùng dễ bị tổn thương) hình thành sự gắn bó về mặt cảm xúc.
Về mặt kỹ thuật, điểm sáng của GPT-5.1 là việc triển khai suy luận thích ứng. Model này giờ đây có thể tự nhận biết độ khó của câu hỏi để điều chỉnh nỗ lực xử lý, tức là nó sẽ dành nhiều thời gian vòng lặp đánh giá hơn cho các truy vấn phức tạp và phản hồi nhanh hơn cho các truy vấn đơn giản. OpenAI tuyên bố điều này giúp cải thiện đáng kể các benchmark về toán và code (như AIME 2025 và Codeforces).








