GPT-5.4 – OpenAI ra mắt mô hình AI flagship dành cho công việc chuyên nghiệp.
GPT-5.4 – OpenAI ra mắt mô hình AI flagship dành cho công việc chuyên nghiệp. logo

GPT-5.4 – OpenAI ra mắt mô hình AI flagship dành cho công việc chuyên nghiệp.

🇻🇳 Tiếng Việt

Công cụ chatbot số 1 thế giới

★★★★★ 5.0 /5.0

GPT‑5.4 là gì

GPT-5.4 là mô hình AI hàng đầu được OpenAI phát hành, được định vị là “mô hình tiên tiến mạnh mẽ nhất được thiết kế cho công việc chuyên nghiệp”. Mô hình lần đầu tiên tích hợp suy luận, lập trình, thao tác máy tính gốc, tìm kiếm web sâu và ngữ cảnh triệu Token vào một mô hình duy nhất mà không hy sinh bất kỳ hiệu suất nào. Trong bài kiểm tra thao tác máy tính OSWorld, với tỷ lệ thành công 75%, lần đầu tiên vượt qua mức độ con người; trong bài kiểm tra công việc kiến thức GDPval, 83% nhiệm vụ đạt hoặc vượt qua tiêu chuẩn chuyên nghiệp. GPT-5.4 hỗ trợ hiểu giao diện qua chụp màn hình và thực hiện thao tác chuột và bàn phím, có thể hoàn thành các nhiệm vụ phức tạp giữa các ứng dụng một cách độc lập, đánh dấu sự chuyển đổi quan trọng của AI từ “trả lời câu hỏi” sang “hoàn thành nhiệm vụ”.

Chức năng chính của GPT‑5.4

  • Thao tác máy tính gốc:Thông qua chụp màn hình để hiểu giao diện, thực hiện nhấp chuột và nhập bàn phím, hoàn thành các nhiệm vụ phức tạp giữa các ứng dụng (như gửi email, điền biểu mẫu, thao tác web), tỷ lệ thành công trong bài kiểm tra OSWorld là 75%, lần đầu tiên vượt qua mức độ con người.
  • Công việc kiến thức sâu:Hỗ trợ xử lý các nhiệm vụ công việc thực tế của 44 nghề nghiệp, bao gồm tạo PPT, lập mô hình tài chính, phân tích dữ liệu, phân tích tài liệu pháp lý, v.v., bài kiểm tra GDPval cho thấy 83% đạt hoặc vượt qua tiêu chuẩn chuyên nghiệp.
  • Lập trình và gỡ lỗi nâng cao:Tích hợp khả năng GPT-5.3-Codex, hỗ trợ tạo mã, kiểm tra và tối ưu hóa; thêm Playwright Interactive để vừa viết mã vừa gỡ lỗi trực quan, có thể tự động kiểm tra ứng dụng web.
  • Gọi công cụ thông minh:Giới thiệu cơ chế tìm kiếm công cụ, truy vấn định nghĩa công cụ theo nhu cầu, giảm tiêu thụ Token 47%; hỗ trợ gọi linh hoạt các công cụ và API bên ngoài trong các nhiệm vụ nhiều bước.
  • Tìm kiếm web sâu:Hỗ trợ tìm kiếm liên tục nhiều vòng, lọc thông tin và tích hợp kết quả, bài kiểm tra BrowseComp đạt 82.7%, xuất sắc trong việc xử lý các truy vấn phức tạp kiểu “kim trong đống rơm”.
  • Xử lý ngữ cảnh siêu dài:API hỗ trợ ngữ cảnh tối đa 1 triệu Token, có thể xử lý toàn bộ tài liệu dự án trong một lần; hỗ trợ hình ảnh đầu vào độ phân giải cao lên đến 10.24 triệu pixel.
  • Điều chỉnh nhiệm vụ theo thời gian thực:Trước khi thực hiện nhiệm vụ phức tạp, hiển thị kế hoạch công việc, có thể điều chỉnh hướng đi bất cứ lúc nào trong quá trình thực hiện mà không cần bắt đầu lại.
  • Hiểu biết thị giác đa mô hình:Khả năng suy luận thị giác, phân tích tài liệu và nhận diện giao diện được nâng cao đáng kể, hỗ trợ hình ảnh độ phân giải cao và thao tác giao diện phức tạp.

Hiệu suất của GPT‑5.4

  • Công việc kiến thức:
    • Bài kiểm tra GDPval:83.0% nhiệm vụ đạt hoặc vượt qua mức độ chuyên gia ngành ( GPT-5.2 chỉ 70.9%).
    • Mô hình bảng cấp ngân hàng:87.3% (GPT-5.2 là 68.4%).
    • Tạo PPT:Đánh giá của con người cho thấy 68% thích GPT-5.4 hơn.
  • Thao tác máy tính:
    • OSWorld-Verified:Tỷ lệ thành công 75.0%, lần đầu tiên vượt qua mức độ con người 72.4%, GPT-5.2 chỉ 47.3%.
    • WebArena-Verified:67.3%, khả năng xử lý nhiệm vụ trình duyệt vượt trội.
    • Online-Mind2Web:92.8%, chỉ cần quan sát chụp màn hình có thể thao tác chính xác trên web.
  • Khả năng lập trình:
    • SWE-Bench Pro57.7%, hơi vượt qua GPT-5.3-Codex (56.8%), đồng thời độ trễ thấp hơn, hiệu quả Token cao hơn.
    • Terminal-Bench 2.0:75.1%, hiệu suất xử lý nhiệm vụ đầu cuối ổn định.
  • Công cụ và tìm kiếm:
    • BrowseComp:82.7% (Phiên bản Pro lên đến 89.3%), tăng 17 điểm phần trăm so với GPT-5.2 (65.8%), đạt mức cao mới trong ngành khởi nghiệp.
    • Toolathlon:54.6% (GPT-5.2 là 45.7%), việc gọi công cụ nhiều bước chính xác hơn.
    • Tiêu thụ Token:Giảm 47%, cơ chế tìm kiếm công cụ giảm chi phí đáng kể trong khi vẫn giữ được độ chính xác tương đương.
  • Học thuật và suy luận:
    • GPQA Diamond:92.8% (Phiên bản Pro 94.4%), câu hỏi khoa học gần như đạt điểm tối đa.
    • Kỳ thi cuối cùng của nhân loại (có công cụ):52.1% (Phiên bản Pro 58.7%), hiệu suất xuất sắc trong bài kiểm tra tổng hợp khó khăn.
    • ARC-AGI-2:73.3% (Phiên bản Pro 83.3%), khả năng suy luận trừu tượng tăng mạnh, GPT-5.2 Pro chỉ 54.2%.
  • Độ tin cậy:
    • Xác suất sai sót của một sự thật đơn lẻ:Giảm 33%.
    • Tỷ lệ sai sót trong câu trả lời hoàn chỉnh:Giảm 18%, trở thành mô hình factual nhất của OpenAI cho đến nay.

GPT‑5.4

Cách sử dụng GPT‑5.4

  • ChatGPT:Truy cập ChatGPT chính thức hoặc ChatGPT App, GPT-5.4 đã được mở cho người dùng ChatGPT Plus, Team và Pro, thay thế GPT-5.2 Thinking trở thành mô hình suy nghĩ mặc định.
  • OpenAI API:Gọi điểm cuối mô hình gpt-5.4 hoặc gpt-5.4-pro thông qua khóa API, hỗ trợ ngữ cảnh tối đa 1 triệu Token và chức năng tìm kiếm công cụ, tính phí theo mức tiêu thụ Token.
  • Codex:Truy cập Codex chính thức nhập /fast để bật chế độ tăng tốc, hoặc sử dụng cửa sổ ngữ cảnh 1M thử nghiệm để xử lý các dự án mã lớn, hỗ trợ gỡ lỗi trực quan Playwright Interactive.

Giá sản phẩm của GPT‑5.4

  • Đăng ký ChatGPT
    • Đăng ký Plus/Business:Bao gồm GPT-5.4 Thinking (3000 lần mỗi tuần).
    • Đăng ký Pro:Bao gồm GPT-5.4 Pro (không giới hạn).
  • API tính phí theo mức tiêu thụ
    • GPT-5.4:Đầu vào $2.50/million Token, đầu vào cache $0.25/million Token, đầu ra $15/million Token.
    • GPT-5.4 Pro:Đầu vào $30/million Token, đầu ra $180/million Token.

Các ứng dụng của GPT‑5.4

  • Tự động hóa văn phòng:Thay thế công việc thủ công trong việc tạo PPT, lập mô hình tài chính, phân tích dữ liệu, xử lý tài liệu và các công việc kiến thức khác.
  • Đại lý thông minh:Tự động thao tác máy tính để hoàn thành các nhiệm vụ giữa các ứng dụng, như tự động gửi email, điền biểu mẫu, lên lịch, nhập dữ liệu hàng loạt.
  • Phát triển phần mềm:Phát triển toàn diện, kiểm tra mã, sửa lỗi, hỗ trợ gỡ lỗi tương tác Playwright trong khi viết mã, có thể xây dựng độc lập các ứng dụng web và trò chơi phức tạp.
  • Quy trình doanh nghiệp:Kết nối hệ thống nội bộ để thực hiện tự động hóa RPA, xử lý các nhiệm vụ dài hạn nhiều bước như khai báo thuế, kiểm tra hợp đồng, dịch vụ khách hàng.
  • Nghiên cứu sâu:Tìm kiếm web nhiều vòng để tích hợp thông tin, xử lý các truy vấn phức tạp cần xác minh từ nhiều nguồn.