Thử nghiệm sớm GPT-5: Không bằng bước nhảy vọt từ GPT-3 lên GPT-4

Kinhtetrithuc.vn – GPT-5 sắp được OpenAI phát hành. Người dùng sẽ xem xét bước tiến từ GPT-4 lên GPT-5 có tương xứng với những cải tiến mà phiên bản trước từng đạt được không.

GPT-5 phiên bản mới nhất của mô hình ngôn ngữ lớn làm nền tảng cho hiện tượng ChatGPT từ tháng 11.2022.

Hai chuyên gia thử nghiệm sớm GPT-5 đã nói với Reuters rằng họ rất ấn tượng với khả năng lập trình và giải quyết các bài toán khoa học, toán học của GPT-5. Thế nhưng, cả hai cho rằng mức độ cải tiến của GPT-5 so với GPT-4 không lớn bằng bước nhảy vọt từ GPT-3 lên GPT-4. Do đã ký thỏa thuận bảo mật thông tin, hai người này từ chối nêu tên, theo Reuters.

Bước tiến của GPT-4 đạt được nhờ sức mạnh điện toán và dữ liệu tăng lên đáng kể. OpenAI từng kỳ vọng rằng việc mở rộng quy mô theo cách tương tự sẽ tiếp tục tạo ra các mô hình AI ngày càng tốt hơn.

Tuy nhiên, công ty khởi nghiệp AI hàng đầu thế giới đã gặp khó khăn trong việc mở rộng quy mô. Một trong những vấn đề là rào cản dữ liệu mà OpenAI gặp phải. Ilya Sutskever, đồng sáng lập và cựu nhà khoa học trưởng của OpenAI, cho biết năm ngoái rằng trong khi sức mạnh xử lý đang tăng lên, lượng dữ liệu không tăng tương ứng.

Ông đề cập đến thực tế rằng mô hình ngôn ngữ lớn được huấn luyện trên các tập dữ liệu khổng lồ thu thập từ toàn bộ internet. Các phòng thí nghiệm AI hiện không còn nhiều lựa chọn khác cho kho dữ liệu văn bản do con người tạo ra.

Ngoài việc thiếu dữ liệu, một vấn đề khác là quá trình đào tạo các mô hình ngôn ngữ lớn có nhiều khả năng gặp phải lỗi do phần cứng gây ra vì hệ thống rất phức tạp. Các nhà nghiên cứu có thể không biết hiệu suất cuối cùng của mô hình ngôn ngữ lớn cho đến khi quá trình này kết thúc (có thể mất hàng tháng).

OpenAI chưa công bố thời điểm phát hành GPT-5, nhưng theo các báo cáo truyền thông, giới công nghệ kỳ vọng điều này sẽ xảy ra sớm, có thể trong tháng 8 này. Boris Power, người đứng đầu bộ phận Nghiên cứu ứng dụng tại OpenAI, viết trên mạng xã hội X hôm 6.8: “Rất háo hức chờ xem công chúng sẽ đón nhận GPT-5 như thế nào”.

“OpenAI đã tạo nên một bước tiến khổng lồ từ GPT-3 lên GPT-4, thế nên sự mong đợi dành cho GPT-5 là vô cùng lớn. Hy vọng GPT-5 sẽ mở khóa các ứng dụng AI vượt xa khả năng trò chuyện, tiến tới thực hiện các nhiệm vụ một cách hoàn toàn tự động”, Navin Chaddha, Giám đốc điều hành tại quỹ đầu tư mạo hiểm Mayfield nhận xét.

Mayfield đầu tư vào các công ty AI nhưng không có OpenAI.

Tính toán lúc kiểm thử

Cách đây gần ba năm, ChatGPT đã giới thiệu cho thế giới khái niệm về AI tạo sinh, khiến người dùng kinh ngạc với khả năng viết văn và thơ giống con người, và nhanh chóng trở thành một trong những ứng dụng phát triển nhanh nhất lịch sử.

Vào tháng 3.2023, OpenAI đã phát hành GPT-4, mô hình ngôn ngữ lớn có bước tiến vượt bậc về trí tuệ. Trong khi phiên bản trước đó là GPT-3.5 chỉ đạt điểm kỳ thi luật ở nhóm 10% thấp nhất, GPT-4 đã vượt qua kỳ thi mô phỏng này với kết quả thuộc top 10% cao nhất.

GPT-4 sau đó đã trở thành mô hình ngôn ngữ lớn tiêu chuẩn để đánh giá. Thế giới bắt đầu nhận ra rằng các mô hình AI có thể vượt trội hơn con người trong nhiều nhiệm vụ.

Không lâu sau, các công ty khác cũng bắt đầu bắt kịp OpenAI. Trong cùng năm 2023, Google của Alphabet và Anthropic (được Amazon, Google hậu thuẫn) đã tung ra những mô hình cạnh tranh với GPT-4. Chỉ trong vòng một năm, các mô hình ngôn ngữ lớn mã nguồn mở hiệu suất ngang với GPT-4 như Llama 3 của Meta Platforms cũng được phát hành.

Ngoài việc huấn luyện các mô hình ngôn ngữ lớn, OpenAI hiện đã đầu tư vào một hướng đi khác gọi là “tính toán lúc kiểm thử”, cho phép dồn nhiều sức mạnh xử lý hơn để giải quyết những nhiệm vụ khó như toán học hoặc tác vụ phức tạp đòi hỏi khả năng suy luận và ra quyết định giống con người.

Sam Altman, Giám đốc điều hành OpenAI, cho biết GPT-5 sẽ kết hợp cả hai yếu tố: Tính toán lúc kiểm thử và các mô hình ngôn ngữ lớn.

Trong một tập mới đây của podcast This Past Weekend with Theo Von, Sam Altman mô tả trải nghiệm thử nghiệm GPT-5 với giọng điệu căng thẳng.

Sam Altman nói rằng GPT-5 “hoạt động rất nhanh” khi kể lại những khoảnh khắc khiến ông cảm thấy rất lo sợ. Dù thúc đẩy việc phát triển GPT-5, doanh nhân 40 tuổi người Mỹ tuyên bố rằng trong một số phiên thử nghiệm, ông đã nhìn vào GPT-5 và so sánh mô hình AI thế hệ mới này với dự án Manhattan.

Những cải tiến được mong chờ ở GPT‑5

1. Suy luận có cấu trúc

GPT‑5 có thể được thiết kế để xử lý vấn đề logic phức tạp và các bước quyết định liên tiếp hiệu quả hơn rất nhiều so với GPT‑4 và GPT‑4o.

2. Khả năng đa phương thức thống nhất

Người dùng không còn phải chuyển đổi giữa các phiên bản mô hình ngôn ngữ lớn chuyên biệt để sử dụng theo nhu cầu, vì GPT‑5 tích hợp xử lý văn bản, hình ảnh, giọng nói và logic trong một hệ thống duy nhất.

3. Cửa sổ ngữ cảnh dài hơn và phản hồi chính xác hơn

Rộ tin GPT‑5 hỗ trợ cửa sổ ngữ cảnh rất lớn (có thể tới hàng triệu token), ghi nhớ cuộc trò chuyện dài và ít sai lệch nội dung, giảm hiện tượng ảo giác (đưa ra thông tin sai lệch giống như thật).

Cửa sổ ngữ cảnh là chỉ lượng thông tin mà mô hình ngôn ngữ lớn có thể ghi nhớ hoặc xử lý cùng lúc trong một đoạn văn bản.

4. Khả năng lập trình và giải toán được nâng cao

Hiệu suất trong các tác vụ liên quan đến lập trình, toán học và logic của GPT-5 được cho sẽ cải thiện đáng kể, vượt trội các đối thủ như Claude Sonnet 4 do Anthropic phát triển.

5. Dễ tùy biến và thân thiện với người dùng

Dự kiến GPT-5 sẽ có phiên bản mini và nano nhằm vận hành nhẹ hơn và tương thích API, phù hợp cả cho người dùng phổ thông và nhà phát triển, với giao diện tiện lợi và mang đến trải nghiệm mượt mà hơn.

6. Tăng cường an toàn và kiểm soát đạo đức

OpenAI có thể chú trọng đến việc thử nghiệm, kiểm soát đạo đức và xác minh sự an toàn của GPT‑5 trước khi ra mắt, nhằm giảm thiểu rủi ro khi sử dụng trong các vấn đề nhạy cảm như an ninh sinh học.

Theo Sơn Vân / Tạp chí 1 thế giới

Xem thêm: