OpenAI
Trang này được dịch bằng máy học. Xem bài viết gốc bằng tiếng Anh.

Quản lý câu lệnh trong Khu thử nghiệm

Câu lệnh chất lượng cao để khởi động mọi tích hợp thành công

Đã cập nhật: 3 days ago

Tổng quan

Bản cập nhật Khu thử nghiệm mới nhất của chúng tôi giới thiệu một quy trình làm việc có cấu trúc, thân thiện với việc hoàn tác để bạn có thể tự tin lặp lại, xác thực các thay đổi và chuyển từ thử nghiệm sang production với ít bước hơn. Dưới đây là phần giới thiệu nhanh về những gì đang ra mắt và cách bắt đầu.

Có gì mới

Câu lệnh cấp dự án

Giờ đây, câu lệnh ở cấp Dự án và không còn ở cấp người dùng nữa.

Lịch sử phiên bản với hoàn tác chỉ bằng một cú nhấp

Phát hành bất kỳ bản nháp nào để tạo phiên bản mới, sau đó khôi phục ngay phiên bản trước đó. Ở hậu trường, một Prompt ID duy nhất luôn trỏ đến phiên bản đã phát hành mới nhất, và bạn cũng có thể chỉ định một phiên bản cụ thể nếu muốn một tham chiếu được ghim.

Biến câu lệnh

Thêm chỗ giữ chỗ như {user_goal} để giúp tách câu lệnh tĩnh khỏi thông tin dành riêng cho từng trường hợp (đầu vào).

Prompt ID

Việc phát hành khóa bản nháp hiện tại vào một ID mà các công cụ hạ nguồn có thể gọi ổn định trong khi bạn tiếp tục lặp lại trong các bản nháp mới.

So sánh song song

So sánh trực quan đầu ra từ hai phiên bản để quyết định phiên bản nào hoạt động tốt hơn trước khi bạn phát hành.

Biến được nhận diện trong API & SDK

Responses APIAgents SDK giờ chấp nhận cùng các {variables} mà bạn định nghĩa trong Playground, vì vậy câu lệnh bạn thử nghiệm chính là câu lệnh bạn gọi bằng chương trình—hiện tại chỉ cần truyền văn bản đã kết xuất.

Tích hợp Evals tích hợp sẵn (chạy thủ công)

Liên kết một Eval để điền sẵn biến và xem kết quả đạt/trượt ngay trên trang chi tiết câu lệnh. Liên kết được lưu cùng Prompt ID để thử nghiệm có thể lặp lại.

Optimize

Optimize là một công cụ mới có trong các trang Playground và Logs, tự động cải thiện câu lệnh bằng cách phát hiện và sửa các mâu thuẫn, chỉ dẫn không rõ ràng và định dạng đầu ra còn thiếu.

Khi chạy, công cụ này trả về phiên bản cải thiện của câu lệnh hoặc các gợi ý hữu ích, cùng với bản tóm tắt các thay đổi đã thực hiện. Bạn có thể xem trước các chỉnh sửa và áp dụng trực tiếp trong Playground chỉ với một cú nhấp.


Hướng dẫn bắt đầu nhanh

Tạo câu lệnh

Đi tới Playground → Prompts → Create New, soạn thảo văn bản của bạn và thêm {variables} nếu cần.

Bạn có thể dùng tính năng generate để ChatGPT gợi ý một câu lệnh, định nghĩa hàm hoặc lược đồ đầu ra dựa trên mô tả tác vụ của bạn.

Sử dụng tính năng optimize để xem lại và nhận đề xuất cải thiện.

Thêm hàm (tùy chọn)

Gọi hàm cho phép bạn kết nối câu lệnh với các hành động hoặc dữ liệu trong thế giới thực mà không cần rời khỏi Playground.

Để biết thêm hướng dẫn về cách sử dụng hàm, vui lòng tham khảo bài viết của chúng tôi: Gọi hàm trong Chat Playground

Đính kèm một Eval (tùy chọn)

Chọn Link Eval để tạo dữ liệu kiểm thử, chạy bộ chấm điểm và xem kết quả đạt/trượt. Chạy lại Eval sau mỗi lần phát hành để phát hiện hồi quy cho đến khi có các lần chạy tự động.

Phát hành

Nhấp vào Publish để tạo Prompt ID. Tiếp tục thử nghiệm trong một bản nháp mới và khôi phục bất kỳ phiên bản đã phát hành nào từ History chỉ với một cú nhấp.

Lặp lại

Kiểm thử câu lệnh mới của bạn, xem lại kết quả và tiếp tục lặp lại khi cần.

Mẹo để tạo câu lệnh tốt

Đặt hướng dẫn về giọng điệu tổng thể hoặc vai trò trong thông điệp System; giữ các chi tiết và ví dụ cụ thể cho tác vụ trong các thông điệp User.

Kết hợp các ví dụ ít mẫu thành một khối ngắn gọn kiểu YAML hoặc dạng gạch đầu dòng để dễ quét và cập nhật.

Phản chiếu cấu trúc dự án của bạn bằng các tên thư mục rõ ràng để đồng đội có thể nhanh chóng tìm thấy câu lệnh.

Chạy lại Eval đã liên kết mỗi khi bạn phát hành—phát hiện vấn đề sớm rẻ hơn nhiều so với sửa chúng trong production.


Câu hỏi thường gặp

Các preset hiện có của tôi có bị hỏng không?

Câu lệnh là cách mạnh mẽ hơn để quản lý cấu hình với hỗ trợ tạo phiên bản và biến mẫu. Tất cả preset hiện có của bạn có thể được nhập vào Prompts bằng tùy chọn "Import preset" trong menu thả xuống Prompt của Playground.

Import preset as prompt dialog with preset options and a warning that prompts are visible to project users

Tôi có cần chỉ định phiên bản trong mã không?

Chỉ khi bạn muốn ghim một phiên bản cũ hơn. Chỉ cần gọi Prompt ID thì luôn dùng phiên bản mới nhất.

Tôi có thể tự động hóa các lần chạy Eval không?

Hiện tại, hôm nay chỉ có các lần chạy lại thủ công.

Bài viết này có hữu ích không?