Cách kỹ thuật tạo câu lệnh hoạt động
Do cách các mô hình OpenAI được huấn luyện, có những định dạng câu lệnh cụ thể hoạt động đặc biệt hiệu quả và tạo ra đầu ra hữu ích hơn từ mô hình.
Hướng dẫn chính thức về kỹ thuật tạo câu lệnh của OpenAI thường là nơi tốt nhất để bắt đầu nếu bạn muốn tìm mẹo viết câu lệnh.
Dưới đây chúng tôi trình bày một số định dạng câu lệnh mà chúng tôi thấy hoạt động tốt, nhưng bạn cứ tự do khám phá các định dạng khác, có thể phù hợp với tác vụ của bạn hơn.
Quy tắc thực tế và ví dụ
Lưu ý: “{text input here}” là chỗ giữ chỗ cho văn bản/ngữ cảnh thực tế
1. Dùng mô hình mới nhất
Để có kết quả tốt nhất, chúng tôi thường khuyên dùng các mô hình mới nhất, mạnh nhất. Các mô hình mới hơn thường dễ áp dụng kỹ thuật tạo câu lệnh hơn.
Lưu ý: Có một số khác biệt cần cân nhắc khi viết câu lệnh cho một mô hình suy luận so với khi viết câu lệnh cho mô hình GPT. Xem thêm chi tiết tại đây.
2. Đặt hướng dẫn ở đầu câu lệnh và dùng ### hoặc """ để tách hướng dẫn với ngữ cảnh
Kém hiệu quả hơn ❌:
Tóm tắt văn bản bên dưới thành danh sách gạch đầu dòng gồm các ý quan trọng nhất.
{text input here}Tốt hơn ✅:
Tóm tắt văn bản bên dưới thành danh sách gạch đầu dòng gồm các ý quan trọng nhất.
Văn bản: """
{text input here}
"""3. Hãy cụ thể, mô tả rõ và chi tiết nhất có thể về ngữ cảnh, kết quả, độ dài, định dạng, phong cách mong muốn, v.v.
Hãy cụ thể về ngữ cảnh, kết quả, độ dài, định dạng, phong cách, v.v.
Kém hiệu quả hơn ❌:
Viết một bài thơ về OpenAI. Tốt hơn ✅:
Viết một bài thơ truyền cảm hứng ngắn về OpenAI, tập trung vào đợt ra mắt sản phẩm DALL-E gần đây (DALL-E là một mô hình ML chuyển văn bản thành hình ảnh) theo phong cách của {famous poet}4. Thể hiện định dạng đầu ra mong muốn bằng ví dụ
Kém hiệu quả hơn ❌:
Trích xuất các thực thể được nhắc đến trong văn bản bên dưới. Trích xuất 4 loại thực thể sau: tên công ty, tên người, chủ đề cụ thể và chủ đề.Văn bản: {text}Hãy vừa cho thấy vừa nói rõ — các mô hình phản hồi tốt hơn khi được cho thấy yêu cầu định dạng cụ thể. Điều này cũng giúp việc phân tích nhiều đầu ra một cách đáng tin cậy bằng chương trình trở nên dễ hơn.
Tốt hơn ✅:
Trích xuất các thực thể quan trọng được nhắc đến trong văn bản bên dưới. Trước tiên trích xuất tất cả tên công ty, sau đó trích xuất tất cả tên người, rồi trích xuất các chủ đề cụ thể phù hợp với nội dung và cuối cùng trích xuất các chủ đề khái quát chung
Định dạng mong muốn:
Tên công ty: <danh_sách_tên_công_ty_cách_nhau_bằng_dấu_phẩy>
Tên người: -||-
Chủ đề cụ thể: -||-
Chủ đề chung: -||-
Văn bản: {text}5. Bắt đầu với không mẫu, sau đó ít mẫu, nếu cả hai đều không hiệu quả thì tinh chỉnh
✅ Không mẫu
Trích xuất từ khóa từ văn bản bên dưới.
Văn bản: {text}
Từ khóa:✅ Ít mẫu - cung cấp một vài ví dụ
Trích xuất từ khóa từ các văn bản tương ứng bên dưới.
Văn bản 1: Stripe cung cấp các API mà nhà phát triển web có thể dùng để tích hợp xử lý thanh toán vào trang web và ứng dụng di động của họ.
Từ khóa 1: Stripe, xử lý thanh toán, API, nhà phát triển web, trang web, ứng dụng di động
##
Văn bản 2: OpenAI đã huấn luyện các mô hình ngôn ngữ tiên tiến có khả năng hiểu và tạo văn bản rất tốt. API của chúng tôi cung cấp quyền truy cập vào các mô hình này và có thể được dùng để giải quyết hầu như mọi tác vụ liên quan đến xử lý ngôn ngữ.
Từ khóa 2: OpenAI, mô hình ngôn ngữ, xử lý văn bản, API.
##
Văn bản 3: {text}
Từ khóa 3:✅Tinh chỉnh: xem các phương pháp hay nhất về tinh chỉnh tại đây.
6. Giảm các mô tả “màu mè” và thiếu chính xác
Kém hiệu quả hơn ❌:
Mô tả cho sản phẩm này nên khá ngắn, chỉ vài câu, và không dài hơn nhiều.Tốt hơn ✅:
Dùng một đoạn văn gồm 3 đến 5 câu để mô tả sản phẩm này.7. Thay vì chỉ nói không nên làm gì, hãy nói nên làm gì thay thế
Kém hiệu quả hơn ❌:
Sau đây là cuộc trò chuyện giữa một tác nhân và một khách hàng. KHÔNG HỎI TÊN NGƯỜI DÙNG HOẶC MẬT KHẨU. KHÔNG LẶP LẠI.
Khách hàng: Tôi không thể đăng nhập vào tài khoản của mình.
Tác nhân:Tốt hơn ✅:
Sau đây là cuộc trò chuyện giữa một tác nhân và một khách hàng. Tác nhân sẽ cố gắng chẩn đoán vấn đề và đề xuất giải pháp, đồng thời không hỏi bất kỳ câu nào liên quan đến PII. Thay vì hỏi PII, như tên người dùng hoặc mật khẩu, hãy hướng dẫn người dùng đến bài viết trợ giúp www.samplewebsite.com/help/faq
Khách hàng: Tôi không thể đăng nhập vào tài khoản của mình.
Tác nhân:8. Dành riêng cho tạo mã - Dùng “từ dẫn” để hướng mô hình theo một mẫu cụ thể
Kém hiệu quả hơn ❌:
# Viết một hàm python đơn giản để
# 1. Hỏi tôi một số đo bằng dặm
# 2. Chuyển đổi dặm sang kilômétTrong ví dụ mã dưới đây, việc thêm “import” gợi ý cho mô hình rằng nó nên bắt đầu viết bằng Python. (Tương tự, “SELECT” là một gợi ý tốt cho phần đầu của câu lệnh SQL.)
Tốt hơn ✅:
# Viết một hàm python đơn giản để
# 1. Hỏi tôi một số đo bằng dặm
# 2. Chuyển đổi dặm sang kilômét
import9. Sử dụng tính năng Generate Anything
Nhà phát triển có thể dùng tính năng 'Generate Anything' để mô tả một tác vụ hoặc đầu ra ngôn ngữ tự nhiên mong muốn và nhận được một câu lệnh được điều chỉnh phù hợp.
Tìm hiểu thêm về cách dùng tính năng 'Generate Anything'.
Tham số
Nói chung, chúng tôi thấy rằng model và temperature là những tham số thường được dùng nhất để thay đổi đầu ra của mô hình.
model- Các mô hình có hiệu năng cao hơn thường đắt hơn và có thể có độ trễ cao hơn.temperature- Một thước đo về mức độ thường xuyên mô hình tạo ra một token ít có khả năng hơn.temperaturecàng cao thì đầu ra càng ngẫu nhiên hơn (và thường sáng tạo hơn). Tuy nhiên, điều này không giống với “tính trung thực”. Với hầu hết trường hợp sử dụng mang tính thực tế như trích xuất dữ liệu và hỏi đáp trung thực,temperaturebằng 0 là tốt nhất.max_completion_tokens(độ dài tối đa) - Không kiểm soát độ dài của đầu ra mà là một giới hạn cắt cứng cho việc tạo token. Lý tưởng nhất là bạn sẽ không thường chạm tới giới hạn này, vì mô hình sẽ dừng lại khi nó nghĩ rằng đã hoàn tất hoặc khi chạm đến chuỗi dừng mà bạn đã xác định.stop(chuỗi dừng) - Một tập hợp ký tự (token) mà khi được tạo ra sẽ khiến quá trình tạo văn bản dừng lại.
Để biết mô tả về các tham số khác, xem tài liệu tham chiếu API.
